大規模言語モデル入門
GPT・BERT・T5のゼロショット推論
BPE
J-GLUE(BERT、RoBERTa、LUKE、DeBERTa v2)
NER(BERT)
要約生成(T5)
文埋め込み(BERT+SimCSE)
質問応答(ChatGPT)
Hugging Face Hubでモデルやデータセットが公開されている
感想ブログ
最新トピックもありつつ、言語モデルの基礎技術も網羅されていて入門書としてとても良かったです。LLM はこれから勉強するけど機械学習や自然言語処理に少しは触れたことがある!って方にちょうどヒットする内容だと思います。NLPをガッツリやっていてサーベイ目的で読む場合には物足りない気がします。