大規模言語モデル
これらのモデルは、言語の構造や文脈を理解し、人間のように文章を生成したり、質問に答えたりすることができる
これまで専用のモデルが必要だった領域で、単一のモデルで高品質な結果を出力できる
明示的に学習させていない四則演算能力や画像の追加学習と組み合わせることで、テキストキャプションの生成やテキストからイメージの生成にも機能することが示された
例
クラウド経由で利用できるクローズドソース型
クラウド利用かつオープンソース型
ローカルで実行可能なオープンソース型
日本語特化のもの
評価方法
関連
参考文献