LLMのための日本語インストラクションデータ作成プロジェクト
https://liat-aip.sakura.ne.jp/wp/llmのための日本語インストラクションデータ作成/
理研AIPの言語情報アクセス技術チームでは、2024年3月末を目処に、OpenAIのInstructGPTのFine Tuningで利用されたインストラクションデータと同等規模(1万を目標)の日本語インストラクションを開発するプロジェクトを開始しました。
http://liat-aip.sakura.ne.jp/wp/llmのための日本語インストラクションデータ作成/llmのための日本語インストラクションデータ-公開/
フォーム入力してダウンロードできる
https://huggingface.co/datasets/p1atdev/ichikara-instruction
に上がっているらしい
#ichikara-instruction
ichikara-instruction LLMのための日本語インストラクションデータの作成