Tanuki-8×8B
https://weblab.t.u-tokyo.ac.jp/2024-08-30/東京大学松尾・岩澤研究室 GENIACプロジェクトにおいて、大規模言語モデル「Tanuki-8×8B」を開発・公開
経産省及びNEDOが進める日本国内の生成AI基盤モデル開発を推進する「GENIAC」プロジェクトにおいて、松尾・岩澤研究室が「Tanuki-8×8B」を開発・公開。
本モデルは、フルスクラッチで開発されており、対話、作文能力を評価する指標「Japanese MT-Bench」において「GPT-3.5 Turbo」と同等以上の性能を達成。
Apache License 2.0のライセンスに基づき、研究および商業目的での自由な利用が可能。「Tanuki-8×8B」の軽量版である、「Tanuki-8B」をチャット形式で利用できるデモも公開。
https://zenn.dev/matsuolab/articles/377f7ae8b1169e大規模言語モデルTanuki-8B, 8x8Bの位置づけや開発指針など
https://zenn.dev/matsuolab/articles/95fa297ef12a14ChatbotArena的なシステムでTanuki-8x8Bを始めとする大規模言語モデルの日本語性能を評価する(2024年8月)
https://gyazo.com/bab212ca0d2f2edd152221f86efc670b
Tanuki-8×8B
https://huggingface.co/weblab-GENIAC/Tanuki-8x8B-dpo-v1.0weblab-GENIAC/Tanuki-8x8B-dpo-v1.0
Tanuki-8B
Tanuki-8×8Bの軽量版
https://huggingface.co/weblab-GENIAC/Tanuki-8B-dpo-v1.0weblab-GENIAC/Tanuki-8B-dpo-v1.0
ライセンス
Apache 2.0
GENIAC 松尾研 LLM開発プロジェクト