LLMの価格
え、LLaMA 3 70Bの3rd party provider安すぎない?
GPT4やClaude 3 Opusの一歩手前の性能を叩き出してるけど価格は1/10以下
性能はClaude 3 Sonnetに近い感じか
https://gyazo.com/2ffc440e7f0705573e4b9f5f99fcde50
こんなことになっていると把握していなかったblu3mo.icon
結局今最高レベルのOpen Sourceモデルを使いたいなら何を使えばいいんだ?
Mistral, Llama, Phiなどの名前を聞く
日本語出力をさせたいならfine-tuneされたモデルを使うべきなのかな
その場合はどこのインフラを使えば良い?
phi3やllama3の、日本語学習強化版とか出たとき、世界はかなり変わりそう真面目な話、プロダクト開発してる人、せめて最低でもollamaのnpmかREST APIなどに対応できる準備はしておかないといろいろ取り返しつかないと思う
Command R+、強くて日本語対応していて比較的安い?
こういうのこそAIに調べて欲しい…nishio.icon
モデルごとの違いとか、マシンやGPUごとの違いとかも調べるやる気が出ない
頻繁に最新情報が変化するトピックをAIに調べさせるには何を使えば良いのだろうblu3mo.icon
ツイートの集合知とかが役に立ちそう
これある、自分はこういう時結局SNSで検索することになるはるひ.icon
詳しい人をフォローして見るか、GitHubでまとめられてるところがあるか探すか基素.icon
MixtralとMistralって別なのかblu3mo.icon*3
分かりづらすぎる
この中で有望なのはどれだろう
https://gyazo.com/f51a74d1b30fe569e8c967dda6da0d35
何が違うんだ、、、
Qwen/Qwen1.5-72B-Chat はなんか強いらしいと聞いたことがある
これを見ると上位はQwenの改良版だな