LLMの価格 - 井戸端

LLMの価格

え、LLaMA 3 70Bの3rd party provider安すぎない?

GPT4やClaude 3 Opusの一歩手前の性能を叩き出してるけど価格は1/10以下

性能はClaude 3 Sonnetに近い感じか

https://gyazo.com/2ffc440e7f0705573e4b9f5f99fcde50

こんなことになっていると把握していなかったblu3mo.icon

結局今最高レベルのOpen Sourceモデルを使いたいなら何を使えばいいんだ?

Mistral, Llama, Phiなどの名前を聞く

日本語出力をさせたいならfine-tuneされたモデルを使うべきなのかな

その場合はどこのインフラを使えば良い?

phi3やllama3の、日本語学習強化版とか出たとき、世界はかなり変わりそう真面目な話、プロダクト開発してる人、せめて最低でもollamaのnpmかREST APIなどに対応できる準備はしておかないといろいろ取り返しつかないと思う

Command R+、強くて日本語対応していて比較的安い？

こういうのこそAIに調べて欲しい…nishio.icon

モデルごとの違いとか、マシンやGPUごとの違いとかも調べるやる気が出ない

頻繁に最新情報が変化するトピックをAIに調べさせるには何を使えば良いのだろうblu3mo.icon

Perplexityも対応できないという認識

ツイートの集合知とかが役に立ちそう

これある、自分はこういう時結局SNSで検索することになるはるひ.icon

詳しい人をフォローして見るか、GitHubでまとめられてるところがあるか探すか基素.icon

MixtralとMistralって別なのかblu3mo.icon*3

分かりづらすぎる

この中で有望なのはどれだろう

https://gyazo.com/f51a74d1b30fe569e8c967dda6da0d35

何が違うんだ、、、

Qwen/Qwen1.5-72B-Chat はなんか強いらしいと聞いたことがある

これを見ると上位はQwenの改良版だな