2024-2-17 LT daiiz
だいず
Daiki Iizuka
株式会社Helpfeel エンジニア
本日の発表資料
https://gyazo.com/27700fd5b4eba220121cbc241908ad32
LLMの観察と実践の技術同人誌書いてます
https://gyazo.com/b5af2d6bddc7865c30e3f771640602b8 https://gyazo.com/b5929e993040f86448574c1ab0b2693c
Googleの言語モデルに触れてみよう!
Gemini
Google(Google DeepMind)の大規模言語モデル
OpenAIで言うところのGPT
Bard
https://gyazo.com/56a5ba9a4ca9d4482336b96a26d656ae/thumb/360#.png
吟遊詩人
OpenAIで言うところのChatGPT
つい最近、Geminiブランドに統一された
https://gyazo.com/db5a019d75bb31e285b909061bdcedef
Gemini Advanced
いまなら2ヶ月無料!
https://gyazo.com/b690133b3f39beb243f86c08d3ed5156
OpenAIで言うところのChatGPT Plus
Googleの最強精度のモデル Gemini Ultra が搭載されているらしい
Gemini Advanced
https://gyazo.com/17cd4d9eacaa1d6f398bf44449934327
https://gyazo.com/3a350f691dc2e81b51ebc32ab7ea4234
Google AI Playground
少し前はMakerSuiteと呼ばれていた
https://gyazo.com/533fc7cfecd8d9b6be3470f97e760a81
Gemini 1.0 Pro
現状で使えるGeminiファミリーで最も高性能のモデル
GPT-3.5以上4未満
デモ
Node.jsから使うには
APIキーを発行する
チャット
startChat
マルチモーダル(画像とテキストを入力にした質問応答)
マルチターンはまだ苦手らしい
AI Playgroundからコードの雛形を入手できる
https://gyazo.com/489142ed6243dafb5c63d4ec813e2105
Gemini 1.5 Pro
一昨日発表された最新のモデル
コンテキスト長(≒ 入力文字数)が100万トークンに
読み飛ばし問題も解決されているらしい?
https://gyazo.com/5a99b2218cee534fc83c9d0a99831418
Googleのブログより引用
公式ブログ
Gemini 1.5 Pro: テクニカルレポート
https://gyazo.com/3fa7f7fc6f4dea4f9d3dc15c6682ef27
https://gyazo.com/d0ad0479c4a26d1343b263f06d8b22a7
Gemini 1.5 Pro: Google AI Playgroundからwaitlistに並ぼう
https://gyazo.com/4886481306a4dad0e6f2ef7d360329f1
その他のモデルは?
PaLM 2
Geminiの前の世代の言語モデル
安定している+用途ごとのAPIが充実している
Codey
Imagen
画像生成
MedLM