個人開発でのLLM活用10連発
https://scrapbox.io/files/6697d0887a0d6f001c63e33d.jpg
Photo by pastak.icon
こんばんは
Helpfeel エンジニア
前回
興味関心がある身近なデータを集めまくる
データを起点にして次の挑戦領域を発見する
自分が作ったものを毎日使う
アイデアの本質が見えるまで深堀りする
ときどき刺激を加える
個人開発歴
大学生の頃から
10年以上
色々と作ってきた
思いつき次第試したい
自分が毎日使いたい
多くの人に使ってもらいたい
個人開発の傾向
いくつか並行して開発を進めている
分野ごとの広がりを整理を試みた様子
https://gyazo.com/f00c6b9d7c526c10376a7aaaa9bbcc1e
画像を扱う題材が好き
個人開発でLLMを使っていく話
手を動かして慣れていくしかないですよね!
https://gyazo.com/b5af2d6bddc7865c30e3f771640602b8
LLMでお絵かきする
拡散モデルではなく
LLMでお絵かきする
SVG大好き
https://gyazo.com/bdbcd576dad07e6eeb8cf23d78e6ebcc
SVGでの表現の限界に挑戦してくれる
https://gyazo.com/c0798b219aef610255aa9f5c0f911fa5
ちょっとしたSVG素材を作る
アイコンやプレースホルダー画像など
https://gyazo.com/11493d907a44bbdcb403c04612b1f2e8
出先の隙間時間に作業を進められる
外でもスマホでも個人開発できるようになった!
チャットクライアントを作る
開発アイデアやコードがデフォルトでコンテキストに乗る
いちから前提を話さなくていい
具体的なコードで会話できる
開発TODOメモやイベント情報を混ぜた秘書を作れる
https://gyazo.com/0f61cdb64190ec5284e8576130a0a188
チャットクライアントを作る
LLMとのチャットUIの研究を兼ねている
例: テキスト入力欄は画面上部にあったほうがいい
例: 会話の中で、コンテキストに含めるものを選択したい
https://gyazo.com/c547cfac3073dbf29e2c678af7dd39f6
https://gyazo.com/ee3269accbceb81daa0d073efac9b604
最近Goolge AI Studioにも実装されていた
チャットクライアントを作る
エクスポート機能を実装するべき
より強いモデル情報を引き継げる
簡単なブログ記事にもなれる?
HTML形式で出力しておくといい
ブラウザで読める(人間可読)
他のクライアントにもファイルとして渡せる
https://gyazo.com/eb9facbbb7695301492208b0f4262f98
情報分析する
積読になっているブックマークをときどき見直したい
ブックマーク検索ツールも開発中
定点観測機能
https://gyazo.com/bf7eace76e0d5dc89301c35e5d3b924b https://x.com/daizplus/status/1782579167705641227
新しい順に読みたい
追加日ではなく
古い記事がバズっていたりすることもある
情報分析する
ウェブページを画像としても保存している
https://gyazo.com/413fa487276576448662be54fd318080
https://gyazo.com/704394c17ca2f8f7cd8e099ea2e7328e
情報分析する
マルチモーダルLLMにスクリーンショットをそのまま渡す
先頭から高さ1000pxの領域で十分
プロンプトの例
code:js
const prompts = [
"スクリーンショット画像から情報を抽出して、このコンテンツの作成日を推定してください。",
"時刻が不明確な場合は 00:00 としてください。",
"複数の候補が考えられる場合は、確度が高い順に並べて回答してください。",
"日時情報を抽出できなかった場合は、空の配列を返してください。",
"---",
只今の日時は、${nowDateStr} です。,
];
情報分析する
入力画像の例
(説明用に回答根拠箇所のマーキングを付与している)
https://gyazo.com/bc2ae867c4cb5681b578a501c9a5f0c3
https://scrapbox.io/files/66978f753ab2a8001d8fdc97.jpg
記事の作成日を推定させる
該当箇所が複数あれば、確度順に全部答えてもらう
Cosenseのページなど、推定不能な場合は空になる
DBでも複数の値を記録できるようにしておく
あとで人間がチェックする
記事作成日を推定できた様子
灰色の文字で表記。紫色の長方形はリンクタイトルをマスキングしたもの。
https://gyazo.com/df9d7fac8dc362e30e7cabc8f33f58fa
最新作
画像検索エンジンの作成・共有サービス
https://gyazo.com/c56376cdaf29d798b10cd6a8cacd2682
2年間ほぼ毎日使っている daiiz.icon
写真を探す
写真に撮られた本のスクリーンショットを探す
撮影場所に関する情報が書かれた画像を探す
テックイベントのスライド写真を起点に連想検索する
論文とWebページを串刺しで検索する
たぶん便利なので一般向けのサービスにしてみよう!
機能を削ぎ落として調整した
落としすぎた気もする
塩梅が難しい
ドッグフーディング期間が長すぎると自分に特化したシステムになりがち
温めすぎないほうがいい
最新作: Phonno
Phonno = Photos + Annotations
自分が追加した画像資料にGroundingできる
https://gyazo.com/b5929e993040f86448574c1ab0b2693c
画像の特定領域に説明を書いて検索可能にする
特に検索で見つけたい箇所を手厚く
書くために探し、探すために書く
PhonnoでのLLMの利活用
画像の説明を書いてもらう
https://gyazo.com/2c6e764c188e65e3a28d0370c732c9dc
画像片そのものと説明をマルチモーダルモデルに与える
https://gyazo.com/b8531a43362438c2d458cb72ac421c5a
画像から検索キーワードを連想する
https://gyazo.com/3830b68bab95d031c54511185a99e6c7
APIのコスト感
一般公開してもまあ大丈夫だろう
だめだったらそのときに考える
最新作: Phonno
Coming soon...
個人開発でもLLM使っていこう!
規模感問わず
モチベーションの維持
本質的な作業に集中
新機能開発
面白い使い方を懇親会で教えてください!