AIの使い方、向き合い方
喧々諤々の議論
思考力拡張・思考力簒奪
創造性支援・創造性簒奪
いまのふんわりな考え
分類が必要
画像生成とLLMだと議論が異なる
検出器もAI?
強化学習は使われている
画像生成AIならStable Diffusionのエコシステムがおもしろい
コミュニティの存在
ChatGPTは汎用的で活用の幅の提示がすごい
飲み会のおもしろツールから、哲学的難題、開発サポートもなんでも
実際に使う
画像生成AI
DALL-E
さらっと触っただけだがあまりおもしろい絵がでない
他と比較したときにモデルとしての特徴がある
海外のイラスト風
Midjourney
モデルとしての特徴がある
ファンタジー絵のような風合い
Discordでさわるのがめんどそう
代替があればわざわざこれをさわらないかも
Stable Diffusion
HuggingFaceなどで対応モデルが無数に用意されている
Loraによってモデルが人々によって量産されている
→MidjourneyやDALL-Eのような固定のモデルよりははるかに良い
OpenSourceである
モデルなどで細かくライセンスがあるので注意も必要
ControlNetなどいじれるポイントが複数あるのも良い
動画生成AI
Sora
さわっていないが、見ている
1分動画を1hでだせるらしい
レンダリングスピードは速い
Karmaとか下手なGPUレンダラーより速い…
Runway
ITPから出てきた
ChatAI(LLM)
Chat-GPT
汎用的で活用の幅の提示がすごい
飲み会のおもしろツールから、哲学的難題、開発サポートもなんでも
記事要約
嘘や妄想が混入するがガイドにはなる
英文翻訳
精度高い
日本語の文法的おかしさはほぼない
開発支援
PythonやJSならWeb上のエディターがゴリゴリコード修正してくれる
漠然としたアルゴリズムの課題などにうまく相談に乗ってくれる(わりといいメンター)
例えば、点群の四面体分割、BinPackingなどググるより遥かに自分の実用に沿った提案をしてくれる
検出器
Skeleton Tracking
実際の利用シーンが多い
Pythonでさくっと検出して描画に使う、というのを早くまわせると良さそう
開発支援(LLM)
Copilot
VSCodeやVisualStudioで快適に動作
JSなどは精度高くアシスト
チャットでの質問も可能
oFやC/C++のサジェスト精度はいまいち
さわれる範囲の依存がたくさん存在するからか?
コンパイルエラーに遭遇したときの解決力などはほぼない
ChatGPTのほうがふわっとした課題に対する対応力はある
つかえるアルゴリズムの列挙
改善の提案など
Cursor
VSCodeベースの開発環境でOpenAIのチャット環境を搭載している
プロジェクト全体、構造を把握するためCopilotなどよりも精度が良い、らしい