20250416研究tips共有ページ
#20250416研究Tips共有_高橋
論文収集
Connected Papers
論文のタイトルを入力すると,その論文が引用している/その論文が引用された,他の論文が表示される
例:
https://scrapbox.io/files/67fc89729f4abe5e967dcaeb.png
丸が大きいほど引用されている.色が濃いほど,最近出版されたことを示す.
Deep Researchも便利なんだが,こうしたマッピングも見やすくて良い
Google Gemini Pro 2.5 with Deep Research
OpenAIのChatGPTのDeep Resaerchと同様に,調べたいワードや対象・トピックを入力していろんなウェブから引っ張ってきてくれる.利点として,Deep Researchで調べた内容はそのままGoogle Docsに保存できる.他のDeep Researchよりも,性能が良い(髙田の直感). 2.0は無料.
同じDeep Research 系列
Perplexty ... 最近は結構改善されたっぽい?2月には困った(竹島)
ChatGPT ... こちらも最近優秀.Geminiとの精度差分はよくわからない.が,髙田的にはgeminiの方が全体的に速いイメージ.
コーディング(プログラミング)
Google Gemini Pro 2.5
サクッと聞いて帰ってくる答えが優秀
コンテキストサイズ(一回に処理できる情報量)が一番大きい(はず?
Claude 3.7 Sonnet
こちらもサクッと聞いて返ってくる答えが優秀
Claudeはhtml や javascriptをプレビュー描画できるので優秀.髙田の場合はp5.jsでオンライン実験を作るので,Claudeに「htmlとp5jsでXXXみたいな実験スクリプト作って.p5jsはCDNで読み込んで」としている
CSSとかも設計が面倒くさいので,適当に投げて描画してもらっている
ChatGPT
いつもの
Cursor editor https://www.cursor.com/ja
vscodeに統合可能なツール.右のタブにAIに聞くことができる
AIはAgentモード,Askモードがある,
Agentモードは「XXやって」っていえばディレクトリ作ったりスクリプト作ったり,コマンドラインで実行してくれる.なんだこれ
Askモードは,「XXってどうやる?」って聞くと回答を示してくれる
AIモデルを選べる.Claude 3.7, Gemini 2.5あたりは課金すると選べる.あと課金すると回答が速い(確か
vscodeの拡張ツールをそのまま移行できることから髙田は使っている
vscode
最近,Agentモードが一般開放された?
Devin
https://devin.ai/
cursor, vscodeのようなツールに近い,指示するだけでアプリケーション一本作れるくらいすごいらしい
ただ課金額がめちゃ高いらしい
Cline
https://github.com/cline/cline
Cursor, devin, vscodeとにたような感じ
要約系
Google NotebookLM
資料や論文をアップロードして要約してもらうことが可能.ここで大事なのは,その資料に載っている情報のみを答えることが可能で,載っていない情報は「載っていない」と答えられるところ.これは非常に良い
例えば,ドキュメントや論文をアップロードして,「XXってどうやればいい?」「XXって何?」って聞くと,その情報がどこに書いてあるかを参照しつつ,回答してくれる.書いていない場合は,ないって言ってくれる.
資料の要約はテキストベースだけでなく,2人のラジオにすることなども可能
最近はマインドマップ機能も追加された
ChatGPT, Claudeなどなど...
MCP (Model Context Protocol)
そもそもこれは何
AIツール間を互換性を担保するもの.現状,人間がAIに情報を入力・AIからの出力をコピペするといったことがあるが,それも全部やってくれる,というイメージ
例:AIに「今日の相場は?」と聞いた場合,事前学習データからでは回答できない.そこで,AIが最新の相場情報が載っているウェブにアクセスして情報を収集,ユーザに回答を提供する.
これだとDeep Researchでもできるじゃん,とはなるけど,AIが自社のサービス内で完結するのではなく,外部のツールにアクセスできるようになった,というのが重要
Blender MCP
https://github.com/ahujasid/blender-mcp
チャットに「ビル作って」とかいうと作ってくれるらしい,すごい
https://x.com/MengTo/status/1903316180045337073
MCP Server Store
https://mcp.so/ja
ここでどんなMCPがあるか見れる模様
---
普段の使い方
あくまで髙田 takada.icon の使い方です
髙田が実験に使っているツール
メインはtouchdesigner.対面実験は全てこれ
ノードベースプログラミング.フレームレート制御とかめっちゃしやすい.内部でpythonとcpp,GLSLがかけるのでなんとかできるパワーがある.ハードウェアとの連携も楽.有料ライセンスじゃないとFull HD以上出せないのが難点
オンライン実験はtypescriptとp5js
データ解析はpythonとmatlab
最近,uvが出たので使ってみている
課金について
Google One AI. 月額2900円,gemini advanced と NotebookLM Plusが含まれている(はず).今後,Google CalendarやGmail等の連携が強化されることを期待して課金(いい感じの予定調整くんとか出てきてくれそう)
Claude Pro. 月額20ドル.html,cssのプレビューが強いのと,まあまあいい機能を先駆的に実装してくれるので課金.
connected paper. 年36ドル.割り勘課金.
OpenAI (ChatGPT).チームプラン.OISTラボで課金.
普段の使い方: プログラミング系
Deep Researchでよくライブラリとか探している,ついでにほしいAPIがあるかも聞く
オンライン実験(ブラウザ)実装時
自分はp5jsで課題を実装しつつ,裏側でclaudeにinformed consentやinstructionのページを作らせる.
オンライン実験(ソフトウェアを配布して,インストールさせるタイプ)実装時
tauriという,javascript (typescript) とRustをベースにしたアプリケーションツールを使用
基本的にブラウザ版と同じような開発プロセスだが,rustはまだわからないのでよくAIに聞いている
セキュリティ面が素人なので,その周りもよく聞く
対面実験実装時
touchdesignerというマイナーな言語を使っているため基本的に自分で実装.内部でpythonが書けるので,numpyで行列処理する時に忘れがち or エラー出がちな時は即AIに聞いて直してもらっている
AI駆動開発全体に言えること
最終的に自分でなんとかできる力が必要.大枠は組めるけど,細部の調整やローカルエラーみたいなところはAIに聞いても微妙なことが多いので,人間側の解決力はまだ要する.
普段の使い方: 論文執筆系
最初の検索は基本自分で実施.いい感じのpaperを見つけたらconnected papersに入れて関連する論文を観察.概要見て優先度を策定,優先度が高いものは自分で読む.低いものやめっちゃ長い教科書系はNotebookLMに入れて全体像を把握
一度読んだ論文で何が・どこに書いてあるか忘れた時はほしい情報が書いてそうなPDFをいくつかNotebookLMに入れて,どこにあるか聞く
Deep Researchは,調べることが余程新しくない・論文が見つからない限りは使わないようにしている.元の調べる力が減る感覚がある(これからAIツール前提の社会になっていくのに何をいっているのか,という感じはある
NotebookLMでは,自分で書いた論文をアップロードして要約,他者から見てどのような内容になっているかを観察しつつ,自分で「XXって何?」「XXを詳細に教えて」っていうのを聞いて添削
ただ未発表の論文でこれをするのはまだ危ない(どこで学習データに転用されるかわからない)ので,基本的に自分で執筆,共著者による添削,修正を通じてpreprintに上げる(投稿寸前)になった時に使う.
ミーティング議事録の生成等は基本AI任せ
Moonlight 論文読み(高橋さん)
普段の使い方:雑務系
報告書やメールの返信はよく生成させている.自分で手直しをして提出
情報収集:大体全部X (旧twitter)と学会
博士課程中に便利ツールが矢継ぎ早に登場してきて多くの作業が楽になる一方で,失うものも多そうなので大きく依存しないようにしている(それがいいかは不明