AIツール比較2026
前提
日本語の自然さ、skillsとかMCPの対応状況は除外。
単純なアルゴリズム力・実装力、自走力の比較
/icons/hr.icon
Codex
llimit
かなり寛大。ゆるく開発するだけならPlusプランで充分。
Pro(x20)なら5時間リミットに到達するのは不可能、100時間ぐらい連続で作業させて週制限に到達するレベル
CLI
全体的にノーマル。便利。
/goalが便利だけど、タスクの分解の仕方が微妙な感じ。ChatGPTに投げて作業計画を立てさせておくのが吉
Claudeと違って40時間以上普通に走るので優秀
VSCode拡張
最近使わなくなったので2月時点の評
何とも普通。並列で動かしたいので使わなくなった
自走力
GPT-5.4か5.5になったあたりで優秀になった
/goalは暴走列車感はあるけど、進めてくれるので良い
Antigravity(Pro)
limit
Codexに慣れると小さく感じる
Gemini 3.1 ProとClaudeのlimitが分かれてるのでローテしてたら結構使える
5月時点ではそんなことない。一瞬で使えなくなる。作業途中で急に止まるのやめてほしい
バックグラウンドで並列実行できるけど、複数窓で表示する機能が欲しい
WSLで動かさないと「allow this command」が多発してまともに自走できない。
結構長時間走ってくれる(TPS, レスポンスが遅めかもしれない)
CLI
最近出たけどGemini CLIから悪いところを引き継いでる感
Gemini 3.1 Proの実装力はCodex 5.3 ExHighと同じくらい
自走力
前はあまりないと言われてたけど、Claudeと比較しても普通に自走力がある感じがする
Claude Code(Pro)
limit:数時間ごとのlimitが小さすぎて機能が比較できん、まともに使えん
Opusは10メッセージでリミットになり、Sonnet 4.6も実装させたら自走してる途中でリミットになる
Opus4.6はかなりいいモデルだが、10メッセでリミットになるツールに用はない
ツール自体はいいと思う。自走力も高くて使ってて気持ちがいい。が途中でリミットになるせいでストレスがマッハ。
すぐにトークン上限になる気がする。32kじゃ足りてない
vscode拡張
limitのせいで試せない
外部APIのハーネスとして利用
体験が非常に良い。多分ハーネスの質ではトップ。
/loop, /goalで自走力の低いモデルを回しまくる使い方が許される
/icons/hr.icon
ChatGPT
limit
ガチでかかったことない。Extend Thinkingを20メッセージ*3回で送ってみたけど止まる気配がなかった。
最近は制限されるらしい
DeepResearchに時間がかかる。がGeminiよりいいか?と言われれば微妙かもしれない。同じぐらい
Canvasでコード出力できるが、毎回ダウンロードしないとなので使い勝手は悪い。普通にファイルのダウンロードリンク頂戴といったほうがいい
Gemini(Pro)
Gemini 3.1 Proはかなり実装力はある。
ai studio
limit:前はでかかったけど、今はかなり縮小されてそう。すぐ引っかかる。
gemini 3.1 proが取り柄。悪くない。
web
limit:使い倒したら引っかかる。
DeepResearchが的確。ChatGPTほど時間をかけないので速めに欲しいときに助かる。
コピペが不便。markdownなのにそのままコピーしてIDEに貼り付けると数式が全部消える。
内容をコピー→GeminiにShift+Ctrl+V→これをコピペしないといけない
Deepthinkを開放しなさい
/icons/hr.icon
Kimi-k2.6
安いAPIで使える中では一番使いやすい
GLM-5.1
エージェント性能を宣伝しているが、遅い気がする
DeepSeek-v4 Pro
安いけど、問題解決への筋が悪い
Perplexity.ai
日常使いで。簡単なコマンド聞くときとかはChatGPTだと遅いので使った。小回り用に便利
Qwen
DeepResearchがある。良さそうには見えない。
3.7 Maxを安く解放しなさい
Grok
複数エージェントをwebから呼べるのは良い。以上。