AIツール比較2026

前提

日本語の自然さ、skillsとかMCPの対応状況は除外。

単純なアルゴリズム力・実装力、自走力の比較

/icons/hr.icon

Codex

llimit

かなり寛大。ゆるく開発するだけならPlusプランで充分。

Pro(x20)なら5時間リミットに到達するのは不可能、100時間ぐらい連続で作業させて週制限に到達するレベル

CLI

全体的にノーマル。便利。

/goalが便利だけど、タスクの分解の仕方が微妙な感じ。ChatGPTに投げて作業計画を立てさせておくのが吉

Claudeと違って40時間以上普通に走るので優秀

VSCode拡張

最近使わなくなったので2月時点の評

何とも普通。並列で動かしたいので使わなくなった

自走力

GPT-5.4か5.5になったあたりで優秀になった

/goalは暴走列車感はあるけど、進めてくれるので良い

Antigravity(Pro)

limit

Codexに慣れると小さく感じる

Gemini 3.1 ProとClaudeのlimitが分かれてるのでローテしてたら結構使える

5月時点ではそんなことない。一瞬で使えなくなる。作業途中で急に止まるのやめてほしい

バックグラウンドで並列実行できるけど、複数窓で表示する機能が欲しい

WSLで動かさないと「allow this command」が多発してまともに自走できない。

結構長時間走ってくれる(TPS, レスポンスが遅めかもしれない)

CLI

最近出たけどGemini CLIから悪いところを引き継いでる感

Gemini 3.1 Proの実装力はCodex 5.3 ExHighと同じくらい

自走力

前はあまりないと言われてたけど、Claudeと比較しても普通に自走力がある感じがする

Claude Code(Pro)

limit：数時間ごとのlimitが小さすぎて機能が比較できん、まともに使えん

Opusは10メッセージでリミットになり、Sonnet 4.6も実装させたら自走してる途中でリミットになる

Opus4.6はかなりいいモデルだが、10メッセでリミットになるツールに用はない

ツール自体はいいと思う。自走力も高くて使ってて気持ちがいい。が途中でリミットになるせいでストレスがマッハ。

すぐにトークン上限になる気がする。32kじゃ足りてない

vscode拡張

limitのせいで試せない

外部APIのハーネスとして利用

体験が非常に良い。多分ハーネスの質ではトップ。

/loop, /goalで自走力の低いモデルを回しまくる使い方が許される

/icons/hr.icon

ChatGPT

limit

ガチでかかったことない。Extend Thinkingを20メッセージ*3回で送ってみたけど止まる気配がなかった。

最近は制限されるらしい

DeepResearchに時間がかかる。がGeminiよりいいか？と言われれば微妙かもしれない。同じぐらい

Canvasでコード出力できるが、毎回ダウンロードしないとなので使い勝手は悪い。普通にファイルのダウンロードリンク頂戴といったほうがいい

Gemini(Pro)

Gemini 3.1 Proはかなり実装力はある。

ai studio

limit：前はでかかったけど、今はかなり縮小されてそう。すぐ引っかかる。

gemini 3.1 proが取り柄。悪くない。

web

limit：使い倒したら引っかかる。

DeepResearchが的確。ChatGPTほど時間をかけないので速めに欲しいときに助かる。

コピペが不便。markdownなのにそのままコピーしてIDEに貼り付けると数式が全部消える。

内容をコピー→GeminiにShift+Ctrl+V→これをコピペしないといけない

Deepthinkを開放しなさい

/icons/hr.icon

Kimi-k2.6

安いAPIで使える中では一番使いやすい

GLM-5.1

エージェント性能を宣伝しているが、遅い気がする

DeepSeek-v4 Pro

安いけど、問題解決への筋が悪い

Perplexity.ai

日常使いで。簡単なコマンド聞くときとかはChatGPTだと遅いので使った。小回り用に便利

Qwen

DeepResearchがある。良さそうには見えない。

3.7 Maxを安く解放しなさい

Grok

複数エージェントをwebから呼べるのは良い。以上。