Codex
Introducing Codex | OpenAI
複数タスクを並列処理できる、クラウドベースの自律駆動エージェントAI
モデルはcodex-1
タスクごとに専用の環境で実行される
codex cli
軽量なエージェント
OpenAI社内でエンジニアが日常的に利用している
しばらく無料だが後から従量課金に移行予定
ChatGPT Pro Operatorとの違い
Codex:開発者向けの「コードを書くためのAI」
Operator:一般ユーザー向けの「ブラウザを操作するAI秘書」
table:operatorとの違い
観点 Codex Operator
本質 ソフトウェアエンジニアリング特化のクラウド実行エージェント 実ブラウザを使ってWeb上のGUIを視覚的に操作する自律エージェント
操作対象 GitHubリポジトリ、コードベース(ローカルまたはクラウド) 任意のWebサイト(TripAdvisor、Instacartなど)
インターフェース ファイル操作、コマンド実行(lint/test/PRなど) マウスクリック、スクロール、テキスト入力などGUI操作
実行環境 OpenAIが提供するコード用クラウドサンドボックス OpenAIのリモートブラウザ環境
指示方法 「このコードにバグがあるので直して」などの開発指示 「コロッセオのツアーを予約して」などの人間的な依頼
自律性 コードに対して試行錯誤とテストを繰り返す ブラウザを「見て・クリックして・戻って」進めるGUI操作が可能
モデル codex-1(o3ベース強化学習) CUA(Computer-Using Agent、GPT-4oの視覚+RL強化)
対象タスク例 PRの作成、ユニットテストの追加、コードの説明など フォーム入力、ミーム作成、商品購入、Web検索、予約など
ログイン/CAPTCHA 非対応(コードだけ扱う) 途中でユーザーに引き継ぎ(ログイン・支払い情報等)
公開状況 ChatGPT Pro / Enterprise で利用可能(順次拡大) アメリカ国内の一部ChatGPT Proユーザー限定公開中(研究プレビュー)
月3万円 OpenAI ChatGPT Codex を試して(みてる現在進行形) #codex - Qiita
@GOROman
ためしてる。けっこうすごい。ManusとDevin使ってなかったらもっと驚けた気はするけど、使ってしまったので想定内ではある。KVMっぽいの大量に並列起動しまくるのはOpenAIの資金力ならではな気がするww これ赤字では
> @d_1d2d
> OpenAIがAIコーディングエージェントの「Codex in ChatGPT」を発表
>
> ・o3をソフトウェア開発向けに最適化したcodex-1を搭載
> ・合格するまでコードに対して反復テスト
> ・クラウド内の仮想コンピュータ上で動作
> ・GitHub接続
> ・複数タスクの並列実行
> ・仮想チームメイトへ
>
> 詳細はスレッド↓