Codexの使い方 完全ガイド|CLI・IDE・Cloudの始め方と料金 (2026年版)

Codexの使い方完全ガイド|CLI・IDE・Cloudの始め方と料金

この記事のポイント Codexは「バグを直して」「機能を追加して」と日本語で指示するだけで、コードの生成・修正・テスト・レビューまで自走するOpenAIのコーディングエージェント。 入口はCLI・IDE拡張・Cloud・ChatGPTアプリの4つ。どれも同じChatGPTアカウントで動く。 始め方そのものは5分で終わる。難しいのは「承認モードの設計」と「どのモデルを使うか」で、ここを外すと事故るか遅くなる。 料金はChatGPTの有料プラン(月$20〜)に同梱。重く使うなら新Pro $100プランが現実解になる。

Codexは、もう「補完ツール」ではない。自然言語の指示から、コード生成・バグ修正・テスト実行・コードレビューまでを一気通貫で自動化するクラウド型のAIコーディングエージェントだ(出典: AIツール紹介各社, 2026年5月時点)。2026年4月16日には大型アップデート「Codex for (almost) everything」が発表され、PC操作(Computer Use)、画像生成、メモリ、アプリ内ブラウザ、90超のプラグインが一気に追加された(出典: Codex機能解説記事, 2026年4月時点)。

つまり、コードを書く道具という枠を超えつつある。だからこそ「使い方」を最初に正しく組んでおくと、後の生産性が段違いになる。この記事は、入口の選び方から料金、承認設計、他ツールとの違いまでを実務目線で並べる。


Codexとは何か(定義文で押さえる)

Codexとは、OpenAIが提供する、自然言語の指示からコードを生成・編集・テスト・レビューできるクラウド型のAIコーディングエージェントである。「バグを修正して」「新機能を追加して」と書けば、エージェントが該当ファイルを探し、変更し、必要なら動作確認まで進める(出典: Codexサービス解説, 2026年5月時点)。

似たツールに、同じくターミナルで動くAnthropicのClaude Codeがある。両者ともターミナル常駐型のエージェントだが、Codexはモデル・課金がChatGPT/OpenAIエコシステムに統合されている点が分かれ目になる(出典: Codex CLI解説記事, 2026年)。

Codexはマルチモーダルでもあるとされ、テキストだけでなくスクリーンショットや図を渡すと、それに応じてコードを生成・編集できる(出典: OpenAI Codex CLI解説, 2026年)。設計図のスクショを投げて雛形を作らせる、といった使い方が成立する。


2026年4月の大型アップデートで何が変わった?

最大の変化は、Codexが「コードを書くエージェント」から「PCを操作するエージェント」へ間口を広げたことだ。

2026年4月16日の「Codex for (almost) everything」で、PC操作(Computer Use)、gpt-image-1.5による画像生成、メモリ、アプリ内ブラウザ、90超のプラグインが追加された(出典: Codex機能解説記事, 2026年4月時点)。コードの外側、たとえばブラウザ操作や画像生成までエージェントの守備範囲に入った。

地味に効くのがメモリとプラグインだ。プロジェクトの文脈を覚え、外部サービスと連携する。エージェントが「単発のタスク処理」から「継続的に手伝う相棒」へ寄っていく、という方向性が見える。

OpenAIはこの時期にAstral(uv・Ruffの開発元)の買収も発表しており、Python開発体験への投資姿勢が読み取れる(出典: Codex機能・料金解説記事, 2026年4月時点)。Python中心の開発者には追い風だ。


Codexのモデル構成を理解する

Codexは単一モデルではなく、用途で複数モデルを使い分ける構成になっている。ここを把握しないと「速いのに頭が悪い」「賢いのに遅い」のミスマッチを踏む。

主力モデルはGPT-5.4とGPT-5.3-Codex系に整理され、旧GPT-5-Codex系は現行のデフォルトから外れている(出典: Codexモデル構成解説, 2026年4月時点)。さらに上位にGPT-5.5系が位置づけられているとの記述もある(出典: Codex Review, 2026年5月時点)。

下の表は、公開情報から読み取れるモデルの役割を整理したもの。数値ベンチマークは出典が確認できないため記載しない。

モデル系統位置づけ向いている作業
GPT-5.5系最上位の高性能枠設計判断・難所のリファクタ・複雑なデバッグ
GPT-5.4現行の主力日常的な実装・機能追加・レビュー
GPT-5.3-Codex系コード特化コード生成・編集の高速処理
旧GPT-5-Codex系デフォルトから除外(現行では非推奨)

要するに、難所は上位モデル、量産は主力〜コード特化、という割り振りが基本線になる。モデル名やバージョンは更新が速いので、実際の選択肢はアプリ内の最新表示を正とすること。


Codexの4つの使い方を一望する

Codexの入口は大きく4つ。CLI、IDE拡張、Cloud、ChatGPTアプリ(macOS/Windows含む)だ(出典: Codex使い方解説, 2026年)。同じChatGPTアカウントで横断して使える。

それぞれ得意分野が違う。下の表で当たりをつけてから、自分の作業に合う入口を選ぶといい。

利用形態動く場所向いているケース
CLIターミナルローカルの既存リポジトリを直接いじる
IDE拡張VS Code等のエディタコードを見ながら対話的に修正
Cloudブラウザ(クラウド実行)並列タスク・長時間の自走作業
ChatGPTアプリデスクトップ/Web軽い相談・スクショからの生成

迷ったら、まずローカル開発ならCLI、エディタ常用ならIDE拡張から始めるのが無難だ。クラウド実行の旨味は後述する。


Codex CLIの始め方

CLIはターミナルで完結する。Codex CLIは2025年4月16日にリリースされたコーディングエージェントで、ターミナル上でリポジトリを直接編集できる(出典: OpenAI Codex CLI解説, 2026年)。

手順はシンプルだ。まずパッケージをインストールし、ChatGPTアカウントかOpenAI APIキーで認証する。あとは対象リポジトリのディレクトリでCodexを起動し、日本語で指示するだけ。

# インストール後、リポジトリ内で起動
codex

# プロンプト例
> このプロジェクトのログイン処理にあるバグを直して、テストも通して

CLIの強みは、ローカルファイルへの直接アクセスとマルチモーダル入力だ。スクリーンショットや図を渡すと、それに応じてコードを生成・編集する(出典: OpenAI Codex CLI解説, 2026年)。エラー画面のスクショを投げて原因を当てさせる、といった運用が効く。

注意点は1つ。CLIは強力ゆえに、承認設定を緩めると勝手にコマンドを実行する。最初は厳しめの承認モードで様子を見るのが鉄則だ(承認モードは後述)。


IDE(エディタ拡張)での使い方

エディタ拡張は、コードを目で見ながら対話できるのが利点。CodexはVS Code等のIDE向けに拡張を提供しており、開いているファイルの文脈を踏まえて修正提案する(出典: Codex使い方解説, 2026年)。

使い方の型はこうだ。直したいファイルやコード片を選択し、サイドパネルで「この関数のN+1問題を解消して」と指示する。差分が提示され、確認してから適用する。

CLIとの違いは「粒度」にある。CLIはリポジトリ全体を任せる大技、IDE拡張はファイル単位の精密な手術に向く。レビューしながら少しずつ進めたい局面はIDEが手堅い。


Cloud(クラウド版)での使い方

Cloudは、Codexをブラウザ上のサンドボックスで動かす形態。ローカルマシンを占有せず、長時間の自走や並列実行を任せられる。

レビュー記事の集計では、Codexは7時間超の自律実行に対応するとされる(出典: No Code MBA, OpenAI Codex Review 2026)。「PRをいくつか並行で進めておいて」と投げて、別作業に移れるのがCloudの本質的な価値だ。

一方で、コストの罠もある。あるレビューでは「無料のCLI」と「$200級のクラウド」の落差が論点として挙げられている(出典: Codex Review, 2026年5月時点)。クラウド実行は便利だが、回し過ぎると費用がかさむ。軽い作業はCLI、重い並列作業だけCloud、という線引きが現実的だ。

クラウド開発エージェントの設計思想に興味があるなら、画像系の自律ワークフローを扱ったSora完全ガイドや、検索系AIの自走を解説したFelo完全ガイドも比較材料になる。


ChatGPTアプリ内での使い方

ChatGPTのデスクトップアプリ(macOS/Windows)やWebからもCodexに触れる(出典: Codex使い方解説, 2026年)。コードベースを直接いじるより、相談ベースの使い方に向く。

たとえば「このエラーログの原因を3つ挙げて」「この仕様を満たす関数の雛形を書いて」といった単発の依頼。2026年4月以降はアプリ内ブラウザや画像生成も使えるため、調べ物と生成を同じ画面で完結できる(出典: Codex機能解説記事, 2026年4月時点)。

非エンジニアが「とりあえず動くものを見たい」段階でも入りやすい。本格的にリポジトリへ反映する段になったら、CLIかIDEへ移行する流れが自然だ。


承認モード(Approval Modes)は最重要設定

ここを軽視すると痛い目を見る。Codexはファイル変更やコマンド実行を伴うため、「どこまで自動で許すか」を決める承認モードが安全運用の心臓部になる(出典: Codex機能デモ, 2026年5月時点)。

考え方はシンプルだ。自動化の度合いと事故リスクはトレードオフになる。下の表で自分のリスク許容度に合わせて選ぶ。

モード傾向挙動向いている場面
厳格(都度承認)変更・実行のたびに確認本番に近いリポジトリ、初めて触る時
中庸読み取りは自動、書き込みは確認日常開発のデフォルト
自走一定範囲を自動実行使い捨てブランチ・隔離環境での量産

最初は厳格、慣れて信頼できたら緩める。この順番を逆にしない。特に削除やgit操作を自動化する前は、必ず隔離ブランチで挙動を確かめること。


料金はいくら?プラン別に整理する

Codexは独立課金ではなく、ChatGPTの有料プランに同梱される形が基本だ。Codexは有料ChatGPTプランすべてに含まれるクロスサーフェスのエージェント、と位置づけられている(出典: Codex Review, 2026年5月時点)。

価格の論点は3つある。エントリーのPlus、中量級、そして新設のPro $100だ。下の表は公開情報から確認できる範囲をまとめたもの(変動が速いので最新は公式表示を正とする)。

プラン月額位置づけ
ChatGPT Plus$20Codexの入口。軽〜中量の利用
Pro(新)$100重い利用・上位モデル枠の現実解
クラウド重用時〜$200級長時間自律・並列実行を多用する場合

レビューの結論は割れている。「$20で足りるか」が買い手の判断軸であり、あるレビューは「Plusで十分なケースも多い」とする一方、別のレビューは重用時に$200級へ跳ねる「クラウドの罠」を指摘する(出典: No Code MBA / Codex Review, 2026年5月時点)。

正直なところ、ライト利用ならPlus一択。毎日エージェントに長時間任せるなら、Pro $100が損益分岐になりやすい。OpenAI API経由の従量課金でも使えるので、チームの使い方に合わせて選ぶといい。


対応プログラミング言語と日本語対応

言語の守備範囲は広い。CodexはPython、JavaScript、TypeScript、Go、Java、C++、C#、Swift、PHP、Rustなど30以上のプログラミング言語に対応する(出典: Codexサービス解説, 2026年5月時点)。主要言語で困る場面はまずない。

日本語については、プロンプトも出力も日本語で問題なく通る。指示を日本語で書いても、コメントや説明を日本語で返させても破綻しない(出典: OpenAI Codex CLI解説, 2026年)。国内チームでも英語に切り替える必要はない。

前述のAstral買収(uv・Ruff)を踏まえると、今後はPython体験への投資が厚くなる見込みだ(出典: Codex解説記事, 2026年4月時点)。Pythonデータ基盤を持つチームには地味に重い意味を持つ。


Codexで何ができる?代表的なユースケース

抽象論より具体例で見たほうが早い。Codexが効くのは、定型でないが手間のかかる作業だ。

  • 既存コードのバグ修正とテスト追加を一括で任せる
  • 仕様文から新機能のスキャフォールド(雛形)を生成する
  • リファクタリングとコードレビューを自走させる
  • スクショや図から実装の下書きを起こす

ここに2026年4月以降の拡張が乗る。PC操作・画像生成・アプリ内ブラウザが加わり、コードの外側の雑務まで巻き取れるようになった(出典: Codex機能解説記事, 2026年4月時点)。たとえば、生成した画像を含むランディングページを一気に組む、といった横断作業が一画面で成立する。

画像生成ワークフローを深掘りしたいなら、ComfyUI vs Stable Diffusionで生成基盤の違いを押さえておくと、Codexの画像機能の位置づけが分かりやすい。歯科クリニックなど非IT業種のAI活用を整理した歯科クリニックのAI活用事例も、エージェントを業務に落とす発想の参考になる。


Claude CodeやGeminiと何が違う?

ターミナル型エージェントの代表格がClaude Codeだ。Codexと同じくターミナルで動くが、モデルと課金がそれぞれのエコシステム(OpenAI / Anthropic)に閉じる点が一番の違いになる(出典: Codex CLI解説, 2026年)。

選び分けの軸はシンプルだ。普段ChatGPT課金をしているならCodexが自然、Anthropicのモデルを信頼するならClaude Code、という具合に「既に払っている先」に寄せると無駄がない。

下の表は、公開情報から読み取れる傾向の比較。性能の数値断定は出典が確認できないため避け、構造的な違いだけを並べる。

観点CodexClaude Code系
提供元OpenAIAnthropic
課金ChatGPT/OpenAI同梱各社プラン
入口の広さCLI/IDE/Cloud/アプリ主にCLI/拡張
コード外操作PC操作・画像生成あり(別系統で対応)

汎用AIアシスタント全般の動向はMeta AI完全ガイドも併せて見ると、各社の戦略差が立体的に見えてくる。


セキュリティと商用利用の注意点

エージェントにファイル操作とコマンド実行を許す以上、セキュリティ設計は自己責任の領域になる。承認モードで権限を絞るのが第一防衛線だ(前述)。

商用利用は可能で、OpenAIの利用規約に準拠する範囲で業務利用できる。ただし機密リポジトリをクラウド実行に乗せる場合は、社内のデータ取り扱いポリシーとの整合を必ず確認すること。手元のCLIで完結させるか、クラウドに出すかで、データの流れが変わる。

オフラインでは動かない。クラウドモデルへの接続が前提のため、ネットワーク遮断環境では使えない。閉域での利用要件があるチームは、この制約を前提に設計する必要がある。


うまく使うコツ(プロンプト設計)

エージェントの出力品質は、指示の解像度でほぼ決まる。曖昧な「いい感じにして」は事故のもとだ。

効くのは、ゴール・制約・確認方法をセットで渡すこと。「ログイン処理のバグを直して」ではなく「ログイン時にトークンが二重発行されるバグを、既存テストを壊さずに直して、再現テストも追加して」と書く。

長い自走を任せるときほど、最初に方針を固定するのが効く。途中で方向がぶれたら一度止めて、差分をレビューしてから再開する。7時間級の自律実行が可能だからこそ、放置ではなく「節目で確認」が事故を防ぐ(出典: No Code MBA, 2026年)。

メモリ機能が入ったことで、プロジェクト規約を覚えさせる運用も現実的になった(出典: Codex機能解説記事, 2026年4月時点)。命名規則やディレクトリ構成を最初に教えておくと、以降の出力が安定する。


実際に使っている企業・チーム

Codexは個別企業の導入名がリサーチ上で確認できなかったため、ここでは公開情報から読み取れる利用層を、出典付きで一般情報として記す。捏造した事例は載せない。

  • ChatGPT Plus課金の個人開発者層 — あるレビュー著者は数ヶ月のPlus利用を経て2026年5月1日にPro $100へ移行したと記録しており、個人開発者がエントリープランから入る典型例が読み取れる(出典: Codex Review, 2026年5月10日時点)。
  • 大規模なエージェント利用ベース — レビュー集計ではCodexの週次利用者が500万人規模、自律実行7時間超とされ、実プロダクト開発で常用される層が広く存在することがうかがえる(出典: No Code MBA, OpenAI Codex Review 2026)。
  • ランディングページを実制作した検証チーム — 公開デモでは、Codexアプリを使って実際に出荷可能なランディングページをゼロから構築する一連の流れが記録されている(出典: Eric Tech, "I Tested Every Codex Feature", 2026年5月)。

いずれも個別の社名特定ではなく、公開された利用シーンからの引用にとどめている。


よくある質問(FAQ)

Q. Codexを使うのにいくらかかる?

Codex自体はChatGPTの有料プランに同梱され、入口はPlusの月$20。重く使う場合は新Pro $100プランが用意されている(出典: Codex Review / No Code MBA, 2026年5月時点)。CLIツール自体は無料で、利用にはアカウント認証かAPIキーが要る。

Q. CLI・IDE・Cloud・アプリ、どれから始めるべき?

ローカルの既存リポジトリを直接いじるならCLI、エディタを見ながら少しずつ直すならIDE拡張が入りやすい。長時間の自走や並列実行を任せたい段階でCloudへ広げるのが現実的な順番だ(出典: Codex使い方解説, 2026年)。

Q. 日本語で指示できる?

できる。プロンプトも出力も日本語で問題なく通り、国内チームが英語へ切り替える必要はない(出典: OpenAI Codex CLI解説, 2026年)。

Q. どのプログラミング言語に対応している?

Python・JavaScript・TypeScript・Go・Java・C++・C#・Swift・PHP・Rustなど30以上に対応する(出典: Codexサービス解説, 2026年5月時点)。主要言語で困る場面はほぼない。

Q. Claude Codeとどちらがいい?

普段ChatGPT/OpenAIに課金しているならCodexが無駄なく収まり、Anthropicのモデルを信頼するならClaude Codeが合う。両者ともターミナル型で、差は主にエコシステムと課金の所属にある(出典: Codex CLI解説, 2026年)。

Q. オフラインで使える?

使えない。クラウドモデルへの接続が前提のため、ネットワーク遮断環境では動作しない。

Q. 勝手にコードを壊さない?

承認モードで防げる。初期は都度承認の厳格モードで動かし、信頼できる範囲だけ自動化を広げるのが安全だ。削除やgit操作の自動化前は隔離ブランチで検証すること(出典: Codex機能デモ, 2026年5月時点)。

Q. 2026年4月のアップデートで何が増えた?

PC操作(Computer Use)、画像生成、メモリ、アプリ内ブラウザ、90超のプラグインが追加され、コードの外側の作業まで守備範囲が広がった(出典: Codex機能解説記事, 2026年4月時点)。


AI PICKS編集部の判定

Codexの現在地は「最も間口の広いコーディングエージェント」だ。CLIで手元を任せ、IDEで精密に直し、Cloudで長時間放流し、アプリで相談する——同じアカウントで4面を行き来できるのは、競合に対する明確な強みになっている。2026年4月のPC操作・画像生成・メモリ追加で、コードを書く道具という定義そのものが拡張された点も見逃せない。

一方で、手放しでは薦めない。クラウド実行を回し過ぎると$200級へ膨らむコスト構造があり、ライト層には過剰になりがちだ。多くの個人開発者はPlus $20で足り、毎日長時間エージェントを走らせる人だけがPro $100に進む——この線引きを誤ると、払い過ぎか性能不足のどちらかに落ちる。

結論はこうだ。すでにChatGPTに課金しているなら、Codexは追加コストゼロで始められる破格の入口になる。まず厳格な承認モードで小さく試し、信頼が積み上がった範囲だけ自動化を広げる。この順番さえ守れば、リスクを抑えたまま生産性の上振れを取りに行ける。AIエージェント開発の主導権をOpenAIエコシステムに寄せたいチームにとって、現状はかなり強い選択肢だ。


編集部の評価

率直に言って、Codexの間口の広さは圧倒的だ。ターミナル派もエディタ派も、同じ課金の中で違和感なく移行できる。30以上の言語対応と日本語のスムーズさも、国内チームには重宝する水準にある。

ただしコスト設計は正直シビアだ。クラウド多用時の費用は微妙にコントロールしづらく、「便利だから回す」を放置すると請求で驚く。ここは自走させる範囲を自分で律する規律が要る。

総じて、ChatGPT課金者には一択に近い。新規にエージェント基盤を選ぶフェーズでも、入口の広さと拡張速度を考えれば有力候補から外れない。


関連する比較・代替を見る

  • Codex vs Claude Code徹底比較
  • Codex vs GitHub Copilotの違い
  • Codex vs Cursorどちらが速いか
  • Codex vs Gemini Code Assist
  • Codex vs Devin自律性比較
  • Codexの代替ツールを探す

参考にした一次情報

  • Codexとは?主要機能や使い方、料金体系を解説(2026年4月アップデート / モデル構成 / Astral買収)
  • Codexとは?料金・使い方・評判を徹底解説【2026年最新】(サービス詳細 / 対応言語)
  • Codexの使い方|OpenAIの自律型コーディングエージェントを解説(ChatGPT版・CLI・デスクトップ・IDEの整理)
  • OpenAI Codex CLIとは?使い方やAPI料金(CLIリリース / マルチモーダル入力 / 日本語対応)
  • OpenAI Codex Review (May 2026): The $200 Cloud Trap(モデル / Pro $100移行 / クラウドコスト論)
  • OpenAI Codex Review 2026: Is It Worth $20/Month?(No Code MBA / 週500万ユーザー / 7時間超の自律実行)
  • I Tested Every Codex Feature So You Don't Have To (2026)(Eric Tech / 承認モード / 実LP構築デモ)
  • OpenAI Codex Review 2026 — Updated from Daily Use(日常利用ベースの評価)