CodexとClaude Codeは「作業前の設定」で速くなる 実務で効く4つの型
AIコーディングエージェントを効率よく使う近道は、長い魔法のプロンプトを書くことではありません。検証方法、リポジトリ固有の指示、権限、反復作業の自動化を先に整えることです。
OpenAIのCodexはクラウド、CLI、IDE、アプリで動き、AnthropicのClaude Codeもターミナル、IDE、デスクトップ、ブラウザで使えます。どちらもファイルを読み、編集し、コマンドを実行できるため、使い方を誤ると「速いがレビューしにくい変更」が増えます。2026年5月20日時点で見るべき差は、モデル名よりも運用設計です。
- 小さな修正は直接依頼し、大きな変更は先に調査と計画を分ける
AGENTS.mdやCLAUDE.mdに、テスト、ビルド、PR作法を短く書く.env、秘密鍵、生成物、外部ネットワークは権限で明示的に絞る- フォーマット、lint、危険コマンドのブロックはフックで機械的に動かす
何が変わったのか
コーディングAIは、チャットでコード片を出す段階から、リポジトリ内で作業するエージェントへ移っています。
OpenAIのCodex webは、クラウド上のサンドボックス環境でタスクを実行し、複数タスクを並行して進められます。2026年3月4日のOpenAI発表では、CodexアプリがWindowsにも広がり、複数エージェントを管理する画面として位置づけられました。
AnthropicのClaude Codeも、CLI、VS Code、デスクトップ、Web、JetBrains系IDEで使えるエージェント型ツールです。公式ドキュメントは、ファイル編集、コマンド実行、PR作成、MCP連携、フック、サブエージェントを主要機能として説明しています。
ここで重要なのは、どちらも「質問に答えるAI」ではなく、作業権限を持つ開発環境の一部になっている点です。導入効果は、プロンプトの巧さだけでは決まりません。
効率化の核心は「完了条件」を渡すこと
最初に変えるべきは依頼文です。抽象的に「直して」ではなく、何を読ませ、何を変え、何で完了とするかを渡します。
Codexのベストプラクティスは、プロンプトに次の4点を入れることを勧めています。
- Goal: 何を作る、直す、調べるのか
- Context: 関係するファイル、ログ、設計メモ、エラー
- Constraints: 守るべき設計、依存関係、セキュリティ要件
- Done when: テスト通過、再現手順の解消、画面差分の確認など
Claude Codeのベストプラクティスも、テスト、スクリーンショット、期待出力のような検証手段を渡すことを重視しています。これは単なる使い勝手の話ではありません。エージェントが自分でコマンドを実行できるなら、最後に人間が目視で全部拾うより、先に「このテストを通せ」と渡した方が手戻りが減ります。
使いやすい依頼の形
たとえば、曖昧な依頼はこうです。
ログイン周りを直して。
実務では、次のように変えます。
src/auth/を読んで、セッション期限切れ後にログインが失敗する原因を調べる。まず再現テストを1つ追加し、その後に修正する。完了条件は、そのテストと既存の認証テストが通ること。既存の公開APIは変えない。
短いですが、エージェントに必要な判断軸が入っています。どのフォルダを見るか、何を証明するか、何を変えてはいけないかが明確です。
永続指示は短く、リポジトリに置く
毎回同じ注意を書く運用は続きません。CodexならAGENTS.md、Claude CodeならCLAUDE.mdに、チームの作法を残します。
Codexは作業前にAGENTS.mdを読み、グローバル設定とリポジトリ内の指示を階層的に扱います。公式ドキュメントでは、~/.codex/AGENTS.mdに共通の作業規約を置き、リポジトリルートやサブディレクトリで上書きする例が示されています。
Claude CodeはCLAUDE.mdをセッション開始時に読み込みます。Anthropicは、/initでひな形を作り、ビルドコマンド、テスト方法、コードスタイル、PR作法などを短く保つことを勧めています。
ここがポイント: 永続指示に長い設計資料を詰め込むより、「必ず実行するテスト」「触ってはいけない場所」「PR前に見るコマンド」を短く書く方が、毎回の作業で効きます。
入れるべき内容は、たとえば次のようなものです。
- JavaScript変更後は
npm testではなくpnpm test:unitを先に実行する - DBマイグレーションはレビューなしで作らない
- 生成ファイルは直接編集せず、元ファイルを変更する
- 認証、課金、個人情報に触る変更は必ず追加テストを作る
逆に、一般的な言語仕様、長いAPI説明、ファイルごとの網羅説明は入れすぎない方がよいでしょう。コンテキストを消費し、肝心な指示が埋もれます。
権限設計で「速さ」と「安全」を両立する
エージェントに自由を与えるほど作業は速くなります。ただし、秘密情報や外部サービスに触れる権限まで広げると、レビュー以前の問題が起きます。
Codexの権限設定では、ファイルシステムにread、write、denyを指定できます。公式ドキュメントは、ワークスペースを書き込み可能にしつつ、**/*.envをdenyにする例を示しています。ネットワークについても、必要なドメインを許可し、全許可の*は意図がある場合だけ使うべきです。
Claude Codeでも、.claude/settings.jsonのpermissions.denyで.env、secrets/**、認証情報ファイルなどを読ませない設定ができます。Anthropicは、これによりファイル探索や読み取り操作から対象を除外できると説明しています。
実務では、最初から広い権限で始めるより、作業の種類ごとに分ける方が扱いやすくなります。
- 調査だけ: リポジトリ読み取り、書き込みなし
- 小修正: ワークスペース書き込み、ネットワークなし
- 依存関係更新: 必要なレジストリやGitHubだけネットワーク許可
- CI連携:
ghなどのCLIを使うが、認証情報の読み取りは禁止
特に日本企業の開発現場では、委託先、社内端末、クラウド開発環境が混ざることがあります。エージェント導入時は「誰がAIを使うか」だけでなく、「どのリポジトリで、どの秘密情報に近づけるか」を先に決める必要があります。
フックは「毎回やること」に使う
プロンプトの指示は、モデルが読み落とす可能性があります。毎回必ず実行したい処理は、フックに寄せるのが現実的です。
Codexのフックは、SessionStart、PreToolUse、PostToolUseなどのイベントで動きます。PreToolUseでは、Bash、apply_patch、MCPツール呼び出しの一部を検査し、危険な操作をブロックできます。ただしOpenAIは、これは完全な強制境界ではなく、現時点では一部のツール呼び出しを対象とするガードレールだと説明しています。
Claude Codeのフックも、特定のライフサイクルイベントでシェルコマンド、HTTPエンドポイント、LLMプロンプトなどを実行できます。Anthropicのドキュメントでは、ファイル編集後のフォーマット、コミット前のlint、危険操作のブロックといった使い方が示されています。
フックに向く処理は明確です。
- ファイル編集後にformatterを走らせる
- コミット前にlintや型チェックを走らせる
rm -rf、本番環境向けCLI、秘密情報の読み取りを止める- セッション開始時にローカルの開発ルールを追加で読ませる
一方で、複雑な設計判断までフックに押し込むと運用しづらくなります。フックは「必ず機械的に判定できること」に絞るべきです。
CodexとClaude Codeの使い分け
両者は競合製品ですが、実務では「どちらが万能か」より「どの作業面に置くか」で考える方が判断しやすいです。
| 作業 | 向く使い方 | 見るべき設定 |
|---|---|---|
| 既存コードの調査 | 読み取り中心で質問、設計理解、影響範囲確認 | 読み取り権限、コンテキスト管理 |
| 小さな修正 | 対象ファイルと完了条件を指定して直接編集 | テストコマンド、formatter、差分確認 |
| 複数ファイルの機能追加 | 先に計画を作らせ、承認後に実装 | Plan系の運用、永続指示、PR作成手順 |
| 反復作業 | lint修正、依存更新、リリースノート作成を半自動化 | フック、スキル、MCP、CLI連携 |
CodexはAGENTS.md、権限プロファイル、クラウド並列実行、アプリでの複数エージェント管理を見ておきたい製品です。Claude CodeはCLAUDE.md、許可モード、フック、スキル、サブエージェント、IDE/CLI横断の運用が中心になります。
ただし、どちらでも最初の導入単位は同じです。いきなり大規模リファクタリングを任せるのではなく、テストで判定できる小さな修正から始め、成功した依頼文と設定を永続化します。
導入時のチェックリスト
最後に、チームで使い始める前に見る項目を短く整理します。
AGENTS.mdまたはCLAUDE.mdに、テスト、ビルド、禁止事項を短く書いたか.env、秘密鍵、認証情報、生成物を読み取り禁止にしたか- ネットワーク許可を必要なドメインに絞ったか
- formatter、lint、危険コマンド検査をフックにできるか
- 大きな変更では、調査、計画、実装、検証を分ける運用にしたか
- AIが作った差分を、人間がレビューできる粒度に保っているか
CodexやClaude Codeの効率化は、AIに丸投げする話ではありません。開発チームが普段から暗黙に守っている手順を、ファイル、権限、フック、完了条件として見える形にすることです。次に見るべきなのは、新モデルの発表だけでなく、自分のリポジトリに「AIが安全に失敗できる境界」があるかどうかです。
参照リンク
- OpenAI Developers: Codex web
- OpenAI: Introducing the Codex app
- OpenAI Developers: Codex best practices
- OpenAI Developers: Custom instructions with AGENTS.md
- OpenAI Developers: Codex permissions
- OpenAI Developers: Codex hooks
- Claude Code Docs: Overview
- Claude Code Docs: Best practices for Claude Code
- Claude Code Docs: Settings
- Claude Code Docs: Hooks reference
