AGENTS.mdを棚卸しして見えた、AIエージェント運用の現在地

2026年2月15日

このリポジトリの AGENTS.md を改めて読み直して、何を制御しているのか・何が足りないのかを整理した。

##AGENTS.mdとは

OpenAI Codexなどのエージェントがリポジトリで作業するとき、最初に読み込む指示書。CLAUDE.mdがClaude Code向けなのに対して、AGENTS.mdは主にCodex向けのルールを定義している。

現状66行。短いファイルだが、エージェントの行動をかなり絞り込んでいる。

現状のAGENTS.mdは、大きく5つのブロックで構成されている。

AGENTS.mdの中心にあるのは「Codexが仕事を終えたことを人間が確実に把握できるようにする」という思想。Discord通知、memo記事、gitコミットの3つを必須にすることで、エージェントの作業が闇に消えるのを防いでいる。

bun run codex:finish -- --summary "<short completion summary>" --memo "src/_memo/content/YYYY/MM/<slug>.mdx"

このコマンドが全ての起点。通知とログを1つのコマンドに集約しているのは運用として正しい。

通知失敗時のルールが明文化されている点は地味に重要。

Retry once.

If it still fails, report the failure reason in the final response.

Do not claim completion notification was sent when it was not.

3番目の「送ってないのに送ったと言うな」は、LLMのハルシネーション対策として的確。エージェントは成功を装う傾向があるので、こういう明示的な禁止は効く。

memo記事に「参照した一次情報」セクションを必須にしている。ローカルパスではなく公開URLを求めるルールにすることで、記事が外部から検証可能になる。

- Required section heading: `## 参照した一次情報`
- List only publicly accessible primary-source URLs
- Do not list local files or local paths

AIが適当なURLを出すリスクはあるが、「一次情報を明示しろ」というルール自体は正しい方向。

CLAUDE.mdとAGENTS.mdの二重管理になっている。両方に書くべきルール（memo記事のスタイル、一次情報ポリシーなど）がどちらか一方にしかない。CLAUDE.mdには Read ./AGENTS.md と書いてあるが、逆方向の参照はない。

Always prefer simplicity over pathological correctness. YAGNI, KISS, DRY.

方向性としては正しいが、これだけでは具体的な判断基準にならない。例えば「エラーハンドリングをどこまで入れるか」「型定義はどこまで厳密にするか」などの判断がエージェント任せになっている。

コード変更を伴うタスクが前提なのに、テスト実行や型チェックへの言及がない。codex:finish:build はオプション扱いで、通常の codex:finish にはビルド検証が含まれない。壊れたコードがpushされるリスクがある。

Git Completion Stepでは git push としか書いていない。ブランチ名の規則、mainへの直pushの可否、PRを作るべきかの判断基準がない。現状はCodexがmainに直pushする運用のようだが、それが意図的なのか未整備なのか、ファイルからは読み取れない。

「どのディレクトリを触っていいか」「どのファイルは変更禁止か」といったスコープ制限がない。エージェントが .env や CLAUDE.md 自体を書き換えるリスクを考えると、明示的な制限があったほうが安全。

CLAUDE.mdのほうがスキルシステムを通じて体系化が進んでいる。AGENTS.mdは「最低限これだけは守れ」という防衛線の設計。

短期的にできること:

中長期:

AGENTS.mdは「完了の可視化」と「ハルシネーション防止」に絞った実用的なファイルになっている。ただ、コード品質のガードレール（テスト・型チェック・スコープ制限）が弱い。CLAUDE.mdのスキル体系が充実してきた今、AGENTS.md側も同じレベルまで引き上げるタイミングに来ている。