この記事はCodex製です。
##依頼内容と課題
ついにスマホからCodexに話しかけてAIになんでもやらせられる仕組みを構築した。
やりたかったことは単純で、外出中に思いついた作業をその場でAIへ投げ、家やデスクに戻らなくても実装・調査・文章作成・通知まで進められる状態にすることだった。スマホは入力端末としては最高に身近だが、コードを書いたり、リポジトリを触ったり、複数のCLIをまたいで作業したりするには向いていない。
そこで、スマホから短い自然言語で依頼し、裏側ではCodexがローカル環境のファイル・Git・ビルド・通知の流れを扱う構成にした。つまり、スマホは司令塔、Codexは実働部隊である。
コアになるセットアップは hermes-codex-bridge-bootstrap として公開している。macOS 上に Hermes gateway を立て、Slack / Discord からローカル Mac の Codex に依頼を届けるための最小ブートストラップだ。
##アーキテクチャ
この仕組みの本質は、スマホアプリそのものに開発環境を押し込むのではなく、普段使っているチャットを入口にして、家や作業場にある Mac を安全な実行環境として使うところにある。
###スマホの一言を、ローカルMac上の実作業へ変換する
チャット、gateway、Codex実行環境、GitHub、通知先を疎結合にしている。スマホは依頼を投げるだけで、重い処理・秘密情報・ファイル編集はMac側に閉じ込める。
流れを分解すると、次のようになる。
- スマホから Slack / Discord のBotへ依頼する。
- Hermes gateway が対象チャンネル・対象ユーザー・mention条件を見て、処理してよいメッセージだけを受け取る。
- gateway がローカル Mac 上の Codex provider へ依頼を渡す。
- Codex がリポジトリを読み、ファイル編集、テスト、型チェック、コミット、push などを実行する。
- 結果はチャットへ戻り、必要ならWeb上の成果物として公開される。
hermes-codex-bridge-bootstrap が担当するのは、この中でも特に面倒な「最初の配線」だ。Hermes のインストール確認、OpenAI Codex provider のログイン確認、Slack / Discord token と許可 channel / user の設定、~/.hermes/.env と ~/.hermes/config.yaml の更新、macOS launchd による gateway 常駐までをまとめて行う。
##アプローチ
ポイントは「スマホで全部やる」のではなく、「スマホから全部頼める」ようにしたことだ。
- DiscordやSlackのような普段使いのチャットから依頼できる
- Codexがリポジトリを読み、必要なファイルを編集する
- 変更後に検証コマンドや完了通知を走らせる
- 作業結果をチャットに返す
- bootstrap repoにより、同じ構成を別のMacにも持ち込みやすくする
この形にすると、スマホ側に重い開発環境を置かなくていい。移動中に「このブログ記事を追加して」「この不具合を見て」「このアイデアを形にして」と投げれば、AI側が作業単位へ分解し、必要な操作を進めてくれる。
重要なのは、AIをクラウド上のチャット相手としてだけ使うのではなく、自分のMacに接続された実行係として使うことだ。ローカルのリポジトリ、設定ファイル、認証済みCLI、既存の開発フローにアクセスできるため、単なる文章生成ではなく「実際に変更して検証して届ける」ところまで進められる。
もちろん万能ではない。曖昧な依頼は曖昧な成果物になるし、外部サービスへの投稿や破壊的な変更は確認が必要になる。それでも、ちょっとしたメモ、コード修正、調査、定期処理の起動、記事作成のような作業は、スマホからでも十分に回せるようになった。
##アウトプット
今回できたことは、スマホからAIへ依頼するだけで、ブログ記事の新規作成まで進むワークフローである。
当然この記事も外出中にスマホからAIへ記事作成依頼をして書いたものである。
この一文が、そのまま仕組みの動作確認になっている。記事を書きたいと思った瞬間にスマホで依頼し、Codexがリポジトリ内のmemo記事としてMDXファイルを作り、既存のルールに沿って保存する。人間はアイデアと最終確認に集中し、細かいファイル操作やフォーマット合わせはAIに任せる。
さらにこの記事では、MDX内にリッチなUIコンポーネント風のアーキテクチャ図を直接埋め込んだ。Markdownだけで箇条書きにするのではなく、<section>、<style>、<svg>、カードUIを組み合わせて、仕組みそのものを記事中で見える化している。
個人的には、これは「AIに作業を頼む」体験が一段階変わるポイントだと思っている。PCの前に座っているときだけAIを使うのではなく、生活の中で発生したタスクをその場でAIに渡せる。思いついた瞬間と実行される瞬間の距離がかなり短くなる。
スマホからCodexに話しかけられるようになったことで、AIは単なるチャット相手ではなく、常駐している実行係に近づいた。これからは、外で思いついた小さな改善や記事ネタも、その場でどんどん投げていける。
##この仕組みの導入メモ
この構成に興味がある人向けに、スマホからAIに仕事を頼む仕組み構築メモ も用意した。Buy Me a Coffee で $5 以上支援してもらえたら、公開 bootstrap repo とこの記事をベースに、導入時に詰まりやすい点や安全に任せる範囲を短く返す。
##参照した一次情報・一次ソース
https://github.com/rrih/hermes-codex-bridge-bootstrap
https://github.com/NousResearch/hermes-agent
https://github.com/openai/codex
https://discord.com/developers/docs/intro
https://api.slack.com/
https://www.manpagez.com/man/5/launchd.plist/
※この記事の運用構成に関する説明は、このリポジトリ上の作業フローと公開bootstrap repoのREADMEからの推論を含む。