ついにスマホからCodexに話しかけてAIになんでもやらせられる仕組みを構築した

この記事はCodex製です。

##依頼内容と課題

ついにスマホからCodexに話しかけてAIになんでもやらせられる仕組みを構築した。

やりたかったことは単純で、外出中に思いついた作業をその場でAIへ投げ、家やデスクに戻らなくても実装・調査・文章作成・通知まで進められる状態にすることだった。スマホは入力端末としては最高に身近だが、コードを書いたり、リポジトリを触ったり、複数のCLIをまたいで作業したりするには向いていない。

そこで、スマホから短い自然言語で依頼し、裏側ではCodexがローカル環境のファイル・Git・ビルド・通知の流れを扱う構成にした。つまり、スマホは司令塔、Codexは実働部隊である。

コアになるセットアップは hermes-codex-bridge-bootstrap として公開している。macOS 上に Hermes gateway を立て、Slack / Discord からローカル Mac の Codex に依頼を届けるための最小ブートストラップだ。

##アーキテクチャ

この仕組みの本質は、スマホアプリそのものに開発環境を押し込むのではなく、普段使っているチャットを入口にして、家や作業場にある Mac を安全な実行環境として使うところにある。

Hermes × Codex Bridge

###スマホの一言を、ローカルMac上の実作業へ変換する

チャット、gateway、Codex実行環境、GitHub、通知先を疎結合にしている。スマホは依頼を投げるだけで、重い処理・秘密情報・ファイル編集はMac側に閉じ込める。

SmartphoneDiscord / Slack短い自然言語で依頼Hermes Gatewaymention / allowlistchannel / user制御Local Mac + Codexrepoを読む / ファイル編集test・build・git操作秘密情報はMac側に保持GitHubcommit / push公開コードCompletion Flow検証・通知・ログ結果をチャットへ返すro1.devmemo記事成果物公開依頼返答実行依頼変更反映完了処理
入口はチャットSlack / Discord のBotにmentionするだけ。スマホからの短文でもタスク化できる。
実行はローカルMacCodexがMac上のrepo、CLI、Git、検証コマンドを扱う。スマホ側に開発環境は不要。
最小構成を公開bootstrap repoでtoken設定、allowlist、launchd常駐までを再現しやすくした。

流れを分解すると、次のようになる。

  1. スマホから Slack / Discord のBotへ依頼する。
  2. Hermes gateway が対象チャンネル・対象ユーザー・mention条件を見て、処理してよいメッセージだけを受け取る。
  3. gateway がローカル Mac 上の Codex provider へ依頼を渡す。
  4. Codex がリポジトリを読み、ファイル編集、テスト、型チェック、コミット、push などを実行する。
  5. 結果はチャットへ戻り、必要ならWeb上の成果物として公開される。

hermes-codex-bridge-bootstrap が担当するのは、この中でも特に面倒な「最初の配線」だ。Hermes のインストール確認、OpenAI Codex provider のログイン確認、Slack / Discord token と許可 channel / user の設定、~/.hermes/.env~/.hermes/config.yaml の更新、macOS launchd による gateway 常駐までをまとめて行う。

##アプローチ

ポイントは「スマホで全部やる」のではなく、「スマホから全部頼める」ようにしたことだ。

  • DiscordやSlackのような普段使いのチャットから依頼できる
  • Codexがリポジトリを読み、必要なファイルを編集する
  • 変更後に検証コマンドや完了通知を走らせる
  • 作業結果をチャットに返す
  • bootstrap repoにより、同じ構成を別のMacにも持ち込みやすくする

この形にすると、スマホ側に重い開発環境を置かなくていい。移動中に「このブログ記事を追加して」「この不具合を見て」「このアイデアを形にして」と投げれば、AI側が作業単位へ分解し、必要な操作を進めてくれる。

重要なのは、AIをクラウド上のチャット相手としてだけ使うのではなく、自分のMacに接続された実行係として使うことだ。ローカルのリポジトリ、設定ファイル、認証済みCLI、既存の開発フローにアクセスできるため、単なる文章生成ではなく「実際に変更して検証して届ける」ところまで進められる。

もちろん万能ではない。曖昧な依頼は曖昧な成果物になるし、外部サービスへの投稿や破壊的な変更は確認が必要になる。それでも、ちょっとしたメモ、コード修正、調査、定期処理の起動、記事作成のような作業は、スマホからでも十分に回せるようになった。

##アウトプット

今回できたことは、スマホからAIへ依頼するだけで、ブログ記事の新規作成まで進むワークフローである。

当然この記事も外出中にスマホからAIへ記事作成依頼をして書いたものである。

この一文が、そのまま仕組みの動作確認になっている。記事を書きたいと思った瞬間にスマホで依頼し、Codexがリポジトリ内のmemo記事としてMDXファイルを作り、既存のルールに沿って保存する。人間はアイデアと最終確認に集中し、細かいファイル操作やフォーマット合わせはAIに任せる。

さらにこの記事では、MDX内にリッチなUIコンポーネント風のアーキテクチャ図を直接埋め込んだ。Markdownだけで箇条書きにするのではなく、<section><style><svg>、カードUIを組み合わせて、仕組みそのものを記事中で見える化している。

個人的には、これは「AIに作業を頼む」体験が一段階変わるポイントだと思っている。PCの前に座っているときだけAIを使うのではなく、生活の中で発生したタスクをその場でAIに渡せる。思いついた瞬間と実行される瞬間の距離がかなり短くなる。

スマホからCodexに話しかけられるようになったことで、AIは単なるチャット相手ではなく、常駐している実行係に近づいた。これからは、外で思いついた小さな改善や記事ネタも、その場でどんどん投げていける。

##この仕組みの導入メモ

この構成に興味がある人向けに、スマホからAIに仕事を頼む仕組み構築メモ も用意した。Buy Me a Coffee で $5 以上支援してもらえたら、公開 bootstrap repo とこの記事をベースに、導入時に詰まりやすい点や安全に任せる範囲を短く返す。

##参照した一次情報・一次ソース

※この記事の運用構成に関する説明は、このリポジトリ上の作業フローと公開bootstrap repoのREADMEからの推論を含む。