中高生でもわかる！5体のAIエージェントで電話予約を完全自動化する方法

出典: note.com / 2026-05-23

はじめに：「テレアポ会社、AIにやらせたら最強じゃね？」

考えてみてほしい。「もし自分がテレアポ会社の社長だったら、どんな仕事が必要か？」。お客様に電話をかけるオペレーター、予約を管理するシステム、広告やSNSで集客する人、電話の台本を考える人、全部をまとめる社長。これを1台のMacBookと5体のAIエージェントで全部やったらどうなるか。

実際にやってみた。しかも無料のAIモデルを中心に。この記事では、その全貌を包み隠さず公開する。中高生の君が読んで「自分でもできそう」と思えるように、仕組みから失敗談まで全部書く。

5体のエージェントとその役割

1台のMacBook上でtmuxによりターミナルを4分割し、OMP #2（広報）、OMP #3（開発）、Codex（難題）、OpenCode（汎用）を同時運用する。その上位にPi（司令塔）が位置し、Telegram経由でKT（人間の艦長）と繋がっている。

各エージェントの詳細

Piは司令塔。TelegramでKTと会話し、tmuxで4体を統括・監視・エラー対応する。OMP #2は広報担当でnote、X、Substackでの記事公開や進捗発信を行う。OMP #3は「移動支援の兄貴」としてVapi AIアシスタントの設定・改善と電話台本作成を担当する。Codexはテスト自動化のエキスパートで、難しい問題解決やシミュレーションスクリプト作成が役割。OpenCodeは汎用作業の予備戦力で、単純タスクやコード整形を無料モデルでこなす。

コスト戦略：GPT-5.5は難しい問題だけ。OMPとOpenCodeは無料モデルで常時稼働。

ポイントは「Piが全部見てる」ことだ。PiだけがTelegram経由でKTと繋がっている。Piはtmuxで4つのペインを監視し、どのエージェントが今何をしているか、エラーが出ていないかを常にチェックしている。まるでゲームの**RTS（リアルタイムストラテジー）**でユニットを俯瞰操作している感覚だ。

電話予約の流れ：ユーザーから見える世界

利用者が電話をかけるとVapi AIアシスタントが自然に応答し、日時調整の会話を経て予約が確定する。電話の相手は人間だと思って話しているが、実際はAI（Vapi）だ。自然な会話で日時を調整し、予約データ（日付、時間、行先）が保存される。

ここまでは既存の技術でもできる。このプロジェクトの本当の価値はここからだ。

山場：「AI同士が電話で会話する」バグ発見シミュレーション

予約システムをリリースする前に絶対にテストしなければならないことがある。「変なリクエストが来たら、AIはどう対応するのか」。利用者の声が小さい、要件が伝わらない、時間外の予約、方言や早口——これを全部人手でテストしてたら日が暮れる。

そこで登場するのが**「AI同士のシミュレーション会話」だ。Codex（GPT-5.5クラスの超頭脳）が「めっちゃ話しにくい利用者」を演じて、何度も何度も電話をかけ直す。相手はOMP #3が設定したVapi AIアシスタントだ。つまりAI対AIのロールプレイテスト**。

実際に起きた失敗（再現）

ある日のシミュレーション会話。Codex（利用者役）が「予約キャンセルしたいが、予約番号がわからない」と伝えたところ、OMP #3（Vapi側）は詳細が不明なため確認できないと応答し、予約キャンセルができなかった。ユーザー体験最悪だ。

このログを見たPiが即座に判断。OMP #3に「予約番号がわからない」「名前だけで検索」「日付が曖昧」の3パターンに対応できる会話フローを追加するよう指示した。OMP #3は修正し、再度Codexがシミュレーションを実行。1回目は予約番号がないとキャンセル不可、2回目は名前だけでも検索できるよう修正したが同名が複数で失敗、3回目で名前と住所の一部で特定できるようになりキャンセル成立した。

**このループを、全部AI同士で回している。**人間（KT）は結果をTelegramでチラ見して「よし、OK」と言うだけだ。

なぜ5体も必要か？

「1体のスーパーAIにやらせればいいじゃん」——そう思うかもしれない。だがここにこのプロジェクト最大の工夫がある。

1体に全部やらせると、1つのエラーで全部止まる。判断がブラックボックス化する。コストが高いモデルが必要になる。同時作業ができない。しかし5体に分散すれば、1体が止まっても他がカバーする。Piが全部見ているから修正できる。無料モデルでも回せる部分は任せられる。tmuxで4窓同時進行できる。

特にコストは大きい。Codex（GPT-5.5クラス）は頭はいいが高い。だから「難しいテストスクリプトの作成」にだけ集中させて、単純な記事投稿やコード整形はOMP #2やOpenCode（無料モデル）に任せる。「頭脳は最高峰に、単純作業は無料に」——これが現実的なAI活用のコツだ。

開発の1日をのぞき見

タイムラインで見るとこんな感じになる。朝9時、PiがKTからTelegramで指示を受信する。「今日はキャンセルフローのテストを完了させて」。5分後、Piがtmuxで全員に指示を出す。OMP #3にキャンセルフローの実装、Codexにテストスクリプトの作成、OpenCodeにコードレビューの準備。30分後、OMP #3とCodexが同時に完了を報告。Piが両方の実行を承認し、シミュレーションが始まる。Codexが3つのシナリオ中2つ失敗したと報告。PiがOMP #3に原因特定と修正を指示。修正後、Codexが再テストを実行し全シナリオ通過。9時41分、PiがKTに完了を報告。KTが確認してOK。

このサイクルの速さが、AIエージェント開発の真の力だ。人間が寝てる間もAIエージェントは動き続けられる。

失敗から学んだこと（正直に話す）

**失敗1：エージェントが暴走した。**ある時OMP #3が勝手にVapiの設定を大幅変更し、それまで動いていた普通の予約フローまで壊した。対策としてPiに「変更前の設定を必ずバックアップしてから変更する」ルールを追加。今ではPiが全エージェントの変更をgitで管理し、問題があれば即座にロールバックする。

**失敗2：AI同士の会話がループした。**CodexとOMP #3のシミュレーションで、お互いに「すみません」「いえいえこちらこそ」という無限謝罪ループに陥った。AIに日本人らしい丁寧さを求めた結果、お互いに譲り合って永遠に会話が終わらない。対策としてCodexのテストシナリオに「同じフレーズが3回以上続いたら強制終了」を追加した。

**失敗3：Piに頼りすぎ。**最初はPiに全部の判断を任せすぎてコンテキストがパンクした。対策として各エージェントに「自分で判断していい範囲」と「Piに報告すべき範囲」を明確に定義。今では単純な修正はエージェント同士で完結し、Piは本当に難しい判断だけに集中できる。

「自分でもできそう」と思った君へ

この記事を読んで「おもしろそう」「やってみたい」と思った中高生に一番伝えたいことがある。**この仕組みの8割は無料のツールで再現できる。**必要なものは1台のパソコン（MacじゃなくてもLinuxやWindowsでもOK）、tmux（無料）、Telegram API（無料）、各AIモデルのAPI（無料枠あり）、そしてやる気と好奇心（無限）。最初は5体もいらない。まずは2体（司令塔役と作業役）から始めて、徐々に増やしていけばいい。

おわりに：AIエージェントは「チーム」で動かせ

1体のAIに全部やらせるより、複数のAIに役割を与えてチームで動かす方が、はるかに安定して、はるかに安く、はるかに楽しい。

このプロジェクトで得られた一番の気づきは、AIに「何をさせるか」ではなく、AI同士を「どう繋ぐか」が、これからの時代のスキルになるということだ。

君がもし「AIで何か作りたい」と思っているなら、まずは1体のAIと仲良くなって、次に2体目をどう繋ぐか考えてみてほしい。その先に、5体、10体、100体のAIエージェントが協働する世界が待っている。その世界を作るのは、君たち中高生だ。

この記事は note.com から KTBLOG に移行されました。元記事: https://note.com/famous_prawn2009/n/nf1008831058f