← Back to Home
note.com ·

ぬいぐるみが電話を取る日(匿名版)

ぬいぐるみが電話を取る日(匿名版)

ぬいぐるみが電話を取る日(匿名版)

出典: note.com / 2026-05-30

title: ぬいぐるみが電話を取る日 —— 移動支援AX 構想書

date: 2026-05-30

audience: 中学生以上

status: 調査完了・構想フェーズ

—— 誰も「AI」と言わなくなるまでの物語

0. この話に出てくるもの

ある地区 という町で、お年寄りの送迎を手伝っている 担当者さん 電話で予約を受けるのが毎日の仕事 それを代わりにやってくれる ぬいぐるみ ぬいぐるみの中に入っている Atom Echo(あずき大のコンピューター) そして、この仕組みを考えた あなたたち

1. いま起きていること

ある地区には、病院に行きたいお年寄りを車で送迎するサービスがあります。予約はすべて電話です。

担当者さんは毎日、電話が鳴るたびに手を止めて、メモを取って、予約表を確認して、「はい、大丈夫です」と答えています。簡単そうに聞こえるけど、一日に何十件もかかってくる。他の仕事もある。なかなか大変です。

「これ、ロボットに代わってもらえないかな」

そう思ったのが、すべての始まりでした。

2. 最初に考えたこと

予約の電話をAIに取らせる。音声を文字に直して、内容を読み取って、予約表に書き込む。

市販のAI電話サービス(Vapi)を使えば、これはもうできます。実際に試して、ちゃんと動きました。月に2万円かかります。

でも、これで終わりにしなかったのは、2万円が高いからではありません。

「コンピューターが電話に出ています」と相手に意識させたくない。お年寄りが「AIと話してる」と身構えるようなものにはしたくない。そもそも道具であることを感じさせたくない。

3. ゼロから作り直す

そこで決めました。ぜんぶ自分たちで作る。

新品の電話番号。新品のデータベース。人間が取るかロボットが取るか、スイッチひとつで切り替えられる。今までの運用は一切壊さない。「隣に」新しい仕組みを作る。

必要な部品はこうです:

古いAndroidスマホ(電話を受ける) ケーブル数本(数百円) Mac(文字起こしと予約処理) そして、ぬいぐるみ

4. 二つの道

電話の音声をMacに送る方法を、ふたつ調べました。

道A:アナログケーブル

Androidのイヤホン端子とMacのマイク端子をケーブルでつなぐ。費用は数千円。今日から試せる。

メリット:簡単、確実、ノイズが少ない

デメリット:有線、片方向(録音だけ)、ケーブルが邪魔

道B:Atom Echo(Bluetooth)

Atom Echoという小さなコンピューターをぬいぐるみに入れて、BluetoothでAndroidと無線接続する。費用はAtom Echoが約2,500円。

メリット:無線、双方向、ぬいぐるみから声が出せる

デメリット:開発に10日ほどかかる

調査の結果、道Bも技術的には可能だとわかりました。どちらも「できる」。だから順番にやります。まず道Aですぐに試して、並行して道Bの開発も進める。

5. 会話のしくみ

電話がかかってきてから予約が完了するまで、中ではこんなことが起きています。

① 文字起こし(Whisper)

相手の声を文字にします。「3月15日の14時、山田です」→ テキスト化。

② データ抜き出し(LLM)

AIがテキストから必要な情報だけを取り出します。

入力:「3月15日の14時、山田です」 出力:{ 日付: “3月15日”, 時間: “14:00”, 名前: “山田” }

ここだけAI(LLM)を使っています。でも会話の文章はAIに作らせません。

③ 足りない情報を聞く(状態機械)

「送迎の行き先は?」「電話番号は?」—— 決まった順番で、決まった言葉だけで聞き返します。これはプログラムで決めたルール通りに動くだけで、AIは使っていません。

④ 予約を保存(Paperclip)

全部の情報が揃ったら、予約表に書き込みます。担当者さんが「承認」ボタンを押すまでは「仮予約」。人間が最終確認する余地を残しています。

6. AIを使うのは、たった一カ所だけ

この仕組みの中で「AI」が働くのは、音声を文字にするところと、文字から日付や名前を取り出すところだけです。

| 作業 | 誰がやる? |

|------|-----------|

| 電話に出る | Atom Echo(プログラム) |

| 声を文字に | Whisper(AI) |

| 文字から予約データを抜き出す | LLM(AI) |

| 次に何を聞くか決める | 状態機械(プログラム) |

| 相手に話す文章を作る | 固定テンプレート(プログラム) |

| 予約を保存する | Paperclip(プログラム) |

| 最終確認する | 担当者さん(人間) |

AIに「会話」を任せると、おかしなことを言うかもしれません。存在しない日付をでっち上げるかもしれません。だからAIの仕事を情報を抜き出すことだけに限定している。これがこの仕組みの一番大事な設計です。

7. 「無音」と「間」の問題

お年寄りと話していて、いちばん困るのが沈黙です。

今の仕組みでは、相手が喋り終わってから応答が返るまでに、こんな時間がかかります:

  1. 無音が3秒続く → 「話し終わった」と判断

  2. 文字起こしに2〜4秒

  3. 応答を作って声に出す

つまり最長で7秒、相手は無音を待つことになります。高齢者にとって7秒はとても長い。「もしもし? 切れた?」と不安になります。

対策はこうです。相手が喋り終わったと判断した瞬間、まず 「少々お待ちください」 という短い声を即座に返す。その裏で文字起こしとデータ抽出を走らせる。「待たされている」ではなく「ちゃんと聞いてもらえている」と感じてもらう。さらにぬいぐるみが「ピッ、ピッ」と小さな音を鳴らせば、考えている感じが伝わります。

8. これが完成したら

まず動かす

Atom Echoをプログラミングして、AndroidとBluetoothでつなぎます。電話がかかってきたら応答して、音声をMacに送る。文字起こし→予約抽出→仮予約登録。

担当者さんはスマホに届く通知を見て「承認」を押すだけ。

その先の世界

Vapi(できあいのAI電話サービス)につなげば、その日から全自動です。月2万円かかるけれど、すぐに「電話を取って予約を取る」ところまで行けます。

ゆくゆくは、Vapiを外して、自分たちで作った応答の仕組み(ayame)に置き換える。そのとき、月の費用は1,550円。ほとんど電気代だけです。

9. いちばん大事なこと

このプロジェクトの本当のゴールは「AIで電話予約を自動化しました」ではありません。

「電話予約の話をしているときに、AIという言葉が出てこなくなること」 です。

ぬいぐるみが座っていて、電話が鳴ったら出て、予約を取る。それだけ。お年寄りは「ぬいぐるみの担当者さん」に話しかけているだけで、中で何が動いているかは知らなくていい。操作方法も説明書もいらない。

いい道具は、使い方を覚えなくても使える。道具の存在を意識しなくなる。

10. いま、どこまで来ているか

| 段階 | やること | いま |

|------|---------|------|

| Phase 0 | アナログケーブルで録音実験 | 部品待ち |

| Phase 0.5 | Atom Echo Bluetooth調査 | ✅ 調査完了 |

| Phase 1 | 文字起こし〜予約保存の自動化 | 未着手 |

| Phase 2 | 本番の電話番号と端末 | 未着手 |

資料

| 資料 | ありか |

|------|--------|

| プロジェクト全体設計書 | 10_再開発移動支援AX.md |

| 実験手順書 | 10_再開発移動支援AX_PoC手順書.md |

| Bluetooth HFP 調査結果 | phase_0_5_atom_echo_hfp_research.md |

| Fabric 詳細報告 | ~/fabric/2026-05-30_Phase0.5_HFP調査結果.md |

| Paperclip Issue | CMP-3(done) |

| ayame 対話エンジン | ~/ayame/ |

動くものから。順番を守れ。やったことは残る。


この記事は note.com から KTBLOG に移行されました。元記事: https://note.com/famous_prawn2009/n/nee1c3f1125e7