ぬいぐるみが電話を取る日(匿名版)
ぬいぐるみが電話を取る日(匿名版)
出典: note.com / 2026-05-30
title: ぬいぐるみが電話を取る日 —— 移動支援AX 構想書
date: 2026-05-30
audience: 中学生以上
status: 調査完了・構想フェーズ
—— 誰も「AI」と言わなくなるまでの物語
0. この話に出てくるもの
ある地区 という町で、お年寄りの送迎を手伝っている 担当者さん 電話で予約を受けるのが毎日の仕事 それを代わりにやってくれる ぬいぐるみ ぬいぐるみの中に入っている Atom Echo(あずき大のコンピューター) そして、この仕組みを考えた あなたたち
1. いま起きていること
ある地区には、病院に行きたいお年寄りを車で送迎するサービスがあります。予約はすべて電話です。
担当者さんは毎日、電話が鳴るたびに手を止めて、メモを取って、予約表を確認して、「はい、大丈夫です」と答えています。簡単そうに聞こえるけど、一日に何十件もかかってくる。他の仕事もある。なかなか大変です。
「これ、ロボットに代わってもらえないかな」
そう思ったのが、すべての始まりでした。
2. 最初に考えたこと
予約の電話をAIに取らせる。音声を文字に直して、内容を読み取って、予約表に書き込む。
市販のAI電話サービス(Vapi)を使えば、これはもうできます。実際に試して、ちゃんと動きました。月に2万円かかります。
でも、これで終わりにしなかったのは、2万円が高いからではありません。
「コンピューターが電話に出ています」と相手に意識させたくない。お年寄りが「AIと話してる」と身構えるようなものにはしたくない。そもそも道具であることを感じさせたくない。
3. ゼロから作り直す
そこで決めました。ぜんぶ自分たちで作る。
新品の電話番号。新品のデータベース。人間が取るかロボットが取るか、スイッチひとつで切り替えられる。今までの運用は一切壊さない。「隣に」新しい仕組みを作る。
必要な部品はこうです:
古いAndroidスマホ(電話を受ける) ケーブル数本(数百円) Mac(文字起こしと予約処理) そして、ぬいぐるみ
4. 二つの道
電話の音声をMacに送る方法を、ふたつ調べました。
道A:アナログケーブル
Androidのイヤホン端子とMacのマイク端子をケーブルでつなぐ。費用は数千円。今日から試せる。
メリット:簡単、確実、ノイズが少ない
デメリット:有線、片方向(録音だけ)、ケーブルが邪魔
道B:Atom Echo(Bluetooth)
Atom Echoという小さなコンピューターをぬいぐるみに入れて、BluetoothでAndroidと無線接続する。費用はAtom Echoが約2,500円。
メリット:無線、双方向、ぬいぐるみから声が出せる
デメリット:開発に10日ほどかかる
調査の結果、道Bも技術的には可能だとわかりました。どちらも「できる」。だから順番にやります。まず道Aですぐに試して、並行して道Bの開発も進める。
5. 会話のしくみ
電話がかかってきてから予約が完了するまで、中ではこんなことが起きています。
① 文字起こし(Whisper)
相手の声を文字にします。「3月15日の14時、山田です」→ テキスト化。
② データ抜き出し(LLM)
AIがテキストから必要な情報だけを取り出します。
入力:「3月15日の14時、山田です」 出力:{ 日付: “3月15日”, 時間: “14:00”, 名前: “山田” }
ここだけAI(LLM)を使っています。でも会話の文章はAIに作らせません。
③ 足りない情報を聞く(状態機械)
「送迎の行き先は?」「電話番号は?」—— 決まった順番で、決まった言葉だけで聞き返します。これはプログラムで決めたルール通りに動くだけで、AIは使っていません。
④ 予約を保存(Paperclip)
全部の情報が揃ったら、予約表に書き込みます。担当者さんが「承認」ボタンを押すまでは「仮予約」。人間が最終確認する余地を残しています。
6. AIを使うのは、たった一カ所だけ
この仕組みの中で「AI」が働くのは、音声を文字にするところと、文字から日付や名前を取り出すところだけです。
| 作業 | 誰がやる? |
|------|-----------|
| 電話に出る | Atom Echo(プログラム) |
| 声を文字に | Whisper(AI) |
| 文字から予約データを抜き出す | LLM(AI) |
| 次に何を聞くか決める | 状態機械(プログラム) |
| 相手に話す文章を作る | 固定テンプレート(プログラム) |
| 予約を保存する | Paperclip(プログラム) |
| 最終確認する | 担当者さん(人間) |
AIに「会話」を任せると、おかしなことを言うかもしれません。存在しない日付をでっち上げるかもしれません。だからAIの仕事を情報を抜き出すことだけに限定している。これがこの仕組みの一番大事な設計です。
7. 「無音」と「間」の問題
お年寄りと話していて、いちばん困るのが沈黙です。
今の仕組みでは、相手が喋り終わってから応答が返るまでに、こんな時間がかかります:
-
無音が3秒続く → 「話し終わった」と判断
-
文字起こしに2〜4秒
-
応答を作って声に出す
つまり最長で7秒、相手は無音を待つことになります。高齢者にとって7秒はとても長い。「もしもし? 切れた?」と不安になります。
対策はこうです。相手が喋り終わったと判断した瞬間、まず 「少々お待ちください」 という短い声を即座に返す。その裏で文字起こしとデータ抽出を走らせる。「待たされている」ではなく「ちゃんと聞いてもらえている」と感じてもらう。さらにぬいぐるみが「ピッ、ピッ」と小さな音を鳴らせば、考えている感じが伝わります。
8. これが完成したら
まず動かす
Atom Echoをプログラミングして、AndroidとBluetoothでつなぎます。電話がかかってきたら応答して、音声をMacに送る。文字起こし→予約抽出→仮予約登録。
担当者さんはスマホに届く通知を見て「承認」を押すだけ。
その先の世界
Vapi(できあいのAI電話サービス)につなげば、その日から全自動です。月2万円かかるけれど、すぐに「電話を取って予約を取る」ところまで行けます。
ゆくゆくは、Vapiを外して、自分たちで作った応答の仕組み(ayame)に置き換える。そのとき、月の費用は1,550円。ほとんど電気代だけです。
9. いちばん大事なこと
このプロジェクトの本当のゴールは「AIで電話予約を自動化しました」ではありません。
「電話予約の話をしているときに、AIという言葉が出てこなくなること」 です。
ぬいぐるみが座っていて、電話が鳴ったら出て、予約を取る。それだけ。お年寄りは「ぬいぐるみの担当者さん」に話しかけているだけで、中で何が動いているかは知らなくていい。操作方法も説明書もいらない。
いい道具は、使い方を覚えなくても使える。道具の存在を意識しなくなる。
10. いま、どこまで来ているか
| 段階 | やること | いま |
|------|---------|------|
| Phase 0 | アナログケーブルで録音実験 | 部品待ち |
| Phase 0.5 | Atom Echo Bluetooth調査 | ✅ 調査完了 |
| Phase 1 | 文字起こし〜予約保存の自動化 | 未着手 |
| Phase 2 | 本番の電話番号と端末 | 未着手 |
資料
| 資料 | ありか |
|------|--------|
| プロジェクト全体設計書 | 10_再開発移動支援AX.md |
| 実験手順書 | 10_再開発移動支援AX_PoC手順書.md |
| Bluetooth HFP 調査結果 | phase_0_5_atom_echo_hfp_research.md |
| Fabric 詳細報告 | ~/fabric/2026-05-30_Phase0.5_HFP調査結果.md |
| Paperclip Issue | CMP-3(done) |
| ayame 対話エンジン | ~/ayame/ |
動くものから。順番を守れ。やったことは残る。
この記事は note.com から KTBLOG に移行されました。元記事: https://note.com/famous_prawn2009/n/nee1c3f1125e7