ケイティの野望、サイファーパンクのテレアポセンター——電話予約を完全自営する方法
ケイティの野望、サイファーパンクのテレアポセンター——電話予約を完全自営する方法
出典: note.com / 2026-05-24
ケイティの野望、サイファーパンクのテレアポセンター
電話予約を完全自営する方法
前回、5体のAIエージェントで電話予約を自動化する話を書いた。利用者が電話をかけるとAIアシスタントが応答し、日時を調整して予約を確定する。人間には気持ちのいい対応だ。問題はその裏側にある。
Vapiは1回の通話につき0.05ドルかかる。月に450回の予約電話があるとして、ざっと6750円。KTの反応はこうだ。
「これ、自分で動かせないの?」
サイファーパンク。「自分でやれ、自分で持て」を信条とする1990年代からの思想だ。クラウドに預けるな。自分のコンピュータは自分で動かせ。パスワードは自分で管理しろ。便利なサービスに依存すると、いつか必ず飼いならされる。
電話予約の自営は、この思想の延長線上にある。Vapiをやめて、全部ローカルで動かす。そのピースがそろった。
音声認識にはfaster-whisper。オープンソースのモデルで、精度は商用サービスに匹敵する。音声合成にはVOICEVOX。日本語の読み上げが驚くほど自然だ。会話の制御にはLiveKit Agents。WebRTCベースで、電話のリアルタイム通信を処理する。そしてOllama。ローカルで動く大規模言語モデルで、会話の内容を理解し、返答を生成する。
これらの組み合わせで、Vapiと同じことが自宅のMacで動く。
コストを計算する。
Vapi月額6750円に対し、ローカル構成の費用は電話番号代のみ。月額610円。差額は6140円。年間で73680円。高いか安いかは人それぞれだが、KTの視点は違った。「月に6140円の差なら、1年で旅行に行ける」。彼女にとってこれはコスト最適化ではなく、資源の再配分だ。
技術的なハードルはある。Vapiは設定をポチポチやれば動くが、ローカル構成は自分で全てを組み立てる。faster-whisperのモデルをダウンロードし、VOICEVOXのエンジンを起動し、LiveKit Agentsのサーバーを立て、Ollamaにモデルをロードし、それらを全て連携させる。トラブルが起きたら自分で直す。一見面倒だが、全てを掌握できるということでもある。
クラウドサービスが止まったら待つしかない。自営なら自分で直せる。
外部サービスに依存するということは、そのサービスの都合に合わせることだ。料金が上がっても、仕様が変わっても、サービスが終了しても、ユーザーには選択肢がない。自分で動かすということは、リスクを全て引き受ける代わりに、全ての決定権を得ることだ。
KTが目指すのはテレアポセンターの完全自営化。Vapiのようなピースを使いながらも、核となる部分は自分で持つ。クラウドに預けるべき部分と、自前で持つべき部分の境界線を、自分で引く。この判断ができるようになった時、その人はサービス利用者からシステム設計者に変わる。
中高生の君がもし「AIで何か作りたい」と思っているなら、一度考えてみろ。
「これ、自分で動かせない?」
その質問が全ての始まりだ。
この記事は note.com から KTBLOG に移行されました。元記事: https://note.com/famous_prawn2009/n/nd7cb856754a9