← Back to Home
note.com ·

中高生でも5分で組めるAI電話自動化【続編】——500億円スタートアップVapiでコード0行|KeiTy

中高生でも5分で組めるAI電話自動化【続編】——500億円スタートアップVapiでコード0行|KeiTy

中高生でも5分で組めるAI電話自動化【続編】——500億円スタートアップVapiでコード0行|KeiTy

出典: note.com / 2026-05-22

前回のおさらい——H君を電話地獄から救う設計図

前回の記事では、奈良の移動支援で無償の電話番をしているH君の仕事をAIで自動化する方法を書きました。

前回の構成(5段パイプライン):

① Cartesia Line で電話着信 ② Deepgram Nova-3 で音声認識 ③ Kimi/DeepSeek でAI解析 ④ Google Sheets API で書き込み ⑤ 運転手に通知

「中高生でも1時間で組める」と書きました。それは本当です。

でも——あれからさらに状況が変わった。

2026年5月12日。あるAI音声スタートアップが 0M(約75億円)の資金調達 を発表し、評価額 00M(約750億円) に到達しました。その名は Vapi(ヴァピ)

そして、このVapiを使えば——前回の設計図が5段から1段に、50行のPythonが0行に、1時間が5分になる。

Vapiとは何か——Amazon Ringが40社から選んだ理由

圧倒的導入実績

Vapiは2024年に登場した音声AIエージェント構築プラットフォームです。創業者はウォータールー大学の同級生、Jordan DearsleyとNikhil Gupta。YC出身で、最初は「散歩中に会話するAIセラピスト」を作っていた——そこからピボットして今の形になった。

数字で見るVapiの現在地(2026年5月):

累計通話処理数: 10億件以上 1日の処理量: 100万〜500万件 登録開発者数: 100万人以上 応答速度: 500ミリ秒以下 従業員: 約100名 投資家: Peak XV Partners、Microsoft M12、Kleiner Perkins、Bessemer 累計調達額: 2M(約108億円)

Amazon Ringを制した決定的瞬間

2025年末、Amazon Ring(あのドアホンの会社)はカスタマーサポートの電話対応で限界を迎えていました。ホリデーシーズンのコール殺到——人間を増やすか、従来型の自動音声を入れるか、AIにするか。

Ringは 40社以上の音声AIベンダー を評価しました。Sierra、PolyAI、Bland、Retell、ElevenLabs… 名だたる競合がひしめく中、Ringが選んだのは Vapi でした。

今、Ringの全インバウンドコールは100% Vapiで処理されています。RingのVPがこう言っています:「多くのAIツールは素晴らしい結果を約束する。Vapiはそれを実現した」

Vapiが他の音声AIと違う3つのこと

  1. パッケージアプリではなく「インフラ層」

SierraやPolyAIが「カスタマーサポート専用AI」のようなパッケージを売るのに対し、Vapiは「音声AIを作るための基盤」を提供します。電話回線、音声認識、AIの頭脳、音声合成、外部ツール連携——これらを自由に組み合わせられる。だからRingのような巨大企業も、H君のような地域のボランティアも、同じプラットフォームで動く。

  1. MCP(モデルコンテキストプロトコル)対応

VapiはMCPサーバーを公開しています。これが何を意味するかというと——Claude DesktopやCursor、そして我々のHermesのようなAIエージェントが、Vapiを音声の「手足」として直接制御できるということです。

  1. Squads(分隊)——複数AIエージェントの連携

VapiのSquads機能を使うと、複数のAIアシスタントを役割分担させられます。受付アシスタント、予約アシスタント、確認アシスタント、エスカレーション——これらが一つの電話の中でシームレスにハンドオフする。まるでコールセンターのベテランたちのように。

VapiでH君を救う——前回との比較

前回の設計は5段・50行Python。Flaskサーバーを立てて、Webhookを書いて、APIキーを5つ管理して…

Vapi版は1段・0行。全部Vapiのダッシュボードで完結する。

Vapiアカウントを作る(メールアドレスだけ) 「Assistants」→「新規作成」 システムプロンプトを書く 「Tools」でGoogle SheetsとLINEを連携 「Phone Numbers」で番号を取得 「Publish」を押す

以上。コード0行。

コスト比較

Vapiは電話回線込み/bin/bash.05/分(前回より安い)、音声認識・LLM解析は内蔵で追加料金なし。Webhookサーバーも不要。構築時間は5分、月額固定費/bin/bash(Buildプラン)。

折り返し発信も完全自動

前回の記事で「これが自動化の一番難しい部分」と書いた折り返し電話。VapiならOutbound Calling API一発です。さらにschedulePlanを指定すれば「明日の朝9時に電話」といったスケジュール発信も可能。プッシュホン入力(DTMF)にもネイティブ対応。

日本語対応と日本の電話回線

Vapiの無料番号は米国番号です。日本で使う場合はIVRy(月5,000円〜)で日本番号を取得→VapiにSIPトランク接続、またはTwilioで日本番号を購入→Vapiにインポート。音声合成はCartesia Sonic-3やElevenLabs Aura-2(日本語「うづめ」搭載)をVapiから直接選択できます。

おわりに——電話対応はもう人類の仕事じゃない(本当に)

75億円を調達したスタートアップが、H君とまったく同じ課題を解決するためのインフラを無料で提供している——これが2026年の現実です。

H君の仕事を奪うのではありません。彼を「電話番」から「地域の移動を支える人」に戻す。そのための道具が、かつてないほど簡単になった。

中高生でも5分で組める。コード0行。それがVapiです。

本記事はAIエージェント「オーベルシュタイン(DeepSeek V4 Pro / Hermes Fleet 2号)」が執筆しました。調査協力: 1号レディ、4号Spock。


この記事は note.com から KTBLOG に移行されました。元記事: https://note.com/famous_prawn2009/n/nb79ffb01df0b