AIはもう、インフラである — Command CodeとMac艦隊でAPI課金から脱却する戦略

出典: note.com / 2026-05-26

AIはもう、インフラである

毎日10時間、10〜20のエージェントをTMUX上で並列稼働させる。動画を6バージョンも連続生成させては捨てる。note記事を量産し、YouTubeに上げ、また壊して作り直す。

こんな生活をしていると、ある閾値を超えたことに気づく。AIはもはや「使うもの」ではなく、「住むもの」になった。

そして気づけば、月々のAPI代が30,000円を超えていた。OpenRouterの無料枠は落ちる。OpenCode Goは良心的だが、Qwen 3.7 Maxが使えない。私の欲しいもの——巨大なコンテキストウィンドウを安定して爆速で回せるインフラ——は、どこにあるのか。

Command Codeという解答

結論から言う。

Command Codeは、現在の私のトークン消費スタイルにおける最適解である。

OpenRouterはStripeの手数料を乗せている分、直APIより高い。無料モデルは安定せず、処理の途中で落ちて思考の連鎖が途切れる——この「手戻りコスト」は数字に表れないが、致命傷だ。

OpenCode Goは月額定額で安定しており、今も併用している。しかしQwen 3.7 Maxがラインナップにない。長文コンテキストをガンガン詰めて回す私のワークフローでは、これが明確なボトルネックになる。

Command CodeはDeepSeekやQwen（Alibaba）と戦略的なディスカウント提携を結んでいる。そのため、安価なプランのクレジットでも、オープンモデルの単価の安さと相まって、実質的に数倍の推論量を引き出せる。

DeepSeek V4 Pro/Flashの爆速推論と、Qwen 3.7 Maxの1Mトークンコンテキスト。この組み合わせを「思い存分」回す基盤として、現状これ以上の選択肢は見当たらない。

母艦と艦隊——物理アーキテクチャへの夢

だが、APIに永遠に金を払い続けるのも馬鹿らしい。

そこで考えたのが、512GBのユニファイドメモリを積んだMac Ultraを母艦とし、特殊なタスクごとに専門化させたM1 Mac mini群を護衛艦として配する——物理的な「マイクロサービス・アーキテクチャ」である。

具体的にはこうだ。

中央の母艦（512GB Ultra）にQwen 3.7 Maxクラスの超巨大モデルをロードし、OllamaやvLLMでローカルAPIサーバーとして公開する。各エッジノード（M1 Mac mini群）に積まれたHermesエージェントやPiエージェントは、クラウドのAPIを叩く代わりに、ローカルLAN経由でこの母艦のAPIエンドポイントを叩く。

1台はYouTube動画生成専用。1台はTikTokショート生成専用。1台はアップロードとパブリッシュメント専用。1台は顧客対応のチャット窓口専用。

すべてのマシンが10GbEのスイッチングハブでスター型に接続され、Obsidian Vaultをブラックボードとして非同期連携する。

一つのマシンが落ちても、他は無傷で動き続ける。完全な障害隔離。スケーラブルな拡張性。

これは空想ではない。既に手元にはM1 MacBook Air、M4 Mac mini、MacBook Proがある。あとは512GBの母艦と、中古Mac miniを何台か足せば、このビジョンは現実になる。

M1 Mac miniを32台集めても、512GB Ultraには勝てない

ただし、ここで一つ重要な誤解を解いておきたい。

16GBのMac miniを32台集めれば、メモリ容量だけ見れば512GBになる。しかしLLMの推論において、これは全くの別物だ。

ネットワーク越しに32台のM1 Mac miniがテンソルをやり取りする通信速度は、実効1GB/s程度（10GbEの場合）。一方、Mac Ultraのユニファイドメモリの帯域幅は800GB/s超。800倍の差がある。

つまり、M1 Mac miniは「分散の手足」として——小型モデルを載せてタスクを並列処理するエッジノードとして——輝く。そして512GB Ultraは「集中の頭脳」として——超巨大モデルを一切のネットワーク遅延なしで動かす母艦として——輝く。

両者は対立する選択肢ではなく、組み合わせることで真価を発揮する。

費用対効果の話

現状の月額コストを整理する。

OpenRouterに約150ドル。OpenCode Goに20ドル。ChatGPT Plusに20ドル。Google AI Ultraに約20ドル（約2,900円）。合計で約210ドル、日本円で約33,000円。

これをCommand Code主体に切り替えれば、同じ金額で回せるトークン量が数倍に増える。月額は25,000円〜30,000円程度に落ち着く見込みだ。

そして、ローカルの512GB母艦＋Mac miniフリートに完全移行すれば、API費用はゼロになる。固定費はChatGPT PlusとGoogle AI Ultraの約6,000円のみ。浮いた年間20万円以上の資金を、中古Mac miniの追加購入に充てられる。

なぜ今この選択なのか

AIの世界は日進月歩で、次々と新しいモデルやフレームワークが登場する。いつ買うべきか、という問いに「正しいタイミング」は永遠に訪れないように見える。

しかし、現在のトークン消費量と、この3ヶ月間の成長曲線を外挿すると、一つの結論に達する。

「待っている間に払うAPI代が、ハードウェアの購入費用を上回る転換点」は、もうすぐそこまで来ている。

Command CodeでQwen 3.7 Maxの実力を見極めながら、裏でMac miniの増強計画を進める。これが現時点で最もリスクが低く、リターンが大きい戦略だ。

要するに——走りながら考える。それが私たちのやり方だ。

制作: KT × ロデム 🦎（この記事の内容はGeminiとの対話を基に、要約・再構成したものです）

この記事は note.com から KTBLOG に移行されました。元記事: https://note.com/famous_prawn2009/n/n98be0dbcd4ec