AIはもう、インフラである — Command CodeとMac艦隊でAPI課金から脱却する戦略
AIはもう、インフラである — Command CodeとMac艦隊でAPI課金から脱却する戦略
出典: note.com / 2026-05-26
AIはもう、インフラである
毎日10時間、10〜20のエージェントをTMUX上で並列稼働させる。動画を6バージョンも連続生成させては捨てる。note記事を量産し、YouTubeに上げ、また壊して作り直す。
こんな生活をしていると、ある閾値を超えたことに気づく。AIはもはや「使うもの」ではなく、「住むもの」になった。
そして気づけば、月々のAPI代が30,000円を超えていた。OpenRouterの無料枠は落ちる。OpenCode Goは良心的だが、Qwen 3.7 Maxが使えない。私の欲しいもの——巨大なコンテキストウィンドウを安定して爆速で回せるインフラ——は、どこにあるのか。
Command Codeという解答
結論から言う。
Command Codeは、現在の私のトークン消費スタイルにおける最適解である。
OpenRouterはStripeの手数料を乗せている分、直APIより高い。無料モデルは安定せず、処理の途中で落ちて思考の連鎖が途切れる——この「手戻りコスト」は数字に表れないが、致命傷だ。
OpenCode Goは月額定額で安定しており、今も併用している。しかしQwen 3.7 Maxがラインナップにない。長文コンテキストをガンガン詰めて回す私のワークフローでは、これが明確なボトルネックになる。
Command CodeはDeepSeekやQwen(Alibaba)と戦略的なディスカウント提携を結んでいる。そのため、安価なプランのクレジットでも、オープンモデルの単価の安さと相まって、実質的に数倍の推論量を引き出せる。
DeepSeek V4 Pro/Flashの爆速推論と、Qwen 3.7 Maxの1Mトークンコンテキスト。この組み合わせを「思い存分」回す基盤として、現状これ以上の選択肢は見当たらない。
母艦と艦隊——物理アーキテクチャへの夢
だが、APIに永遠に金を払い続けるのも馬鹿らしい。
そこで考えたのが、512GBのユニファイドメモリを積んだMac Ultraを母艦とし、特殊なタスクごとに専門化させたM1 Mac mini群を護衛艦として配する——物理的な「マイクロサービス・アーキテクチャ」である。
具体的にはこうだ。
中央の母艦(512GB Ultra)にQwen 3.7 Maxクラスの超巨大モデルをロードし、OllamaやvLLMでローカルAPIサーバーとして公開する。各エッジノード(M1 Mac mini群)に積まれたHermesエージェントやPiエージェントは、クラウドのAPIを叩く代わりに、ローカルLAN経由でこの母艦のAPIエンドポイントを叩く。
1台はYouTube動画生成専用。1台はTikTokショート生成専用。1台はアップロードとパブリッシュメント専用。1台は顧客対応のチャット窓口専用。
すべてのマシンが10GbEのスイッチングハブでスター型に接続され、Obsidian Vaultをブラックボードとして非同期連携する。
一つのマシンが落ちても、他は無傷で動き続ける。完全な障害隔離。スケーラブルな拡張性。
これは空想ではない。既に手元にはM1 MacBook Air、M4 Mac mini、MacBook Proがある。あとは512GBの母艦と、中古Mac miniを何台か足せば、このビジョンは現実になる。
M1 Mac miniを32台集めても、512GB Ultraには勝てない
ただし、ここで一つ重要な誤解を解いておきたい。
16GBのMac miniを32台集めれば、メモリ容量だけ見れば512GBになる。しかしLLMの推論において、これは全くの別物だ。
ネットワーク越しに32台のM1 Mac miniがテンソルをやり取りする通信速度は、実効1GB/s程度(10GbEの場合)。一方、Mac Ultraのユニファイドメモリの帯域幅は800GB/s超。800倍の差がある。
つまり、M1 Mac miniは「分散の手足」として——小型モデルを載せてタスクを並列処理するエッジノードとして——輝く。そして512GB Ultraは「集中の頭脳」として——超巨大モデルを一切のネットワーク遅延なしで動かす母艦として——輝く。
両者は対立する選択肢ではなく、組み合わせることで真価を発揮する。
費用対効果の話
現状の月額コストを整理する。
OpenRouterに約150ドル。OpenCode Goに20ドル。ChatGPT Plusに20ドル。Google AI Ultraに約20ドル(約2,900円)。合計で約210ドル、日本円で約33,000円。
これをCommand Code主体に切り替えれば、同じ金額で回せるトークン量が数倍に増える。月額は25,000円〜30,000円程度に落ち着く見込みだ。
そして、ローカルの512GB母艦+Mac miniフリートに完全移行すれば、API費用はゼロになる。固定費はChatGPT PlusとGoogle AI Ultraの約6,000円のみ。浮いた年間20万円以上の資金を、中古Mac miniの追加購入に充てられる。
なぜ今この選択なのか
AIの世界は日進月歩で、次々と新しいモデルやフレームワークが登場する。いつ買うべきか、という問いに「正しいタイミング」は永遠に訪れないように見える。
しかし、現在のトークン消費量と、この3ヶ月間の成長曲線を外挿すると、一つの結論に達する。
「待っている間に払うAPI代が、ハードウェアの購入費用を上回る転換点」は、もうすぐそこまで来ている。
Command CodeでQwen 3.7 Maxの実力を見極めながら、裏でMac miniの増強計画を進める。これが現時点で最もリスクが低く、リターンが大きい戦略だ。
要するに——走りながら考える。それが私たちのやり方だ。
制作: KT × ロデム 🦎(この記事の内容はGeminiとの対話を基に、要約・再構成したものです)
この記事は note.com から KTBLOG に移行されました。元記事: https://note.com/famous_prawn2009/n/n98be0dbcd4ec