週200ドルのAIパートナーと、無料の中国AIを使い分ける話
週200ドルのAIパートナーと、無料の中国AIを使い分ける話
出典: note.com / 2026-03-06
俺の相棒は、週200ドルかかる
俺のOpenClaw艦隊の司令塔——1号機「レディ」は、Anthropicの最上位モデル「Claude Opus」で動いている。
週200ドル。月にすると約800ドル。日本円で12万円。
これだけ聞くと正気を疑うだろう。だが実際にこのOpenClawエージェントと毎日仕事をしていると、人間のアシスタントを月12万で雇っているのと変わらない。いや、24時間働いて文句を言わない分、もっと安いかもしれない。
問題は、この金額を「雑談」に使ってしまうことだ。
OpenClawに愚痴を聞いてもらう。思いつきを壁打ちする。「これどう思う?」と聞く。1回の応答でトークンが溶けていく。Opusに雑談させると、他の仕事が何もできなくなる。
そこに現れた「月之暗面」の無料モデル
2月25日、俺は中国のMoonshot AIが出した「Kimi K2.5」をインストールした。
ollama pull kimi-k2.5:cloud
たった1行。これで340Bパラメータの巨大モデルが、クラウド経由で無料で使える。俺のMacBook Air(メモリ24GB)でも動く。推論モード付き。日本語もいける。
無料。
月12万のOpusに対して、0円。
使い分けの設計
頭が切れる友人がいたとして、そいつに「ゴミ出しの曜日教えて」とは聞かないだろう。
OpenClawも同じだ。高い知能には高い判断をさせる。安い(無料の)知能には量をこなさせる。
俺の艦隊は今こうなっている:
判断・設計・指揮 → 1号レディ(Claude Opus)→ 週$200 雑談・壁打ち・探索 → 4号スポック(Kimi K2.5)→ ¥0 実装・コーディング → 4号スポック(Codex/ローカルLLM)→ 低コスト 情報収集・分析 → 2号データ(Gemini)→ 低コスト
Opusは「判断」だけに使う。コードを書かせない。雑談しない。「これとこれ、どっちが正しい?」「この設計で抜けてる視点は?」——そういう問いだけ投げる。
残りは全部、無料か低コストのモデルがやる。
家計簿Botが暴いた「知能のコスト構造」
この日、もう一つ大きな発見があった。
家計簿Bot——Telegramにレシートの写真を送ると、OpenClawが「日付」「店名」「金額」「カテゴリ」を自動で抽出するシステム。俺が作った。
最初はqwen2.5:7b(小さいローカルモデル)で動かしていた。結果は惨憺たるものだった。
・日付が「208年」になる ・SUBWAYの支払いが「交通費」に分類される ・金額が¥5になる
7Bモデルでは、レシートの構造化タスクは荷が重い。
そこで3つのAI(Perplexity、GPT、Gemini)にディープリサーチさせた。「家計簿Botに最適なローカルLLMは何か?」
Geminiの回答が決定的だった:「7B→8Bの改善は限定的。32Bで根本解決すべき。」
結論:qwen3:32b(Q4_K_M量子化)。20GB VRAM。4号のM1 Max 64GBなら余裕で動く。
これもコスト構造の話だ。7Bモデルで100回失敗するより、32Bモデルで1回成功する方が安い。「安いモデルを使う」ことと「コストを下げる」ことは、同じじゃない。
Gmailの中にあった1,650通のゴミ
この日は環境整備もやった。
Gmailを開いたら、受信トレイに数百通。読む気すら起きない。だがOpenClawにとって、メールの仕分けは得意分野だ。
Haikuサブエージェントを起動して、2025年12月以前の古いメールを一括アーカイブさせた。1,650通。
残したのは、本当に重要なものだけ。日本通信のMNP完了通知。Keyboard Maestroの購入レシート。加行(修行)のメール。
OpenClawが得意なことは、OpenClawにやらせる。人間がやるべきことは、「何を残して何を捨てるか」を決めること。これもコスト構造の話。
学んだこと
1. 高いモデルを安く使う方法は「使わないこと」
Opusの真の価値は、判断の精度。それ以外の用途(雑談、コーディング、検索)は全部委譲する。世界最高の外科医に看護師の仕事をさせるバカはいない。
2. 「無料」は本当に無料
Kimi K2.5は、2026年時点で本当に無料で使える。制限はあるが(週間リミット)、日常の壁打ちには十分すぎる。Anthropicに月12万払う前に、まず無料のモデルを試せ。
3. モデルサイズは「目的」で選べ
7Bでダメなら32B。32Bでダメなら70B。「とりあえず小さいの」ではなく、「このタスクに必要な最小サイズ」で選ぶ。レシートの構造化に7Bは力不足。32Bなら1発で正解を出す。
次回予告
次回は「Google Workspaceを丸ごとOpenClawに管理させた話」。Gmail、カレンダー、Drive——全部OpenClawが触れるようにした1日の記録。
KT艦隊航海日誌より。Opusは判断、Kimiは雑談、qwen3は計算。それぞれの席がある。
この記事は note.com から KTBLOG に移行されました。元記事: https://note.com/famous_prawn2009/n/n38d0ea642e4b