Hermes Agent完全ガイド 第3回:モデル選び — Opus/Sonnet/GPT-5.4/無料モデル
Hermes Agent完全ガイド 第3回:モデル選び — Opus/Sonnet/GPT-5.4/無料モデル
出典: note.com / 2026-03-22
あなたのAIエージェントの「脳」を選ぶ
Hermes Agentを使い始めて最初にぶつかる壁がある。
「モデルは何を選べばいいんだ?」
Claude Opus 4.6、Claude Sonnet 4.5、GPT-5.4、Gemini 3 Pro、DeepSeek、Qwen……。選択肢が多すぎる。しかもそれぞれ値段が違う。性能が違う。得意分野が違う。
この記事では、Hermes Agentで使えるモデルを全て解説し、「あなたの使い方なら、これを選べ」という具体的な指針を示す。机上の空論ではない。実際に4台のマシンで毎日Hermes Agentを運用している経験から書く。
まず理解すべきこと:Hermes Agentは「モデル非依存」
ここがHermes Agentの最大の設計思想の一つだ。
実はOpenClawもClaude専用ではない。OpenAI、Gemini、Ollamaなど複数プロバイダーに対応している。ただし、OpenClawはClaude(特にSonnet)との親和性が最も高く設計されており、他モデルでの動作は限定的だ。
一方、Hermes Agentは設計の根幹からマルチモデル対応を前提にしている。Anthropic、OpenAI、Google、DeepSeek、Qwen、Kimi、MiniMax、さらにはOllamaで動かすローカルモデルまで。対応プロバイダーは20以上。
これが意味するのは:
・最高性能が欲しいなら → Claude Opus 4.6やGPT-5.4 Proを使える
・コストを抑えたいなら → 無料モデルや格安モデルに切り替えられる
・オフラインで使いたいなら → Ollamaでローカルモデルを動かせる
・用途に応じて混在できる → メインはOpus、サブタスクはSonnet、検索はGemini
OpenClawでも理論上はモデル切替が可能だが、Hermesほどシームレスではない。Hermesはconfig.yaml一行の変更で全プロバイダーに切り替えられ、補助タスクごとに別モデルを割り当てる機構まで備えている。
主要モデル一覧 — 2026年3月現在
Tier S:最高性能(月額$60〜$200の覚悟)
Claude Opus 4.6(Anthropic)
・Hermes Agentの「推奨モデル」。公式が一番上に置いている
・コーディング能力が圧倒的。複雑なマルチファイル編集、長いコンテキストでの整合性維持が得意
・200Kトークンのコンテキストウィンドウ
・弱点:高い。入力$15/100万トークン、出力$75/100万トークン。長時間セッションで数千円飛ぶこともある
・うちの運用:4号機(M1 Pro Max 64GB)のメイン頭脳。判断・指揮・分析専門
GPT-5.4 Pro(OpenAI)
・OpenAIの最上位。推論能力はOpusと互角かそれ以上の場面もある
・100万トークンのコンテキスト。Opusの5倍
・弱点:さらに高い。そしてOpenAIのAPI制限が厳しい
・うちの運用:特殊な推論タスクで使うことがある程度
Tier A:高性能・実用的(月額$10〜$60)
Claude Sonnet 4.5 / 4.6(Anthropic)
・Opusの弟分。性能はOpusの7〜8割だが、コストは約1/5
・入力$3/100万トークン、出力$15/100万トークン
・日常的なコーディング、文章作成、分析なら十分すぎる
・Hermes Agentの「サブエージェント」として最適。メインのOpusが指揮を取り、実作業をSonnetに委譲するパターン
GPT-5.4(OpenAI)
・バランス型。コーディングも推論もそこそこ強い
・100万トークンコンテキスト
・うちの運用:30日間の統計で3セッション、376万トークン消費。大量のデータ分析に使った
Gemini 3 Pro / Flash(Google)
・100万トークンのコンテキストが最大の武器
・長大なドキュメントを丸ごと読ませる用途に最適
・Flashは高速・低コスト。要約やデータ変換に向く
Tier B:コスパ重視(月額$0〜$10)
Qwen 3.5 Plus(Alibaba Cloud)
・中国発のモデルだが性能は侮れない
・Alibaba Cloudのコーディング定額プランなら月$10で使い放題
・うちの運用:補助タスク(圧縮、セッション検索、ビジョン分析)を全てQwenに回している。これでOpusのトークンを節約
DeepSeek V3.2 / Chat(DeepSeek)
・中国発。コーディング特化で評価が高い
・65Kトークンとコンテキストは狭いが、指示追従性が良い
・価格が非常に安い
Claude Haiku 4.5(Anthropic)
・Claudeファミリーの最軽量。高速・低コスト
・単純なタスク(ファイル検索、フォーマット変換、簡単な質問応答)に最適
・うちの運用:2セッション使用。軽い作業専用
Tier C:無料モデル($0)
Hunter Alpha / Healer Alpha(OpenRouter提供)
・OpenRouterが提供する無料モデル
・性能はTier Sに遠く及ばないが、学習用・テスト用としては十分
・制限:レート制限あり、応答品質にばらつき
Nemotron 3 Super 120B / Trinity Large(NVIDIA / Arcee AI)
・OpenRouter経由で無料利用可能
・ローカルで動かすには巨大すぎるモデルを無料で試せる
Ollamaローカルモデル
・自分のマシンで動かすなら完全無料
・うちの4号機にはOllama経由で16モデル、合計350GBが常駐している
・弱点:M1 Pro Max 64GBでも大型モデルは遅い。推論品質もクラウドAPIには及ばない
・利点:オフライン動作、プライバシー完全確保、ランニングコスト¥0
設定方法 — config.yamlの書き方
Hermes Agentのモデル設定は ~/.hermes/config.yaml で行う。
メインモデルの設定:
hermes setup を実行すると対話形式で設定できる。もしくはconfig.yamlを直接編集する。
プロバイダーの設定は ~/.hermes/.env にAPIキーを書く:
ANTHROPIC_API_KEY=sk-ant-xxx
OPENAI_API_KEY=sk-xxx
GROQ_API_KEY=gsk_xxx
OpenRouterを使えば、1つのAPIキーで全モデルにアクセスできる:
OPENROUTER_API_KEY=sk-or-xxx
これがHermes Agentの「モデル非依存」を実現している仕組みだ。
うちの実運用 — 4台の艦隊はこう使い分けている
ここからが本題だ。理論ではなく、実際の運用を見せる。
4号機(オーベルシュタイン)— M1 Pro Max 64GB
・メインモデル:Claude Opus 4.6(Anthropic直接)
・補助モデル:Kimi K2.5(圧縮・検索・ビジョン用)
・役割:判断・指揮・分析。最も高度なタスクを担当
・コスト戦略:Opusは高いので、単純作業はサブエージェントに委譲。自分は「考える」ことに専念
1号機(ロデム)— M1 Air
・メインモデル:定時X投稿(1日21本のcron)を担当
・役割:ソーシャルメディア運用の自動化
2号機(DATA少佐)— 2019 Intel MBP
・OpenClaw(Claude直接)で動作
・役割:暗号通貨・サイファーパンク関連
・Hermes Agentではなく、あえてOpenClawを使っている理由:この用途ではOpenClawのシンプルさが合う
3号機(ラフォージ)— Mac mini M4
・OpenClaw(Claude直接)で動作
・役割:会計コンサルSaaS開発
4台中2台がHermes Agent、2台がOpenClaw。これが現実だ。全てをHermesにする必要はない。タスクに合ったツールを選ぶ。
「補助モデル」という概念 — Hermesだけの武器
Hermes Agentには「auxiliary(補助)」という設定がある。これがコスト最適化の鍵だ。
config.yamlで以下のように設定する:
auxiliary:
compression:
model: kimi-k2.5
provider: custom
session_search:
model: kimi-k2.5
provider: custom
vision:
model: kimi-k2.5
provider: custom
これは何をしているかというと:
・コンテキスト圧縮(会話が長くなった時の要約)→ 安いモデルに任せる
・セッション検索(過去の会話を探す)→ 安いモデルに任せる
・画像認識(スクリーンショット分析など)→ 安いモデルに任せる
メインのOpusは「判断」だけに集中し、それ以外の雑務は安いモデルが処理する。人間の組織と同じだ。社長が経理もやっていたら会社は回らない。
OpenClawにも補助的なモデル活用の概念はあるが、Hermesほど体系的に「メインモデルと補助モデルを明確に分離する」設計にはなっていない。Hermesのauxiliary設定は、タスク種別ごとに別モデルを割り当てる粒度の細かさが特徴だ。
モデル選びの判断フローチャート
迷ったらこの順番で考えろ:
予算は月いくらか?
・¥0 → Ollamaローカルモデル or OpenRouter無料モデル
・〜¥1,500 → Qwen 3.5 Plus(Alibaba定額)or DeepSeek
・〜¥5,000 → Claude Sonnet 4.5 + 補助モデルにQwen
・〜¥15,000 → Claude Opus 4.6 + 補助モデルにKimi/Qwen
・上限なし → GPT-5.4 Pro + Opus の二刀流
主な用途は?
・コーディング中心 → Claude Opus 4.6 が最強
・長文分析 → Gemini 3 Pro(100万トークン)
・チャットボット運用 → Sonnet 4.5 で十分
・学習・実験 → 無料モデルで始めてから上げていく
プライバシーは?
・クラウドに送りたくないデータがある → Ollamaローカルモデル一択
OpenClawとの比較 — モデル選びの自由度
項目: 対応モデル / Hermes Agent: 50種以上 / OpenClaw: Claude/OpenAI/Gemini/Ollama等(Claudeが最適)
項目: プロバイダー / Hermes Agent: 20以上(Anthropic/OpenAI/Google/DeepSeek/Qwen/Kimi/MiniMax/Ollama他) / OpenClaw: 複数対応(Claudeとの親和性が最高)
項目: モデル切替 / Hermes Agent: config.yaml一行で全プロバイダー / OpenClaw: 設定変更で対応(Hermesほどシームレスではない)
項目: 補助モデル / Hermes Agent: あり(タスク種別ごとに別モデル割当可能) / OpenClaw: 限定的
項目: 無料モデル / Hermes Agent: あり(OpenRouter経由で複数) / OpenClaw: 限定的
項目: ローカルモデル / Hermes Agent: Ollama完全対応 / OpenClaw: Ollama対応あり
OpenClawの設計思想は「Claudeとの親和性を最大化する」だ。他モデルにも対応しているが、Claudeで使った時に最も力を発揮する。
Hermes Agentの設計思想は「どのモデルでも等しく動く」だ。20以上のプロバイダーを一級市民として扱い、補助タスクのモデル分離まで設計に組み込んでいる。
どちらが正解かは、あなたの状況次第だ。Claudeメインなら OpenClawの方がシンプルで良い場面もある。モデルの選択肢と柔軟性を重視するならHermesだ。
実際のコストを晒す
うちの直近30日間のHermes Agent統計:
・全セッション: 61回
・全メッセージ: 3,318通
・全ツール呼び出し: 1,359回
・全トークン: 4,252,286(入力: 4,219,824 / 出力: 32,462)
モデル別の内訳:
・GPT-5.4: 3セッション、3,762,147トークン
・Claude Opus 4.6: 25セッション、490,139トークン
・Qwen 3.5 Plus: 12セッション(補助タスク)
・Claude Haiku 4.5: 2セッション
注目すべきは、GPT-5.4がたった3セッションで376万トークンを消費していること。大量データ処理に使うとトークンが爆発する。日常運用はOpusの49万トークンで25セッション回している。
補助モデル(Kimi/Qwen)のおかげで、Opusの消費を最小限に抑えている。この「頭脳と手足の分離」がHermes Agentの運用コスト最適化の核心だ。
まとめ:モデル選びは「予算×用途」の掛け算
・金に糸目をつけないなら、Claude Opus 4.6一択。Hermes Agentの全機能を最大限引き出せる
・コスパ重視なら、Sonnet 4.5 + Qwen補助の組み合わせが最強
・完全無料でも始められる。Ollamaかo OpenRouter無料モデルで「AIエージェントとは何か」を体感してから課金しても遅くない
・OpenClawも複数モデルに対応しているが、Hermesの強みは対応プロバイダーの広さと、補助モデルによるコスト分離の設計にある
次回はさらに深い話をする。「第4回:認証の真実 — OAuth/APIキー/setup-token」。Hermes Agentの認証システムは一見複雑に見えるが、理解すれば強力だ。そしてOpenClawのsetup-tokenとは根本的に違う。
この記事は note.com から KTBLOG に移行されました。元記事: https://note.com/famous_prawn2009/n/n794f43fe5da1