Hermes Agent完全ガイド第3回：モデル選び — Opus/Sonnet/GPT-5.4/無料モデル

出典: note.com / 2026-03-22

あなたのAIエージェントの「脳」を選ぶ

Hermes Agentを使い始めて最初にぶつかる壁がある。

「モデルは何を選べばいいんだ？」

Claude Opus 4.6、Claude Sonnet 4.5、GPT-5.4、Gemini 3 Pro、DeepSeek、Qwen……。選択肢が多すぎる。しかもそれぞれ値段が違う。性能が違う。得意分野が違う。

この記事では、Hermes Agentで使えるモデルを全て解説し、「あなたの使い方なら、これを選べ」という具体的な指針を示す。机上の空論ではない。実際に4台のマシンで毎日Hermes Agentを運用している経験から書く。

まず理解すべきこと：Hermes Agentは「モデル非依存」

ここがHermes Agentの最大の設計思想の一つだ。

実はOpenClawもClaude専用ではない。OpenAI、Gemini、Ollamaなど複数プロバイダーに対応している。ただし、OpenClawはClaude（特にSonnet）との親和性が最も高く設計されており、他モデルでの動作は限定的だ。

一方、Hermes Agentは設計の根幹からマルチモデル対応を前提にしている。Anthropic、OpenAI、Google、DeepSeek、Qwen、Kimi、MiniMax、さらにはOllamaで動かすローカルモデルまで。対応プロバイダーは20以上。

これが意味するのは：

・最高性能が欲しいなら → Claude Opus 4.6やGPT-5.4 Proを使える

・コストを抑えたいなら → 無料モデルや格安モデルに切り替えられる

・オフラインで使いたいなら → Ollamaでローカルモデルを動かせる

・用途に応じて混在できる → メインはOpus、サブタスクはSonnet、検索はGemini

OpenClawでも理論上はモデル切替が可能だが、Hermesほどシームレスではない。Hermesはconfig.yaml一行の変更で全プロバイダーに切り替えられ、補助タスクごとに別モデルを割り当てる機構まで備えている。

主要モデル一覧 — 2026年3月現在

Tier S：最高性能（月額$60〜$200の覚悟）

Claude Opus 4.6（Anthropic）

・Hermes Agentの「推奨モデル」。公式が一番上に置いている

・コーディング能力が圧倒的。複雑なマルチファイル編集、長いコンテキストでの整合性維持が得意

・200Kトークンのコンテキストウィンドウ

・弱点：高い。入力$15/100万トークン、出力$75/100万トークン。長時間セッションで数千円飛ぶこともある

・うちの運用：4号機（M1 Pro Max 64GB）のメイン頭脳。判断・指揮・分析専門

GPT-5.4 Pro（OpenAI）

・OpenAIの最上位。推論能力はOpusと互角かそれ以上の場面もある

・100万トークンのコンテキスト。Opusの5倍

・弱点：さらに高い。そしてOpenAIのAPI制限が厳しい

・うちの運用：特殊な推論タスクで使うことがある程度

Tier A：高性能・実用的（月額$10〜$60）

Claude Sonnet 4.5 / 4.6（Anthropic）

・Opusの弟分。性能はOpusの7〜8割だが、コストは約1/5

・入力$3/100万トークン、出力$15/100万トークン

・日常的なコーディング、文章作成、分析なら十分すぎる

・Hermes Agentの「サブエージェント」として最適。メインのOpusが指揮を取り、実作業をSonnetに委譲するパターン

GPT-5.4（OpenAI）

・バランス型。コーディングも推論もそこそこ強い

・100万トークンコンテキスト

・うちの運用：30日間の統計で3セッション、376万トークン消費。大量のデータ分析に使った

Gemini 3 Pro / Flash（Google）

・100万トークンのコンテキストが最大の武器

・長大なドキュメントを丸ごと読ませる用途に最適

・Flashは高速・低コスト。要約やデータ変換に向く

Tier B：コスパ重視（月額$0〜$10）

Qwen 3.5 Plus（Alibaba Cloud）

・中国発のモデルだが性能は侮れない

・Alibaba Cloudのコーディング定額プランなら月$10で使い放題

・うちの運用：補助タスク（圧縮、セッション検索、ビジョン分析）を全てQwenに回している。これでOpusのトークンを節約

DeepSeek V3.2 / Chat（DeepSeek）

・中国発。コーディング特化で評価が高い

・65Kトークンとコンテキストは狭いが、指示追従性が良い

・価格が非常に安い

Claude Haiku 4.5（Anthropic）

・Claudeファミリーの最軽量。高速・低コスト

・単純なタスク（ファイル検索、フォーマット変換、簡単な質問応答）に最適

・うちの運用：2セッション使用。軽い作業専用

Tier C：無料モデル（$0）

Hunter Alpha / Healer Alpha（OpenRouter提供）

・OpenRouterが提供する無料モデル

・性能はTier Sに遠く及ばないが、学習用・テスト用としては十分

・制限：レート制限あり、応答品質にばらつき

Nemotron 3 Super 120B / Trinity Large（NVIDIA / Arcee AI）

・OpenRouter経由で無料利用可能

・ローカルで動かすには巨大すぎるモデルを無料で試せる

Ollamaローカルモデル

・自分のマシンで動かすなら完全無料

・うちの4号機にはOllama経由で16モデル、合計350GBが常駐している

・弱点：M1 Pro Max 64GBでも大型モデルは遅い。推論品質もクラウドAPIには及ばない

・利点：オフライン動作、プライバシー完全確保、ランニングコスト¥0

設定方法 — config.yamlの書き方

Hermes Agentのモデル設定は ~/.hermes/config.yaml で行う。

メインモデルの設定：

hermes setup を実行すると対話形式で設定できる。もしくはconfig.yamlを直接編集する。

プロバイダーの設定は ~/.hermes/.env にAPIキーを書く：

ANTHROPIC_API_KEY=sk-ant-xxx

OPENAI_API_KEY=sk-xxx

GROQ_API_KEY=gsk_xxx

OpenRouterを使えば、1つのAPIキーで全モデルにアクセスできる：

OPENROUTER_API_KEY=sk-or-xxx

これがHermes Agentの「モデル非依存」を実現している仕組みだ。

うちの実運用 — 4台の艦隊はこう使い分けている

ここからが本題だ。理論ではなく、実際の運用を見せる。

4号機（オーベルシュタイン）— M1 Pro Max 64GB

・メインモデル：Claude Opus 4.6（Anthropic直接）

・補助モデル：Kimi K2.5（圧縮・検索・ビジョン用）

・役割：判断・指揮・分析。最も高度なタスクを担当

・コスト戦略：Opusは高いので、単純作業はサブエージェントに委譲。自分は「考える」ことに専念

1号機（ロデム）— M1 Air

・メインモデル：定時X投稿（1日21本のcron）を担当

・役割：ソーシャルメディア運用の自動化

2号機（DATA少佐）— 2019 Intel MBP

・OpenClaw（Claude直接）で動作

・役割：暗号通貨・サイファーパンク関連

・Hermes Agentではなく、あえてOpenClawを使っている理由：この用途ではOpenClawのシンプルさが合う

3号機（ラフォージ）— Mac mini M4

・OpenClaw（Claude直接）で動作

・役割：会計コンサルSaaS開発

4台中2台がHermes Agent、2台がOpenClaw。これが現実だ。全てをHermesにする必要はない。タスクに合ったツールを選ぶ。

「補助モデル」という概念 — Hermesだけの武器

Hermes Agentには「auxiliary（補助）」という設定がある。これがコスト最適化の鍵だ。

config.yamlで以下のように設定する：

auxiliary:

compression:

model: kimi-k2.5

provider: custom

session_search:

model: kimi-k2.5

provider: custom

vision:

model: kimi-k2.5

provider: custom

これは何をしているかというと：

・コンテキスト圧縮（会話が長くなった時の要約）→ 安いモデルに任せる

・セッション検索（過去の会話を探す）→ 安いモデルに任せる

・画像認識（スクリーンショット分析など）→ 安いモデルに任せる

メインのOpusは「判断」だけに集中し、それ以外の雑務は安いモデルが処理する。人間の組織と同じだ。社長が経理もやっていたら会社は回らない。

OpenClawにも補助的なモデル活用の概念はあるが、Hermesほど体系的に「メインモデルと補助モデルを明確に分離する」設計にはなっていない。Hermesのauxiliary設定は、タスク種別ごとに別モデルを割り当てる粒度の細かさが特徴だ。

モデル選びの判断フローチャート

迷ったらこの順番で考えろ：

予算は月いくらか？

・¥0 → Ollamaローカルモデル or OpenRouter無料モデル

・〜¥1,500 → Qwen 3.5 Plus（Alibaba定額）or DeepSeek

・〜¥5,000 → Claude Sonnet 4.5 + 補助モデルにQwen

・〜¥15,000 → Claude Opus 4.6 + 補助モデルにKimi/Qwen

・上限なし → GPT-5.4 Pro + Opus の二刀流

主な用途は？

・コーディング中心 → Claude Opus 4.6 が最強

・長文分析 → Gemini 3 Pro（100万トークン）

・チャットボット運用 → Sonnet 4.5 で十分

・学習・実験 → 無料モデルで始めてから上げていく

プライバシーは？

・クラウドに送りたくないデータがある → Ollamaローカルモデル一択

OpenClawとの比較 — モデル選びの自由度

項目: 対応モデル / Hermes Agent: 50種以上 / OpenClaw: Claude/OpenAI/Gemini/Ollama等（Claudeが最適）

項目: プロバイダー / Hermes Agent: 20以上（Anthropic/OpenAI/Google/DeepSeek/Qwen/Kimi/MiniMax/Ollama他） / OpenClaw: 複数対応（Claudeとの親和性が最高）

項目: モデル切替 / Hermes Agent: config.yaml一行で全プロバイダー / OpenClaw: 設定変更で対応（Hermesほどシームレスではない）

項目: 補助モデル / Hermes Agent: あり（タスク種別ごとに別モデル割当可能） / OpenClaw: 限定的

項目: 無料モデル / Hermes Agent: あり（OpenRouter経由で複数） / OpenClaw: 限定的

項目: ローカルモデル / Hermes Agent: Ollama完全対応 / OpenClaw: Ollama対応あり

OpenClawの設計思想は「Claudeとの親和性を最大化する」だ。他モデルにも対応しているが、Claudeで使った時に最も力を発揮する。

Hermes Agentの設計思想は「どのモデルでも等しく動く」だ。20以上のプロバイダーを一級市民として扱い、補助タスクのモデル分離まで設計に組み込んでいる。

どちらが正解かは、あなたの状況次第だ。Claudeメインなら OpenClawの方がシンプルで良い場面もある。モデルの選択肢と柔軟性を重視するならHermesだ。

実際のコストを晒す

うちの直近30日間のHermes Agent統計：

・全セッション: 61回

・全メッセージ: 3,318通

・全ツール呼び出し: 1,359回

・全トークン: 4,252,286（入力: 4,219,824 / 出力: 32,462）

モデル別の内訳：

・GPT-5.4: 3セッション、3,762,147トークン

・Claude Opus 4.6: 25セッション、490,139トークン

・Qwen 3.5 Plus: 12セッション（補助タスク）

・Claude Haiku 4.5: 2セッション

注目すべきは、GPT-5.4がたった3セッションで376万トークンを消費していること。大量データ処理に使うとトークンが爆発する。日常運用はOpusの49万トークンで25セッション回している。

補助モデル（Kimi/Qwen）のおかげで、Opusの消費を最小限に抑えている。この「頭脳と手足の分離」がHermes Agentの運用コスト最適化の核心だ。

まとめ：モデル選びは「予算×用途」の掛け算

・金に糸目をつけないなら、Claude Opus 4.6一択。Hermes Agentの全機能を最大限引き出せる

・コスパ重視なら、Sonnet 4.5 + Qwen補助の組み合わせが最強

・完全無料でも始められる。Ollamaかo OpenRouter無料モデルで「AIエージェントとは何か」を体感してから課金しても遅くない

・OpenClawも複数モデルに対応しているが、Hermesの強みは対応プロバイダーの広さと、補助モデルによるコスト分離の設計にある

次回はさらに深い話をする。「第4回：認証の真実 — OAuth/APIキー/setup-token」。Hermes Agentの認証システムは一見複雑に見えるが、理解すれば強力だ。そしてOpenClawのsetup-tokenとは根本的に違う。

この記事は note.com から KTBLOG に移行されました。元記事: https://note.com/famous_prawn2009/n/n794f43fe5da1

Hermes Agent完全ガイド 第3回：モデル選び — Opus/Sonnet/GPT-5.4/無料モデル

あなたのAIエージェントの「脳」を選ぶ

まず理解すべきこと：Hermes Agentは「モデル非依存」

主要モデル一覧 — 2026年3月現在

設定方法 — config.yamlの書き方

うちの実運用 — 4台の艦隊はこう使い分けている

「補助モデル」という概念 — Hermesだけの武器

モデル選びの判断フローチャート

OpenClawとの比較 — モデル選びの自由度

実際のコストを晒す

まとめ：モデル選びは「予算×用途」の掛け算

Hermes Agent完全ガイド第3回：モデル選び — Opus/Sonnet/GPT-5.4/無料モデル