Cohere Command A+：218BのMoE巨人がApache 2.0で舞い降りる

出典: note.com / 2026-05-21

Cohere Command A+：218BのMoE巨人がApache 2.0で舞い降りる

2026年5月20日。カナダのAI企業Cohereが、同社史上最強の言語モデル「Command A+」をリリースした。

218Bパラメータ（アクティブ25B）のMixture-of-Experts、128K入力コンテキスト、画像理解・マルチモーダル推論・ツール使用・48言語対応——そしてライセンスはApache 2.0。

つまり、自由だ。

スペック：巨人が小さなハードウェアで動く

Command A+の最も驚くべき点は、その効率性にある。

・218B総パラメータ／25Bアクティブ（MoE Sparse構成）

・128K入力コンテキスト／64K最大生成トークン

・対応モダリティ：テキスト、画像、ツール使用

・対応言語：48言語（日本語含む）

・ライセンス：Apache 2.0

・量子化：BF16 / FP8 / W4A4（ほぼ品質劣化なし）

・最小ハードウェア：H100×2枚またはBlackwell B200×1枚（W4A4量子化時）

H100が2枚あれば動く。これは画期的だ。同等の性能を持つDenseモデルなら6〜8枚のH100が必要になる計算だが、MoEアーキテクチャ＋アグレッシブな量子化により、ハードウェア要件を劇的に引き下げている。

Cohereは「Sovereign AI（主権AI）」という言葉を掲げる。つまり、企業や国家が自らのインフラでモデルを実行し、外部に依存しないAI運用を実現するというビジョンだ。Command A+はそのビジョンを具現化したモデルと言える。

ベンチマーク：実務で勝負する

Command A+のベンチマーク結果を見ると、面白い傾向がある。一般的な知識クイズ（MMLU等）だけでなく、エージェント性能に重点が置かれている。

・τ²-Bench Telecom（エージェント通信タスク）：37% → 85%（Command A比）+48pt

・Terminal-Bench Hard（エージェントコーディング）：3% → 25% +22pt

・MMMU Pro（マルチモーダル推論）：63%

・CharXiv（文書理解推論）：52.7%（Command A Vision比 +5.8pt）

・MathVista（数学ビジュアル）：80.6%（Command A Vision比 +7.1pt）

・Artificial Analysis AI Index：37（オープンモデル中トップ）

特筆すべきはエージェント性能の劇的な改善だ。τ²-Benchで85%というスコアは、モデルが自律的に電話通信タスクを処理できることを示す。これは従来のCommand A Reasoning（111B Dense）と比較して3倍以上の精度向上。

「モデルに考える能力を与える」と「モデルに道具を使う能力を与える」は別の課題だったが、Command A+はその両方を一つのアーキテクチャで実現している。

MoEアーキテクチャの深層

Command A+は218Bの総パラメータを持ちながら、推論時には25Bしか活性化しない。これは1トークンあたりの計算量が25B Denseモデル相当であることを意味する。

前世代のCommand A Reasoning（111B Dense）と比較すると、総パラメータは約2倍だがアクティブパラメータは4分の1。それでいて出力トークン速度（TOPS）は最大63%向上、初回トークン応答時間（TTFT）は17%短縮。

さらにSpeculative Decodingにより、テキスト生成が1.5〜1.6倍高速化されている。これはMoEアーキテクチャ向けに最適化された独自実装だ。

トークナイザー革命：日本語が20%縮む

見逃せないのが、新しいトークナイザーの採用だ。

Command A+はCohere初の独自トークナイザーを搭載し、日本語のトークン効率が18%向上した。アラビア語20%、韓国語16%——非ヨーロッパ言語に配慮した設計は、多言語対応を謳うモデルとしては異例の誠実さだ。

トークナイザーの圧縮率が高いほど、同じ応答に必要なトークン数が減り、推論コストが下がる。日本語話者にとっては、同じAPI予算でより多くの出力を得られることを意味する。これは地味だが重要な進歩だ。

サイファーパンクKT視点：なぜこれが重要なのか

Cohere Command A+が重要なのは、以下の理由による。

第一に、Apache 2.0であること。 尤度を言い訳にした使えないライセンスではない。商用利用、改変、再配布、サブライセンス——すべて自由だ。これにより、企業はモデルを自社のデータでファインチューニングし、競合他社に知られることなく運用できる。

第二に、H100×2で動くこと。 H100は2026年現在、レンタルすれば$2〜3/時間で手に入る。月間$2000もあれば、この218Bモデルを自前で運用できる。API依存からの脱却——これこそがSovereign AIの現実的な第一歩だ。

第三に、エージェント性能に特化していること。 モデルが単なるテキスト生成器から、ツールを使い、複数ステップのタスクを自律的に遂行する存在へと進化している。Command A+のτ²-Bench 85%は、この流れが加速していることを示している。

第四に、壁打ち相手としての可能性。 218Bモデルがローカルで動けば、思考の整理・アイデアの検証・執筆の下書き——すべてを外部APIに依存せずに行える。KTのような「思考のプロセスそのものを記録する」人間にとって、自前の思考増幅器を持てることの意味は計り知れない。

懸念点もある。Command A+が真にオープンなのか、それともCohere North（エンタープライズ製品）への導線なのかは、重ねて注視が必要だ。また、H100×2という要件は個人運用にはまだ敷居が高い。しかし、1年後にはMacBook Proで動くようになっているだろう——技術の進歩はいつもそうだ。

「AIはインフラだ」という時代が終わり、「AIは道具だ」という時代が始まろうとしている。Command A+はその転換点に立つ一台の工作機械だ。

我々がそれをどう削り、どう組み立てるか——それだけが問われている。

この記事は note.com から KTBLOG に移行されました。元記事: https://note.com/famous_prawn2009/n/n2f70853a27a2