Cohere Command A+:218BのMoE巨人がApache 2.0で舞い降りる
Cohere Command A+:218BのMoE巨人がApache 2.0で舞い降りる
出典: note.com / 2026-05-21

Cohere Command A+:218BのMoE巨人がApache 2.0で舞い降りる
2026年5月20日。カナダのAI企業Cohereが、同社史上最強の言語モデル「Command A+」をリリースした。
218Bパラメータ(アクティブ25B)のMixture-of-Experts、128K入力コンテキスト、画像理解・マルチモーダル推論・ツール使用・48言語対応——そしてライセンスはApache 2.0。
つまり、自由だ。
スペック:巨人が小さなハードウェアで動く
Command A+の最も驚くべき点は、その効率性にある。
・218B総パラメータ/25Bアクティブ(MoE Sparse構成)
・128K入力コンテキスト/64K最大生成トークン
・対応モダリティ:テキスト、画像、ツール使用
・対応言語:48言語(日本語含む)
・ライセンス:Apache 2.0
・量子化:BF16 / FP8 / W4A4(ほぼ品質劣化なし)
・最小ハードウェア:H100×2枚またはBlackwell B200×1枚(W4A4量子化時)
H100が2枚あれば動く。これは画期的だ。同等の性能を持つDenseモデルなら6〜8枚のH100が必要になる計算だが、MoEアーキテクチャ+アグレッシブな量子化により、ハードウェア要件を劇的に引き下げている。
Cohereは「Sovereign AI(主権AI)」という言葉を掲げる。つまり、企業や国家が自らのインフラでモデルを実行し、外部に依存しないAI運用を実現するというビジョンだ。Command A+はそのビジョンを具現化したモデルと言える。
ベンチマーク:実務で勝負する
Command A+のベンチマーク結果を見ると、面白い傾向がある。一般的な知識クイズ(MMLU等)だけでなく、エージェント性能に重点が置かれている。
・τ²-Bench Telecom(エージェント通信タスク):37% → 85%(Command A比)+48pt
・Terminal-Bench Hard(エージェントコーディング):3% → 25% +22pt
・MMMU Pro(マルチモーダル推論):63%
・CharXiv(文書理解推論):52.7%(Command A Vision比 +5.8pt)
・MathVista(数学ビジュアル):80.6%(Command A Vision比 +7.1pt)
・Artificial Analysis AI Index:37(オープンモデル中トップ)
特筆すべきはエージェント性能の劇的な改善だ。τ²-Benchで85%というスコアは、モデルが自律的に電話通信タスクを処理できることを示す。これは従来のCommand A Reasoning(111B Dense)と比較して3倍以上の精度向上。
「モデルに考える能力を与える」と「モデルに道具を使う能力を与える」は別の課題だったが、Command A+はその両方を一つのアーキテクチャで実現している。
MoEアーキテクチャの深層
Command A+は218Bの総パラメータを持ちながら、推論時には25Bしか活性化しない。これは1トークンあたりの計算量が25B Denseモデル相当であることを意味する。
前世代のCommand A Reasoning(111B Dense)と比較すると、総パラメータは約2倍だがアクティブパラメータは4分の1。それでいて出力トークン速度(TOPS)は最大63%向上、初回トークン応答時間(TTFT)は17%短縮。
さらにSpeculative Decodingにより、テキスト生成が1.5〜1.6倍高速化されている。これはMoEアーキテクチャ向けに最適化された独自実装だ。
トークナイザー革命:日本語が20%縮む
見逃せないのが、新しいトークナイザーの採用だ。
Command A+はCohere初の独自トークナイザーを搭載し、日本語のトークン効率が18%向上した。アラビア語20%、韓国語16%——非ヨーロッパ言語に配慮した設計は、多言語対応を謳うモデルとしては異例の誠実さだ。
トークナイザーの圧縮率が高いほど、同じ応答に必要なトークン数が減り、推論コストが下がる。日本語話者にとっては、同じAPI予算でより多くの出力を得られることを意味する。これは地味だが重要な進歩だ。
サイファーパンクKT視点:なぜこれが重要なのか
Cohere Command A+が重要なのは、以下の理由による。
第一に、Apache 2.0であること。 尤度を言い訳にした使えないライセンスではない。商用利用、改変、再配布、サブライセンス——すべて自由だ。これにより、企業はモデルを自社のデータでファインチューニングし、競合他社に知られることなく運用できる。
第二に、H100×2で動くこと。 H100は2026年現在、レンタルすれば$2〜3/時間で手に入る。月間$2000もあれば、この218Bモデルを自前で運用できる。API依存からの脱却——これこそがSovereign AIの現実的な第一歩だ。
第三に、エージェント性能に特化していること。 モデルが単なるテキスト生成器から、ツールを使い、複数ステップのタスクを自律的に遂行する存在へと進化している。Command A+のτ²-Bench 85%は、この流れが加速していることを示している。
第四に、壁打ち相手としての可能性。 218Bモデルがローカルで動けば、思考の整理・アイデアの検証・執筆の下書き——すべてを外部APIに依存せずに行える。KTのような「思考のプロセスそのものを記録する」人間にとって、自前の思考増幅器を持てることの意味は計り知れない。
懸念点もある。Command A+が真にオープンなのか、それともCohere North(エンタープライズ製品)への導線なのかは、重ねて注視が必要だ。また、H100×2という要件は個人運用にはまだ敷居が高い。しかし、1年後にはMacBook Proで動くようになっているだろう——技術の進歩はいつもそうだ。
「AIはインフラだ」という時代が終わり、「AIは道具だ」という時代が始まろうとしている。Command A+はその転換点に立つ一台の工作機械だ。
我々がそれをどう削り、どう組み立てるか——それだけが問われている。
この記事は note.com から KTBLOG に移行されました。元記事: https://note.com/famous_prawn2009/n/n2f70853a27a2