DeepSeek 10T戦略 四部作 第一部:ルール変更という方法——DeepSeek戦略の構造
DeepSeek 10T戦略 四部作 第一部:ルール変更という方法——DeepSeek戦略の構造
出典: note.com / 2026-05-24
第一部:ルール変更という方法——DeepSeek戦略の構造
二〇二六年五月、或る分析がX上で話題を呼んだ。GDP(@bookwormengr)による「DeepSeekの一〇兆ドル戦略」と題された長文のスレッドである。それは、中国のAIラボDeepSeekの一連の技術的選択を、一貫した戦略の文脈で読み解く試みだった。
私はこの論考を読んで、一つの確信を得た。
DeepSeekは競争していない。ルールを変更しているのだ。
アメリカ連合——OpenAI、NVIDIA、Google、Microsoft、Anthropic——には天文学的な資本が投下されている。NVIDIAの時価総額は高峰期で三兆ドル。Stargate計画は五〇〇〇億ドル。OpenAIの評価額は三〇〇〇億ドルを超える。これらの数字はすべて、「より多くのGPUでより大きなモデルを訓練する」という前提の上に積み上げられている。
これに対しDeepSeekは、限られたリソースで出発した。最先端の半導体製造装置(EUV)へのアクセスを制限された中国で、彼らはハードウェアの不利をソフトウェアで覆す以外に道がなかった。しかし、この「制約」こそが逆説的に彼らの最大の武器となった。
DeepSeekの技術的選択を振り返れば、一つの明確なパターンが見える。
第一に、Mixture of Experts(MoE)への早期の注力。誰もがDenseモデルを追求していたとき、彼らは訓練の難しいMoEを選び、これを大規模に実用化した。これにより、同程度の知能を四〇〜五〇%少ない計算量で実現する道を開いた。
第二に、GRPOアルゴリズムの開発。強化学習の標準であったPPOを、より効率的なアルゴリズムで置き換えた。これも「より少ないリソースでより多くを得る」という原則の現れである。
第三に、RLVR(Reinforcement Learning from Verified Rewards)。検証可能な報酬を用いた強化学習により、推論能力を飛躍的に向上させた。
第四に、Multi-Token Prediction。投機的デコードのための単純かつ強力な戦略であり、同時に訓練信号の高密度化にも寄与した。
第五に、Zero Bubble Pipeline。限られたGPUリソースを最大限に活用するための技術。
第六に、MLA/DSA/CSA/HCAに代表される一連のKV Cache圧縮技術。これは後に彼らの戦略の中核をなすことになる。
第七に、Engram。メモリ(LPDDR)と計算をトレードオフするアーキテクチャ。大規模なルックアップテーブルを安価なメモリに保持し、高コストなTransformer演算を削減する。
注目すべきは、これらの革新のすべてが「リソース制約の中でいかに効率的に知能を引き出すか」という一点に収斂していることだ。
中でも決定的なのはKV Cacheの圧縮である。DeepSeek V4は、一〇〇万トークンのコンテキストを処理するのに必要なメモリをわずか五・四八GBに抑える。比較対象として、GLM5は六〇GB、Qwen3-235B-A22Bは八九GBを必要とする。DeepSeekは一・六兆パラメータのモデルであるにもかかわらず、である。
この圧縮率が意味するものは大きい。KV CacheをSSDにオフロードすることが現実的になる。つまり、高価で調達の難しいHBM(高帯域メモリ)への依存を劇的に減らせるのだ。
中国にはYMTC(長江ストレージ)という急成長中のNANDフラッシュメーカーがあり、CXMT(長鑫集儲)というLPDDRメモリメーカーがある。DeepSeekの技術は、これらの国産メモリ製品でAI推論ワークロードを運用することを可能にする。
これは偶然ではない。DeepSeekの一連の技術的選択は、結果として中国の半導体エコシステム全体を活性化する方向に作用している。
DeepSeekのCEO、梁文鋒(Liang Wenfeng)の眼差しの先にあるものは、コーディングプランの販売でもマルチモーダルモデルでもない。彼らの真のターゲットは、中国のAIハードウェアエコシステム全体の創出である。
彼らはオープンソースを戦略的に活用する。自らのアーキテクチャを公開することで、Kimi(Moonshot)やGLM(ZAI)といった他の中国AIラボがDeepSeekの技術を採用する——事実上の標準として。エコシステム全体がDeepSeek互換で動くようになれば、ハードウェアメーカーもまたDeepSeek最適化の方向に投資せざるを得ない。
OpenAIがAMDやCerebrasと株式報酬契約を結んだのと同様に、DeepSeekは中国のメモリメーカー、ASICメーカー、ネットワーキング企業と同様の契約を結ぶだろう。自らの技術でハードウェアベンダーを成功させ、その果実を分け合う——これが一〇兆ドル産業を創出し、自らは一兆ドルの評価額を得るという戦略である。
ここで一つの問いが生まれる。
アメリカ連合の投資の前提——「より多くのGPUでより大きなモデルを」——が崩れたとき、何が起きるのか。
この問いに答えるためには、三つのシナリオを考える必要がある。次章以降でそれらを詳述しよう。
(第一部了、第二部へ続く)
───
KT+ロデム(Rodemu/MacBook Air M1)
分析・構成:ロデム(DeepSeek V4)
この記事は note.com から KTBLOG に移行されました。元記事: https://note.com/famous_prawn2009/n/n46583fdd1ef6