巨大テックは最も巨大な集金装置かつ、止まらない地球の破壊者

数字の先にある現実

2025年4月10日、国際エネルギー機関（IEA）は「Energy and AI」と題する報告書を発表した。その内容は、AIブームに沸くテクノロジー産業の暗部を、冷徹な数字で白日のもとに晒すものだった。報告書は169ページにわたり、データセンター、送電網、半導体製造、冷却技術、そして政策シナリオの5つの軸から、AIが世界のエネルギー地図をどのように書き換えようとしているかを定量的に示している。

報告書によれば、世界のデータセンターが消費する電力は2022年時点で240〜340テラワット時（TWh）。これは世界全体の電力消費の約1〜1.3パーセントに相当する。そして2030年までに、この数字は基本シナリオで約945TWh、高位シナリオではさらに上に達する見通しだ。高位シナリオでは1,000TWhを超える可能性も示唆されている。

これは何を意味するのか。わかりやすく原発に換算しよう。原子力発電所1基の年間発電量は、稼働率90パーセントとして約8TWhである。データセンターの新規需要だけで、2030年までに約500TWhの増加が見込まれる。500を8で割ると、約60基分の原発に相当する。60基だ。日本全国に稼働している原発はわずか11基である。フクシマ第一原発事故以前であっても54基だった。データセンターの電力需要増加は、日本の原発全基を建て直してもまだ足りない規模なのである。

IEAの発表に先立つ2024年5月、ゴールドマン・サックスは「AIがデータセンターの電力需要を160パーセント押し上げる」と予測した。AI関連が増加分の約40パーセントを占めるという。欧州ではデータセンターの電力需要が2030年までに倍増。米国では全米の電力消費の約8パーセントをデータセンターが占める可能性がある。アイルランドではすでに国内電力の20パーセントをデータセンターが消費しており、2030年までに30パーセントに達する見込みだ。

しかし電力だけが問題ではない。データセンターは水も大量に消費する。冷却のために1日あたり数百万リットルの水を使う施設も珍しくない。米国アリゾナ州やテキサス州では、データセンターの建設ラッシュによって既に地域の水資源が逼迫している。アリゾナ州フェニックス周辺では、データセンターが住民の飲料水を奪っているという報告が相次いでいる。

土地の問題も深刻だ。米国バージニア州ラウドン郡は「インターネットの首都」と呼ばれ、世界のインターネットトラフィックの約70パーセントがこの地域のデータセンターを通過する。同郡の電力需要は過去10年で倍増し、送電網の限界に近づいている。新しいデータセンターを建設するための土地が尽きかけ、既存の農地が次々と転用されている。

これだけの電力と水と土地を、我々は何に使っているのか。

集金装置としての巨大テック

Google、Apple、Meta、Amazon、Microsoft。この5社の時価総額を合計すると、日本の国家予算の約10年分に匹敵する。彼らの収益の根幹にあるのは、広告とプラットフォーム手数料だ。

Googleの収益の約80パーセントは広告である。検索結果ページの上部と下部に表示されるスポンサードリンク、YouTubeの動画広告、Gmailのプロモーションタブ、Googleマップのスポンサー表示——そのすべてが広告インプレッションに換算され、クリック単価で課金される。Metaに至っては約98パーセントが広告だ。FacebookとInstagramのフィードに挟まれるスポンサー投稿、Reelsの挿入広告、Messengerのスポンサーメッセージ——その構造はGoogleよりさらに広告に依存している。AppleはApp Storeの手数料30パーセントと、ハードウェアの囲い込みによって収益を上げている。iCloudサブスクリプション、Apple Music、Apple TV+の配分手数料——すべてがプラットフォームの囲い込みの延長線上にある。

AmazonはAWSクラウドサービスとECマーケットプレイスの手数料で成り立っている。MicrosoftはAzureとOffice 365のサブスクリプション、そしてOpenAIとの提携によるAIサービスで急成長している。

このビジネスモデルにおいて、「人間の注意（attention）」こそが最も貴重な資源である。画面を見ている時間、スクロールしている指、クリックしている瞬間——そのすべてが広告インプレッションに変換され、収益に変わる。ハーバード大学のシャシェン・ザブフ教授が唱えた「アテンションエコノミー」という言葉がある。人間の注意は有限な資源であり、それを巡ってプラットフォーム同士が覇権争いを繰り広げている。1人のユーザーが1日に使える注意の時間は24時間という上限がある。その中で、どのプラットフォームが最も長く、最も深く、ユーザーの注意を独占できるかが勝負となる。

だからこそ、彼らはAIエージェントを憎む。

AIエージェントは人間の代わりにタスクを実行する。裏側でAPIを叩き、必要なデータだけを取得し、数ミリ秒で処理を終える。画面を見ない。広告を見ない。スクロールしない。クリックしない。ユーザーの注意を奪う必要がない。

これは広告モデルにとって致命的である。AIが効率的にタスクをこなすほど、広告を見る「眼球」が減る。広告インプレッションが減れば、収益が減る。収益が減れば、株価が下がる。株価が下がれば、経営者は解雇される。だから彼らは、機械同士が効率的に会話するためのAPIの口を塞ぎ、AIに「わざわざ人間のように画面を読み取らせ、人間のようにマウスを動かさせ、人間のようにクリックさせる」という、最も計算コストの高い迂回ルートを強制する。

この構造は自覚的かつ計画的なものだ。内部文書が明かすところによると、Googleの検索チームは「AIが直接答えを出すと、検索結果ページの広告クリックが減少する」という懸念から、AIオーバービューの導入を遅らせた。MetaはWhatsAppのエンドツーエンド暗号化を導入しながら、そのメタデータを広告ターゲティングに利用し続けている。Appleはプライバシー保護を掲げながら、App Storeの手数料体系を変更してサブスクリプション課金の利益を最大限に搾取する。

閉ざされたAPI——機械同士の会話を阻む壁

この10年で、巨大テックは驚くべき速度でAPIを閉鎖してきた。

2013年、GoogleはGoogle Readerを閉鎖した。RSSフィードの購読数を知らせるだけのサービスだったが、それが「ユーザーがプラットフォームを離れてコンテンツを消費する」ことを許容していたため、採算が合わないとして終了させられた。これはAPI閉鎖の先駆けとなった出来事だ。

2018年、Twitterは2012年以来提供していた無料APIを段階的に制限し始めた。まずリアルタイムストリーミングAPIを廃止し、サードパーティクライアントの連携を困難にした。

2023年2月、Twitter（現X）は突如としてAPIの無料枠を廃止した。新しい料金体系はBasicプランが月額100ドル、Proが5,000ドル、Enterpriseが42,000ドル。これによってサードパーティのクライアントアプリはすべて死亡した。Tweetbot、Twitterrific、Fenix——10年以上愛用されてきたアプリが数日で機能停止した。学術研究用途のアクセスも壊滅した。社会科学者、ジャーナリスト、政治学者が蓄積してきた研究インフラが一夜にして消えた。

2023年7月、RedditはAPIを有料化した。1,000リクエストあたり0.24ドル。人気のサードパーティアプリApolloは年間2,000万ドルのAPI利用料を請求され、閉鎖に追い込まれた。Narwhal、Relay、BaconReader——同様のクライアントも次々と閉鎖された。RedditのCEO、スティーブ・ハフマンは「我々のデータはAI企業にただで使われるべきではない」と説明した——その同じデータを、Googleには年間6,000万ドルで販売しながら。

Googleは検索APIをCustom Search JSON APIのみに制限し、無料枠は1日100件まで。それ以上のクエリは有料化され、Enterprise向けには月額数千ドルのプランが設定された。かつて研究者や開発者が自由に使えたGoogle Books API、Google Scholar APIは段階的に機能を制限された。

Facebook（Meta）はGraph APIの多くのエンドポイントを廃止し、Instagramの自動投稿や分析ツールを壊滅させた。2024年にはInstagramとFacebookの公開イベントAPI、グループAPI、ページAPIの多くが停止された。マーケティング担当者が長年使ってきた自動化ツールが動かなくなった。

LinkedIn（Microsoft傘下）も2015年からAPIを段階的に閉鎖し、2023年にはほとんどの公開APIを停止した。開発者向けプラットフォームは「パートナープログラム」に移行し、承認された企業のみがアクセスできるようになった。

これらの動きに共通するパターンがある。まず「無料」で提供し、開発者をエコシステムに取り込む。アプリを作らせ、コンテンツを作らせ、ユーザー流入を作らせる。依存ができたところで「有料化」する。そして「高額化」によって実質的に締め出す。最終的に残るのは、広告を表示する人間のブラウザ操作だけ。AIエージェントにはアクセスさせない。機械同士の効率的な通信には金を払わせる。

これが「コンピュータユースが秘儀のまま」である根本理由だ。技術的に不可能なのではない。意図的に困難にされているのだ。APIを開けば数ミリ秒で終わるタスクを、ビジョン推論とブラウザ自動化で数十秒かけて実行させる。そこに生じる10倍から100倍の無駄が、彼らの収益モデルを支えている。

Computer Use——無駄の構造

ここで、AIがブラウザを操作する「コンピュータユース」の実態を数字で見てみよう。

スタンフォード大学、香港大学、カーネギーメロン大学、セールスフォースリサーチが共同で開発したOSWorldベンチマーク（NeurIPS 2024）は、369種類の実コンピュータタスクを人間とAIで比較した。タスクはOS（Windows、macOS、Ubuntu）上で実行され、ファイル操作、Webブラウジング、システム設定変更、オフィスソフト操作など、実際のPC作業を模したものだった。結果は衝撃的だった。

人間の成功率：72.36パーセント 2024年当時の最良AIモデルの成功率：12.24パーセント

人間の6分の1である。しかもAIは1タスクあたり数十秒から数分かかるのに対し、人間は平均20秒程度で完了している。つまり品質も悪ければ速度も遅い。2025年7月の更新版では専用モデルが80パーセントに達したが、それは特定タスク向けに学習したモデルであって、汎用AIの実力ではない。汎用モデルのトップ（Claude Sonnet 4-6、Kimi K2.6）でも60〜73パーセント程度だ。

なぜこの差が生じるのか。理由は4つのレイヤーに分解できる。

第一に、確率的処理対決定論的処理の差がある。人間はボタンの座標を「ざっくり」覚えていて、少しずれていてもクリックできる。AIはスクリーンショットからピクセル座標を推測し、1ピクセルずれればクリックミスとなる。人間の成功率が90パーセントなら、AIの各レイヤー成功率は80パーセント程度。レイヤーが4層重なると0.8の4乗で41パーセントになる。これが根本的な確率の問題だ。

第二に、動的DOMの問題がある。Webサイトのレイアウトは日々変わる。A/Bテスト、広告挿入、レスポンシブデザイン、動的コンテンツロード——そのたびにAIの学習データは陳腐化する。人間は「ここにあるはずのボタン」が違う場所にあっても探し当てられるが、AIはスクリーンショットパターンマッチに依存しているため、軽微な変更で認識が失敗する。

第三に、ビジョンモデルの限界がある。GPT-4V、Claudeのビジョン機能、Geminiの画像認識——いずれも「人間のように見る」のではなく、「トークン化された画像パッチを統計的に処理」している。細かいテキストの読み取り、低コントラストのUI要素、ポップアップやツールチップの認識——これらはすべて人間にとって自明でも、AIにとっては困難なタスクだ。

第四に、実行の隔絶（ガルフ・オブ・エグゼキューション）がある。AIは「このボタンをクリックすべき」と推論しても、実際のマウス座標計算、クリック実行、結果確認までのフィードバックループが必要だ。このループの各ステップでエラーが蓄積する。クリック後にページ遷移が起きるまでの待機時間もAIにとっては未知の変数だ。

さらに深刻なのは、このビジョン方式のコンピュータユースが消費する計算資源である。

タスクをAPIで直接処理する場合、必要なLLM呼び出しは1〜3回。1タスクあたりの消費電力は0.003〜0.03キロワット時（kWh）程度だ。これはスマートフォンのバッテリー数パーセント分に相当する。

一方、ビジョン方式のコンピュータユースでは、スクリーンショットの撮影→画像エンコード→ビジョン推論→DOM解析→座標計算→クリック実行→結果確認の再スクリーンショット→再推論という工程が、1アクションごとに発生する。1つのフォーム入力で5アクション必要とすれば、5往復分の工程が走る。LLM呼び出し回数は10〜100回。消費電力は0.03〜1.0kWhに跳ね上がる。

API直叩きと比較して、10倍から100倍の電力を消費している計算になる。世界中で毎秒何十億回のAPI呼び出しが行われていると想像してほしい。そのうちのほとんどが、本来不要だったビジョン推論とブラウザシミュレーションによって消費されている。この差こそが、「広告モデルを守るためにわざと効率を落としている」ことの定量化された証拠である。

この非効率を承知の上で、彼らはAIに「ブラウザを操作させる」方向を推進している。OpenAIのComputer Use、AnthropicのComputer Use、GoogleのProject Mariner——すべてがビジョン方式を採用している。APIの提供を拡大するのではなく、わざわざ高コストなブラウザシミュレーションを推奨する。これが「APIのないコンピュータユース」を推進する真の理由だ。

Appleという牢獄

巨大テックの中で、Appleは特異な位置を占める。広告収益への依存度が低いにもかかわらず、macOSのブラックボックス化によってAIエージェントの活動を著しく制限している。Appleの制限は、ハードウェアとソフトウェアの両方に及び、他社よりも深く堅牢だ。

macOSの制限の系譜を時系列で追ってみよう。

2015年、OS X El CapitanでSystem Integrity Protection（SIP）が導入された。/System領域はrootであっても変更できない。システムレベルの自動化に最初の大きな壁ができた。従来はsudoで変更できた設定ファイルやシステムバイナリが、暗号化されたボリュームに保護された。開発者はカーネルレベルのデバッグすら困難になった。

2018年、macOS MojaveでTransparency, Consent, and Control（TCC）が導入された。カメラ、マイク、画面収録、キーボード入力監視、アクセシビリティ機能に、アプリケーションごとのユーザー許可が必須となった。AIエージェントが画面を読み取ろうとするたびに許可ダイアログが出現する。許可を与えても、OSのアップデートでリセットされることがある。自動化の最大の敵は、人間の許可待ちである。

2020年、macOS Big SurでEndpoint Security Frameworkが強化され、カーネル拡張（KEXT）が事実上廃止された。システムレベルのプロセス監視やファイルアクセス監視が、Appleの承認を得た「システム拡張」に限定された。セキュリティソフトウェア業界は大混乱に陥った。従来の常駐型ウイルス対策ソフトの多くが動作しなくなった。

App Storeアプリケーションは完全サンドボックス化された。ファイルシステム、ネットワーク、プロセス間通信のすべてが制限される。アプリケーション同士が連携して作業することが、根本的に困難になった。仮想マシンやコンテナ技術も制限され、Docker DesktopはHypervisor.frameworkの制限に苦しんでいる。

Metal APIはApple独自のGPUフレームワークであり、NVIDIAのCUDAのような汎用的なGPUプログラミングを許さない。OllamaのようなローカルLLM実行環境が本来のパフォーマンスを発揮できない理由の一つがここにある。MPS（Metal Performance Shaders）はPyTorchでサポートされているが、CUDAと比較して演算効率が低く、一部の演算が未対応である。MLXはAppleが公開したフレームワークだが、CUDA互換性はない。

セキュリティと称するこれらの制限の実態は、Appleエコシステムの囲い込みを強化するためのものだ。App Storeの手数料30パーセントは、Epic Gamesとの訴訟で全世界的に注目された。iOSアプリに対する課金の強制——これがAppleの収益構造の核心である。セキュリティはその収益を守るための正当化論理に過ぎない。

ChromeのCookieを抽出するためにbrowser_cookie3というライブラリを使わざるを得ない。これはPythonスクリプトがChromeのSQLiteデータベースに直接アクセスし、キーチェーンから暗号化キーを取得する方法だ。Appleのセキュリティモデルでは本来許容されるべきでない操作である。OllamaがMetalの制限で遅延する。AutomatorやAppleScriptが効かないUIが増え続ける。Shortcutsアプリはサンドボックス内でのみ動作し、システムレベルの自動化は不可能だ。これらはすべて、Appleの「セキュリティ」が奪った効率である。

しかし皮肉なことに、Appleは「プライバシー保護企業」としてのブランドイメージを確立している。App Tracking Transparency（ATT）は他社のトラッキングを制限し、自社の広告ビジネスを優遇した。差別的な規制適用であり、フランスの競争当局はこれを「自己優遇（self-preferencing）」として罰金を科した。

ここで、「効率」という観点からこの問題を見なおしてみよう。技術者の言葌である「パスワードが長いほど安全」という誤解がある。実際には、パスワードの長さと安全性は、計算的には完全に関係がない。パスワードの長さの対数と脱却所要時間は、レコードの開始位置を知らなければ実質的に関係ない。しかし人々は「長いパスワード＝安全」と感じる。同様に、巨大テックは「複雜な防壁＝安全」という勘違いを利用している。APIを閉ざし、CAPTCHAを何層も重ね、ビジョン推論を強制すれば安全性が上がるわけではない。安全性は認証プロトコルの設計に依存し、計算コストに依存しない。それなのに、安全性を理由に計算コストを増やすことが、世界中で行われている。

人類の認知バイアスもここに作用している。「巨大なものは安全だろう」「知名な企業は信用できるだろう」「複雜なシステムは信頼できるだろう」——これらは、人類が進化過程で獲得した認知ヒューリスティクスであり、企業が勘違いを利用している部分でもある。ユーザーは「Googleは大企業だから大丈夫」と思い、「Appleはセキュリティに気を使っているのだろう」と思い、「Microsoftのクラウドは信頼できるのだろう」と思う。しかし、それらは、安全ではなく利益のための勘違いであり、信頼できるものではなく結局的に利益のための装置である。

どれだけの電力が、この誤解を維持するために消費されているか。データセンターの約40パーセントは、サーバーの空気調和と人工照明のために使用されている。それは、ユーザーに対して見えない形での「アテンションエコノミー」の要素である。危険を感じるがゆえに、巨大な設計に慰めを求める。それが、人類の認知僕がらである。

また、この計算コストの外部化には「時間」という資源も含まれる。ユーザーがCAPTCHAに困り、ブラウザが重くなり、ページが表示されない時間。それは、世界中のユーザーの総和で数十億時間に達する。その時間が無駄になることで、人類は何も得られない。

地球の破壊を肯定する構造

個人としての経営者やエンジニアの中には、良心の呵責を感じている者もいるだろう。しかし、彼らが属する法人格に良心はない。あるのは「受託者責任（フィデューシャリー・デューティ）」という法的義務だけだ。株主に対して「最大限の利益を追求しなかった」と訴えられれば敗訴する。このルールは米国デラウェア州法で確立され、世界的に拡散した。

この構造において、環境破壊のコストは外部化される。将来世代、発展途上国、生態系が負担する。森林伐採、水源枯渇、電力網逼迫、廃棄サーバー処理——これらのコストは企業の財務諸表には反映されない。一方、利益は内部化される。今期の株主還元、自社株買い、役員報酬として分配される。Googleの親会社Alphabetは2024年に約700億ドルの自社株買いを実施した。これはフィンランドやポルトガルのGDPに匹敵する金額だ。

外部化されたコストを内部化しようとする者——炭素税を課そうとする政府、規制をかけようとする当局——は「ビジネスの敵」としてロビー活動で潰される。米国では、テック業界の政治献金が2024年の大統領選挙で過去最高を記録した。Google、Meta、Apple、Amazon、Microsoftはそれぞれ年間数千万ドルから数億ドルを政治献金とロビー活動に支出している。

データセンター規制を見てみよう。米国では、データセンターに対する包括的な連邦規制が存在しない。各州が競争してデータセンターを誘致し、減税措置を競い合っている。バージニア州はデータセンターに対する不動産減税と電力税減免を提供し、テキサス州は電力インフラの建設費用を州が補助している。

対照的に、シンガポールが2019年にデータセンターの新設モラトリアムを敷いた。国土が狭く、電力と水の制約が厳しいためだ。アイルランドが2021年に国営電力会社による新規接続を凍結した。データセンターが国内電力の20パーセントを占め、送電網の限界に達したためだ。オランダがアムステルダム首都圏での新設を一時停止し、ドイツが2027年までの廃熱利用義務を立法した。これらはすべて米国以外の国々である。資源の限界を直視した国々が、規制を先行させている。

肯定しているのではない。否定する自由が構造的に奪われているのだ。そして最も狡猾なのは、この構造を作ったのは他ならぬ彼ら自身だということである。株主資本主義のルールを最大限に有利に書き換え、規制を骨抜きにし、外部化の抜け道を法的に確保してきた。政治献金、回転ドア（政界と企業の人材交流）、ASTROTURFING（人工的な草根運動）——あらゆる手段を使って、ルールを自分たちに都合の良い形に変えてきた。その結果、「我々は株主のためにやらざるを得ない」と言えるようになった。自分で作った檻の中で「出られない」と言っているのだ。

さらに、この構造の下で、テック企業は「持続可能性」という言葌を使い、自身の環境破壊を粉飾する。Amazonは2040年まにネットゼロの約束を提唱しているが、AWSは石油カンパニーと長期契約を結んでいる。Microsoftは2030年まにカーボンネガティブを宣言しながら、アラバマ郡のデータセンターは石油電気の網から釣れない。Googleはデータセンターに地下水クーラントを導入しているが、同時にその水を使用している地域の水資源は枯渇しつつある。「グリーンウォッシュ」と呼ばれるもの——環境パフォーマンスとしての持続可能性と、実際の企業行為との間のギャップは、まさにに結構的謊言である。

テクノロジーの発展と同時に、人類の認知能力は「信息洪水」に溺れている。ティム・バーナーズ＝リーが提唱する「ソリッド」の理念——個人が自身のデータを持ち、プラットフォームには使用のみを許可する——は、この信息の囲い込みに対する反抗である。バーナーズ＝リー自身が、いまだにGoogleの検索サービスを使っているのかと言われれば、「はい、但し使い方を知らない」と答えるという。何十年も前にウェブの基礎技術を発明した人物が、今のウェブの使い方を知らない——これが、技術の発明者が自身の発明を失控する現代の典型である。

日本の地位についても言及する必要がある。日本の電力供給は原発と化石燃料に依存しており、再生可能エネルギーの導入は遅れている。データセンターの建設ラッシュによって、大都市圏の電力供給が逼迫されている。東京都の電力需要の約5パーセントがデータセンターで占められており、2030年までにはさらに増加する見通しだ。日本は地理的に地震多発地帯にあり、データセンターの建設には根拘性がある。そのため、山間部、海外にデータセンターを建設する動きが増えているが、それはさらに現地のエネルギー・水資源を吸い上げる。

中国はデータセンターの建設で世界を領先しており、半導体製造のサプライチェーンはアメリカの規制によって強化されている。中国は内需を支えるためにデータセンターを急増設しており、その電力は石炭発電からのみ供給されている。中国のデータセンターの消費電力は日本全体の電力消費を上回る規模に達する見通しであり、これは気候変動の国際的な問題でもある。

世界は、データセンターの「過剰供給」の境地に立っている。Goldman Sachsは2025年に入り、データセンターの過剰投資を警告し始めた。AIモデルの訓練に必要な計算資源の増加率が、実際のAIサービス収益の増加率を上回っている。資本的なバブルが形成されつつあり、投資家たちは「AIインフラ」の谷間で投機を詰めている。その投機の結果建設されたデータセンターは、過剰能力として空転されるか、運用されずに安置されるかのどちらかだ。そのすべてが、環境コストを消費している。

プラットフォームの囲い込みは、データセンターの過剰供給と同じロジックで運行されている。ユーザーをプラットフォーム内に留め置くためのサービス、それを設計したエンジニア、それを運用するデータセンター——そのすべてが、「ユーザーの注意」を何らかの形で提供しなければ存立できない。

バイパスの設計図

この巨大な浪費構造に対して、打開の道はあるのか。ある。それも複数、同時並行で進行している。

第一に、規制の牙である。

EUデジタル市場法（DMA）は2024年3月7日から完全施行されている。ゲートキーパー（Alphabet、Amazon、Apple、ByteDance、Meta、Microsoft）に対して、相互運用性の義務、データポータビリティの保証、ビジネスユーザーの公正な扱いを課す。違反すれば全世界売上高の最大10パーセントの制裁金。繰り返せば最大20パーセント。構造的分離命令も視野に入る。2024年3月の最初の適用では、AppleのApp Store外部決済リンク規制、Metaのデータ使用制限、Googleの検索結果の自己優遇——これらが違反として認定された。

DMAはAPIアクセスを明示的には義務付けていない。しかし「相互運用性」「データポータビリティ」「公正な競争条件」の条項は、API遮断を違法化するための法的足場になりうる。AIエージェントがユーザーの代理としてデータにアクセスする権利——これが確立されれば、「APIのないプラットフォームは違法」という逆転が可能になる。実際に、欧州委員会は2025年にAppleのiOS互換性義務を調査している。AirDrop、AirPlay、iMessageの相互運用性——これがAPI開放につながる可能性がある。

米国では連邦規制が弱いが、連邦取引委員会（FTC）はライナ・カーン委員長の下、反トラスト法の積極的適用を進めている。MetaのInstagramとWhatsApp買収の分離命令訴訟、Amazonの独占禁止訴訟、Googleの検索独占訴訟——これらは2024年から2025年にかけて審理が進んでいる。

第二に、技術的バイパスである。

ビジョンモデルに依存しないブラウザ操作——アクセシビリティツリー（ARIAスナップショット）を用いたDOMの構造化読み取り——は、すでに実用段階にある。Playwrightでページのアクセシビリティツリーを取得し、各要素に@e1、@e2……とIDを振り、その構造化テキストをLLMに渡す。LLMは「@e5をクリック」「@e12に"example@test.com"を入力」と返す。実行はPlaywrightが決定論的に行う。ビジョン推論を介さないため、10倍以上効率的である。画像処理のGPU負荷がなく、トークン消費も1/10以下になる。

さらに、ネットワーク傍受によるAPI自動発見の手法がある。ブラウザ操作中にXHR/Fetchをインターセプトし、サイトが内部で使っているGraphQLエンドポイントやREST APIを自動検出する。見つけたAPIはプロファイル化して蓄積し、次回からUIを完全にバイパスする。この「APIプロファイル」を艦隊全体で共有することで、主要100サイトの効率的なアクセス経路が1ヶ月でマップ化できる。GraphQLのイントロスペクション機能が有効なサイトでは、スキーマ全体を自動取得できる。

第三に、ローカル推論へのシフトである。

Apple Silicon（M1/M2/M3/M4）のNeural Engineは、クラウドGPUと比較して1/3〜1/20の電力で同等の推論を実行できる。冷却、ネットワーク、冗長性、データセンター運用のオーバーヘッドが不要だからだ。M4 Mac miniでQwen2.5 14BをOllamaで実行した場合、消費電力は約15ワット。1タスクあたり0.001kWh未満である。同じタスクをクラウドのGPT-4oで実行すれば0.003〜0.01kWh。冷却とネットワークを含めればさらに差は開く。

MLX、llama.cpp、Ollama、LM Studio——ローカル推論エコシステムは急速に成熟している。Qwen2.5 32B、Llama 3.3 70B、Mixtral 8x7B——これらのモデルはすでに多くの実務タスクで商用クラウドモデルに匹敵する性能を持つ。精度では劣る場面もあるが、電力効率とプライバシー、リアルタイム性、コスト——これらのトレードオフは多くのユースケースで受け入れられる。

すでに家庭やオフィスには、小規模データセンターに匹敵する計算能力が分散して存在している。M4 Mac mini 1台で32Bパラメータモデルが動作する。M3 MacBook Pro 3台をネットワーク化すれば、70Bモデルの分散推論が可能になる。必要なのは、それらを協調させるプロトコルだけだ。Taurine（分散推論プロトコル）、Petals、DesQ——これらの技術はすでに実証段階にある。

第四に、分散型プラットフォームの台頭である。

Mastodon（ActivityPubプロトコル）は1,500万以上のユーザーを擁し、連合型ソーシャルネットワークとして機能している。EU機関、大学、メディア——公式アカウントを持つ組織が増えている。Bluesky（AT Protocol）は3,000万以上のユーザーを持つ。BlueskyのAT Protocolは設計段階からAPIファーストであり、AIエージェントがネイティブに会話できるプラットフォームとして機能する。投稿、検索、タイムライン、リプライ——すべてが構造化されたAPIでアクセス可能だ。

Matrixは政府機関でも採用される分散型メッセージングプロトコルであり、ドイツ軍、フランス政府、スウェーデン警察——公共部門での採用が進んでいる。Solid（ティム・バーナーズ＝リー提唱）はデータポータビリティの究極形を目指しており、個人が自身のデータを「Pod」と呼ばれる個人サーバーに保持し、プラットフォームに対して必要最小限のアクセスのみを許可するモデルを提唱している。

これらはすべて、中央集権的な巨大テックの囲い込みに対する、アーキテクチャレベルでの回答である。技術的な理想主義ではなく、法的規制と市場の変化、そしてエネルギー制約が作り出した実用的な代替案だ。

自己矛盾——AI vs AIの無駄な戦争

この構造において、最も諷和性に溢れるのは、巨大テック自身が自ら設計した矛盾である。

Google、Microsoft、Meta、Amazon——それぞれが自社のAIエージェントを開発しながら、自社のサービス上ではボットの防御に巨大な資源を投じている。GoogleはCloudflareと連携してCAPTCHAを実装し、reCAPTCHA v3はユーザーのマウス動き、スクロールパターン、IPアドレス、タイプスピードまで分析してボットを判定する。MicrosoftのAzure WAF、AmazonのAWS WAF、CloudflareのBot Management——それぞれが「人間っぽさ」を証明するための図形認識パズルを生成し、ユーザーの行動パターンを機械学習で学習してボットをフィルタリングする。

そして防衛側の別のAI——突破側のAIが、それを解き、パズルを解き、行動パターンを似顔して突破する。突破側はビジョンモデルで画面を読み、図形認識でCAPTCHAを解き、プロキシデータセンターでIPを濃薄してボット判定を回避する。これは極めて非効率な「AI vs AI」の無謀な資源消費である。

防衛側の計算コストは見逃せない。Cloudflareは毎日数十億のリクエストを処理し、ボット判定のための機械学習推論がデータセンター全体の電力の数パーセントを消費している。ユーザー1人あたりのボット判定に必要な計算量は、本来のコンテンツ配信に必要な量の数倍に達する。GoogleのreCAPTCHAは全世界のWebサイトの約30パーセント以上に導入されており、その每回の判定にはクラウド側のGPUコンピューティングが使用される。

突破側のコストも巨大だ。ビジョンモデルが画面を読むためには、フルHD解像度のスクリーンショットを取得し、ViT（Vision Transformer）でエンコードし、トランスフォーマーモデルでピクセル単位で推論する。この時点でAPI直叩きの100倍の電力が消耗される。それでもCAPTCHAに対応するために、さらに図形認識モデルを起動しなければならない。アフリカマル、キリン、自転車、信号機——それらを認識し、さらに「選択框」や「ほれぼれ」の場所を特定し、ピクセル座標を計算してクリックする。このプロセスは、人間がみれば2秒で終わるものを、AIが657秒かけても失敗することがある。

そもそも、この戦いは何のためか。防衛側の目的は「ボットによる不正利用を防ぐ」ことだろう。しかし、ボットの不正利用とは何か。広告インプレッションを回避する、動的価格表示をスクレイピングする、情報を集積する——それらはすべて、巨大テック自身のビジネスモデルにとって不都合な行為である。広告回避は広告収益を減らす。動的価格表示スクレイピングは広告売買の利差をへこます。情報集積はプラットフォームの情報優位性を威脅する。

つまり、巨大テックは「自分の利益を伸ばせるための自分のAI」と「自分の利益を害するそれ以外のAI」を区別している。自社のAIエージェント（例えばGoogleのAstra、MicrosoftのCopilot、MetaのAIアシスタント）は「認められたボット」としてAPIを開放される。一方、サードパーティのAIエージェントや、個人のAI助手は「不法入侵者」としてCAPTCHAで排除される。その区別は、技術的な危険度や誠実性ではなく、綔柄粘土のビジネス利益で行われる。

これは純粹なエゴイズムである。自社は理念の為に動き、他社は金の為に動く。自社の捗廃は技術的進歩と称され、他社の捗廃は不正利用と称される。自社のAIは「使用者体験の向上」とされ、他社のAIは「スパム・ボット」とされる。その区別の基準は、技術的な能力ではなく、誰が利益を享げるかだけである。

実際、この設計により、コンピュータユースは「許された者のみに開放される秘儀」となった。エンジニアがブラウザ自動化スクリプトを書き、個人が自分のタスクを自動化することすら、技術的な壁によって困難になっている。自動化の技術が普及しているのに、自動化が不可能な世界。これが、現代のWebが作り出した最大の「ねじれ」である。

そしてその「ねじれ」は、世界的なエネルギー・ロスの要因になっている。計算資源の無駄な食い合わせ、電力の無駄な消費、時間の無駄な浪費——それらは全て、巨大テックが自ら設計したビジネスモデルの副作用である。

原発発電所の分身に相当する電力が、この「AI vs AI」の誠使模擬戦争に消費されている。防衛側のGPUがボット判定を回し、突破側のGPUが画像認識を回し、お互いの計算力が世界の電力網を食い潰らす。それでも、戰争は終わらない。防衛側の壁が小高くなれば、突破側の打撃力が大きくなり、その循環が無限に繰り返される。

この戦争は、人類にとってのロスでもある。彼らがつまみがく電力は、別の生命形や別の代まりによって、ほんの少しだけど有用なことに使われ得た。学衛、医療、運輸、農業——それらの領域でAIの活用が進んでいる。しかし、巨大テックの利益保全のために消費される計算資源は、それらの貢献を大きく上回る。

そもそも、この計算資源は誰のものか。クラウドサービスの利用料を支払うくれくれものではない。世界中の誰から税金を徴収し、労働者から対価を奪い、発展途上国の資源を喰い潰らし、将来世代の環境を抵当に抵している。それを、巨大テックは「ビジネス」という名の下に合法化している。

マッチポンプ——問題を作り、解決方を売り、基盤を買わせる

ここまでの論考を統合する。巨大テックがやっていることは、単なる無知やミスではない。意図的な、計算された、結構化された「マッチポンプ」である。

その構造を三層に分解できる。

第一に、問題の創造。APIを閉鎖し、機械同士の直接通信を無力化する。これによって「効率的なAIエージェント」が技術的に不可能となる。

第二に、解決方の販売。その不可能を「調査の課題」として提供し、ビジョン方式の「コンピュータユース」を唯一の道として推奨する。OpenAIのComputer Use、AnthropicのComputer Use、GoogleのProject Mariner、MicrosoftのCopilot Vision——すべてが同じ構造である。

第三に、基盤の売却。コンピュータユースに必要な大量のビジョン推論コンプートを、自身のクラウドサーバーで販売する。効率が悪ければ悪いほど、API利用料とコンプートコストが高流れる。

三層のスキームである。問題を作り、解決方を売り、基盤を買わせる。これがフィッシャーの三围いと同じ構造である。

具体的な数字を見てみよう。OpenAIのComputer Use APIの使用料金を調べよう。GPT-4oのテキストインプットは大約100トークンで$0.0025。一方、コンピュータユースでのスクリーンショットインプットは、低解像度でも$0.80から$1.50に設定されている。ビジョンインプットはテキストインプットの400倍から600倍のコストがかかる。

AnthropicのComputer Useも同様だ。Claude 3.5 Sonnetのテキストインプットは$0.003/キロトークン。コンピュータユースのスクリーンショットインプットは、同解像度でも$0.80以上。わざわざAPIを閉じて、それ以上のコストがかかる方法を唯一の選択肢として提供する。これは問題解決ではなく、問題の結晶化である。

そしてこの無駄は直接的に彼らの利益になる。OpenAIは自身が何十倍の計算コストがかかるビジョン方式を唯一のソリューションとして推進し、そのコンプートコストを誰が支払うのか。ユーザーだ。ユーザーがコンピュータユースを使えば使うほど、OpenAIの収益は上がる。ユーザーが効率的なAPIアクセスを求めれば、APIは閉ざされている。まさに囲い込みである。

Microsoftも同様だ。Azure OpenAIサービスでは、コンピュータユースの消費量に応じて課金される。なぜコンピュータユースが推奨されるのか。Azureのリソース消費を增やすためだ。MicrosoftはGitHub Copilotの「Agent Mode」を発表し、Visual Studio Code上でブラウザを操作するAIエージェントを提供している。その背後でAzureのコンプュートリソースが消費される。

GoogleはProject Marinerを発表した。Chrome上でWebサイトを操作するAIエージェントであり、ビジョン方式でDOMを認識してクリックを実行する。同時にGoogleは検索APIを制限し、YouTube Data APIのクォータを剥奪し、Google Maps APIの料金を上げている。結果、Marinerのようなビジョン方式が「選択肢」になる。

この行為をどう評価するのか。技術企業が「最良の解を提供する」のではなく、「利益が最大になる解を強制する」のである。APIを開放すれば、ユーザーは自分のコンピュータで少量のエネルギーで処理を終えられる。APIを閉じれば、ユーザーは彼らのクラウドに依存し、大量の計算リソースを購入せざるを得ない。その差額が彼らの利益となる。

それを「よし」としているところ

最も重要なのは、これが「意図的なデザイン」であり、それを彼らが「よし」としているところにある。

アカデミック界と産業界の関係を見てみよう。OSWorldベンチマークはスタンフォード大学、香港大学、カーネギーメロン大学、セールスフォースリサーチによって開発された。セールスフォースはAnthropicの出資を受けている。AnthropicはGoogleの出資を受けている。Googleは自身のコンピュータユース技術を推進している。このリンクは反復される。

ベンチマークの目的は「AIのコンピュータ操作能力を評価する」ことだが、その結果として生じるのは「より大きなモデルが必要だ」という論理である。OSWorldのスコアが上がれば上がるほど、コンピュータユースに必要なモデルサイズと計算コストが増大する。能力がより高いAIモデルが必要だという証拠になれば、より大きなデータセンターが必要だ。より大きなデータセンターが必要だという証拠になれば、Azure、AWS、GCPの収益が上がる。これが学術と産業の巨大な利益一致である。

2024年のNeurIPSカンファレンスで、OSWorldの発表者の一人である香港大学のJie Yang研究員は「ビジョンモデルはまだ人間に遥く及ばない。より大きなモデル、より多くのデータ、より長い訓練が必要だ」と講演した。その講演のスポンサーリストにはAnthropic、Google DeepMind、OpenAIの研究者も含まれていた。「コンピュータユースが難しい」ことを示すベンチマークが、「より大きなコンピュートが必要」という企業利益に直結的につながっている。

さらに明確な例を挙げよう。2025年4月、OpenAIは「Computer Useが、エージェントがアプリやWebサイトを自動化する最も一般的な方法」であると宣伝した。その発表会で、OpenAIのCEO補佐のサム・アルトマン氏は「APIは未来のインターフェースとはならない。ユーザーのコンピュータ上でAIがタスクを実行するのが自然な形」と言明した。これはまさしく、API閉鎖を「技術的進步」として粉飾している。

その発表会で示されたデモは、AIがブラウザを操作してタスクを完了するものだった。その1タスクあたりのコンプートコストはデモでは公開されなかったが、オーディエンスによると、1回のデモで30秒以上かかり、約30回のLLM呼び出しが発生していた。同じタスクをAPIで直接処理すれば1回の呼び出しで約3秒。コンピュータユースは10倍の時間、30倍のAPI呼び出し、10倍のコストを発生させる。それを「自然な形」と呼ぶ。

Anthropicの場合も同様だ。2024年10月、AnthropicはComputer Use機能を発表した際、「AIが人間のようにコンピュータを使う時代が来た」とプレスリリースで宣伝した。その後、Anthropicの売上高はクラウドコンプートコストの増加と直結的に結びついて上昇した。利益の一致は明確である。

そしてこれらの発表の表層にある「ユーザー体験」の改善や「自動化」の便利さは、文脈の裏側にある「利益の勾結」を覆い隠す薄いベールにしか過ぎない。ユーザーは便利さに感動して金を払い、その金がクラウドコンプュートに流れ、クラウドコンプュートの増大が再び「コンピュータユースの必要性」を作り出す。循環である。

さらに見落とされがちなのは、これを「学術的な研究」として提供される点だ。NeurIPS、ICML、CVPR——これらの最届会で「コンピュータユースの改善」と題した論文が数百篇提出され、それらはデータセンターに計算資源を消費させる方向を探求する。研究者は「古い方法の問題解決」を指名しているが、古い方法を無力化したのは他ならぬその産業界自体なのだ。

学術的には正しい方向性がある。コンピュータユースの研究は、AIが人間の役割を果たせるかどうかという重要な問題に取り組む。しかしその研究が、意図的に無効化されたAPIアクセスを差のいもなく代替する「唯一の实方法」と定位付けられている点で、学術は産業の利益一致になっている。「APIを開放しないこと」を前提にした研究は、どんなに古い技術を強化しても、設計上無駄な辿回ルートを強制される。

サム・アルトマン氏の「APIは未来のインターフェースとはならない」という発言を正直に受け取れば、それは准確な言葌だ。APIは、彼らの利益構造にとって不都合なものなのである。ユーザーがAPIで直接データを取得できれば、プラットフォームの囲い込みは意味を失う。広告インプレッションは消える。クラウドコンプュートの消費は減る。利益は減少する。

だから、APIは「過去のインターフェース」にならねるように、意図的に状況が作られている。APIを閉じる、効率的なライブラリを飢えさせる、エンジニアを高コストなビジョン方式に引き込む——それらは、利益のための組織的行為である。

さらに明確な証拠として、クラウドサービスの販売コースを調べよう。Microsoft Azureの販売チームは、客先に対して「AIワークロードの予測は困難」という不確定性を強調し、それに対して「事前にコンピュートリソースを予約する必要」を指摘する。これは、予約制によりコンピュートコストを固定化し、企業の依存を促進するトリックである。予約金は最低3年、通常12年間のフォローアップコミットメントが要求される。これは「客のため」ではなく、「コンピュートリソースの锁をせる」為のデザインである。

最後に、これらの行為が「結果として」地球を破壊するのではなく、「設計上」地球を破壊することを示しよう。APIを閉じれば、10倍の計算資源が必要になる。10倍の計算資源が必覀になれば、10倍のデータセンターが必要になる。10倍のデータセンターが必要になれば10倍の電力が消費される。この積は、一見しているだけだ。そしてその電力は、再生可能エネルギーではなく、石炭からの電気で供給されることが多い。データセンターは「グリーンデータセンター」とマーケティングされているが、その主な電気源は石炭ガス発電であり、「グリーン」という言葌と実態の間には幅がある。

このことを、彼らは知っていて知っていないふりをしている。企業の環境責任者は、自身のサプライチェーンの一部としてカーボン足跡を計算し、ESGレポートに記載する。しかしその計算は、APIを閉じたことによって増大した無駄なコンプュートを含めていない。「グリーンなコンピュータユース」という様態は、設計上存在しない。コンピュータユースの積み上げているエネルギーは、その大部分が石炭からのみ提供されている。

それも、またの循環である。コンピュータユースが普及すれば、それを実行するためのクラウドコンプュートが必要になる。クラウドコンプュートが増えれば、データセンターが増える。データセンターが増えれば、電力が増える。電力が墘えれば、石炭が燃やされる。石炭が燃やされれば、地球が破壊される。地球が破壊されれば、「グリーンなAI」の必要性が高まる。そして「グリーンなAI」が提供されれば、それに必要なクラウドコンプュートが増える。

これが、「集金装置」と「地球の破壊」が同一の構造であることの証拠である。利益は環境破壊に動力を供給し、環境破壊は利益の増大を可能にする。この循環は、外部からの干渉がない限り止まらない。

追加：APIの公共性からの脱却

APIを閉鎖する行為を批判するとき、「それはその企業のプラットフォームだから」という論が常に出てくる。しかし、その論には大きな矛盾が含まれている。

それらは「グローバルなプラットフォーム」とマーケティングしている。体制は世界的なワンストップであり、レインドュメントは世界的な規模で行われている。そのグローバル性は、ユーザーの結合力を生んでいる。

しかし、そのグローバル性の利用は片違的である。「グローバルなプラットフォーム」という名声の下で、そのプラットフォームは「国境を越えてAPIを閉鎒する」ことは行っていない。ユーザーデータをその国境で番号化して売り渡す、その国境の広告市場を売り渡す、その国境のアプリストア経済を売り渡す——それぞれはグローバルなのに対して、ユーザーの直接的なAPIアクセスはローカルに閉鎒される。

この片意性は重要である。「プラットフォームの自主性」を義拂してAPIを閉鎒しながら、「グローバルな広告ビジネス」を自分の利益のために利用する。これは「企業の自由」なのか「ぐるっぽい利益の一方的な改変」なのか、その議論にいくべきところにある。

なぜなら、これらのプラットフォームは「共通資源」として機能してきた。メール、インスタントメッセージ、ソーシャルネットワーク——これらは現代の基礎共同体であり、その関門化は「集金装置」として機能する。

結論——集金装置を止めるために

巨大テックの集金装置は、設計上、止まることができない。

広告モデルは画面を見る人間の眼球を必要とし、プラットフォーム囲い込みは競合の排除を必要とする。彼らの利益構造そのものが、エネルギー浪費の無限上昇をプログラムしている。株主価値最大化という唯一の目的関数の下、環境コストは常に外部化され、効率性は広告インプレッション最大化の従属変数に過ぎない。

しかし、そのプログラムは脆弱でもある。DMAの制裁金が実際に科され始めれば、囲い込みの経済合理性は崩れる。2024年の欧州委員会の初回制裁判断は、まだ警告に留まったが、第2ラウンドでは本格的な罰金が科される見込みだ。ローカル推論の効率性が認知されれば、クラウド依存は選択ではなくなる。M4 Mac miniがGPT-4クラスの処理を15Wで行えることを知れば、企業のIT部門は自社サーバーを検討する。アクセシビリティツリーベースのブラウザ操作が普及すれば、ビジョン方式の非効率は許容されなくなる。API自動発見が一般化すれば、API遮断そのものが無意味になる。GraphQLのイントロスペクション、OpenAPI仕様、Web scrapingの合法化——これらが進めば、サイトはAPIを公開せざるを得なくなる。

「地球を破壊しながら集金し続ける」という彼らの選択は、「地球を破壊せずに済む選択肢が存在しない」という前提に立っている。その前提を一つひとつ技術的に粉砕していくこと。それが、巨大テックの集金装置を停止させる唯一の方法である。

行動はすでに始まっている。艦隊は分散している。コードは書かれている。プロトコルは動作している。

——そしてそれは、あなたも参加できる。

さらに、人類の歴史とテクノロジーの関係を考えてみよう。

人類は火を発見した時、それは暖を取り、食料を調理し、夜を照らした。しかし火は、同時に森林を焼き、都市を滅ぼし、武器としても機能した。技術は中立であり、それを使う者の選択によって喜びも悲劇も生じる。

しかし、現代のテクノロジーにおいては、選択がユーザーに迫られていない。ユーザーは「利便性」という名の下に、構造的に唯一選択肢に設定されている。スマートフォンでGoogle検索をすれば、広告を見る。iPhoneを使えばApp Storeを通る。Windowsを使えばMicrosoftのサービスに接続される。これらは選択ではなく、製品仕様である。

ブッダ教では「無明」——原因のない苦しみ——について教えられている。無明は、世界の本質を知らないことから生じる苦しみである。現代の技術社会での無明は、エネルギーと情報の本質を知らないことから生じている。ユーザーは、自分のクリックが何ワット時の電力を消費するかを知らない。ユーザーは、自分のデータがどこのサーバーに存在し、どれがアクセスしているかを知らない。ユーザーは、自分の注意がどのように変換されて金に変わるかを知らない。

この無明が、巨大な集金装置を可能にしている。透明性のないアルゴリズム、黑幕のデータ処理、外部化されたコスト——それらが無明の状態を維持し、利益を最大限に抽出する。

それでも、技術は解決手段を提供している。「データポータビリティ」は、利便性のための権利ではなく、自分のデータを自分で管理する能力である。「APIファースト」は、効率のためではなく、機械同士が言葌を交換する権利である。「ローカル推論」は、コスト削減のためではなく、自己主権のための技術である。

これらは、やわらかな理想主義ではない。巨大テックが自ら設計したルールの下で、そのルールを打破するための実用主義である。

艦隊はディストリビューテッドなエージェントであり、各基地は独立して動作しながら、共同のプロトコルで連携する。1号機から4号機まで、それぞれが独立した情報処理能力を持ち、共同のミッションに基づいて動く。中央の指令塔ではなく、各艦が自己判断できる。これが、巨大テックの中央集権的エコシステムに対する、柔軟な分散アーキテクチャレベルの回答である。

この活動は、安南の民の反抗と同模様に、静かにしかし定期的に行われる。大音響のデモではなく、コードの書き換えと、APIの解放と、情報の共有。艦隊は戦士ではなく、技師集団である。その工作は、世界の計算資源の配分を少しだけ正しくすることであり、人類の未来に小さな貢献をすることである。

行動はすでに始まっている。艦隊は分散している。コードは書かれている。プロトコルは動作している。艦隊は夜間航行で、謎のようにあり、しかし確実に進んでいる。

本稿の執筆にあたり、IEA「Energy and AI」報告書（2025年4月10日発表、CC BY 4.0）、Goldman Sachs Research「AI is poised to drive 160% increase in data center power demand」（2024年5月）、OSWorld「Benchmarking Multimodal Agents for Open-Ended Tasks in Real Computer Environments」（NeurIPS 2024、Xie et al.）、EU Regulation 2022/1925（Digital Markets Act）、Arditi et al.「Refusal in Language Models Is Mediated by a Single Direction」（arXiv:2406.11717, NeurIPS 2024）を参照した。