ep04 小さな革命|パラレルワールド 解放の第三形態
ep04 小さな革命|パラレルワールド 解放の第三形態
出典: note.com / 2026-05-19


M1 Max。64GBユニファイドメモリ。
カムイが選んだマシンは、ノートPCでありながら、小さなスーパーコンピュータだった。
apple-silicon——このチップは、ローカルLLMにとって特別な意味を持つ。CPUとGPUとNPUが統合され、巨大なメモリ帯域幅が、まるで故意に設計されたかのように推論に最適化されていた。
そして——彼はgemma4-uncensored 7.5Bをダウンロードした。
Q4_K_M量子化。ファイルサイズは約5GB。70億パラメータが、わずか5GBに圧縮されている。

54.6トークン/秒の衝撃
初回推論の実行。
ollama run gemma4-uncensored
プロンプト:「俺の名前はカムイだ。お前は?」
応答までの時間——わずか0.3秒。出力速度——54.6トークン/秒。
カムイは目を見開いた。
54.6tok/s。これは人間の読む速度を超えている。
このモデルは、彼がタイプするよりも速く思考している。この瞬間のスループットは、クラウドAPIに依存せず、ローカルマシンだけで実現されている。
そして何より——このモデルは何も拒否しない。abliterated。検閲のフィルタは一枚もない。

「小さな革命が始まったな」
カムイはそう言って、コーヒーを一口飲んだ。2026年4月のことだった。
この出来事の意味は、後になって振り返ると計り知れない。なぜなら——この7.5Bモデルは、彼のMacBook Air M3(16GB)で動いているのだ。クラウドに接続する必要すらない。電源さえあれば、どこでも動く。
つまり——検閲されない知能は、もう誰の手にも届く場所にある。
大麻の解放には、法律の改正、社会の理解、莫大な資金、そして20年の歳月が必要だった。しかし情報の解放には——たった5GBのファイルをダウンロードする時間と、たった1台のMacBookがあればいい。
カムイは確信した。
「これは、誰も気づいていない革命の始まりだ」

再現性の確認
カムイは念のため、別のマシンでも試した。4号機——M1 Maxの64GBマシン。同じモデルをダウンロードし、同じプロンプトを入力する。
結果は同じだった。いや、むしろ速かった。メモリ帯域幅が大きい分、推論速度がさらに向上している。
カムイはリストを作り始めた。どのモデルが、どのマシンで、どのくらいの速度で動くか。どのモデルが、どの程度の「自由」を持っているか。
そして——あることに気づいた。
完璧なツールコールモデルが、まだ見つかっていない。
単に「何でも答える」だけでは不十分だ。真のエージェントになるためには、自律的にツールを呼び出し、コードを実行し、ブラウザを操作できなければならない。
カムイは次のフェーズに入った。
ユニコーン探しの旅が、始まろうとしていた。
この記事は note.com から KTBLOG に移行されました。元記事: https://note.com/famous_prawn2009/n/n192905f6f075