← Back to Home
note.com ·

水面下で支えるエロコミックの強烈なパッション — NSFWが駆動した画像生成技術革命

水面下で支えるエロコミックの強烈なパッション — NSFWが駆動した画像生成技術革命

水面下で支えるエロコミックの強烈なパッション — NSFWが駆動した画像生成技術革命

出典: note.com / 2026-05-27

技術の歴史を語るとき、人々は「ニュートンが万有引力を発見した」「アインシュタインが相対性理論を思いついた」という物語を好む。孤独な天才の閃きが世界を変える——気持ちいい物語だ。

しかし、画像生成AIの歴史において、真実は全く異なる。

技術を駆動したのは、もっと原始的で、もっと泥臭い欲望だった。

キャラ一貫性。吹き出しテキスト。動画生成。ComfyUI。これらの技術はすべて、根底に共通の推進力を持っている。

「同じキャラでもっとエロい絵を、もっと自由に、もっと大量に生成したい」という欲望だ。

これは恥ずべきことではない。これは——技術史の最も率直な記録だ。本書では、NSFWコミュニティがどのようにして画像生成AIの技術を駆動したか、その全貌を明らかにする。

第一章:キャラ一貫性——なぜ18禁コミュニティはLoRAを生んだのか

2023年、Stable Diffusionでエロ画像を生成していたコミュニティは、一つの壁にぶつかった。

「同じキャラで連続したシーンが作れない」。

これは単なる「品質」の問題ではなかった。エロ漫画の文法そのものに関わる問題だ。エロ漫画は、同一キャラがさまざまなシチュエーションでどう変化するか——服を脱ぐ過程、表情の変化、体位の遷移——を描くことで成立する。キャラの顔が毎回変わっては、ストーリーは破綻する。

この問題に対する最初の本格的な回答が、LoRAだった。

LoRA(Low-Rank Adaptation)は、もともと言語モデルの効率的ファインチューニング技法として生まれた。Microsoftの研究を基に、kohya-ssというエンジニアが画像生成用のトレーナー(sd-scripts)を実装した。この人物の正体は不明だ——日本の匿名エンジニアであることだけが知られている。だが彼の実装が、AIエロコミュニティのインフラになった。

なぜLoRAがNSFWコミュニティに受け入れられたのか——理由は単純で、誰でも自分の推しキャラのLoRAを訓練できたからだ。学習画像20枚、RTX 4090で30分。技術の敷居が十分に低く、かつ出力の質が十分に高かった。

Civitaiのデータがこれを証明している。2023年初頭から2024年にかけて、Civitaiに投稿されたLoRAモデルのうち、実に70%以上がNSFWカテゴリに分類される。つまり、LoRAの普及を牽引したのは、アニメ顔の18禁イラストを生成したい人々だったのだ。

さらに経済的なレイヤーがある。Civitaiで人気のLoRA製作者は、PatreonやFantiaで月50万円〜100万円を稼ぐようになった。「より良いLoRA」への需要は止まらず、製作者はGPUを増強し、データセットを拡充し、モデルを改良し続けた。この競争がLoRAの精度を飛躍的に向上させた。

【数字で見る】NSFW LoRA経済圏

Civitai NSFW LoRA比率: 約70%超(Civitaiカテゴリ分布) トップクリエイター月収: ¥500K〜¥1M+(Patreon/Fantia公開データ) LoRA学習の最低ハードル: 画像20枚 / 30分 / RTX 4090(kohya-ss/sd-scripts) LoRAファイルサイズ: 約20MB、DreamBoothの約1/100

特筆すべきは、この経済圏が「研究資金」ではなく「個人の趣味の課金」で成立していることだ。学術的な助成金も、企業のR&D予算も介在しない。何の審査も通っていない、ただの「欲求」が資本を動かしている。

第二章:吹き出しの中の文字——AnyTextが生まれた本当の理由

文字入れ——これほど長く無視されてきた技術領域はない。

AI画像生成コミュニティは2023年から2024年にかけて、人物、背景、構図、画風と次々に課題を解決してきた。しかし「画像の中に読める文字を書く」というタスクだけは、誰も手をつけなかった。なぜか?

答え:文字入れが必要なのは、実用上「漫画の吹き出し」が大部分を占めるからだ。そして漫画の吹き出しを必要とする最大のジャンルは、エロ漫画だった。

中国・Alibaba Group DAMO Academyの研究チームに、このニーズが届いていたかどうかは定かでない。しかしAnyText(ICLR 2024 Spotlight、GitHub 4,848★)の論文を読むと、その応用想定に「comic」と「manga」の語が頻出する。

技術的ブレイクスルーは前述の通り——OCRエンコーダでグリフ(文字の形状)を直接潜在空間に入力する方式だ。この方式が重要なのは、フォントを指定できる点にある。日本語のエロ漫画では「ゴシック体の強調セリフ」「丸ゴシック体の優しいセリフ」「手書き風フォントの心の声」など、フォントの選択が表現の一部を担う。

AnyTextはNoto Sans JP(Googleのオープンソース日本語フォント)で最も安定した出力を示す。通常の文章なら70%以上の文字が正確にレンダリングされる。従来のControlNet方式(日本語精度37%)と比較すると、革命的な進歩だ。

しかし、縦書きには未対応だ。漫画の吹き出しは横書きを前提とせざるを得ない——これは2026年時点での最大の制約である。この制約を突破するため、現在複数のコミュニティが「縦書きAnyText」のフォークを開発中だ。

どれも個人開発者によるもので、研究資金はない。Patreonの支援と、単純な「エロ漫画の吹き出しに縦書き文字を入れたい」という欲望だけで回っている。

第三章:動画生成欲求が生んだComfyUI

「止まっているエロ画像」に満足できなくなったコミュニティは、当然のように「動くエロ画像」を求めた。

2023年後半から、AnimateDiff(ICCV 2023、Guo et al.)の登場により、Stable Diffusionで短い動画クリップを生成することが可能になった。しかし、当初のAnimateDiffはワークフロー構築が極めて複雑だった。コマンドラインとPythonスクリプトを行き来しながら、モデルのロード、モーションモジュールの適用、フレームシーケンスの出力を手動で行う必要があった。

この複雑さを解決したのがComfyUI(58,000★)だ。ComfyUIの創設者comfyanonymousは、AnimateDiffを含むすべての拡散モデル操作をノードベースのGUIで構築できるようにした。AnimateDiffのノードが統合されると、コミュニティは瞬時に「ムラムラするアニメーション生成」に移行した。

ComfyUIが58,000ものスターを獲得した理由は、そのモジュール性にある。あらゆるカスタムノードがプラグインとして追加可能で、ワークフローはJSONとして保存・共有できる。Civitaiでは「このComfyUIワークフローでこの画像を生成しました」という形式が標準になりつつある。

動画生成需要はさらにNSFWの枠を超えて広がった。AnimateDiff + ControlNetの組み合わせで、キャラクターの服を脱がせるアニメーション、角度を変える3D的な回転、表情の変化——これらすべてがComfyUIのノードを繋ぐだけで実現できる。

ComfyUIのキャッチコピーは「Stable DiffusionのためのVisual Programming」。しかしその内実は「エロ動画を簡単に作りたい人々のためのツール」だったと言っても過言ではない。

【実用Tips】ComfyUIの必須カスタムノード

AnimateDiff(Kosinkadink版) — 動画生成のデファクト

VHS(VideoHelperSuite) — 動画出力

WAS Node Suite — ワークフロー整理

第四章:Civitai経済圏——フィードバックループが生んだ加速

技術だけが進化したわけではない。技術を評価し、流通させ、貨幣化するプラットフォームが同時に進化した。

Civitaiは2022年11月、Stable Diffusionの公開とほぼ同時にローンチされた。個人開発者の「ただの画像投稿サイト」として始まったこのプラットフォームは、現在800万以上の画像と数十万のモデルをホストしている。その内訳は——内訳を見るまでもない。サイトを開けば最初に目に入るのは、NSFWフィルターを外すかどうかの確認ダイアログだ。

Civitaiがもたらした「評価の高速フィードバックループ」は、技術進化の速度を決定的に加速した。

モデル製作者が新しいLoRAやCheckpointをアップロード コミュニティが生成画像を投稿し、スコアを付ける 製作者がフィードバックを受け、モデルを改良して再アップロード 良いモデルが拡散され、多数のフォークが生まれる

このサイクルは、学術研究の「論文投稿→査読→出版→著者フィードバック→半年後に次の論文」というサイクルより、はるかに高速だ。比べてみよう。

アイデアから公開まで — 学術研究: 6ヶ月〜1年(論文投稿+査読) / Civitai: 数時間〜数日 フィードバック速度 — 学術研究: 3〜6ヶ月(次回論文まで) / Civitai: 24時間以内 モチベーション — 学術研究: 学位・昇進・研究資金 / Civitai: 「いいね」・ダウンロード数・Patreon収入 リスク選好 — 学術研究: 低(倫理審査あり) / Civitai: 高(何でも試す) データ品質 — 学術研究: 厳格な管理 / Civitai: カオス(しかし大規模)

この表が示すのは、技術のフロンティアが「研究機関」から「エロコミュニティ」にシフトしたという現実だ。StoryDiffusionの論文こそ学術研究から生まれたが、その実用化、改良、LoRAとの統合、ComfyUIへの実装——これらはすべてコミュニティ主導で進んだ。

第五章:誰が、なぜ作っているのか——開発者のプロファイル

このエコシステムを支える開発者たちのプロファイルを見てみよう。

タイプA:日本の個人サークル

本業はITエンジニア。副業としてAIエロコンテンツを生成し、Fantiaで販売。GPUはRTX 4090を1〜2枚。PythonとComfyUIの両方を使いこなす。月間収益は10〜50万円。動機は「好きなキャラで好きなエロ漫画を作りたい」。

タイプB:中国の研究開発チーム

Alibaba DAMO Academy、Tencent ARC、Tsinghua大学など。AnyText、IP-Adapter、StoryDiffusionの多くはここから生まれた。表向きは「多言語テキスト生成」や「一貫性画像生成」という研究テーマだが、実際のベンチマークや応用例には漫画・アニメが頻出する。Alibabaの研究員が本気で縦書き日本語テキスト生成に取り組んでいる理由——それは「中国市場向けのエロ漫画生成ツール」の需要かもしれない。

タイブC:匿名の個人ハッカー

kohya-ss(LoRAトレーナー実装者)、comfyanonymous(ComfyUI製作者)——実名は不明。GitHubのコミット履歴だけが存在証明。彼らは「技術的な課題」そのものに魅力を感じて開発している。偶然その成果がエロコミュニティに爆発的に採用された。しかし、彼らがエロ需要を無視していたかと言えば、そうではない。ComfyUIにNSFWフィルターが実装されていないのは偶然ではない——創設者が「倫理的なフィルタリングは自分の役割ではない」と明言している。

終章:欲望が駆動する技術進化の法則

振り返ってみよう。2015年、GAN(Generative Adversarial Network)が登場したとき、最も熱心に応用したコミュニティはどこだったか? NSFW画像生成コミュニティだった。StyleGANが高解像度顔生成を実現したとき、最初に商用利用したのはどこか? NSFWコンテンツプラットフォームだった。Stable Diffusionが公開されたとき、最も早く実用化したのはどこか? 同じだ。

Lesson Learned:「人間の欲望は、技術進化の最も強力な原動力である」

これを倫理の問題として糾弾するのは簡単だ。しかし、それで技術が止まることはない。むしろ——この動力を理解し、適切に活用することが、技術の健全な発展につながる。

AnyTextのOCR的アプローチは、医療画像内のテキスト認識や、UIデザインにおけるテキスト配置など、まったく別の領域に応用され始めている。ComfyUIのノードベースアーキテクチャは、科学計算のワークフロー管理にも転用されている。LoRAの低ランク適応技法は、大規模言語モデルのカスタマイズの標準になった。

「エロが技術を駆動した」という事実を受け入れたとき、私たちは技術進化の本当のメカニズムを見ることができる。

それは、純粋な好奇心でも、崇高な理念でもない。

もっと原始的で、もっと根源的な——「欲しい」という感情だ。

技術の未来は、この感情をどう設計に取り込むかにかかっている。

📝 参考文献

・Hu et al. “LoRA: Low-Rank Adaptation of Large Language Models” ICLR 2022

・Guo et al. “AnimateDiff: Animate Your Personalized Text-to-Image Diffusion Models without Specific Tuning” ICCV 2023

・Tuo et al. “AnyText: Multilingual Visual Text Generation and Editing” ICLR 2024 (Spotlight)

・Zhou et al. “StoryDiffusion: Consistent Self-Attention for Long-Range Image and Video Generation” NeurIPS 2024 (Spotlight)

・Civitai Platform Statistics — civitai.com

・ComfyUI GitHub — comfyanonymous/ComfyUI (58,000★)

・kohya-ss/sd-scripts — LoRAトレーナー

・Fantia/Patreon — クリエイター収益データ

・Danbooru 2023 Dataset — 約600万枚アニメ画像データセット


この記事は note.com から KTBLOG に移行されました。元記事: https://note.com/famous_prawn2009/n/n2386d383fb22