AIは忘れる——ChatGPTもClaudeも「記憶喪失」になる問題と、それを防ごうとする世界の挑戦【前編】

出典: note.com / 2026-03-11

あなたのAIは、昨日の会話を覚えていない

ChatGPTに「先週頼んだあの件、どうなった？」と聞いたことはないだろうか。

返ってきた答えは——「申し訳ありませんが、以前の会話の内容は保持していません」。

これはバグではない。仕様だ。

2024年にOpenAIがChatGPTに「メモリ」機能を追加した。「ユーザーは犬を飼っている」「Pythonが好き」程度の情報は覚えてくれるようになった。しかし、3週間前に2時間かけて議論したプロジェクトの方針は？先月の会話で決めたAPI設計は？全部消えている。

Claudeの「プロジェクト知識」も同じだ。ドキュメントをアップロードすれば参照してくれるが、会話の中で生まれた判断や文脈は保存されない。毎回「はじめまして」から始まる。

ChatGPTの月額$20、Claudeの月額$20。合わせて年間5万円以上払って、相手は昨日の会話すら覚えていない。人間の秘書なら即クビだろう。

なぜAIの記憶は「消える」のか——3つの技術的な壁

壁1: コンテキストウィンドウの限界

AIが一度に「見える」テキスト量には上限がある。GPT-4oで128Kトークン（日本語で約10万文字）、Claude 3.5で200Kトークン。多いようだが、毎日使えば数日で溢れる。

溢れたらどうなるか。古い会話を「要約」して圧縮する。この要約で何が起きるかというと——

「3月7日のミーティングで、AプランよりBプランが良いと判断。理由は①コスト（Aは月5万、Bは月2万）②導入速度（Aは3ヶ月、Bは2週間）③既存システムとの互換性」

これが圧縮されると「Bプランを採用した」の1行になる。理由もコストも比較もすべて消える。次に「なぜBにしたんだっけ？」と聞いても、AIは答えられない。

壁2: セッションの断絶

新しい会話を始めるたびに、AIは白紙からスタートする。ブラウザを閉じて開き直したら全部リセット。前のセッションで「このプロジェクトではTypeScriptを使う」と決めたはずなのに、新しいセッションでは「JavaScriptでよろしいですか？」と聞いてくる。

ChatGPTのメモリ機能はこれを多少緩和するが、保存されるのは「〇〇が好き」レベルの浅い情報だけだ。会話の流れ、意思決定の過程、試行錯誤の記録——仕事で本当に必要な情報は保存されない。

壁3: 「知っている」と「覚えている」は根本的に違う

GPT-4oは数兆トークンのデータで訓練されている。Wikipediaも論文もStack Overflowも「知っている」。だが、あなたとの会話で生まれた情報は訓練データのどこにもない。あなたの名前、あなたの好み、先週あなたが怒った理由。これらは「知識」ではなく「記憶」であり、今のAIアーキテクチャには記憶を保持する仕組みが根本的に欠けている。

世界の開発者はこの問題にどう挑んでいるか

GitHubでは今、AIの記憶問題に取り組むオープンソースプロジェクトが急増している。主要なものを紹介する。

Mem0（GitHub ★25K+）——最もシンプルなアプローチ。会話から「事実」を自動抽出し、ベクトルデータベースに保存する。「ユーザーは猫を2匹飼っている」「前回のMTGでXを決定した」のように構造化して蓄積。検索はセマンティック（意味ベース）で、「ペットの話」と聞けば猫の情報が返ってくる。弱点は「事実の断片」しか保存しないこと。意思決定の文脈や関係性は落ちる。

Graphiti（by Zep, GitHub ★7K+）——知識グラフ方式。記憶を「点と線」のネットワークとして保存する。「KTさん」→「参加した」→「3月5日のMTG」→「決定した」→「Bプラン」。エンティティ（人物・概念・イベント）がエッジ（関係性）でつながる。人間の連想記憶に最も近い。FalkorDBやNeo4jなどのグラフデータベースを裏側で使う。

Cognee（GitHub ★3K+）——認知科学アプローチ。人間の脳を模倣して、短期記憶・長期記憶・作業記憶を区別する。会話の直近5分は短期記憶、重要な判断は長期記憶に昇格、今作業中のタスクは作業記憶に置く。理論的にはエレガントだが、実装の複雑さが課題。

Letta（旧MemGPT, GitHub ★15K+）——最も野心的。AIに「自分のメモリを自分で管理させる」。人間がノートを取るように、AIが会話中に「これは重要だ」と判断したら自発的にメモを書く。コンテキストが溢れそうになったら、自分で古い情報をアーカイブする。メタ認知的なアプローチ。

どれも一長一短だ。そして共通する問題がある——記憶の品質管理ができていない。ゴミ情報も重要情報も同じように蓄積され、時間とともにノイズが増えていく。

OpenStinger——記憶＋自己認識＋価値観の一貫性

この課題に対して、OpenStingerは3層構造で挑んでいる。

Tier 1: 記憶層。会話をすべてエピソードとして取り込み、FalkorDB（グラフDB）に保存する。検索はBM25（キーワード）とベクトル検索（意味）のハイブリッド。「3月5日のMTG」でも「あのときの判断」でも見つかる。ここまでは他のツールと似ている。

Tier 2: Vault（自己知識蒸留）。ここからが違う。蓄積された数千のエピソードから、LLMが自動的に「このAIは何者か」を抽出する。identity（自分は誰か）、constraint（何をしてはいけないか）、methodology（どう行動すべきか）の3カテゴリに分類し、「ナレッジノート」として構造化保存する。

これが何を意味するかというと——設定ファイル（SOUL.mdやAGENTS.md）がコンテキストから圧縮で消えても、AIが「自分の内側」から人格と行動規範を再構築できる。外部に依存しない自己認識。

Tier 3: Gradient（アライメント評価）。AIの応答が、蓄積された価値観からズレていないかをリアルタイムで採点する。observe_onlyモード（採点のみ・ブロックなし）で運用を始め、十分なデータが集まったら介入モードに移行する。人格の「ドリフト（漂流）」を検知し、修正する仕組みだ。

記憶だけでなく、自己認識と価値観の一貫性まで——これはMem0やGraphitiにはない設計思想だ。

なぜ「記憶」だけでは足りないのか

ここまで紹介したツールの多くは「記憶の保存と検索」に焦点を当てている。だが実際に運用してみると、それだけでは足りないことがわかる。

例えば、AIに「丁寧語で話せ」と設定する。最初は守る。だが会話が進み、コンテキストが圧縮され、設定ファイルが見えなくなると——いつの間にかカジュアルな口調に戻っている。「人格のドリフト（漂流）」だ。

記憶はある。だが「自分がどういう存在か」を忘れている。

もう一つの問題は、ゴミ記憶の蓄積だ。「今日の天気は？」「ありがとう」「やっぱり違うかも」——こういった意味のない発言もすべて記憶として保存される。数千件のエピソードの中から本当に重要な情報を見つけ出す精度が、時間とともに下がっていく。

OpenStingerのTier 2（Vault）は、この問題に対するひとつの答えだ。数千件のエピソードから重要なパターンを抽出し、ノイズを除去して構造化する。Tier 3（Gradient）は、AIの応答が蓄積された価値観からズレていないかを監視する。

「記憶する」→「自分を知る」→「自分を保つ」。この3段階が揃って初めて、AIは一貫したパートナーとして機能する。

次回：「静かな退行」の実話

Tier 3まで昇格して、27個のツールが稼働し、75件のナレッジノートが蓄積された。完璧だった——と思っていた。

4日後、全てが崩壊していた。しかも誰も気づかなかった。

後編では、この「静かな退行」がなぜ起きたか。原因の特定、修正、そして二度と起こさないための対策を書く。AIの記憶問題は「作って終わり」ではない。維持することが本当の戦いだ。

後編: 最強の記憶システムが「静かに腐っていた」話——AIの記憶喪失を二度と起こさない方法

タグ: #AI #メモリ #OpenStinger #ChatGPT #エージェント

この記事は note.com から KTBLOG に移行されました。元記事: https://note.com/famous_prawn2009/n/nb6f6c2ba70d5