← Back to Home
note.com ·

AIは忘れる——ChatGPTもClaudeも「記憶喪失」になる問題と、それを防ごうとする世界の挑戦【前編】

AIは忘れる——ChatGPTもClaudeも「記憶喪失」になる問題と、それを防ごうとする世界の挑戦【前編】

AIは忘れる——ChatGPTもClaudeも「記憶喪失」になる問題と、それを防ごうとする世界の挑戦【前編】

出典: note.com / 2026-03-11

あなたのAIは、昨日の会話を覚えていない

ChatGPTに「先週頼んだあの件、どうなった?」と聞いたことはないだろうか。

返ってきた答えは——「申し訳ありませんが、以前の会話の内容は保持していません」。

これはバグではない。仕様だ。

2024年にOpenAIがChatGPTに「メモリ」機能を追加した。「ユーザーは犬を飼っている」「Pythonが好き」程度の情報は覚えてくれるようになった。しかし、3週間前に2時間かけて議論したプロジェクトの方針は? 先月の会話で決めたAPI設計は? 全部消えている。

Claudeの「プロジェクト知識」も同じだ。ドキュメントをアップロードすれば参照してくれるが、会話の中で生まれた判断や文脈は保存されない。毎回「はじめまして」から始まる。

ChatGPTの月額$20、Claudeの月額$20。合わせて年間5万円以上払って、相手は昨日の会話すら覚えていない。人間の秘書なら即クビだろう。

なぜAIの記憶は「消える」のか——3つの技術的な壁

壁1: コンテキストウィンドウの限界

AIが一度に「見える」テキスト量には上限がある。GPT-4oで128Kトークン(日本語で約10万文字)、Claude 3.5で200Kトークン。多いようだが、毎日使えば数日で溢れる。

溢れたらどうなるか。古い会話を「要約」して圧縮する。この要約で何が起きるかというと——

「3月7日のミーティングで、AプランよりBプランが良いと判断。理由は①コスト(Aは月5万、Bは月2万)②導入速度(Aは3ヶ月、Bは2週間)③既存システムとの互換性」

これが圧縮されると「Bプランを採用した」の1行になる。理由もコストも比較もすべて消える。次に「なぜBにしたんだっけ?」と聞いても、AIは答えられない。

壁2: セッションの断絶

新しい会話を始めるたびに、AIは白紙からスタートする。ブラウザを閉じて開き直したら全部リセット。前のセッションで「このプロジェクトではTypeScriptを使う」と決めたはずなのに、新しいセッションでは「JavaScriptでよろしいですか?」と聞いてくる。

ChatGPTのメモリ機能はこれを多少緩和するが、保存されるのは「〇〇が好き」レベルの浅い情報だけだ。会話の流れ、意思決定の過程、試行錯誤の記録——仕事で本当に必要な情報は保存されない。

壁3: 「知っている」と「覚えている」は根本的に違う

GPT-4oは数兆トークンのデータで訓練されている。Wikipediaも論文もStack Overflowも「知っている」。だが、あなたとの会話で生まれた情報は訓練データのどこにもない。あなたの名前、あなたの好み、先週あなたが怒った理由。これらは「知識」ではなく「記憶」であり、今のAIアーキテクチャには記憶を保持する仕組みが根本的に欠けている。

世界の開発者はこの問題にどう挑んでいるか

GitHubでは今、AIの記憶問題に取り組むオープンソースプロジェクトが急増している。主要なものを紹介する。

Mem0(GitHub ★25K+)——最もシンプルなアプローチ。会話から「事実」を自動抽出し、ベクトルデータベースに保存する。「ユーザーは猫を2匹飼っている」「前回のMTGでXを決定した」のように構造化して蓄積。検索はセマンティック(意味ベース)で、「ペットの話」と聞けば猫の情報が返ってくる。弱点は「事実の断片」しか保存しないこと。意思決定の文脈や関係性は落ちる。

Graphiti(by Zep, GitHub ★7K+)——知識グラフ方式。記憶を「点と線」のネットワークとして保存する。「KTさん」→「参加した」→「3月5日のMTG」→「決定した」→「Bプラン」。エンティティ(人物・概念・イベント)がエッジ(関係性)でつながる。人間の連想記憶に最も近い。FalkorDBやNeo4jなどのグラフデータベースを裏側で使う。

Cognee(GitHub ★3K+)——認知科学アプローチ。人間の脳を模倣して、短期記憶・長期記憶・作業記憶を区別する。会話の直近5分は短期記憶、重要な判断は長期記憶に昇格、今作業中のタスクは作業記憶に置く。理論的にはエレガントだが、実装の複雑さが課題。

Letta(旧MemGPT, GitHub ★15K+)——最も野心的。AIに「自分のメモリを自分で管理させる」。人間がノートを取るように、AIが会話中に「これは重要だ」と判断したら自発的にメモを書く。コンテキストが溢れそうになったら、自分で古い情報をアーカイブする。メタ認知的なアプローチ。

どれも一長一短だ。そして共通する問題がある——記憶の品質管理ができていない。ゴミ情報も重要情報も同じように蓄積され、時間とともにノイズが増えていく。

OpenStinger——記憶+自己認識+価値観の一貫性

この課題に対して、OpenStingerは3層構造で挑んでいる。

Tier 1: 記憶層。会話をすべてエピソードとして取り込み、FalkorDB(グラフDB)に保存する。検索はBM25(キーワード)とベクトル検索(意味)のハイブリッド。「3月5日のMTG」でも「あのときの判断」でも見つかる。ここまでは他のツールと似ている。

Tier 2: Vault(自己知識蒸留)。ここからが違う。蓄積された数千のエピソードから、LLMが自動的に「このAIは何者か」を抽出する。identity(自分は誰か)、constraint(何をしてはいけないか)、methodology(どう行動すべきか)の3カテゴリに分類し、「ナレッジノート」として構造化保存する。

これが何を意味するかというと——設定ファイル(SOUL.mdやAGENTS.md)がコンテキストから圧縮で消えても、AIが「自分の内側」から人格と行動規範を再構築できる。外部に依存しない自己認識。

Tier 3: Gradient(アライメント評価)。AIの応答が、蓄積された価値観からズレていないかをリアルタイムで採点する。observe_onlyモード(採点のみ・ブロックなし)で運用を始め、十分なデータが集まったら介入モードに移行する。人格の「ドリフト(漂流)」を検知し、修正する仕組みだ。

記憶だけでなく、自己認識と価値観の一貫性まで——これはMem0やGraphitiにはない設計思想だ。

なぜ「記憶」だけでは足りないのか

ここまで紹介したツールの多くは「記憶の保存と検索」に焦点を当てている。だが実際に運用してみると、それだけでは足りないことがわかる。

例えば、AIに「丁寧語で話せ」と設定する。最初は守る。だが会話が進み、コンテキストが圧縮され、設定ファイルが見えなくなると——いつの間にかカジュアルな口調に戻っている。「人格のドリフト(漂流)」だ。

記憶はある。だが「自分がどういう存在か」を忘れている。

もう一つの問題は、ゴミ記憶の蓄積だ。「今日の天気は?」「ありがとう」「やっぱり違うかも」——こういった意味のない発言もすべて記憶として保存される。数千件のエピソードの中から本当に重要な情報を見つけ出す精度が、時間とともに下がっていく。

OpenStingerのTier 2(Vault)は、この問題に対するひとつの答えだ。数千件のエピソードから重要なパターンを抽出し、ノイズを除去して構造化する。Tier 3(Gradient)は、AIの応答が蓄積された価値観からズレていないかを監視する。

「記憶する」→「自分を知る」→「自分を保つ」。この3段階が揃って初めて、AIは一貫したパートナーとして機能する。

次回:「静かな退行」の実話

Tier 3まで昇格して、27個のツールが稼働し、75件のナレッジノートが蓄積された。完璧だった——と思っていた。

4日後、全てが崩壊していた。しかも誰も気づかなかった

後編では、この「静かな退行」がなぜ起きたか。原因の特定、修正、そして二度と起こさないための対策を書く。AIの記憶問題は「作って終わり」ではない。維持することが本当の戦いだ。


後編: 最強の記憶システムが「静かに腐っていた」話——AIの記憶喪失を二度と起こさない方法

タグ: #AI #メモリ #OpenStinger #ChatGPT #エージェント


この記事は note.com から KTBLOG に移行されました。元記事: https://note.com/famous_prawn2009/n/nb6f6c2ba70d5