witcheerさんの記事日本語訳
witcheerさんの記事日本語訳
出典: note.com / 2026-03-28
AIエージェントと暮らす — 2ヶ月使い込んだ後のフルセットアップ
著者: witcheer (@witcheer)
朝7時に起きると、Telegramにブリーフィングが届いている。夜間の市場動向、arXivのAIエージェント関連論文、読む価値のあるHacker Newsスレッド、r/LocalLLaMAのReddit投稿、そして今日集中すべきことの優先順位付きリスト——自分の実際のプロジェクトと締め切りと照合済み。
アラームは設定していない。ブラウザも開いていない。Twitterもチェックしていない。
リビングに置いてあるMac Mini上のAIエージェントが、私が寝ている間にすべてやってくれた。昨日の7時から今朝7時までの間に18のスケジュールジョブを実行した。ウェブ検索、記事全文の取得、8つの異なるAPIに対するシェルスクリプトの実行、調査結果のメモリファイルへの書き込み、Telegramチャンネル用のコンテンツ下書き、それらの下書きを自分の文体ルールに照らしてスコアリング、そしてすべてを構造化コンテキストシステムにログ記録——明日のリサーチが今日より賢くなるように。
月額コスト合計:21ドル。
以下がその全内訳。すべてのコンポーネント、すべての設定、遭遇したすべてのバグ、見つけたすべての修正。同じようなものを構築したいなら、必要なものはすべてここにある。
話す内容:
ハードウェア
エージェントフレームワーク:Hermes Agent
モデルスタック
cronジョブ:自律リサーチパイプライン
シェルスクリプト:自動化レイヤー
カスタムスキル:オンデマンド機能
ALIVE:すべてを複利的に蓄積するコンテキストシステム
AIに自分の文体を教える:音声フィードバックループ
やり直すならこうする(2ヶ月の教訓)
これを再現する方法(最小構成&フルセットアップガイド)
哲学
ハードウェア
Mac Mini M4、RAM 16GB。2026年初めに購入。リビングに置いて24時間365日稼働し、すべてを動かしている:AIエージェントゲートウェイ、圧縮用のローカルLLM、たまにDockerコンテナ、そして18のcronジョブすべて。
ディスク使用量合計:エージェントフレームワークに約120MB+ローカルLLMモデルに6.6GB。
要するに:サンドイッチサイズの600ドルのコンピューター。これで自分のAIセットアップ全体が動いている。クラウドサーバーもGPUクラスターもない、月々のAWS請求もない。リビングに置いた箱一つ。
エージェントフレームワーク:Hermes Agent
Hermes Agentは@NousResearchによるオープンソースのPythonフレームワーク。すべての基盤。
インターフェースはTelegramボット。同僚にメッセージを送るように話しかける。ターミナルへのアクセス、ファイルの読み書き、ウェブ検索、ウェブページ全文取得、コード実行、シェルスクリプト実行、そして自分が書いたカスタムスキルが使える。
macOSのlaunchdサービスとして動作し、起動時に開始しクラッシュしたら再起動する。
Hermesが提供するもの:
フルツールアクセス付きTelegramボット(ターミナル、ファイル、ウェブ検索、ウェブ取得、コード実行)
cronスケジューラー — ジョブがスケジュールで実行され、結果がTelegramに配信される
スキルシステム — エージェントに新しい能力を教えるMarkdownファイル
メモリシステム — セッション間でエージェントが読み書きする永続ファイル
セッション管理 — 圧縮、アイドルタイムアウト、毎日のリセット
MCPサポート — ツールアクセスを拡張するためのModel Context Protocolサーバー
提供しないもの:
マルチモデルフォールバックチェーン(単一フォールバックのみ、両方のモデルが失敗したらジョブは失敗)
自動セッションクリーンアップ(手動スクリプトが必要)
良い文章(モデルの限界であり、フレームワークの限界ではない。詳細は後述)
要するに:Telegramに住んでいるAIアシスタントだと思えばいい。ただし、聞いたときに質問に答えるだけでなく、バックグラウンドでスケジュールタスクも実行し、会話の間も記憶を保持し、ツールを使える——24時間365日働き、眠らず、ターミナルにアクセスできるジュニア社員のようなもの。
モデルスタック
ここが面白くなる。1つのモデルではなく、3つ使っている。それぞれ異なる仕事を担当。
インタラクティブチャット:Z.AI経由のGLM-5
ボットに直接メッセージを送るとき、GLM-5を使用。智譜AI(Zhipu AI)の中国製モデルで、Z.AIのコーディングプラン月額21ドルでアクセス。
なぜGLM-5か?ツールコーリングが実際に機能する最安モデルだから。推論はしっかりしており、複雑な多段階指示に従い、リサーチパイプラインを確実に処理する。ただし、文章はひどい。すべての下書きがAIっぽく聞こえる。でも書く必要はない——リサーチ、実行、調整をしてほしいだけ。書くのは自分でやる。
推論トークンの罠: GLM-5は常に推論トークン(応答前の内部「思考」)を生成する。Hermesにはこれを制御するはずのreasoning_effort設定オプションがある。GLM-5には何の効果もない。モデルは関係なく思考する。
その推論トークンが会話履歴に保存される。新しいメッセージには以前のすべての推論が含まれる。だからコンテキストがすぐに埋まる。15〜20回のやり取りの後、エージェントは会話の初めからの数千の推論トークンを再処理するため、極端に遅くなる。
要するに:アシスタントに質問するたびに、答える前に一日の始めからの日記をすべて読み返すようなもの。
Cronジョブ:Z.AI経由のGLM-4.7
18の自動ジョブはすべてGLM-4.7で実行。同じプロバイダー、より安いモデル。Z.AIにはレート制限があるため、これが重要:コーディングプランで5時間あたり600プロンプト。cronジョブがGLM-5を使うと、インタラクティブ用の枠を食い潰してしまう。
圧縮:ローカルOllama経由のQwen3.5
ここが最も時間がかかり、最も多くを学んだ部分。
すべてのAIモデルにはコンテキストウィンドウ(一度に「見える」テキスト量)がある。会話が長くなるとコンテキストが埋まる。圧縮は古いメッセージを要約してスペースを空ける。
元々、圧縮は他のすべてと同じクラウドAPI(Z.AI)を使っていた。これが死のスパイラルを生んだ:
cronジョブ実行 → メッセージ生成 → コンテキスト増大 → 閾値到達 → 圧縮トリガー → Z.AI呼び出し → API枠消費 → さらにcronジョブ → さらに圧縮 → さらに枠消費 → レート制限到達 → 圧縮がサイレントに失敗 → コンテキストが際限なく増大 → エージェントが膨張したセッション処理に10分以上ハング
数日間気づかなかった。エージェントがただ…遅かった。ネットワーク遅延だと思っていた。
修正: Ollamaを使ってローカルモデルで圧縮を実行。完全に無料。レート制限なし。API依存なし。
Mac MiniにOllamaをインストールし、qwen3.5:4b(M4チップで約20トークン/秒で動作する3.4GBモデル)をプルし、圧縮をlocalhostに向けた。以上。
アイドルタイムアウトの発見: 圧縮を修正した後も、ピーク時にエージェントがまだ遅かった。デフォルトのセッションアイドルタイムアウトが1440分(24時間)だと判明。つまりセッションが日中にリセットされない。朝7時のモーニングブリーフィングからすべてのcronジョブを経て翌朝まで肥大し続ける。
60分に変更。ジョブ間でセッションがリセットされるようになった。重負荷時の応答時間が10分以上から5秒未満に。
要するに:一日中デスクに書類が積み重なっても片付けないようなもの。夕方には何も見つからず、古いメモの山をかき分けるからすべてのタスクに10倍時間がかかる。アイドルタイムアウトはデスクを片付ける頻度。24時間は一度も片付けない。60分は1時間ごとに片付ける。同じ仕事が100倍速く終わる。
動作する設定: 圧縮閾値0.50はコンテキストが半分埋まったときにトリガーされることを意味する。Ollamaのkeep-alive 5分は5分間のアイドル後にモデルが自動的にRAMからアンロードされ、他のタスク用にメモリを解放する。
18のCronジョブ:自律リサーチパイプライン
これがシステムの核心。一日を通して実行される18のスケジュールジョブが、リサーチ、モニタリング、下書き、インフラ保守を行う。
すべてのジョブはGLM-4.7で実行。すべてのジョブが結果をTelegramに配信。すべてのジョブが構造化コンテキストシステム(後述)から読み書きする。
毎日のスケジュール
07:00 — モーニングブリーフィング。天気、暗号資産価格、ステーブルコインのペグ、RWAセクターの動き、夜間リサーチの要約、Hacker NewsとRedditのトップスレッド。すべてのプロジェクトコンテキストファイルを読んで今日重要なことを浮かび上がらせる。
07:30 — 競合ダッシュボード。11以上のCDPおよびステーブルコインプロトコルを追跡、TVL変動、ガバナンス提案、パートナーシップ発表。DeFi分野で働いているので、競合他社が公式発表する前に動きを知ることが仕事。
09:00 & 17:00 — Duneモニター。オンチェーンクエリモニタリング。1日2回。
10:00 — Grimoire下書き作成。Telegramチャンネル用の投稿をビジュアルファースト形式で下書き。
11:00 — デイリーナッジ。これは特別。すべてのベンチャーのプロジェクトコンテキストファイルを全部読み、エージェント自体、コンテンツ戦略も含め、緊急度、締め切り、プロジェクト間の緊張関係に基づいてどこに集中すべきか提案する。優先順位エンジン。
12:00 — 下書きレビュー。未投稿の最良の下書きを選び、文体ルールと照合し、レビュー用にTelegramに配信。
14:00 — AI研究。AIニュース、論文、エージェントフレームワーク。ソース:arXiv、Reddit、Hacker News、Techmeme、ニュースサイト。
16:00 — Arcana研究。非公開。
18:00 — DeFi研究。ステーブルコイン、RWA、ガバナンス、競合分析。
20:00 — 深堀り研究。その日の発見から1つのトピックを選んで深堀り。ウェブ取得、データ収集、構造化レポートによる完全な分析。
21:00 — ヘルスチェック。すべてのcron、ゲートウェイステータス、ディスク容量、launchdサービスを監視。
22:00 — コンテンツパフォーマンス。どのコンテンツがよく機能したかを追跡、メトリクスを記録。
23:00 — ナイトリービルダー。これが一番すごい。リサーチ中に特定されたギャップ(不足スクリプト、壊れたデータソース、必要なツール)を見て、自律的にコードを書いて埋める。モニタリングスクリプトを構築し、壊れたパーサーを修正し、新しいデータパイプラインを作成した。私が寝ている間に。
定期スケジュール
月/木 09:00 — アウトリーチCRM。BD(事業開発)ワークフローの一部を自動化。
月 09:00 — ウィークリーインテル。競合情報ブリーフ。
日/水 20:00 — ラーニングダイジェスト。週のキュレートされた学習リソース。
日 08:00 — ウィークリープランナー。パフォーマンスデータ、リサーチ結果、プロジェクト状態を読む → 週のコンテンツと優先順位計画を作成。
毎時
9時〜20時の毎時 — ブレイキングニュース。RSSフィード+TVLモニタリング+ステーブルコインペグアラート+バイラルツイート検出。何かが動いたら1時間以内に知る。
リサーチcronの仕組み
research-aiジョブを分解する。プロンプトは約3,000語。実際の手順:
ステップ1 — ソース検証ルール。まず「実際に訪問したURLなしに発見を含めるな」というルールを徹底。検索して結果がなければそう言え。発見を含める前に自問:このURLを実際に訪問したか? GLM-4.7はURLをハルシネーションする。頻繁ではないが十分に。この指示でハルシネーションされたソースがほぼゼロに。
ステップ2 — コンテキスト読み込み。7つのファイルを読む:永続メモリ、運用ログ、リサーチ優先順位、コンテンツ文体ガイド、過去の下書きからの文体修正、AIリサーチアーカイブ、関連プロジェクトコンテキストファイル。
ステップ3 — メールチェック。Himalaya(CLIメールクライアント)でボットアラートの受信箱をチェック。
ステップ4 — arXivスキャン。arXiv APIでAIエージェント、LLM推論、ツール使用に関する最新論文をクエリするカスタムPythonスクリプトを実行。
ステップ5 — ナイトリービルダーチェック。夜間の自律ビルダーが新しいツールを作ったか確認。
ステップ6 — ウェブ検索。多様なソースが必須。プロンプトは明示的に「まずTechmeme、次にHacker News、次にReddit、それからウェブ検索でギャップを埋める」と指定。 このソース多様性ルールがあるのは、GLM-4.7はデフォルトですべてにRedditを使うから。明示的なルールなしで数日間、毎朝のブリーフィングがRedditだけだった。
ステップ7 — 深読み。最も興味深い2〜3記事を全文ウェブ取得。
ステップ8 — 発見の書き込み。必須。「書き込みのないセッションは失敗」。発見をAIリサーチアーカイブファイルに書き込む。明日のセッションがより豊かな知識ベースから始まる。
ステップ9 — 下書き。コンテンツに値するものがあれば、個人体験形式で下書き。まず文体修正を読む。
ステップ10 — 品質チェック。check_draft.shを実行。文体ルールに対して70/100以上のスコアが必要。
ステップ11 — 運用ログ。何が起きたかの1行サマリー。
ステップ12 — コンテキスト更新。セッション結果でプロジェクトコンテキストファイルを更新。
ステップ13 — 自己チェック。「リサーチアーカイブに新しいコンテンツを書いたか? NOなら、ステップ8に戻れ。」
要するに:各リサーチジョブは、15項目のチェックリストを持った従業員をリサーチミッションに送り出すようなもの。優先順位を読み込め。受信箱をチェックしろ。学術論文をスキャンしろ。ニュースを読め。実際にクリックして記事全文を読め、見出しだけ流し読みするな。見つけたことを書き留めろ。面白ければ何か下書きしろ。下書きがゴミみたいでないか確認しろ。やったことをログに記録しろ。学んだことをチームに報告しろ。何も書き留めなかったら、戻ってやれ。
35のシェルスクリプト:自動化レイヤー
すべてのスクリプトは~/.hermes/scripts/にあり、chmod 700、~/scripts/にシンボリックリンクされてエージェントが簡単に呼び出せる。
これらがシステムの筋肉。エージェントは脳。スクリプトはエージェントが世界と対話する方法。
データソーススクリプト
coingecko.sh — BTC/ETH/AAVE/MKR価格、24時間変動、ステーブルコインペグデータ。APIキー不要。
defillama.sh — CDPプロトコルTVLランキング、ステーブルコイン時価総額。APIキー不要。
rwa-tracker.sh — 完全なRWAセクタースキャン。120以上のプロトコル、250億ドル以上のTVL。トップムーバーを追跡。APIキー不要。
hackernews.sh — キーワード(AI、DeFi、エージェント、LLM)でフィルタリングされたHacker Newsトップストーリー。Firebase API使用。キー不要。
reddit-digest.sh — r/LocalLLaMA、r/MachineLearning、r/defiのトップ投稿。Redditの公開JSONエンドポイント使用。キー不要。
governance-tracker.sh — 関心のあるプロトコル(Morpho、Curve、Lido)のSnapshot.orgのアクティブガバナンス投票。フォーラムRSSフィードも。
arxiv-digest.py — エージェント、推論、ツール使用に関する最新論文をarXiv APIでクエリ。フィルタリングしてフォーマット。
fred.sh — 連邦準備制度経済データ。金利、インフレ、マネーサプライ。無料APIキー。
モニタリングスクリプト
tvl-monitor.sh — TVLスナップショットをキャッシュし、追跡プロトコルが前回チェックから10%以上変動したらアラート。
stablecoin-supply-monitor.sh — 1億ドル以上のUSDT/USDC/DAIミントまたはバーンを検出。大規模な供給変動は市場の動きを示す。
breaking-news.sh — すべてのモニター+RSSフィード+バイラルツイート検出を1つのアラートシステムに統合。
health-check.sh — cronジョブ実行、launchdサービス、ゲートウェイステータス、ディスク容量、PAT有効期限を監視。
コンテンツパイプラインスクリプト
check_draft.sh — 文体ルールに対して下書きを0-100でスコアリング。すべての下書きで自動実行。70未満はフラグ。
draft-review.sh — 毎日最良の未投稿下書きを選び、フォーマットの問題をフラグ。
mark_posted.sh — 下書きを投稿済みアーカイブに移動、コンテンツカレンダーにログ。
log-performance.sh — 投稿メトリクスを記録:インプレッション、エンゲージメント、ブックマーク。
インフラスクリプト
update-walnut.sh — 77行のbash。関連プロジェクトコンテキストファイルにタイムスタンプ付きログエントリを先頭に追加。すべてのリサーチcronの最後に呼ばれる。cronジョブとコンテキストシステムの接着剤。
compact_memory.sh — 3日以上のセッションログをアーカイブ、運用ログを7日分にトリミング。際限ない肥大を防止。
github-push-nightly.sh — 用心スクリプト。Gitにプッシュする前に漏洩シークレット(APIキー、トークン、パスワード)をスキャンする13の正規表現パターンを実行。3層のチェック。
auto-update.sh — 毎日のHermesフレームワーク更新トリガー。
docker-cleanup.sh — 4時間以上のゾンビサンドボックスコンテナを削除。
要するに:スクリプトはツールボックスのようなもの。AIエージェントはハンマー、ドライバー、レンチの使い方を知っているが、実物のツールを渡す必要がある。各スクリプトはエージェントを特定のデータソースや機能に接続するツール。なければウェブ検索しかできない。あれば、DeFiプロトコルのクエリ、学術論文のスキャン、オンチェーン活動のモニタリング、自己ヘルスチェック、GitHubへのコードプッシュができる。
どれも複雑ではない。ほとんどが50行未満。価値は35個がスケジュールシステム内で連携して動くところにある。
6つのカスタムスキル:オンデマンド機能
Hermesのスキルはマークダウンファイル。エージェントに何をいつどのようにしてほしいかを説明するマークダウンドキュメントを書き、呼び出し時にエージェントがそれを読む。
SKILL.mdファイルが指示セット。
- walnuts — クロスプロジェクトコンテキスト
Telegramでwalnutsとタイプ → エージェントが5つのプロジェクトコンテキストファイルをすべて読む → 優先順位、ブロッカー、緊張関係を含むクロスベンチャービューを合成。戦略的ダッシュボード。Telegramで1語、10秒、全プロジェクトの状況把握。
- grimoire — Telegramチャンネル下書き
Telegramチャンネル@witcheergriimoireの投稿をビジュアルファースト形式(1〜4文+画像)で下書き。GLM-5が約5%の確率でURLをハルシネーションするため、URL検証ルール付き。
- yari-intel — 競合情報
オンデマンド市場分析:CDP TVLランキング、競合深堀り、RWA機会マッピング、ガバナンス追跡。DeFi Llamaデータ+シェルスクリプト+ウェブ検索を組み合わせ。
- arcana-intel — コンサルティング市場調査
非公開。
- alpha-scanner — クロスソースシグナル検出
Polymarketオッズ、ステーブルコインフロー、RWAモメンタム、ソーシャルシグナル(Reddit+Thread Reader)、ガバナンスアルファを組み合わせ。
- voice-learn — 下書きフィードバックループ
AI下書きを投稿前に編集すると、このスキルが何を変えたか、なぜ変えたかを抽出し、教訓を保存。以降のすべての下書きは書く前にそれらの教訓を読む。詳細は後述。
要するに:スキルはAIのためのSOP(標準作業手順書)。「Xと言ったらこの特定の方法でYをしろ」というドキュメントを書く。AIは実行時にドキュメントを読んで従う。マークダウンファイルを書けばエージェントに新しい能力がつく。
反復速度が美しい。新しいスキルの作成に10分。テストはTelegramメッセージ1つ。改良はテキストファイルの編集。プラグインの構築、サービスのデプロイ、APIの接続と比べてみてほしい。
ALIVE:すべてを複利的に蓄積するコンテキストシステム
ほとんどの人が見たことがない部分で、最大の違いを生む部分。
@stackwalnutsが作成したALIVEは構造化コンテキストシステム。ディスク上のパーソナルナレッジグラフと考えればいい。基本単位は「walnut」——1つのプロジェクトまたはドメインのコンテキストコンテナ。
構造
各walnutには5つのファイルを含む_core/フォルダがある:
key.md — アイデンティティ、テーゼ、他のwalnutとの関連
now.md — 現在のフェーズ、次のアクション、ブロッカー
tasks.md — 緊急/アクティブ/バックログ
insights.md — 蓄積された知識、学んだ教訓
log.md — セッション履歴(先頭追加のみ、最新が先頭)
3つの統合レイヤー
レイヤー1:cronジョブがwalnutに書き込む。 すべてのリサーチcronの最後に、update-walnut.shスクリプトが関連walnutにログエントリを先頭追加。research-aiはoz-agent walnutに、research-defiはyari-finance walnutに、research-arcanaはarcana walnutにログ。各walnutがリサーチ、発見、学びの履歴を自動的に蓄積。
レイヤー2:cronジョブがwalnutから読む。 リサーチ前に各cronが関連walnutのタスクとインサイトを読む。リサーチが実際に取り組んでいることに合致する。 research-aiがoz-agentのタスク(「下書き品質を改善」)を読む → プロンプトエンジニアリング手法を特定検索。research-defiがyari-financeのタスク(「RWAパートナーシップ機会をマッピング」)を読む → RWAプロトコルニュースを特定検索。モーニングブリーフィングがすべてのwalnutのnow.mdを読む → 全プロジェクトで今日重要なことを浮かび上がらせる。
レイヤー3:インタラクティブTelegramがwalnutコンテキストを取得。 walnutsとタイプすると、エージェントが5つのwalnutファイルをすべて読み、合成されたクロスベンチャービューを返す。コンテキストはアイドルタイムアウトまでセッションに残る。
複利効果
walnutタスクを更新(手動またはTelegram経由)
cronジョブがタスクを読む → リサーチが優先順位に合致
リサーチが発見を生む → 発見がwalnutログを更新
発見に基づいてタスクを調整
次のcronが調整された優先順位を取得
リサーチがより焦点化
発見がより関連性を増す
繰り返し
各cronが自分が何を達成しようとしているか知っている。検索前に優先順位を読む。検索後に見つけたことを書く。次のセッションがよりスマートに始まる。
Claude CodeとHermes Agentの両方が同じファイルをネイティブに読み書きする。同じコンテキストレイヤー。
要するに:5冊のノートがあると想像してほしい。プロジェクトごとに1冊。リサーチ前に関連ノートを読み返して何に取り組んでいて何が必要か思い出す。リサーチ後に見つけたことを書く。翌日また読み返すと、昨日のメモの上に積み重なるからリサーチがより良くなる。 ALIVEはそれと同じ。ただしAIエージェントが読み返しとメモ取りを自動で行い、ノートはインタラクティブエージェントと自動cronジョブの両方が使える形に構造化されている。
AIに自分の文体を教える:音声フィードバックループ
最もワクワクしている手法であり、コストゼロドル。
問題
標準的アプローチ:より良いプロンプトを書く。ルール、例、制約を追加。「個人体験形式で書け」「小文字を使え」「箇条書きなし」「文の長さを変えろ」
39,000文字のコンテンツ文体指示がある。モデルはまだスロップ(低品質テキスト)を出す。ルールを増やしても出力は良くならない。一定点を超えると、モデルはより多くの抽象的指示を統合できない。
修正:修正ログ
AIにどう書くか教える代わりに、何を変えたか見せる。
投稿ごとのサイクル:
Telegramで「下書きを修正した」と伝える
voice-learnスキルが起動
オリジナル下書きと投稿版を読む
すべての違いを抽出:トーンの変化、カット、追加、語句の入れ替え
各教訓をvoice-corrections.mdに保存
以降のすべてのドラフティングcronが書く前にvoice-corrections.mdを読む
なぜ修正がプロンプトに勝るか
プロンプトは「個人体験形式で書け」と言う。 修正は「お前は’これがUST 2.0だと言っているわけではない’と書いた——私はそれを削除した。なぜなら先制的なヘッジは専門性を損なうから。二度とやるな」と言う。
151行の「お前がXをしたとき、私はそれをYに変えた、なぜならZ」。
151の具体例。具体は抽象に常に勝つ。モデルはまだAIスロップを出すが、より良いAIスロップ。修正は複利的に蓄積する。フィードバックループを通過するすべての下書きがより多くの例を追加する。
モデルは人間のようには書けない。しかし、151の特定の避けるべきことを知った、少しだけ良いAIのように書ける。人間が最終パスをするなら、それで十分。
要するに:誰かに「こう書け」という本を渡す代わりに、書くたびに横に座り、特定の文を指して「これはやるな、こうしろ」と言う。28回の修正後、自分でミスを避け始める。完璧ではないが、編集時間が80%書き直しから50%程度に減る。
やり直すならこうする(2ヶ月の教訓)
初日からローカル圧縮で始める。 クラウドAPI圧縮とレート制限はサイレント障害を引き起こす。セッションが際限なく肥大し、応答に10分かかるまで気づかない。ローカルOllama圧縮は無料、信頼性が高く、レート制限ゼロ。
ジョブごとのモデル設定を即座に行う。 スケジューラーコードをパッチするな。更新のたびに消える。jobs.jsonの各ジョブ設定に”model”: “glm-4.7”を設定。更新に耐え、パッチに耐え、再適用不要。
AIに書かせることを期待するな。 リサーチパイプラインを素早く構築。音声フィードバックループを初日に構築。何週間もすべての下書きの50〜80%を書き直すことを受け入れる。修正は蓄積するが、ゆっくり。使える下書きを期待する前に50以上の修正エントリを貯めろ。
セッションアイドルタイムアウトを60分に設定。 デフォルトはもっと長いことが多い。長いセッション=膨張コンテキスト=遅い応答。短いセッション=新鮮なコンテキスト=高速応答。リサーチはセッション間でファイルに保存される。
プロンプトでソース多様性を強制。 明示的に強制しないと、モデルはすべてにRedditを使う。Reddit検索結果が上位に来るから。明示的ルール:「まずTechmemeを取得、次にHacker News、次にReddit、それからウェブ検索でギャップを埋めろ。」順序を指定する。
圧縮パイプラインを監視。 サイレントに失敗する。エージェントが突然応答に10分かかり、8メッセージのコンテキストダンプを送ってきたら、圧縮がおそらく壊れている。モデル、エンドポイント、マニフェストをチェック。ollama pullでクリーンダウンロードを強制。
これを再現する方法
最小構成(30分)
ステップ1: Hermes Agentをインストール。
ステップ2: Z.AIコーディングプラン取得(月21ドル)。.envに設定。重要:/coding/paas/v4エンドポイントを使うこと。/paas/v4ではない。コーディングプランのキーはコーディングエンドポイントでのみ動作。
ステップ3: @BotFatherでTelegramボットを作成。トークンを設定。
ステップ4: ゲートウェイを起動。
ステップ5: 2〜3のcronジョブを作成。モーニングブリーフィング、1つのリサーチセッション、ブレイキングニュースモニターから始める。jobs.jsonを編集し、各ジョブに”model”: “glm-4.7”を設定。
これで、Telegram経由でアクセスでき、自動リサーチジョブ付きの24時間365日AIエージェントがマシン上で動く。
フルセットアップ(週末1回分)
上記すべてに加え:
ステップ6: Ollama+圧縮モデルをインストール。.envとconfig.yamlで設定。セッションアイドルタイムアウトを60分、圧縮閾値を0.50、Ollama keep-aliveを5分に設定。
ステップ7: データソース用のシェルスクリプトを5〜10個作成。自分の仕事に関連するAPIを選ぶ。ほとんどの公開API(CoinGecko、DeFi Llama、Hacker News、Reddit、arXiv)はAPIキー不要。
ステップ8: カスタムスキルを2〜3個作成。クロスプロジェクトコンテキストスキル(walnuts)と自分のドメイン用のコンテンツドラフティングスキルから始める。
ステップ9: 3〜5個のwalnutでALIVEをセットアップ。フォルダ構造を作成、各プロジェクトのkey.mdとnow.mdを書く。update-walnut.shでcronジョブがwalnutの読み書きをするよう配線。
ステップ10: 初日から音声フィードバックループを開始。voice-corrections.mdを作成。下書きを編集するたびに何を変えたか、なぜ変えたかをログ。ドラフティングcronが書く前に修正を読むよう配線。
必要なもの
Mac Mini、古いノートPC、または常時稼働マシン(Linuxでも可——HermesはMac専用ではない)
Z.AIに月21ドル(またはOpenAI互換プロバイダーの自前APIキー)
Telegramアカウント
AI生成コンテンツへの忍耐(最初はひどい——それが普通)
必要ないもの
基本的なシェルスクリプト以上のコーディング経験
誰の許可も
哲学
これは完璧なAIエージェントを作ることではない。
GLM-5はスロップを出す。リサーチはURLをハルシネーションすることがある。cronジョブは失敗する。圧縮はサイレントに壊れる。モデルは人間のようには書けないし、おそらく書けるようにはならない。
しかし、24時間365日動く。私が寝ている間に、arXiv論文をスキャンし、ステーブルコインペグを監視し、RedditとHacker Newsをチェックし、競合TVLを追跡し、朝に私が編集する下書きを書く。起きるとTelegramに夜間の動向のブリーフィングとレビュー待ちの下書きキューがある。
エージェントは永続的。
そして永続性 × 時間 = 複利的コンテキスト。
何週間もの稼働後、メモリファイルがパターンを捉えている。walnutログに履歴がある。文体修正が蓄積している。各新セッションが前回よりも豊かな基盤から始まる。リサーチは検索前に優先順位を読むからより焦点化する。下書きは書く前に修正を読むから少しだけ良くなる。優先順位はモーニングブリーフィングが昨日実際に何が起きたかを読むからより鋭くなる。
魔法はない。すべてはその周りに蓄積する構造化コンテキストの中にある。
walnut、修正ログ、リサーチアーカイブ。AIはエンジン。コンテキストは燃料。
そして燃料は複利的に蓄積する。
構築者:@witcheer
この記事は note.com から KTBLOG に移行されました。元記事: https://note.com/famous_prawn2009/n/n4f0f6664a871