理論はいかに進化したか

このドキュメントは、適応システムにおける帰属崩壊の理論が、Claude・Codex・ChatGPT・Gemini・Perplexityによる複数回のピアレビューを経て、どのように構築・破綻・再構築・精緻化されていったかを追ったものである。

各ステージの圧力が何を取り除き、何が残ったかを正直に記録したログである。

フェーズ 0 原版 — 全面削除

観察者／自己性／意識の理論

原文書（操作的埋め込みエージェンシー理論）は、観察者定義・F余代数的自己性不動点・フォン・ノイマン代数を介したAQFT存在論・IITとの接続を中心に据えていた。

観察者（操作的定義）自己／自己性（F余代数的）意識／クオリア AQFT存在論 IIT接続高PE逆説（初期版）

削除理由

これらの概念は標準的な工学・ML的な意味でのピアレビューになじまず、MOATベンチマーク枠組みの中では反証不可能である。複数AIによるレビューにより、工学的障害モードの記述に現象論的枠組みは不要であることが確認された。削除によって残った核心はより曖昧さが減り、より精確になった。

フェーズ 1 theory.html — 工学的障害定式化

外部残差識別不可能性としての帰属崩壊

観察者／意識の枠組みを取り除いた後に残った核心はこうだ：部分観測可能性下の適応システムは、自らの修正済み方策を通じて、将来の残差の統計的構造を歪め、自身の将来の識別可能性を再帰的に破壊し得る。

theory.html — 主張の要約

誤った潜在チャネルへの更新が方策を歪める。歪んだ方策が将来の軌跡証拠を汚染する。そして軌跡レベルの識別可能性が再帰的に劣化する（再帰的帰属汚染）。

PE ⊥ 帰属分離可能性指向性崩壊メトリクス MOAT v5g設計汚染ヤコビアン（スケッチ）隠れ交絡因子分析高PE逆説（正式撤回）強い「再帰的帰属汚染」実証的主張

ベンチマークコード（moat_v5g.py）はこれを検証するために書かれた。コードレビューにより構造的ギャップが特定された：wrong_strengthがエージェントによって生成されるのではなく、外部から注入されていた。ステージ1は幾何学的検証であり、閉ループの実証ではなかった。

最初の実験

ステージ 1 外部幾何学的検証

ステージ1：指向性枯渇 → AUC崩壊

外部から与えた wrong_strength が PE と総エネルギーを固定したまま DE_B を低下させる。AUC_residual は 0.60 未満に崩壊する。

✓指向性枯渇単体で、PEやエネルギーとは独立に、残差軌跡の識別可能性を破壊するのに十分である。

×閉ループを実証しない。枯渇は外部から供給されている。

ステージ1：幾何学的検証（用語確立）ステージ2：内因性ループ — 未解明

Codex / ChatGPT：「wrong_strength を排除せよ」

ステージ 2a 内因性指向性枯渇

ステージ2a：SRAAgentが外部注入なしで枯渇を生成する

wrong_strength を除去。SRAAgentはBチャネルのみにLS更新を使用し、Qバーストモデルは用いない。

✓DE_B H_B = 0.826 DE_B H_Q = 0.406 コントラスト 0.420

✓PE（H_Q）= 0.300 ≥ 閾値。エネルギー = 2.000。崩壊は指向性によるものであり、エネルギー的なものではない。

?AUC_residual 後期 = 0.761。崩壊していない。なぜ高いのか？

ステージ2a 合格：内因性指向性枯渇 AUCの謎：なぜ 0.761？

ステージ2b：エージェント内部を覗く

ステージ 2b 帰属角 — 一次内部証拠

ステージ2b：エージェントは誤った方向を向いている

エピソード終了時における B_est − I の優勢方向を v_B および v_Q と比較する。

✓H_B 正解率 0.983。v_Bへの平均角度：6.9°。エージェントはBドリフトを正しく学習している。

✓H_Q 誤差率 0.888。v_Qへの平均角度：15.3°。88.8%のエピソードで、エージェントの推定ドリフト方向はQバースト方向に近い。

ステージ2b 合格：エージェント内部の誤帰属新中核概念：外部識別可能性 ≠ 内部識別可能性 AUCはまだ 0.761。なぜ？

浮かび上がった認識

高いAUCは内部誤帰属に反する証拠ではないかもしれない。それは、2つの異なる適応エージェントを比較することで外部観察者が恩恵を受けるという証拠である可能性がある――エージェント自身が決して行わない比較だ。

ステージ2c：謎を解く

ステージ 2c 方策マッチドリプレイ

ステージ2c：高いAUCは最初から方策幾何学だった

H_Q SRAAgentの行動シーケンスを両環境にリプレイ。残差には全体を通じて中立な B̂ = I を使用。

✓SRA適応型AUC：0.762 → リプレイAUC：0.553。低下量：0.209。

✓行動のみAUC：0.550 ≈ 偶然。分類器は行動ラベルを読んでいなかった。

ステージ2c 合格：AUCソース分解高AUC ＝方策誘発の軌跡幾何学であり、環境識別可能性ではない

AUCの謎への答え

H_Bエージェントは v_B 方向に適応した。H_Qエージェントは v_Q 方向に適応した。それぞれ異なる行動方向が異なる残差構造を生み出し、外部分類器が読み取れるようになった。しかしH_Qエージェントは内部では誤った方向を向いていた。2つの誤帰属エージェントの法科学的痕跡は識別可能である。エージェント自身は正しく診断していない。

ステージ2d：幾何学の確認

ステージ 2d 多方向リプレイ表

ステージ2d：AUCは行動方向の関数である

6種類の行動ソースを両環境にリプレイした。

行動ソース	AUC	備考
v_B 方策 / v_B-オラクル	0.640–0.650	B識別方向
H_B エージェント行動	0.639	v_B整合（正しい適応）
v_Q 方策	0.598	バースト方向
H_Q エージェント行動	0.537	v_Q整合（誤帰属）
等方プローブ	0.518	指向性バイアスなし

✓v_B > v_Q を確認。H_B 行動 > H_Q 行動を確認。

×v_Q < 等方は確認されなかった（0.598 > 0.518）。基準を修正：v_QはQバースト分散を励起し、AUCを等方より高める。主張は v_B > v_Q であり、v_Q < 等方ではない。

×「識別オラクル」ラベルを削除：実装はv_B方策と等価であり、独立に最適化されていなかった。v_B-オラクルに改名。

ステージ2d 合格：指向性AUC表誤った基準 v_Q < 等方「識別オラクル」ラベル → v_B-オラクル（≡ v_B）

理論の改訂

現在 theory2.html — 改訂論文

実験が理論に変えたもの

旧中心的主張（theory.html）

誤帰属が外部残差の識別不可能性を引き起こす。方策が将来の軌跡証拠を汚染し、軌跡レベルの識別可能性が再帰的に劣化する。

新中心的主張（theory2.html）

外部証拠は分類可能なまま残るが、適応エージェントはそれを誤った構造更新チャネルにマッピングする。見かけ上の残差分離可能性は方策誘発の軌跡幾何学によって構築される。外部分類器の識別可能性とエージェント内部の帰属正確性は独立である。

主張	ステータス	根拠
PE ⊥ 帰属分離可能性	✓ 支持可能	形式的；保存
内因性 DE_B 枯渇	✓ ステージ2a	wrong_strengthなしのSRAAgent
内部誤帰属（88.8% H_Q）	✓ ステージ2b	帰属角
リプレイ下のAUC低下（0.209）	✓ ステージ2c	方策マッチドリプレイ
AUCは行動方向の関数	✓ ステージ2d	多方向表
適応ループでの残差AUC崩壊	? ステージ2e 未解	未実施
SRAとABHTの差別化	未達成	障害モードベンチマーク
高PE逆説	撤回	形式的根拠なし

PE ⊥ 帰属分離可能性指向性崩壊メトリクス MOAT v5gアーキテクチャ既知の限界としての隠れ交絡因子内的帰属崩壊（改訂定義） D_ext ≠ AC（外部 ≠ 内部）帰属角診断法方策マッチドリプレイ手法指向性AUC表再帰的帰属汚染（実証的主張として）高PE逆説外部残差識別不可能性の主張

未解決問題

ステージ 2e 未着手

ステージ2e：同じループで外部AUCも崩壊させられるか？

リプレイAUC = 0.553はステージ1の崩壊閾値（0.60）に近い。惜しいが、確認には至っていない。

ステージ2eが成功すれば：再帰的汚染の完全な主張が閉じる。ステージ2eが失敗しても：再定式化は維持され、否定的結果はABHT系方策がこの幾何学をカバーしていることを確認する――いずれにせよ価値あるベンチマーク知見となる。

ステージ2e：未着手 — どちらの結果も有効

理論の現在地

取り除けるものをすべて取り除いた後に残った理論はこれだ：

適応システムは、内部の帰属マップが系統的に誤っている状態でも、外部観察者が分類できる残差軌跡を生成し得る。外部分類器の成功は方策の乖離が生んだ法科学的痕跡であり、いかなるエージェントが原因を正しく帰属させたことを示すものではない。外部証拠の質と内部帰属の忠実性の間の解離は、測定可能で再現可能であり、PE条件や標準的な閉ループ同定理論では対処されない。

これは元の主張より小さい。しかし、より精確に真である。

帰属崩壊が内的帰属崩壊になるまで