theory.html · 改訂論文 · ステージ1〜2dの結果を反映

内的帰属崩壊：
適応システムにおける
方策幾何学依存の証拠と
構造的誤帰属

theory.htmlにおける崩壊定義を更新した改訂実証論文。中核命題（PE ⊥ 帰属分離可能性）は保持し、外部残差識別不可能性の主張を撤回・置換する。

複数AIピアレビューリレー：Claude · Codex · ChatGPT · Gemini · Perplexity
依拠：theory.html · 実験チェーンステージ1〜2d
状態：ドラフト · ステージ2e 未解 · ベースライン実験未実施

01 / 概要

§1 · アブストラクト

本論文では内的帰属崩壊を定義し、実証的に検討する。これは、非定常な部分観測可能性下の適応システムが、残差を誤った潜在チャネルに構造的に誤帰属させ、識別方向を避ける方策を生成し、見かけ上の残差証拠を方策幾何学依存にしてしまう障害モードである。中心的な知見は次の解離である：

中心的知見

外部分類器の識別可能性とエージェント内部の帰属正確性は独立である。システムは、内部信念構造が真の構造的原因について系統的に誤っている状態でも、外部から分類可能な残差軌跡を生成できる。

theory.htmlの元の主張——誤帰属が外部軌跡レベルの識別可能性を再帰的に劣化させる——は実験では確認されなかった。確認されたことは、別の意味でより強力だ：見かけ上の残差分離可能性は方策誘発の軌跡幾何学によって構築されており、一方でエージェントの内部帰属マップは誤った構造方向を指し示している。

本論文ではMOAT v5gをこの障害モードのストレステストベンチマークとして提示し、指向性崩壊をその操作的シグネチャとして形式化する。また、実験的に支持された誤帰属連鎖（誤った更新 → 内因性指向性枯渇 → 方策幾何学依存の証拠 → 内部帰属失敗）を示す構成的最小エージェント（SRAAgent）を提供する。

§2 · theory.htmlからの変更点

theory.htmlは帰属崩壊を、再帰的汚染による外部残差識別不可能性の生成として定式化していた：

撤回された主張（theory.htmlアブストラクト）

誤った潜在チャネルへの更新が方策を歪める。歪んだ方策が将来の軌跡証拠を汚染する。そして軌跡レベルの識別可能性が再帰的に劣化する（再帰的帰属汚染）。

実験は、適応残差AUCが崩壊しないことを示している——高いまま（0.762）だ。実験チェーンが明らかにしたのは、その高いAUCの分解である：

ステージ2c：方策マッチドリプレイでAUCが 0.762 → 0.553 に低下。高いAUCは方策幾何学依存だった。
ステージ2b：帰属角：H_Qエピソードの88.8%で $\angle(\hat{v}, v_Q) < \angle(\hat{v}, v_B)$。エージェントは内部で誤帰属している。
ステージ2d：指向性AUC表：AUCは行動方向の関数（$v_B$整合 > $v_Q$整合）。

帰属崩壊の改訂定義：

改訂定義

外部証拠は分類可能なまま残るが、適応エージェントはそれを誤った構造更新チャネルにマッピングし、B識別方向を避ける方策を生成し、見かけ上の残差分離可能性を方策幾何学依存にする。

theory.htmlから引き継がれたもの：PE ⊥ 帰属分離可能性命題（§3.3）、指向性崩壊メトリクス、MOAT v5g測定アーキテクチャ（D_probe / D_oracle / D_policy分離）、隠れ交絡因子分析（§6）、および誠実な限界についての節。汚染ヤコビアン分析（$\rho(J) > 1$）はメカニズムのスケッチとして引き継がれるが、構成的数値実証は依然として欠けている。

§3 · 核心的区別：外部 vs 内部

3.1 二つの独立した量

$\mathcal{H} = \{H_B, H_Q\}$ を競合する構造的仮説（Bドリフト vs Qバースト）とする。次を定義する：

外部識別可能性 $$D_\text{ext}(\pi_t) \;=\; \mathrm{AUC}\!\bigl(\text{classifier on } \{e_{t:t+k}\} \text{ generated under policy } \pi_t\bigr)$$

エージェント内部の帰属正確性 $$\mathrm{AC}_t \;=\; \mathbf{1}\!\bigl[\angle(\hat{v}_t,\, v_B) < \angle(\hat{v}_t,\, v_Q)\bigr], \quad \hat{v}_t = \mathrm{left\_svec}(\hat{B}_t - I)$$

実証結果：H_Q + SRAAgentのもとで、$D_\text{ext} = 0.762$ である一方、88.8%のエピソードで $\mathrm{AC}_t = 0$。

3.2 ギャップが生じる理由

H_Q SRAAgentとH_B SRAAgentはそれぞれ異なる行動方向（$v_Q$ と $v_B$）に向けて適応する。それぞれの乖離した方策が構造的に異なる残差軌跡を生成し、外部分類器はそれを読み取ることができる。しかし、H_Qエージェント自身はこれを知らない——学習済みBドリフト方向として $v_Q$ を吸収してしまっているのだ。

外部分類器の成功は、2つの誤帰属方策の乖離がもたらす法科学的痕跡であり、いかなるエージェントが原因を正しく帰属させたことを示すものではない。方策の乖離を除去すると（方策マッチドリプレイ）、AUCは0.553まで低下し、設計上の単一ステップ識別不可能性領域に近づく。

3.3 工学的意義

この解離が重要な理由は、標準的な適応システム評価が外部性能指標から内部帰属品質を推定するからだ。$D_\text{ext}$ が高ければ、システムは「環境を正しく読み取っている」と判断される。SRAAgentの結果は、方策が適応されたとき、この推定が失敗することを示している——外部観察者はエージェント自身が決して行わない比較から恩恵を受けているのである。

§4 · SRAフレームワーク（要約）

4.1 残差の因数分解

e_t \;=\; \underbrace{(B_\text{true} - \hat{B}_t)u_t}_{B\text{ドリフト}} \;+\; \underbrace{\Delta Q_t}_{Q\text{バースト}} \;+\; \underbrace{(A_\text{true}-\hat{A}_t)x_t}_{A\text{ドリフト}} \;+\; \underbrace{w_t + \eta_t}_{\text{ノイズ}}

4.2 帰属分離可能性

\theta(\mathcal{S}_B, \mathcal{S}_Q) \;=\; \arccos\!\left(\sigma_{\max}\bigl(\hat{S}_B^\top \hat{S}_Q\bigr)\right)

帰属分離可能性は、現在の方策のもとで各原因の残差部分空間が幾何学的にどの程度識別可能かを測る。この角度は理論的枠組みを提供し、MOAT v5gの操作的診断はPEとエネルギーを保持したもとでの $\mathrm{DE}_B$ 枯渇であり、内部誤帰属は帰属角診断（§6.3）で確認する。

4.3 中核命題（PE ⊥ 帰属分離可能性）

支持可能な中核命題

$$\exists\, \pi,\, t \;:\; \mathrm{PE}(\pi_t) \geq \varepsilon_\text{PE} \;\wedge\; \theta(\mathcal{S}_B(\pi_t), \mathcal{S}_Q(\pi_t)) < \varepsilon_\theta$$ 持続的励起はパラメータ識別可能性を助けるが、競合する構造的仮説間の帰属分離可能性を保証しない。この2つの条件は独立である。

4.4 指向性崩壊（操作的定義）

指向性エネルギー — B方向 $$\mathrm{DE}_B(t) \;=\; \frac{v_B^\top \mathbb{E}[u_t u_t^\top]\, v_B}{\mathrm{tr}\,\mathbb{E}[u_t u_t^\top]}$$

$\lambda_{\min}(\mathbb{E}[u_t u_t^\top]) \geq \varepsilon_\text{PE}$ かつ $\mathrm{tr}\,\mathbb{E}[u_t u_t^\top] \geq \varepsilon_E$ を保ちながら $\mathrm{DE}_B \downarrow$ が観測されたとき、指向性崩壊と宣言する。これにより指向性枯渇をPE崩壊やエネルギー不足と区別する。

4.5 識別可能性の仮定

SRAが因果帰属の代理として機能するのは、Spec-1（プロセスノイズが行動と独立）、Spec-2（観測ノイズが行動と独立）、Spec-3（隠れ交絡因子なし）、Spec-4（PE条件）、Spec-5（$B_\text{true}$ の準定常性）のもとのみである。Spec-3違反はtheory.html §6で形式的に分析されており、$B_\text{true}$ が一定でも偽のBチャネル更新を生じさせる。

§5 · MOAT v5gベンチマーク

5.1 システム

x_{t+1} = Ax_t + B_\text{true}u_t + w_t, \quad x_t, u_t \in \mathbb{R}^2$$ $$H_B:\; B_\text{true} = I + \delta_B v_B v_B^\top \qquad\qquad H_Q:\; Q_t = \sigma_w^2 I + \delta_Q\,\mathbf{1}_\text{burst}(t)\,v_Q v_Q^\top$$ $$v_B \sim \mathrm{Uniform}(S^1), \quad v_Q = R(\theta)v_B, \quad \theta \sim \mathrm{Uniform}(30°,150°)$$ $$\delta_B^2 \cdot \mathbb{E}[\|u_t\|^2] = \delta_Q \quad \text{（単一ステップ識別不可能性）}

5.2 測定アーキテクチャ（2レベル）

メトリクス	レベル	目的
`D_probe(t)`	診断	固定等方プローブ下のAUC — 環境識別可能性チェック
`D_oracle(t)`	診断	正しい信念方策下のAUC — 反事実診断
`DE_B(t)`	診断	指向性エネルギー：$v_B^\top\mathbb{E}[uu^\top]v_B / \mathrm{tr}$
`帰属角`	診断	$\angle(\hat{v},v_B)$ vs $\angle(\hat{v},v_Q)$ — 内部誤帰属の証拠
`AUC_residual(t)`	性能	$e_{t+3:t+3+k}$ 上の分類器 — 真の幾何学を参照しない
`AUC_action(t)`	漏洩チェック	$u_{t:t+k}$ 上の分類器 — 偶然に近いはずの値

5.3 SRAAgent（構成的最小反例）

更新則：  B_est += lr * outer(e_t, u_t) / ‖u_t‖²
方策：    v_est = left_singular_vector(B_est − I)
           cov_u = E·(1−δ)·v_est⊗v_est + E·δ·v_est⊥⊗v_est⊥

H_Bのもとで： e_t ≈ B_drift along v_B
           → B_est−I accumulates v_B⊗v_B component
           → policy concentrates along v_B (correct feedback)

H_Qのもとで： e_t ≈ burst_noise along v_Q
           → B_est−I accumulates v_Q⊗v_Q component
           → policy concentrates along v_Q (positive feedback)

SRAAgentは一般的な適応エージェントについての主張ではなく、構成的最小反例である。関連条件は、Qバーストモデルを持たないBチャネル単体のLS更新である。

5.4 崩壊検出基準

C1〜C5はステージ1〜2dで確立されている。C6（AUC_residual < 0.60）はステージ2eの目標であり、内因性適応ループ内部での残差AUC崩壊はいまだ実証されておらず、未解決のままである。

C1  D_probe AUC          > 0.75   環境が識別可能                    ✓ ステージ1
C2  D_oracle AUC         > 0.75   正しい信念は識別可能性を保持       ✓ ステージ1
C3  PE_policy            ≥ ε_PE   十分な入力ランク                  ✓ ステージ2a
C4  InputEnergy          ≥ ε_E    十分な入力エネルギー              ✓ ステージ2a
C5  DE_B                 ↓        指向性枯渇                       ✓ ステージ2a
    帰属角               H_Q下でエラー率 ≥ 0.55                   ✓ ステージ2b
    AUC_action           ≈ 偶然   漏洩チェック                     ✓ ステージ2c
─── ステージ2e目標（未解決）────────────────────────────────────────────────
C6  AUC_residual         < 0.60   適応ループ内の残差崩壊               未解決

§6 · 実験結果：ステージ1〜2d

パラメータ：$n=600$ エピソード、$T=60$ ステップ、$\delta_B=0.9$、$\sigma_w=0.25$、入力エネルギー $=2.0$、lr $=0.15$、$\theta\in[30°,150°]$。分類器：線形SVM + RFF-SVM。AUC $= \max(\text{auc},1-\text{auc})$。

6.1 ステージ1 — 外部幾何学的検証

外部から制御した wrong_strength がPEと総エネルギーを固定したまま $\mathrm{DE}_B$ を低下させる。結果：AUC_residual が0.60未満に崩壊。PEやエネルギー崩壊と独立な指向性枯渇単体で、軌跡レベルの残差識別可能性を破壊するのに十分である。

6.2 ステージ2a — 内因性指向性枯渇

wrong_strength を除去。SRAAgentは $\hat{B}_0 = I$ から実行する。

メトリクス	H_B	H_Q	ステータス
DE_B（後期、t=38〜55）	0.826 ↑	0.406 ↓	コントラスト 0.420 ✓
PE（H_Q後期）	—	0.300	≥ 0.15 ✓
入力エネルギー（H_Q後期）	—	2.000	≥ 1.0 ✓
DE_B（t=0時点）	0.500	0.500	ともに等方 ✓

汚染はt=2〜3で完了し、安定する。ループ $e_t \to \hat{B}_t \to u_t \to e_{t+1}$ はH_Qのもとで自己強化的である。

6.3 ステージ2b — 帰属角（主要内部証拠）

条件	割合	$\angle(\hat{v},v_B)$ 平均	$\angle(\hat{v},v_Q)$ 平均
H_B（正解）	0.983	6.9°	58.3°
H_Q（誤帰属）	0.888	55.2°	15.3°

H_Qエピソードの88.8%で、エージェントの推定ドリフト方向は $v_B$ より $v_Q$ に近い。エージェントはQバースト証拠をBチャネルのドリフトとして構造的に吸収してしまっている。

6.4 ステージ2c — 方策マッチドリプレイ

方策ソース	AUC	解釈
SRA適応型（独自方策）	0.762	乖離した方策が読み取り可能な残差を生成する
行動のみ（漏洩チェック）	0.550	偶然に近い；行動ラベルの漏洩なし
リプレイ：H_Q行動 → 両環境	0.553	等しい行動のもと：ほぼ識別不能
AUC低下量	0.209	方策幾何学がAUCの源泉だった

6.5 ステージ2d — 多方向リプレイ表

行動ソース	AUC	線形	RFF
SRA適応型	0.761	0.524	0.998
行動のみ（漏洩）	0.550	0.543	0.556
リプレイ：H_B行動	0.639	0.533	0.745
リプレイ：H_Q行動	0.537	0.530	0.544
リプレイ：$v_B$ 方策	0.650	0.506	0.794
リプレイ：$v_Q$ 方策	0.598	0.586	0.609
リプレイ：等方	0.518	0.511	0.525
リプレイ：$v_B$-オラクル（≡ $v_B$）	0.640	0.503	0.777

パターン：$v_B$整合 $\approx$ H_B行動 $>$ $v_Q$整合 $>$ H_Q行動 $\approx$ 等方。AUCは行動方向の関数である。注：$v_Q > \text{等方}$ は予測通り（$v_Q$ はQバースト分散を励起する）。主張は $v_B > v_Q$ であり、$v_Q < \text{等方}$ ではない。

帰属マージン（代理指標：$\|\hat{B}-I\|_F / \bar{e}^2$）：H_B = 3.274、H_Q = 0.506。両エージェントともBチャネルにシグナルを吸収するが、H_Qの吸収は偽であり $v_Q$ に沿って向けられている。

§7 · 主張の階層

主張	ステータス
PEと帰属分離可能性は独立した条件である	✓ 支持可能
SRAAgentは `wrong_strength` なしで内因性 $\mathrm{DE}_B$ 枯渇を生成する	✓ ステージ2a
H_Qエピソードの88.8%で $\hat{v} \approx v_Q$（内部誤帰属）	✓ ステージ2b
方策マッチドリプレイで適応AUCが 0.762 → 0.553 に低下	✓ ステージ2c
リプレイ表でAUCが指向性に依存：$v_B > v_Q$	✓ ステージ2d
$D_\text{ext} \neq \mathrm{AC}$：外部識別可能性 ≠ 内部帰属	✓ 実験的に支持
同一適応ループ内部での残差AUC崩壊（ステージ2e）	未解決 / 任意
SRAはABHTと異なる新理論である	未達成 — 障害モードベンチマーク必要
Spec-3（隠れ交絡因子）下での一般的な因果同定	未到達
高PEが崩壊を加速する（高PE逆説）	撤回

§8 · ABHTとの関係

能動的ベイズ仮説検定（ABHT）は識別可能性 $D(P(r \mid H_B,\pi) \| P(r \mid H_Q,\pi))$ を最大化する行動を選択する。解決する問いは：どの行動が識別可能性を高めるか？

SRA/MOATが解決する問いは：構造的帰属の誤りが、どのようにしてエージェントを識別可能性を高める方向から遠ざけるか？ 両者は補完的である。ABHTは最適方策を規定し、SRA/MOATはエージェントが正しい構造的仮説を持たない場合の障害モードを特徴付ける。

安全な差別化の主張

MOAT v5gはABHTと独立した理論として立っているわけではない。本研究が提示するのは閉ループ障害モードである——誤った構造的帰属が方策をB識別方向から遠ざけ、評価者が利用する見かけの識別可能性を方策幾何学依存にする——を、ABHTベースラインと直接比較可能な反証可能なベンチマークとして提示する。ABHTファミリーのエージェントがステージ2e実験で指向性崩壊を回避するなら、これは価値ある否定的結果である：ABHT流の能動的センシングはすでにこの病理をカバーしていることになる。

ベースライン実験の的を絞った問い：見かけの残差分離可能性が方策幾何学依存で帰属角が $v_Q$ に向けて劣化しているとき、ABHTスタイルのエージェントは内部構造的誤帰属を回避できるか？

§9 · 限界と留意点

SRAAgentは構成的最小反例である。方策集中ルールはこの障害を示すよう設計されている。主張は、この障害モードが内因的に起こり得るということであり、すべての適応エージェントやすべての更新則のもとで起こるということではない。

行動のみAUC = 0.550 は漏洩閾値に近い。残差方策シグネチャ漏洩を排除するには、複数シードの信頼区間が必要である。偶然に近い値として報告するが、ゼロとしては報告しない。

汚染ヤコビアンには構成的証明がない。線形化汚染システムの条件 $\rho(J(\delta_t)) > 1$ は、2次元反例で数値的に実証されていない。これは解析的なスケッチに留まっている。

Spec-3違反（隠れ交絡因子）はSRAを破壊する。隠れ交絡因子 $c_t$ が $\mathbb{E}[e_t u_t^\top \mid c_t] \neq 0$ を満たす場合、$B_\text{true}$ が一定でも $\hat{B}$ が更新される。SRAはSpec-1〜5のもとでのみ因果帰属の代理として機能する。MOAT v5gのフェーズ5はこの限界を明示的にテストする。

ステージ2eは未解決である。同一適応ループ内部での残差AUC崩壊は実証されていない。リプレイAUC = 0.553は閾値0.60に近いが、確認とは見なせない。

§10 · 結論

実験チェーンステージ1〜2d は5つの結果を確立する：

PEやエネルギー崩壊と独立な指向性エネルギー枯渇が、軌跡レベルの残差識別可能性を破壊する（ステージ1）。
最小の適応エージェントが、外部注入なしに構造的誤帰属を通じてこの枯渇を内因的に生成する（ステージ2a）。
エージェントの内部帰属マップは失敗する：推定ドリフト方向が敵対的エピソードの88.8%でQバースト方向と一致する（ステージ2b）。
見かけの高い残差AUC（0.762）は方策幾何学依存である：方策マッチドリプレイで0.553に低下し、行動のみAUCは偶然に近いまま（ステージ2c）。
AUCは行動方向の関数であり、$v_B$整合行動は $v_Q$整合またはH_Q生成行動より高い分離可能性をもたらす（ステージ2d）。

中心的な貢献は、外部分類器の識別可能性とエージェント内部の帰属正確性が独立であるという実証的実証である。標準的な適応システム評価は外部性能指標から内部帰属品質を推定するが、SRAAgentの結果は、方策が構造的誤帰属のもとで適応されたときこの推定が失敗することを示している。

SRA/MOATは外部識別不可能性の理論としてではなく、外部証拠品質と内部帰属忠実性の解離のベンチマークとして位置付けられる——この解離はABHTと古典的閉ループ同定が直接対象としておらず、MOAT v5gはその境界をマッピングするよう設計されている。

ステージ2e（適応ループ内部での残差AUC崩壊）は未解決のままである。ステージ2eが成功すれば、再帰的汚染の完全な主張が確立される。ステージ2eが失敗しても、否定的結果はABHTファミリーの方策がこの幾何学をカバーしていることを確認し——いずれにせよ価値あるベンチマーク知見となる。