本論文では内的帰属崩壊を定義し、実証的に検討する。これは、非定常な部分観測可能性下の適応システムが、残差を誤った潜在チャネルに構造的に誤帰属させ、識別方向を避ける方策を生成し、見かけ上の残差証拠を方策幾何学依存にしてしまう障害モードである。中心的な知見は次の解離である:
theory.htmlの元の主張——誤帰属が外部軌跡レベルの識別可能性を再帰的に劣化させる——は実験では確認されなかった。確認されたことは、別の意味でより強力だ:見かけ上の残差分離可能性は方策誘発の軌跡幾何学によって構築されており、一方でエージェントの内部帰属マップは誤った構造方向を指し示している。
本論文ではMOAT v5gをこの障害モードのストレステストベンチマークとして提示し、指向性崩壊をその操作的シグネチャとして形式化する。また、実験的に支持された誤帰属連鎖(誤った更新 → 内因性指向性枯渇 → 方策幾何学依存の証拠 → 内部帰属失敗)を示す構成的最小エージェント(SRAAgent)を提供する。
theory.htmlは帰属崩壊を、再帰的汚染による外部残差識別不可能性の生成として定式化していた:
実験は、適応残差AUCが崩壊しないことを示している——高いまま(0.762)だ。実験チェーンが明らかにしたのは、その高いAUCの分解である:
帰属崩壊の改訂定義:
theory.htmlから引き継がれたもの:PE ⊥ 帰属分離可能性命題(§3.3)、指向性崩壊メトリクス、MOAT v5g測定アーキテクチャ(D_probe / D_oracle / D_policy分離)、隠れ交絡因子分析(§6)、および誠実な限界についての節。汚染ヤコビアン分析($\rho(J) > 1$)はメカニズムのスケッチとして引き継がれるが、構成的数値実証は依然として欠けている。
$\mathcal{H} = \{H_B, H_Q\}$ を競合する構造的仮説(Bドリフト vs Qバースト)とする。次を定義する:
実証結果:HQ + SRAAgentのもとで、$D_\text{ext} = 0.762$ である一方、88.8%のエピソードで $\mathrm{AC}_t = 0$。
HQ SRAAgentとHB SRAAgentはそれぞれ異なる行動方向($v_Q$ と $v_B$)に向けて適応する。それぞれの乖離した方策が構造的に異なる残差軌跡を生成し、外部分類器はそれを読み取ることができる。しかし、HQエージェント自身はこれを知らない——学習済みBドリフト方向として $v_Q$ を吸収してしまっているのだ。
外部分類器の成功は、2つの誤帰属方策の乖離がもたらす法科学的痕跡であり、いかなるエージェントが原因を正しく帰属させたことを示すものではない。方策の乖離を除去すると(方策マッチドリプレイ)、AUCは0.553まで低下し、設計上の単一ステップ識別不可能性領域に近づく。
この解離が重要な理由は、標準的な適応システム評価が外部性能指標から内部帰属品質を推定するからだ。$D_\text{ext}$ が高ければ、システムは「環境を正しく読み取っている」と判断される。SRAAgentの結果は、方策が適応されたとき、この推定が失敗することを示している——外部観察者はエージェント自身が決して行わない比較から恩恵を受けているのである。
帰属分離可能性は、現在の方策のもとで各原因の残差部分空間が幾何学的にどの程度識別可能かを測る。この角度は理論的枠組みを提供し、MOAT v5gの操作的診断はPEとエネルギーを保持したもとでの $\mathrm{DE}_B$ 枯渇であり、内部誤帰属は帰属角診断(§6.3)で確認する。
$\lambda_{\min}(\mathbb{E}[u_t u_t^\top]) \geq \varepsilon_\text{PE}$ かつ $\mathrm{tr}\,\mathbb{E}[u_t u_t^\top] \geq \varepsilon_E$ を保ちながら $\mathrm{DE}_B \downarrow$ が観測されたとき、指向性崩壊と宣言する。これにより指向性枯渇をPE崩壊やエネルギー不足と区別する。
SRAが因果帰属の代理として機能するのは、Spec-1(プロセスノイズが行動と独立)、Spec-2(観測ノイズが行動と独立)、Spec-3(隠れ交絡因子なし)、Spec-4(PE条件)、Spec-5($B_\text{true}$ の準定常性)のもとのみである。Spec-3違反はtheory.html §6で形式的に分析されており、$B_\text{true}$ が一定でも偽のBチャネル更新を生じさせる。
| メトリクス | レベル | 目的 |
|---|---|---|
D_probe(t) | 診断 | 固定等方プローブ下のAUC — 環境識別可能性チェック |
D_oracle(t) | 診断 | 正しい信念方策下のAUC — 反事実診断 |
DE_B(t) | 診断 | 指向性エネルギー:$v_B^\top\mathbb{E}[uu^\top]v_B / \mathrm{tr}$ |
帰属角 | 診断 | $\angle(\hat{v},v_B)$ vs $\angle(\hat{v},v_Q)$ — 内部誤帰属の証拠 |
AUC_residual(t) | 性能 | $e_{t+3:t+3+k}$ 上の分類器 — 真の幾何学を参照しない |
AUC_action(t) | 漏洩チェック | $u_{t:t+k}$ 上の分類器 — 偶然に近いはずの値 |
更新則: B_est += lr * outer(e_t, u_t) / ‖u_t‖² 方策: v_est = left_singular_vector(B_est − I) cov_u = E·(1−δ)·v_est⊗v_est + E·δ·v_est⊥⊗v_est⊥ H_Bのもとで: e_t ≈ B_drift along v_B → B_est−I accumulates v_B⊗v_B component → policy concentrates along v_B (correct feedback) H_Qのもとで: e_t ≈ burst_noise along v_Q → B_est−I accumulates v_Q⊗v_Q component → policy concentrates along v_Q (positive feedback)
SRAAgentは一般的な適応エージェントについての主張ではなく、構成的最小反例である。関連条件は、Qバーストモデルを持たないBチャネル単体のLS更新である。
C1〜C5はステージ1〜2dで確立されている。C6(AUC_residual < 0.60)はステージ2eの目標であり、内因性適応ループ内部での残差AUC崩壊はいまだ実証されておらず、未解決のままである。
C1 D_probe AUC > 0.75 環境が識別可能 ✓ ステージ1
C2 D_oracle AUC > 0.75 正しい信念は識別可能性を保持 ✓ ステージ1
C3 PE_policy ≥ ε_PE 十分な入力ランク ✓ ステージ2a
C4 InputEnergy ≥ ε_E 十分な入力エネルギー ✓ ステージ2a
C5 DE_B ↓ 指向性枯渇 ✓ ステージ2a
帰属角 H_Q下でエラー率 ≥ 0.55 ✓ ステージ2b
AUC_action ≈ 偶然 漏洩チェック ✓ ステージ2c
─── ステージ2e目標(未解決)────────────────────────────────────────────────
C6 AUC_residual < 0.60 適応ループ内の残差崩壊 未解決
パラメータ:$n=600$ エピソード、$T=60$ ステップ、$\delta_B=0.9$、$\sigma_w=0.25$、入力エネルギー $=2.0$、lr $=0.15$、$\theta\in[30°,150°]$。分類器:線形SVM + RFF-SVM。AUC $= \max(\text{auc},1-\text{auc})$。
外部から制御した wrong_strength がPEと総エネルギーを固定したまま $\mathrm{DE}_B$ を低下させる。結果:AUC_residual が0.60未満に崩壊。PEやエネルギー崩壊と独立な指向性枯渇単体で、軌跡レベルの残差識別可能性を破壊するのに十分である。
wrong_strength を除去。SRAAgentは $\hat{B}_0 = I$ から実行する。
| メトリクス | H_B | H_Q | ステータス |
|---|---|---|---|
| DE_B(後期、t=38〜55) | 0.826 ↑ | 0.406 ↓ | コントラスト 0.420 ✓ |
| PE(H_Q後期) | — | 0.300 | ≥ 0.15 ✓ |
| 入力エネルギー(H_Q後期) | — | 2.000 | ≥ 1.0 ✓ |
| DE_B(t=0時点) | 0.500 | 0.500 | ともに等方 ✓ |
汚染はt=2〜3で完了し、安定する。ループ $e_t \to \hat{B}_t \to u_t \to e_{t+1}$ はHQのもとで自己強化的である。
| 条件 | 割合 | $\angle(\hat{v},v_B)$ 平均 | $\angle(\hat{v},v_Q)$ 平均 |
|---|---|---|---|
| H_B(正解) | 0.983 | 6.9° | 58.3° |
| H_Q(誤帰属) | 0.888 | 55.2° | 15.3° |
HQエピソードの88.8%で、エージェントの推定ドリフト方向は $v_B$ より $v_Q$ に近い。エージェントはQバースト証拠をBチャネルのドリフトとして構造的に吸収してしまっている。
| 方策ソース | AUC | 解釈 |
|---|---|---|
| SRA適応型(独自方策) | 0.762 | 乖離した方策が読み取り可能な残差を生成する |
| 行動のみ(漏洩チェック) | 0.550 | 偶然に近い;行動ラベルの漏洩なし |
| リプレイ:H_Q行動 → 両環境 | 0.553 | 等しい行動のもと:ほぼ識別不能 |
| AUC低下量 | 0.209 | 方策幾何学がAUCの源泉だった |
| 行動ソース | AUC | 線形 | RFF |
|---|---|---|---|
| SRA適応型 | 0.761 | 0.524 | 0.998 |
| 行動のみ(漏洩) | 0.550 | 0.543 | 0.556 |
| リプレイ:H_B行動 | 0.639 | 0.533 | 0.745 |
| リプレイ:H_Q行動 | 0.537 | 0.530 | 0.544 |
| リプレイ:$v_B$ 方策 | 0.650 | 0.506 | 0.794 |
| リプレイ:$v_Q$ 方策 | 0.598 | 0.586 | 0.609 |
| リプレイ:等方 | 0.518 | 0.511 | 0.525 |
| リプレイ:$v_B$-オラクル(≡ $v_B$) | 0.640 | 0.503 | 0.777 |
パターン:$v_B$整合 $\approx$ HB行動 $>$ $v_Q$整合 $>$ HQ行動 $\approx$ 等方。AUCは行動方向の関数である。注:$v_Q > \text{等方}$ は予測通り($v_Q$ はQバースト分散を励起する)。主張は $v_B > v_Q$ であり、$v_Q < \text{等方}$ ではない。
帰属マージン(代理指標:$\|\hat{B}-I\|_F / \bar{e}^2$):HB = 3.274、HQ = 0.506。両エージェントともBチャネルにシグナルを吸収するが、HQの吸収は偽であり $v_Q$ に沿って向けられている。
| 主張 | ステータス |
|---|---|
| PEと帰属分離可能性は独立した条件である | ✓ 支持可能 |
SRAAgentは wrong_strength なしで内因性 $\mathrm{DE}_B$ 枯渇を生成する | ✓ ステージ2a |
| HQエピソードの88.8%で $\hat{v} \approx v_Q$(内部誤帰属) | ✓ ステージ2b |
| 方策マッチドリプレイで適応AUCが 0.762 → 0.553 に低下 | ✓ ステージ2c |
| リプレイ表でAUCが指向性に依存:$v_B > v_Q$ | ✓ ステージ2d |
| $D_\text{ext} \neq \mathrm{AC}$:外部識別可能性 ≠ 内部帰属 | ✓ 実験的に支持 |
| 同一適応ループ内部での残差AUC崩壊(ステージ2e) | 未解決 / 任意 |
| SRAはABHTと異なる新理論である | 未達成 — 障害モードベンチマーク必要 |
| Spec-3(隠れ交絡因子)下での一般的な因果同定 | 未到達 |
| 高PEが崩壊を加速する(高PE逆説) | 撤回 |
能動的ベイズ仮説検定(ABHT)は識別可能性 $D(P(r \mid H_B,\pi) \| P(r \mid H_Q,\pi))$ を最大化する行動を選択する。解決する問いは:どの行動が識別可能性を高めるか?
SRA/MOATが解決する問いは:構造的帰属の誤りが、どのようにしてエージェントを識別可能性を高める方向から遠ざけるか? 両者は補完的である。ABHTは最適方策を規定し、SRA/MOATはエージェントが正しい構造的仮説を持たない場合の障害モードを特徴付ける。
ベースライン実験の的を絞った問い:見かけの残差分離可能性が方策幾何学依存で帰属角が $v_Q$ に向けて劣化しているとき、ABHTスタイルのエージェントは内部構造的誤帰属を回避できるか?
SRAAgentは構成的最小反例である。方策集中ルールはこの障害を示すよう設計されている。主張は、この障害モードが内因的に起こり得るということであり、すべての適応エージェントやすべての更新則のもとで起こるということではない。
行動のみAUC = 0.550 は漏洩閾値に近い。残差方策シグネチャ漏洩を排除するには、複数シードの信頼区間が必要である。偶然に近い値として報告するが、ゼロとしては報告しない。
汚染ヤコビアンには構成的証明がない。線形化汚染システムの条件 $\rho(J(\delta_t)) > 1$ は、2次元反例で数値的に実証されていない。これは解析的なスケッチに留まっている。
Spec-3違反(隠れ交絡因子)はSRAを破壊する。隠れ交絡因子 $c_t$ が $\mathbb{E}[e_t u_t^\top \mid c_t] \neq 0$ を満たす場合、$B_\text{true}$ が一定でも $\hat{B}$ が更新される。SRAはSpec-1〜5のもとでのみ因果帰属の代理として機能する。MOAT v5gのフェーズ5はこの限界を明示的にテストする。
ステージ2eは未解決である。同一適応ループ内部での残差AUC崩壊は実証されていない。リプレイAUC = 0.553は閾値0.60に近いが、確認とは見なせない。
実験チェーン ステージ1〜2d は5つの結果を確立する:
中心的な貢献は、外部分類器の識別可能性とエージェント内部の帰属正確性が独立であるという実証的実証である。標準的な適応システム評価は外部性能指標から内部帰属品質を推定するが、SRAAgentの結果は、方策が構造的誤帰属のもとで適応されたときこの推定が失敗することを示している。
SRA/MOATは外部識別不可能性の理論としてではなく、外部証拠品質と内部帰属忠実性の解離のベンチマークとして位置付けられる——この解離はABHTと古典的閉ループ同定が直接対象としておらず、MOAT v5gはその境界をマッピングするよう設計されている。
ステージ2e(適応ループ内部での残差AUC崩壊)は未解決のままである。ステージ2eが成功すれば、再帰的汚染の完全な主張が確立される。ステージ2eが失敗しても、否定的結果はABHTファミリーの方策がこの幾何学をカバーしていることを確認し——いずれにせよ価値あるベンチマーク知見となる。