テストごとの結果
各テストはそれぞれ独立した節で報告され、数値は対応するレポートからそのまま引用している。診断的結果が先に行い(テスト 1–2)、続いて生成モデルに関して試みた(テスト 3–4)。総合的な解釈は §5 に委ねる。
4.1 テスト 1 — ブロック異常スコ(B3/B4) クラス B
focus state late_growth | tail_64_95 | even において、\(B_4\) スコアの actual 中央値(\(-0.047\))は iid 中央値(\(-0.060\))を上回り、高スコアの actual 語を iid から分離する重み付き AUC は \(0.719\) である。
この状態内で、最も低い \(B_4\) スコアの十分位は生存比 \(S = 0.035\)、最も高い十分位は \(S = 1.806\) ―― 明確な単調傾向である。しかも、これはサンプル数の少ない状態で観測された効果である。
完全なロジスティックベースラインに対し、ブロックスコアは小さいながらも実質的な識別性能の改善をもたらす。そして重要なことに、構造的共変量を吸収しきることはない:
| モデル | 重み付き AUC | Δ 対ベース | B4 係数 | ブリッジ |係数| | パリティ係数 |
|---|---|---|---|---|---|
| x_K + parity + bridge + z | 0.5023 | 0.0000 | 0.0000 | 1.1312 | 0.3682 |
| + B4 | 0.5260 | 0.0236 | 0.2330 | 1.1151 | 0.4268 |
| + B3 + B4 | 0.5246 | 0.0223 | 0.1695 | 1.1132 | 0.4423 |
\(B_4\) を加えると AUC は \(0.0236\) 改善する。ブリッジ係数はわずか \(0.0162\) しか下がらず、パリティ係数はまったく下がらない(むしろ上がり、\(-0.0586\) の減少となる)。したがってテスト 1 は B ――「B4 スコアは助けになるがブリッジ/パリティは強いまま」に分類される。ただしこれは分割標本・標本化された診断であって、厳密な集約の証明ではない、という明示的な但し書きを伴う。
要点。ブロックスコアは識別を改善するが、ブリッジ/パリティ効果は残る。
4.2 テスト 2 — ブロック長くりこみ(L = 3…6) クラス B
識別信号は、周辺スコア AUC と \(+\)スコアロジスティック AUC のいずれによってもブロック長とともに単調に増大する一方、ロジスティックベース AUC はランダム分類の水準(\(0.5025\))にとどまる:
| L | 周辺スコア AUC | ロジスティックベース AUC | ロジスティック + スコア AUC | Δ |
|---|---|---|---|---|
| 3 | 0.5611 | 0.5025 | 0.5363 | 0.0337 |
| 4 | 0.5768 | 0.5025 | 0.5436 | 0.0411 |
| 5 | 0.5966 | 0.5025 | 0.5536 | 0.0511 |
| 6 | 0.6198 | 0.5025 | 0.5643 | 0.0618 |
最も高い \(+\)スコアロジスティック AUC は \(L=6\) での \(0.5643\) であり、\(L=3\) から \(L=6\) への利得は \(0.0280\)。しかし残差ギャップは閉じない。\(L=6\) においてブリッジ絶対残差は \(1.1011\)、パリティ残差は \(0.3749\)。focus state における \(L=6\) では、最も低いスコア十分位が \(S = 0.117\)、最も高い有限生存比十分位が \(S = 38.091\) であり、最上位十分位は iid 質量がゼロである。すなわち最も顕著な効果が、最もサンプル数の少ない領域で観測されている。
以上より、テスト 2 は B ――「AUC は増大するが残差は残る」に分類される。より長いブロックはより良く識別するが、ブリッジ/パリティ構造を除去しない。
要点。より長いブロックは識別を一貫して改善するが、相当量のブリッジ/パリティ構造を未説明のまま残す。
4.3 テスト 3 — 有限ブロック再重み付け クラス C
iid 語を \(2^{\alpha S_L}\) で再重み付けするのが最初の生成モデルに関する試みである。全状態で最小 RMSE を与えた適合は、軽く減衰させた短いブロック――\(L=3\)、\(\alpha=0.25\)、 RMSE \(0.000440978\)、JS \(0.000921815\) である。より長い、あるいはより強い再重み付けは良くなるどころか悪くなる。 \(L=6\) では選択されるのは \(\alpha = 0.0\)(再重み付けをまったく行わない)で、RMSE \(0.000642649\)。
focus state はこの過補正を直接示す。その中で最も性能の高い再重み付け(\(L=6\), \(\alpha=0.5\))でもなお質量を過小予測する。
actual \(0.00092052\) 対予測 \(0.00029821\) は、\(\alpha=1\) まで押し進めると、モデルされた focus state 生存は \(0.00416667\) まで下がり、actual 生存 \(0.472461\) に対して大きく外れる。全体で最小 RMSE を与えた適合において、ブリッジ RMSE は \(0.000427051\)、パリティ RMSE は \(0.00262763\)。
総合すると、これらの結果は C 「再重み付けは過補正するか、生成的でない」に対応する。小さな改善はもっぱら減衰短ブロック再重み付けによるものであり、より長い未減衰の再重み付けは強すぎる補正となる。診断的には有用だが、生成器としては弱い。
要点として。短く軽く減衰させた再重み付けは集約適合を改善しうるが、より強いブロック再重み付けは、actual 分布を生成するのではなく過補正する。
4.4 テスト 4 — 最大エントロピーブロック射影 クラス C
2 番目の生成モデルに関する試みは、ヒューリスティックな再重み付けを、ブロック周辺分布を合わせる近似的な正則化 IPF で置き換える。これはより単純なベースラインを上回らない。
最も性能の高い最大エントロピー適合(\(L=3\)、正則化 \(0.75\))は RMSE \(0.000493147\)、 JS \(0.000868073\) であり、生/減衰再重み付けで得られた最小 RMSE \(0.000440978\) より悪い。
正則化は、より長いブロックについてはパリティ残差を確かに減らす――正則化 \(0\) では \(L=5\) と \(L=6\) のパリティ残差は高く始まり、正則化が増えるにつれて \(L=3/L=4\) の水準へ落ちていくが、これは新しい構造が捉えられているのではなく、正則化が射影を減衰ベースラインへ引き寄せていることを反映している。
focus state では、射影で最も actual に近い生存は \(0.444001\)(\(L=5\)、正則化 \(0.9\))で、 actual 生存 \(0.472461\) に対して、この 1 状態では近いものの、重い正則化のもとで得られており、全体適合の改善を伴っていない。
したがってテスト 4 もまた C ――「maxent は生/減衰と変わらない」に該当する。これは全語にわたる完全・厳密な IPF 解ではなく近似射影である、という明示的な注意を伴う。
要点。射影は重い正則化のもとで focus state を適合できるが、全体の状態質量適合は改善しない。
4.5 4 つの判定の要約
| テスト | 種別 | 主要数値 | 自己分類 |
|---|---|---|---|
| 1 · 異常 B3/B4 | 診断的 | +0.0236 AUC;focus AUC 0.719 | B |
| 2 · 長さくりこみ | 診断的 | +スコア AUC 0.5363→0.5643 | B |
| 3 · 再重み付け | 生成的 | 最小 RMSE 0.000440978(L3, α0.25) | C |
| 4 · maxent 射影 | 生成的 | 最小 RMSE 0.000493147(より悪い) | C |
診断テストは B に、生成テストは C に分類される。次節ではこれら 4 つの判定を総合して考察し、記号が正確に何を意味するのかを述べる。
4.6 補助解析:actual−iid の Δ 地図
本節は補助的な記述統計として、各座標における actual と iid の質量差
\[ \Delta(\cdot) \;=\; \mu_{\text{actual}}(\cdot) \;-\; \mu_{\text{iid}}(\cdot) \]を投影した結果を報告する。これは新しい生成モデルではなく、テスト 1–4 が検出した不一致がどの座標で局在するかを補足するための診断量である。Δ を state、 prefix シリンダー、transition、boundary/remaining_K の各座標へ射影した。
state 座標では、bridge_cluster + x_K_window + parity の組が Δ を最もよく局在させた。一方、prefix シリンダーでは初期 prefix から差は見えるものの、ウィンドウ長を伸ばしても単一の prefix には集中しない。transition/prefix 成長で見ても、単一の edge や branch に Δ が集約されることはなかった。
boundary 座標では remaining_K が最も鋭く Δ を局在させ、最大の \(|\Delta|\) は remaining_K=32–63 に現れる。remaining_K=64–95、96–127 にも薄さは続くが、最大の絶対質量差は 32–63 に残る(96–127 は比が最も低い一方、質量と L1 share は小さい)。
| remaining_K | actual | iid | \(\Delta\) | 比 | L1 share |
|---|---|---|---|---|---|
| 32–63 | 1.959532 | 2.139743 | −0.180211 | 0.916 | 38.57% |
| 64–95 | 0.266435 | 0.341662 | −0.075227 | 0.780 | 16.10% |
| 96–127 | 0.018644 | 0.031704 | −0.013059 | 0.588 | 2.80% |
主要な帯(32–63、64–95、96–127)では mass delta が negative である一方、下流への条件付き遷移 delta が positive になる場合がある。たとえば 64-95 -> 32-63 は質量差 \(-0.006059\) だが条件付き delta は \(+0.007861\)、 32-63 -> 16-31 は質量差 \(-0.009262\) だが条件付き delta は \(+0.004618\) である。
これは、actual がその帯にもつ質量は薄い一方で、その帯にいる条件のもとで下流へ進む比率は必ずしも弱くない、という分離を示す。したがって局所遷移の単純な不調ではなく、remaining_K chain 上の質量配置が actual と iid で異なる、という観察として読むのが自然である。
| 座標 | 局在の鋭さ | 主な所見 |
|---|---|---|
| block score | ― | 診断信号はあるが生成は再現しない(§4.1–4.4) |
| state | 中〜高 | bridge_cluster + x_K_window + parity で局在 |
| prefix | 低 | 初期から見えるが単一 prefix に集中しない |
| transition | 低 | 単一 edge/branch に集約されない |
| boundary remaining_K | 高 | 最大 \(|\Delta|\) は 32–63(最大観測点) |
要点。残差は単一の prefix や transition には集中せず、state 座標と remaining_K 境界距離でより鮮明に局在する。最大観測点は remaining_K=32–63 である。