04 結果コラッツ有限ブロック診断

テストごとの結果

各テストはそれぞれ独立した節で報告され、数値は対応するレポートからそのまま引用している。診断的結果が先に行い（テスト 1–2）、続いて生成モデルに関して試みた（テスト 3–4）。総合的な解釈は §5 に委ねる。

4.1 テスト 1 — ブロック異常スコ（B3/B4）クラス B

focus state late_growth | tail_64_95 | even において、\(B_4\) スコアの actual 中央値（\(-0.047\)）は iid 中央値（\(-0.060\)）を上回り、高スコアの actual 語を iid から分離する重み付き AUC は \(0.719\) である。
この状態内で、最も低い \(B_4\) スコアの十分位は生存比 \(S = 0.035\)、最も高い十分位は \(S = 1.806\) ―― 明確な単調傾向である。しかも、これはサンプル数の少ない状態で観測された効果である。

完全なロジスティックベースラインに対し、ブロックスコアは小さいながらも実質的な識別性能の改善をもたらす。そして重要なことに、構造的共変量を吸収しきることはない：

表 4.1 — テスト 1 の回帰（重み付き AUC と選択された係数）。ベースライン = \(x_K\)、パリティ、ブリッジクラスタ、経路形状 \(z\)。
モデル	重み付き AUC	Δ 対ベース	B4 係数	ブリッジ \|係数\|	パリティ係数
x_K + parity + bridge + z	0.5023	0.0000	0.0000	1.1312	0.3682
+ B4	0.5260	0.0236	0.2330	1.1151	0.4268
+ B3 + B4	0.5246	0.0223	0.1695	1.1132	0.4423

\(B_4\) を加えると AUC は \(0.0236\) 改善する。ブリッジ係数はわずか \(0.0162\) しか下がらず、パリティ係数はまったく下がらない（むしろ上がり、\(-0.0586\) の減少となる）。したがってテスト 1 は B ――「B4 スコアは助けになるがブリッジ／パリティは強いまま」に分類される。ただしこれは分割標本・標本化された診断であって、厳密な集約の証明ではない、という明示的な但し書きを伴う。

要点。ブロックスコアは識別を改善するが、ブリッジ／パリティ効果は残る。

4.2 テスト 2 — ブロック長くりこみ（L = 3…6）クラス B

識別信号は、周辺スコア AUC と \(+\)スコアロジスティック AUC のいずれによってもブロック長とともに単調に増大する一方、ロジスティックベース AUC はランダム分類の水準（\(0.5025\)）にとどまる：

表 4.2 — テスト 2、ブロック長 \(L\) ごとの AUC。
L	周辺スコア AUC	ロジスティックベース AUC	ロジスティック + スコア AUC	Δ
3	0.5611	0.5025	0.5363	0.0337
4	0.5768	0.5025	0.5436	0.0411
5	0.5966	0.5025	0.5536	0.0511
6	0.6198	0.5025	0.5643	0.0618

最も高い \(+\)スコアロジスティック AUC は \(L=6\) での \(0.5643\) であり、\(L=3\) から \(L=6\) への利得は \(0.0280\)。しかし残差ギャップは閉じない。\(L=6\) においてブリッジ絶対残差は \(1.1011\)、パリティ残差は \(0.3749\)。focus state における \(L=6\) では、最も低いスコア十分位が \(S = 0.117\)、最も高い有限生存比十分位が \(S = 38.091\) であり、最上位十分位は iid 質量がゼロである。すなわち最も顕著な効果が、最もサンプル数の少ない領域で観測されている。

以上より、テスト 2 は B ――「AUC は増大するが残差は残る」に分類される。より長いブロックはより良く識別するが、ブリッジ／パリティ構造を除去しない。

要点。より長いブロックは識別を一貫して改善するが、相当量のブリッジ／パリティ構造を未説明のまま残す。

4.3 テスト 3 — 有限ブロック再重み付けクラス C

iid 語を \(2^{\alpha S_L}\) で再重み付けするのが最初の生成モデルに関する試みである。全状態で最小 RMSE を与えた適合は、軽く減衰させた短いブロック――\(L=3\)、\(\alpha=0.25\)、 RMSE \(0.000440978\)、JS \(0.000921815\) である。より長い、あるいはより強い再重み付けは良くなるどころか悪くなる。 \(L=6\) では選択されるのは \(\alpha = 0.0\)（再重み付けをまったく行わない）で、RMSE \(0.000642649\)。

focus state はこの過補正を直接示す。その中で最も性能の高い再重み付け（\(L=6\), \(\alpha=0.5\)）でもなお質量を過小予測する。
actual \(0.00092052\) 対予測 \(0.00029821\) は、\(\alpha=1\) まで押し進めると、モデルされた focus state 生存は \(0.00416667\) まで下がり、actual 生存 \(0.472461\) に対して大きく外れる。全体で最小 RMSE を与えた適合において、ブリッジ RMSE は \(0.000427051\)、パリティ RMSE は \(0.00262763\)。

総合すると、これらの結果は C 「再重み付けは過補正するか、生成的でない」に対応する。小さな改善はもっぱら減衰短ブロック再重み付けによるものであり、より長い未減衰の再重み付けは強すぎる補正となる。診断的には有用だが、生成器としては弱い。

要点として。短く軽く減衰させた再重み付けは集約適合を改善しうるが、より強いブロック再重み付けは、actual 分布を生成するのではなく過補正する。

4.4 テスト 4 — 最大エントロピーブロック射影クラス C

2 番目の生成モデルに関する試みは、ヒューリスティックな再重み付けを、ブロック周辺分布を合わせる近似的な正則化 IPF で置き換える。これはより単純なベースラインを上回らない。
最も性能の高い最大エントロピー適合（\(L=3\)、正則化 \(0.75\)）は RMSE \(0.000493147\)、 JS \(0.000868073\) であり、生／減衰再重み付けで得られた最小 RMSE \(0.000440978\) より悪い。

生／減衰の最小 RMSE 0.000440978 と maxent の最小 RMSE 0.000493147 を比較する棒グラフ。 — 図 1. 最小 RMSE 適合の状態質量 RMSE：最大エントロピー射影（右）は生／減衰再重み付けの最小 RMSE（左）を改善しない。低いほど良い。

正則化は、より長いブロックについてはパリティ残差を確かに減らす――正則化 \(0\) では \(L=5\) と \(L=6\) のパリティ残差は高く始まり、正則化が増えるにつれて \(L=3/L=4\) の水準へ落ちていくが、これは新しい構造が捉えられているのではなく、正則化が射影を減衰ベースラインへ引き寄せていることを反映している。

L=3,4,5,6 についてのパリティ残差 RMSE 対正則化の折れ線グラフ。L=5 と L=6 は高く始まり正則化とともに減少する。 — 図 2. パリティ残差 RMSE 対正則化、ブロック長別。より重い正則化は \(L=5,6\) の射影を、\(L=3,4\) がすでに占める低残差領域へ近づける。

focus state では、射影で最も actual に近い生存は \(0.444001\)（\(L=5\)、正則化 \(0.9\)）で、 actual 生存 \(0.472461\) に対して、この 1 状態では近いものの、重い正則化のもとで得られており、全体適合の改善を伴っていない。

L=3,4,5,6 についての focus state 予測生存対正則化の折れ線グラフ。 — 図 3. focus state 予測生存対正則化、ブロック長別。単一セル適合は actual 値の近くまで持っていけるが、それは全体 RMSE の改善を伴わない正則化のもとでのみである。

したがってテスト 4 もまた C ――「maxent は生／減衰と変わらない」に該当する。これは全語にわたる完全・厳密な IPF 解ではなく近似射影である、という明示的な注意を伴う。

要点。射影は重い正則化のもとで focus state を適合できるが、全体の状態質量適合は改善しない。

4.5 4 つの判定の要約

表 4.3 — テストごとの主要数値と自己分類。
テスト	種別	主要数値	自己分類
1 · 異常 B3/B4	診断的	+0.0236 AUC；focus AUC 0.719	B
2 · 長さくりこみ	診断的	+スコア AUC 0.5363→0.5643	B
3 · 再重み付け	生成的	最小 RMSE 0.000440978（L3, α0.25）	C
4 · maxent 射影	生成的	最小 RMSE 0.000493147（より悪い）	C

診断テストは B に、生成テストは C に分類される。次節ではこれら 4 つの判定を総合して考察し、記号が正確に何を意味するのかを述べる。

4.6 補助解析：actual−iid の Δ 地図

本節は補助的な記述統計として、各座標における actual と iid の質量差

\[ \Delta(\cdot) \;=\; \mu_{\text{actual}}(\cdot) \;-\; \mu_{\text{iid}}(\cdot) \]

を投影した結果を報告する。これは新しい生成モデルではなく、テスト 1–4 が検出した不一致がどの座標で局在するかを補足するための診断量である。Δ を state、 prefix シリンダー、transition、boundary／remaining_K の各座標へ射影した。

state 座標では、bridge_cluster ＋ x_K_window ＋ parity の組が Δ を最もよく局在させた。一方、prefix シリンダーでは初期 prefix から差は見えるものの、ウィンドウ長を伸ばしても単一の prefix には集中しない。transition／prefix 成長で見ても、単一の edge や branch に Δ が集約されることはなかった。

boundary 座標では remaining_K が最も鋭く Δ を局在させ、最大の \(|\Delta|\) は remaining_K=32–63 に現れる。remaining_K=64–95、96–127 にも薄さは続くが、最大の絶対質量差は 32–63 に残る（96–127 は比が最も低い一方、質量と L1 share は小さい）。

表 4.4 — remaining_K 境界距離における質量差（ALL、長語かつ最終状態が定義できる語）。\(\Delta = \) actual − iid。
remaining_K	actual	iid	\(\Delta\)	比	L1 share
32–63	1.959532	2.139743	−0.180211	0.916	38.57%
64–95	0.266435	0.341662	−0.075227	0.780	16.10%
96–127	0.018644	0.031704	−0.013059	0.588	2.80%

主要な帯（32–63、64–95、96–127）では mass delta が negative である一方、下流への条件付き遷移 delta が positive になる場合がある。たとえば 64-95 -> 32-63 は質量差 \(-0.006059\) だが条件付き delta は \(+0.007861\)、 32-63 -> 16-31 は質量差 \(-0.009262\) だが条件付き delta は \(+0.004618\) である。
これは、actual がその帯にもつ質量は薄い一方で、その帯にいる条件のもとで下流へ進む比率は必ずしも弱くない、という分離を示す。したがって局所遷移の単純な不調ではなく、remaining_K chain 上の質量配置が actual と iid で異なる、という観察として読むのが自然である。

表 4.5 — Δ の座標別の見え方（補助解析）。
座標	局在の鋭さ	主な所見
block score	―	診断信号はあるが生成は再現しない（§4.1–4.4）
state	中〜高	bridge_cluster ＋ x_K_window ＋ parity で局在
prefix	低	初期から見えるが単一 prefix に集中しない
transition	低	単一 edge／branch に集約されない
boundary remaining_K	高	最大 \(\|\Delta\|\) は 32–63（最大観測点）

この補助解析の範囲 Δ 地図は記述統計である。新しいコラッツ機構を同定するものではなく、remaining_K が不一致を生み出すと立証するものでもない。remaining_K=32–63 は、有限整数の脱出語と iid 参照の差が最も大きく観測された帯（最大観測点）として読むべきであり、不一致の発生源として解釈しない。

要点。残差は単一の prefix や transition には集中せず、state 座標と remaining_K 境界距離でより鮮明に局在する。最大観測点は remaining_K=32–63 である。

テストごとの結果

4.1 テスト 1 — ブロック異常スコ（B3/B4） クラス B

4.2 テスト 2 — ブロック長くりこみ（L = 3…6） クラス B