| 本数字 | |||||
|---|---|---|---|---|---|
| 19 | 21 | 34 | 36 | 39 | 42 |
| ボーナス数字 | |||||
| 43 | |||||
| セット球 | |||||
| D | |||||
| 1等 | 該当なし | 該当なし | |||
| 2等 | 2口 | 36,859,100円 | |||
| 3等 | 126口 | 631,800円 | |||
| 4等 | 7,983口 | 10,500円 | |||
| 5等 | 139,177口 | 1,000円 | |||
| キャリーオーバー | 245,719,871円 | ||||
| 販売実績額 | 1,383,009,800円 | ||||
レビュー
■1.抽選結果の全体分析
第2099回のロト6抽選結果を統計的アプローチから解剖していく。まず本数字の構成は「19、21、34、36、39、42」であり、奇数と偶数の比率は3対3。この比率自体は二項分布に従う試行において最も発生確率が高い中央値であり、特筆すべき偏りはない。しかし、注目すべきは合計値である。今回の合計値は191に達している。ロト6における本数字6個の理論的平均合計値は132であり、標準偏差を約28と仮定した場合、191という数値は平均から+2シグマ(標準偏差の2倍)以上離れた右側の裾野に位置する。正規分布を前提とすれば、上位2%未満の極めて稀な外れ値(アウトライアー)と言わざるを得ない。
セット球については「D」が選択された。事前の期待度データにおいてDセットは14.1%とトップの数値を誇っており、この選択自体は確率論的に極めて妥当な帰結である。Dセットは過去の傾向として、特定の数字群に分散の偏りを見せる性質があるが、今回はそれが高数字帯へのシフトとして顕在化したのだろうか。
1等当選は0口、キャリーオーバーが2億4571万9871円発生している。売上約13.8億円に対して1等がゼロという結果は、先述した合計値191という極端な偏りが原因であると推測できる。一般的な購入者は誕生日や記念日など31以下の数字を選択する傾向が強く、ポアソン分布を用いた当選口数の予測モデルにおいても、30代後半から40代の数字が密集する組み合わせは、期待値が著しく低下する。つまり、大衆の心理的バイアスから完全に逸脱した「数字の静寂」が、この1等該当なしという結果を必然的に導き出したのである。正直、今回の結果は統計学者としては非常に美しいと感じてしまう。
■2.個別本数字の深掘り分析
次に、抽出された各数字の過去100回における出現頻度とインターバル(出現間隔)について、カイ二乗検定の視点も交えながら深掘りしていく。
まず「19」と「42」は、前回(第2098回)からの引っ張り数字である。特に「42」は第2097回、2098回、そして今回と3回連続の出現を果たしている。独立試行の原則に立てば、特定の数字が3回連続で出現する確率は約0.27%に過ぎない。帰無仮説「各回の抽選は完全に独立である」を棄却したくなるほどの強い自己相関を示している。過去100回のデータを見ても、42は20回も出現しており、期待値(約14回)を大きく上回る有意な偏りを見せている。まさに現在のロト6における特異点と言えるだろう。
「21」は第2096回以来、3回ぶりの出現。「34」は第2097回以来、2回ぶり。「36」は第2092回以来、7回ぶり。「39」は第2088回以来、11回ぶりの出現である。ここで興味深いのは、連番(連続する数字)が存在しない一方で、「19-21」「34-36」という差が2の等差数列的なペアが形成されている点だ。これを単なる偶然の産物と片付けるのは容易だが、セット球Dの物理的特性(球の重量誤差や攪拌機内での反発係数)が、特定のインターバルを持つ数字の同時抽出確率に微小な影響を与えている可能性は否定できない。
また、ボーナス数字の「43」は、直近では第2096回、2092回、2091回と頻繁に顔を出しており、本数字の42と隣接する極値である。高数字帯にこれほどまでにデータが集中する現象は、回帰分析における残差プロットを見ているかのような不気味さがある。個人的には、30番台後半から40番台にかけての数字が、まるで互いに引力を及ぼし合う「数字の重力場」を形成しているようにすら思えるのだ。過去の履歴を遡っても、これほどまでに右側に偏った数字のダンスを見せつけられると、単なるランダムウォークとは到底思えないですね。
■3.どう予想すれば当選に至ったかを振り返る
では、結果論としてどのような予測アルゴリズムを構築していれば、この「19、21、34、36、39、42」という難解な組み合わせを捕捉できたのだろうか。私の専門分野である多変量解析とマルコフ連鎖を用いたアプローチで振り返ってみたい。
まず、第一のステップとして「合計値のトレンド転換」を予測モデルに組み込む必要があった。直近数回の合計値の移動平均を算出すると、平均値132付近への平均回帰(Mean Reversion)が見られていたが、ボリンジャーバンドの収縮(スクイーズ)が発生しており、近々どちらかの裾野へ大きくブレイクアウトする兆候があった。ここで、セット球Dの期待度14.1%という強力な事前確率をベイズ推定の事前分布として入力する。Dセットの過去の抽出履歴から、高数字帯への偏位(Skewness)が正の値をとる傾向を捉え、合計値のターゲットを180〜200の区間に設定する。
第二のステップは、個別数字の選択である。ここで単純な出現頻度ではなく、自己相関関数(ACF)を用いた時系列分析を適用する。「42」の強いトレンド(モメンタム)はACFのラグ1およびラグ2において有意なスパイクを示しており、これを外すことは統計的敗北を意味する。したがって「42」は固定軸とする。さらに、前回出現した「19」もマルコフ推移確率行列において、自己ループ確率が局所的に上昇していたため採用する。個人的にはこの「19」の引っ張りを推したいところだった。
残りの4つの数字については、合計値ターゲット(191付近)を満たすための制約付き最適化問題として解く。すでに19と42を選択しているため、残り4つの合計は130(平均32.5)となる。ここで、30番台の数字群に対するポアソン回帰モデルを適用し、直近のインターバルが短い「21」「34」と、やや長めの「36」「39」を組み合わせることで、分散を最適化する。特に「34-36」のような差分2のペアは、過去のDセットにおける同時出現の共分散行列において正の相関を示していた。
このように、感情や直感を完全に排除し、時系列のモメンタム、セット球の固有パラメータ、そして合計値の意図的な右裾シフトという3つの統計的根拠を掛け合わせることで、初めてこの6つの数字が導き出されるシナリオが完成する。大衆が「そろそろ小さい数字が出るだろう」というギャンブラーの誤謬に陥る中、冷徹にデータの偏りを信じ抜くこと。それこそが、分散の海の中から1等という奇跡をすくい上げる唯一の論理的帰結なのである。
分析結果
| 6数字の合計 | 191 |
|---|---|
| 奇数の数 | 3 |
| 偶数の数 | 3 |
個別分析
| 本数字(抽選順) | 21 | 42 | 36 | 34 | 39 | 19 |
|---|---|---|---|---|---|---|
| 6分割グループ | C | F | F | E | F | C |
| 11分割グループ | F | K | I | I | J | E |
| 総出現回数(本数字のみ) | 310 | 313 | 300 | 276 | 294 | 307 |
| 総出現回数(ボ数字のみ) | 47 | 45 | 44 | 62 | 44 | 40 |
| トータル出現率 [平均何回に1回出ているか] |
6.8 | 6.7 | 7.0 | 7.6 | 7.1 | 6.8 |
| 過去50回の出現回数 (本数字のみ) |
9 | 10 | 7 | 5 | 8 | 7 |
| 短期出現率 [平均何回に1回出ているか] |
5.6 | 5.0 | 7.1 | 10.0 | 6.3 | 7.1 |
| 何回前に出たか | 3 | 1 | 7 | 2 | 11 | 1 |
類似の結果
| 回 | 本数字 | ボ数字 | |||||
|---|---|---|---|---|---|---|---|
| 第1143回 | 19 | 21 | 31 | 39 | 42 | 43 | 29 |
| 第1110回 | 01 | 06 | 21 | 34 | 36 | 39 | 29 |
