第98回センバツ優勝校の感情を排した予想

高校野球データ分析

今年のセンバツ、本命は本当に存在するのでしょうか

今年のセンバツは「混戦」と言われています。
突出した絶対王者がいない。どこが勝ってもおかしくない。そんな声も多く聞こえてきます。

しかし、「混戦」という言葉は便利な一方で、根拠が曖昧になりがちです。

そこで本記事では、主観的な評価をいったん横に置きます。

エースの完成度も語りません。
打線の破壊力も比較しません。
伝統や勢いも考慮しません。
そして抽選前ですので、組み合わせも考えません。

使うのは、秋季大会の実績を基に算出した独自のS値だけです。

もちろん、数値が未来を保証するわけではありません。
しかし数値は「立ち位置」を示します。

本記事の目的は、優勝校を断言することではありません。

S値モデルが示す「優勝確率帯」の中心に、どの学校が位置しているのか。

それを、誰が読んでも追える形で提示することです。

そして大会後には必ず検証します。
予想は出して終わりではないからです。

S値とは何か

S値は、秋季大会成績を基礎に、地区競争度などを補正した指標です。

単なる順位ではありません。
単なる勝敗数でもありません。

主に以下を反映しています。

  • 地区大会順位

  • 地区強度

  • 神宮大会補正

  • 地区レベル補正

センバツは秋大会の実績を基礎に選考される大会です。
そのため、秋の結果を定量化するS値は合理的なアプローチだと考えています。

歴代優勝校のS値分布

まず、過去の優勝校がどの水準にあったのかを確認します。

第72回~第97回大会の優勝校S値の統計値は次の通りです。

  • 平均:3.372

  • 標準偏差:1.011739

正規分布を仮定すると、優勝校が最も多く現れる中心帯(±1σ)は

3.372±1.0117393.372

すなわち、

2.36 ~ 4.38

となります。

これは「優勝可能性の足切りライン」ではありません。
あくまで「優勝が最も出やすい中心帯」です。

この帯の外側から優勝が出ることも理論上はありますが、確率的には低くなります。

今大会のS値分布

次に、今大会(第98回)の出場校S値分布を確認します。

統計値は以下の通りです。

  • 平均 μₜ = 2.572

  • 標準偏差 σₜ = 0.965

  • 歪度 Sk = 0.1134

歪度がほぼ0に近いため、分布は概ね対称です。
特定の学校が極端に突出している年ではありません。

ヒストグラムを見ると、2.0~3.0帯に最も集中しています。
4.0以上は少数です。

全体としては整った分布といえます。

母集団の違いについて

ここで一つ整理しておきます。

歴代優勝校平均は3.372です。
今大会出場校平均は2.572です。

一見すると、「今年は水準が低い」と言いたくなります。

しかしこの比較は適切ではありません。

  • 歴代優勝校平均:各大会の“上位1校のみ”の集合

  • 今大会平均:出場校“全体”の集合

母集団が異なるため、単純比較はできません。

本来、水準比較を行うなら、過去大会の「全出場校S値分布」も同様に算出し、同じ母集団同士で比較する必要があります。

本記事はそこまでは行いません。

ここではあくまで、

今大会の中で、どの学校がどれだけ抜けているのか

を見ることに集中します。

Z値による相対評価

S値は絶対値です。
しかし同じ3.3でも、平均との差がどれくらいあるかで意味が変わります。

そこで、今大会内での相対的位置を示す Z値 を算出します。

Z = (X−2.572)/ 0.965

Z値の意味は単純です。

  • Z = +1 → 平均より標準偏差1個分上

  • Z = 0 → ちょうど平均

  • Z = -1 → 平均より標準偏差1個分下

プロ野球で言えば、リーグ平均との差を見る感覚に近いものです。

具体例:山梨学院の場合

山梨学院のS値は4.4です。

今大会平均は2.572ですから、

差は

4.4 − 2.572 = 1.828

となります。

これを標準偏差0.965で割ると、

1.828 ÷ 0.965 ≒ 1.89

となります。

つまり、

山梨学院は「今大会平均より標準偏差約1.9個分上に位置する」

という意味になります。

Z値の解釈

Z値は次のように解釈できます。

  • Z = 0
    → ちょうど大会平均と同じ水準

  • Z = +1
    → 平均より標準偏差1個分上(上位約16%圏)

  • Z = +2
    → 平均より標準偏差2個分上(かなり突出)

  • Z = −1
    → 平均より標準偏差1個分下

このように、Z値は

「平均との差の大きさを、共通の物差しで表したもの」

と考えると分かりやすいです。

なぜZ値が必要なのか

S値そのものでも序列は分かります。

しかし、S値だけでは

「どれくらい抜けているのか」

が直感的に分かりません。

例えば、

  • S値3.3とS値2.9の差は0.4

  • S値4.4とS値4.0の差も0.4

差は同じ0.4でも、
大会全体のばらつきの中での意味は異なります。

Z値に変換すると、

その差が「標準偏差何個分か」で表現されるため、
大会内での突出度が明確になります。

歴代優勝分布からの距離(Zₚ)

次に、歴代優勝分布から見た距離を測ります。

Zₚ = (Xー3.372)/ 1.011739

Zₚが0に近いほど、歴代優勝帯の中心に近いことを意味します。

  • Zₚ ≈ 0 → 優勝帯の中心

  • Zₚ ≈ -1 → 優勝帯下限付近(2.36)

  • Zₚ ≈ -2以下 → 例外領域

Zₚは全校に算出します。
2.36未満を最初から除外することはしません。

中心帯の外から優勝が出る可能性も理論上はあるからです。ただし確率的には低くなります。

全校一覧と帯による整理

ここで、全32校の

  • S値

  • Z値(今大会内)

  • Zₚ値(歴代優勝分布基準)

を一覧にします。

次に、歴代優勝中心帯(2.36~4.38)に該当する学校を整理します。

この帯に入る学校は、統計的に最も優勝が出やすいゾーンに位置しています。

この表では、S値2.4以上の学校が概ねこの帯に含まれます。

一方、S値2.3以下の学校は中心帯の外側となります。
優勝可能性がゼロではありませんが、例外寄りと位置づけられます。

純S値モデルの結論

ここまで、今大会内での相対位置(Z値)と、歴代優勝分布からの距離(Zₚ)という二つの軸で整理してきました。

純S値モデルにおいて重視するのは、

  1. 今大会内でどれだけ抜けているか

  2. 歴代優勝確率帯から大きく外れていないか

この二条件です。

まず、山梨学院はS値4.4、Z値1.894と、今大会内では明確に最上位に位置しています。
一方で、歴代優勝分布の中心帯(2.36~4.38)をわずかに上回っており、Zₚは約+1σ付近にあります。

統計的には中心帯のど真ん中ではなく、準中心帯に位置する学校と言えます。

したがって、純S値モデル上、

山梨学院は最有力候補の一角であるが、絶対的本命と断定する位置ではない

と整理するのが妥当です。

一方で、歴代優勝中心帯の内部に位置し、かつ今大会内でも上位にいる学校は、分布上より安定したポジションにあります。

純S値モデルとしては、

  • 今大会内で突出している山梨学院

  • 歴代優勝中心帯内で上位にいる神戸国際大付九州国際大付

この両者を「優勝確率帯の中心群」として位置づけます。

抽選前の純粋な数値評価としては、以上が結論となります。

それでも外れる可能性

数値は万能ではありません。

  • 組み合わせ

  • 短期決戦の分散

  • 投手の急成長

  • 一試合の事故

これらによって、中心帯の外側から優勝が出る可能性は理論上あります。

ただし、確率的には低い。
本記事はその確率の高低を示しているに過ぎません。

まとめ

本記事では、純粋にS値のみを用いて優勝校を推定しました。

歴代優勝分布との距離、今大会内での相対位置、その両方を基準に整理しています。

抽選後は、トーナメント構造を織り込んだ再推定を行います。

そして大会後には必ず検証します。

予想とは、
仮説を提示し、
結果を受け止め、
次に活かす行為です。

本稿はその第一歩です。

コメント

タイトルとURLをコピーしました