Rayを釣りたくて III

フロリダ沖に降り注ぐ栄光の光の中で舞い踊るトビエイを釣り上げる事を望むブログ。スポーツナビ+閉鎖に伴ってIIIとなって引っ越しました。旧記事で画像がほしい記事があればコメントいただければ、気づき次第対応します。

【連載 第12回】打者の運と実力を探る ~それでも実力である~

 本稿は連載をしているひとつながりの記事です。 過去記事についてはリンク先からご確認ください。

[第16項:それでも実力である]

 一先ず、これまでのまとめをします。本連載でここまでわかったことは以下のとおりです。

・BABIPは確かに正規分布の様な形の分布をしている。

・BABIPはxBABIPに引きずられて上下する。

・このことからxBABIPと運の複合的な要素でBABIPは成り立っている。

・BABIPとxBABIPの差で見たLuckについて、このLuckを維持する選手がいる。

・Luckの維持とxBABIPは無関係である。

・その他スタッツとLuckについては相関が無い。xBABIPとも相関は無い。

・球場によってはLuckが高く/低く出やすい球場がある。ただし、その効果はかなり限定的である。

・結果的に依然としてLuckを左右する要素はわかっていない。

 本稿では今後、xBABIPとBABIPの差であるLuck、これが真に運だけなのか、それとも実力を示しているのかを確認します。今回は統計学的にxBABIPに対するBABIPの発生確率を調べてみたいと思います。これが極々一般的な値をとればxBABIPに対して正しいBABIPを発生させていることにもつながりますし、逆に極端な値をとればそれは実力でLuckを左右している証左になります。

 試行回数をBABIPの基になる打席数(AB-HR-SO+SF)、成功数を安打数(H-HR)とし、成功率がxBABIPと仮定して計算を行います。最終的にxBABIPから考えた、実際の安打数以上の安打数を出せる確率を求めます。ここで求められた数字が極端であればあるほど、実力でLuckをコントロールし得ることを示しています。例えば実際に記録した安打数を上回る可能性が0.1%もない打者が複数人もいた場合、それは明らかにおかしいことが分かります。

 統計学的なことを言うとベルヌーイ試行が云々と言う話になりますが、今はexcelという非常に強い味方がおり、とても手計算ではできないレベルの計算を一瞬にしてやってのけられますので、彼を使っていきます。

 この場合はBINOMDISTという関数を使用することで、簡単に求められます。

 では早速見ていきましょう。今回の対象は02年から14年の間に3,000打席以上の選手です。表の見方ですが、左から名前、期間中のBABIP、同じくxBABIP、同Luckまでは問題ないでしょう。nはBABIP有効打席数、kは同有効安打数となります。①からが結果で①が実際の安打数以下になる確率、①´がそれをパーセント表示したもの、②が逆にそれ以上の安打を打てる確率、②´がそのパーセント表示です。

 順番はLuckの高い選手から並べてあります。見ればわかりますが、凄まじい数字がならんでおります。Hollidayの99.999995%をはじめとして99.9%以上が実に275名中15名もおります。統計学的には1,000人に一人の運を持つ選手が5.5%もおります。一方で0.1%以下(小数点2位四捨五入)の選手も20名、こちらも1,000人に一人の運を持つ選手が7.3%もいるのです。最も幸運な男の栄誉に授かったのはMatt Hollidayで同じことを2,000万回やって1度というレベルの幸運でした。続いてMi. Cabreraが300万回に1度、ほぼ同じような確率でBraun。イチローも50万回に1度という確率です。不運の方に目を向けてみるとC. Izturisが2,000万回に1度レベルの不運、さらにRollinsが40万回に1度、Schneiderが2万回に1度の不運でした。

 たった275サンプルでこれほどまでに万の単位でしか発生しえない幸運あるいは不運が多発することははっきり言ってあり得ないです。ちなみに麻雀牌136枚から無作為に14枚選んで形を作れる天和が発生確率33万回に1度ですから、イチローの幸運よりも発生確率が低く、大体Jeterの発生確率くらいで、彼は全体の8位です。275人が麻雀やって8人が天和出すくらいだといえばそのあり得ない形なのをわかるでしょうか。下位二人もそれと同等以上の不運を発生させていますから、かなり異常な状況であることがわかります。

 このことからわかることは明らかにxBABIPに関わらず、Luckを変動させられるということです。Luckは運だけではなく実力が絡んでいる証拠です。またxBABIPがまだまだ精度が悪い印象もあります。ここの精度の上昇も必要だとは思います。

 サンプル数の問題もあるので、サンプル数を増やしたり減らしたりしてみましょう。まずは6,000打席以上の確率です。

 これだと99.9%以上が44名中5名、0.1%以下が4名とむしろ極端な成績の選手は増えることになりました。これはサンプル数が上がることで、より精度が向上しているからだといえます。

 続いて単年度の成績を見ます。代表として2014年をピックアップしました。

こちらは146名中99.9%以上、あるいは0.1%以下がそれぞれ1名と数は減りました。単年度だとより運の要素が強く出ることがわかります。そのため、やはり単年度を見る程度ではまだまだ信頼度が足りていません。

[第17項:だから実力である]

 上記のように、サンプル数が少ない場合ははっきりとは出てきませんが、サンプル数を増やせば増やすほど、明らかに統計学的には異常といえる値が多く出てきます。これにより実力でLuckの数値を上下動させることが可能だとわかりました。

 一方で、その実力の有無を見ることは相変わらず難しく、MVP受賞者であるRollinsですら下位にいますから、単年度の成績の予想にもつながらないといえます。今後の精査が必要とされるところです。xBABIPの改良も必要になるでしょう。とはいえRCくらいの手間で計算できる簡易な式になることも同時に望まれます。

 というところで今日はここまでとします。