Rayを釣りたくて III

フロリダ沖に降り注ぐ栄光の光の中で舞い踊るトビエイを釣り上げる事を望むブログ。スポーツナビ+閉鎖に伴ってIIIとなって引っ越しました。旧記事で画像がほしい記事があればコメントいただければ、気づき次第対応します。

【連載 第2回】打者の運と実力を探る 第一章 ~BABIPと正規分布~

 前回、一旦余談挟むと言いましたが、大切な内容を忘れていましたので、第一章の続きを続けます。

[第5項:実力の分布は正規分布か]

 前項ではBABIPは正規分布ではなく、実力を示している(と本連載で定めている)xBABIPによって高くなりやすかったり、低くなりやすかったりしている、つまり平均の違うサンプルが混じっているため、正しくは正規分布では無いと結論づけました。一方で、この平均値の分布=xBABIPの分布が正規分布である可能性がある、とも述べています。

 本項では実際にxBABIPの分布を調べ、正規分布に近い形であるかどうかを確認してみます。

□01

 まずは度数分布表。本来はいけないことではありますが、両端は.321以上、.290以下ということでまとめてしまっております。

□02

 グラフにすると正規分布に近い形になりました。xBABIP.290以下のサンプル数が厚すぎる様な気もしないでもないですが、それに対応するxBABIP.321~.320とxBABIP.321以上を足すと360サンプルで、こちらは307サンプル。1800サンプル程度にしては悪くないと考えられます。また、xBABIPが低い選手は成績も悪くなりがちですから、必然的に打席数を多く稼げないと考えると妥当な数とも言えそうです。以前にも説明しましたが、このサンプル数はすべて規定打席をクリアした選手の分だけです。

 この結果から、打者の実力ともいえるxBABIPも正規分布しているのではないかと考えられます。そのため、BABIPが運の要素も含みながらも、正規分布に近い形をとることはあり得るのではないでしょうか。

 また、第4項において、.301~.310にBABIPの平均値があるようなグラフになっていました。本稿のxBABIPのグラフと比較するとこれまた同じように.301~.310に最大となるようなグラフになっていることが分かります。ただし、度数がxBABIPが440に対してBABIPが265となっておりますし、見た感じも分散はBABIPの方が大きくなっていると言えると思います。申し訳ないですが、ここは計算していません。

[第6項:運の分布は正規分布か]

 前項では実力を示していると私が考えているxBABIPの分布がほぼ正規分布であることを確認しました。本稿では続いて運の要素が正規分布しているかどうかも確認していきます。さて、運はどのように計ったら良いでしょうか。

 弊ブログではずっと使っているのですが、運をそのまま英訳してLuckと呼んでいます。様々なパターンのLuckを使っているのですが、本連載では以下の式で統一します。

(打者) Luck=BABIP-xBABIP

(参考:投手) Luck=xBABIP-BABIP

 記録したBABIPがxBABIPとどれくらいの差があるかを引き算で求めただけの、非常に簡単な式となっています。当然、一般的な運とは違い、現時点ではノイズ的にとられてしまっている様々な要素(走力や球場サイズ、守備力等)が全て混ざっていることを確認してください。この指標はプラスの数字が幸運を、マイナスの数字は不運を表しています。イメージ通りになるように投打で逆の式にしているのは作成者(私めにございます)のちょっとした工夫です。

 全サンプルに対してこの指標を計算し、分布を調べたところ、以下のとおりとなりました。

□03

 今回は横長の度数分布表です。縦横を一定にしなさいとお叱りを受けそうです。

□04

 見ればわかるとおり、BABIPやxBABIPのように綺麗なグラフにはなりませんでした。これでもそれなりに正規分布っぽい感じはしますが、様々な要素が入ってしまっているのでしょう。ただし、プラスのサンプル数(0.00を含む)が925人に対してマイナスが917人ですから、バランスは悪い様には見えません。前項でも書いた通り、BABIPとxBABIPの平均値の差は3毛もありませんから、大きな問題にはならないでしょう。

 実際のグラフは-0.11~-0.20がちょっと多くて、逆に-0.21~0.30が少ない様に見えるのですがいかがでしょうか。0.00~0.10が多いのは0.00を含んでやや幅が広い分仕方がないと言えるのではないかと考えられます。

 そのように考えると、運についても概ね正規分布であると言っても間違いはないのではないかと思います。

[第7項:運と正規分布]

 前項・前々項・前々々項において結果、BABIP、xBABIP、Luckが正規分布かどうかを確認しました。検定こそしていませんが、おそらく正規分布かそれに近い分布であることが分かりました。

 各種指標でそれぞれが正規分布しておりました。その中でxBABIPとLuckの2つでBABIPが構成されていると本連載ではしておりますので、xBABIPも正規分布かつLuckも正規分布ならばBABIPも正規分布になることはほぼ必然と言えるでしょう。ただし、BABIPが完全に運では無いということも理解していただければと思います。

 このようにBABIPが正規分布しているために、当初はほとんどが運だと思われていた指標ですが、実際には運だけではなく、実力もかかわっていることがわかりました。さらには実力の分布も正規分布に近く、また運も当然のように正規分布するため、結果的にBABIPが正規分布したことが分かりました。

 では次章ではこれを使って各論に移りたいと思いますが、その前に一つ余談を挟む予定です。今度こそは。