Rayを釣りたくて III

フロリダ沖に降り注ぐ栄光の光の中で舞い踊るトビエイを釣り上げる事を望むブログ。スポーツナビ+閉鎖に伴ってIIIとなって引っ越しました。旧記事で画像がほしい記事があればコメントいただければ、気づき次第対応します。

確かにBOSのプライスの防御率は向上する可能性が極めて高い。だがしかし。

 まずはこの記事を読んで欲しいと思います。[心配ご無用!BOSプライス、FIPはキャリアハイ]

 同じくスポナビ+のブログ「MLB 戦いの原理を求めて」さんの記事になります。これについて私も色々思うところがある訳で、少し色々数字を用いて考えてみようと思います。この記事にコメントをつけようと思ったのですが、説明しようとするとあまりにも長くなりそうだったので、どうせならと私の方で一本の記事にしてしまったものです。

 まずはいつものように?Priceのここまでの成績を見てみましょう。今回はダイジェスト版で。

□01

 9試合に先発して55.1回を投げ6勝1敗、70奪三振に対して14四球です。

□02

 んでBABIPは悪く.352、HR/FBは標準的な10.4%、そしてLOB%が59.7%とかなり悪い数字が出ています。ここからが上で紹介した記事でも問題にしていた点ですが、防御率が5.53に対して、FIP2.69、xFIP2.88となっていて、ERAとFIPの差が実に2.84もあるのです。

 記事ではERAとFIPの差は0.1-0.2程度の差に収まるため、今年のプライスはここまで悪い防御率を維持することはありえないとしています。

 確かにこのFIPとERAの差は見もので、凄い数字が出ています。(TB的にはこの防御率で6勝1敗ってのが羨ましいですが。ね、OdorizziとSmyly。Mooreが6勝1敗みたいなもんだもん。)

 この結論自体は妥当性が高いと私はみていて、確かにこの数字を維持することはPriceが全力で投げている限り、極めて困難な内容だと思います。ここまではいいんですが、問題はその次に有ります。

 一つ目。

 この記事で氏は2,000イニング以上を投げている投手6名のFIPとERAを見せて、ERAとFIPの差(E-F)は0.1-0.2前後に収束すると言っています。一方で、Tom GlavineがFIP3.95に対してERA3.54だったことについても言及し、氏は例外的な選手であるから彼を取り上げて、ERAとFIPの乖離があることを指摘するのは恣意的であり、この6名の動きが正しいのだと読めます。

 では実際にはどうなのか、調べてみないとわからないので、「Rayを釣りたくて」管理人seriseriが総力を挙げて(大したことはしてない。スペックは低いんで)調べてみました。じゃじゃん。

□03

□04

□05

□06

□07

□08

 1901年から2015年までで通算2,000イニング以上投げた投手に限定して調べてみました。総勢376名おり、7名ではないことを先に申し伝えておきます。左が観測されたE-Fで、右が人数です。黄色く着色されているのが、標準偏差1つ以内(偏差値40.00-59.99)、オレンジが2つ以内(偏差値30台と60台)、赤が3つ以内(20台と70台)となっております。

 黄色は全部で260名、全体の69.1%、標準偏差2つ以内が94.4%、3つ以内が100%でした。理論値では1つ以内67.8%、2つ以内95.3%、3つ以内99.7%と言うことでしたから、ほぼ理論値通りの値が出ています。このことから、E-Fは確かに平均に回帰する動きを見せる、正規分布に近い分布なのだということが分かります。

□09

 グラフにすると確かに正規分布っぽいですね(0.01刻みなのでちょっとぎざぎざですが)。E-Fは確かに平均に回帰する(平均に集まりやすい)性質を持った分布ではあるのですが、2,000IP程度では必ずしも0.1-0.2前後には収束しません。私が調べた結果、2,000IP以上で0.2以内に収まるのはわずか245名、65.2%に過ぎず、1/3以上の選手は0.2以上の乖離をしているのです。また、Glavineが0.41の差があることから、彼が例外的な選手であるとしていましたが、私が調べたら0.41よりも大きなE-Fの差があった選手は総勢39名、実に10.3%、10人に1人は氏の言う「例外的な投手」だったのです。これを例外とするのは相当に困難ではないでしょうか。クラスに4人も例外がいることになります。ちなみに偏差値で言うと71以上あるいは33.6以下の人達ですね。関東の大学だと早慶上智東大一橋

当たりの学生はみんなまとめて例外事項で、考えに入れてはいけない人達扱いです。それはさすがにやりすぎでしょう。

 何が言えるかと言うと、確かにE-Fは平均に向かって回帰する性質を持ちますが、0.2以上乖離する選手はいくらでもいますし、それをすべて例外事項とするにはあまりにも多い割合です。むしろ単に正規分布していて、平均近くだからそういう選手が多い傾向にあるくらいしか言えないのではないかと思います。氏こそが「むしろ逆に恣意的」に誤った(ように見える)情報を伝えています。

 なお、捕捉しますが、2,000イニング以上投げた投手のE-Fの平均は大体-0.05位。まぁこれくらい良くないと、2,000イニングも投げさせてもらえないでしょう。ここを平均に正規分布しています。

 また、リーグのE-Fは0.00になります。これはFIPの式の構造からそうなります。だからと言って各投手のE-Fが0.00になる訳ではありません。平均に回帰する動きがあるくらいのもので、必ず平均に一致する訳ではありません。

 次に今シーズンとしてみた時のE-Fについて言及していますが、これも確かにサンプル数が集まるにつれて、平均に回帰する性質があると考えることが出来ます。なので、確かに極端な数字を記録する可能性は非常に低いです。が、だからといって、Priceの成績が0.1-0.2に収まるかというと、そこはわかりません。

 仮に正規分布しているものと仮定しても、単年だと投げてもせいぜい400IP(昔を含んでいるからね)。2,000IPよりはずっとサンプルは小さいですから、より分散は大きく、極端な例が発生し得ると考えられます。では実際はどうなのか、観てみましょう。

□10

□11

□12

□13

□14

□15

□16

□17

 見方は先程と一緒で、白は偏差値80以上もしくは20未満の非常に極端な例です。これを見ると先程より人数は多く8534名おりました。黄色枠で69.3%(理論値67.8%)、黄色+オレンジで95.4%(理論値95.3%)、3つ以内で99.58%(理論値99.7%)ですから、こちらも正規分布しているように思えます。

□18

 グラフにしてもその傾向は見てとれますね。しかし、やはりサンプル数が少ない集団ですから分散はより大きなものになっています(2,000IP以上だと0.22で、規定投球回以上だと0.52)。その結果、より極端な成績を残しやすいことが分かります。ちなみに氏の言っていた0.2以内の選手は2,607名でわずか30.5%、0.4以上の乖離がある選手は4,800名、実に43.8%にも及びました。つまり、これくらいの乖離は当然のように発生しても不思議ではないのです。

 さて、ここでもう一度Priceの成績に立ち戻ってみます。彼の乖離は現状2.84です。規定投球回以上の選手では最高の乖離は2.07でしたので、Priceが規定投球回以上投げた場合、これを維持するのはかなり難しいでしょう。ちなみに偏差値にすると106.5ですから、1000万分の1以下の確率でしか発生し得ません。逆にそれを発生させたら凄いですよね。

 もし(駄目だけど)賭けをしても良いのなら、私はコレよりもE-Fの差が小さくなる方に賭けます。倍率が良いので、維持する方に1円くらいは賭けても良いかな、とか思いますが(笑)

 Priceの成績を云々と語り、しかもそれを統計を用いて説明するのであれば、最低でもこれくらいは書かないと氏の説明している内容をわかるように(少なくとも統計学的な知見として)客観的には説明できないでしょう。それであっても、PriceがこのERAを維持する可能性は有りますし、近似はしますが、そのブレは氏が考えているよりも大きなものになるでしょう。

 ざっとこのような感じになります。「MLB 戦いの原理を求めて」さんのブログは結論は正しいと私も同意できますが、それに至るプロセスがあまりにも稚拙であり、むしろ読者にミスリードを与える、事実とは違う恣意的な数字を見せております。これは統計を扱ってブログを書く上ではかなり危険で、絶対にやってはいけない行為です。特にスポナビ+のように多くの読者がいる場においては、です。統計学的な文章であれば重大な違反です。このような記事を書かない様に私も十分に気をつけなくては、とも思います。自らの思い(主観)を書くブログならば、それを明記しているのであれば問題は全くないですが、そうではない記事としか読めない氏の記事においては、より客観的な内容とすべきでしょう。明らかに欠陥記事だと思いますので、矢も楯もたまらず書くのに至った次第です。簡単にではございますが、今日はここまで。

 ちなみに今思いましたけど、0.2以下の根拠にFangraphsの記事を挙げられてましたが、おそらくこれは2,000IP以上の投手の標準偏差1つ以内(0.22)を誤認したものなのではないでしょうか。元記事に当たった訳ではないですが。思っただけね。英語は誤読もしちゃいやすいし。

☆本日のおまけ

 ファンタジーは相変わらず低調です。一応ここ2週間のMVPです。

打:42打数11安打5本塁打13打点 OPS1.086のMatt Carpenter

投:17回24奪三振 防御率0.53 WHIP0.47 2勝2QSのKershaw(また)

 もう投げ出したいです。。。あまりにもアレで。