Rayを釣りたくて III

フロリダ沖に降り注ぐ栄光の光の中で舞い踊るトビエイを釣り上げる事を望むブログ。スポーツナビ+閉鎖に伴ってIIIとなって引っ越しました。旧記事で画像がほしい記事があればコメントいただければ、気づき次第対応します。

歴史学とセイバーメトリクス 日本におけるセイバーの拒否?誤解?

 セイバーと言えばノースアメリカンのF86が出てくるのは私だけか…。そっちはSabre(なぜかこのスペルだ)。個人的にはあんまりカッコいい戦闘機とは思えないんですよね。なんかぬぼーっとしてて、変に後退翼で。F-80シューティングスターの方がかっこよくないですか?もしくはグラマンF9Fパンサーとか。ちなみにF86とF9Fの初飛行が1947年。もうちょっと戦争が続いちゃってたら烈風はこの人達と戦わないといけない羽目になってましたね。。。大変。ま、P-80(F-80)も烈風も初飛行は1944年で同級生だし。一体何を書いているんだというお話。さて、本題に入りましょうか。

 私は普段こういう数字だらけ、日本国内に限ればSABR系ゴリゴリの前衛的なブログ書いていますが、実は私は大学時代の専門は歴史学でした。色々諸事情があって、経済学部に所属し、経済史と言うジャンルの中のさらにマイナーな日本経済史と言うジャンルの中のさらにマイナーな日本漁業経済史と言うジャンルを勉強していました。だから本当は歴史学と漁業の専門家なのです。で、肝心の統計学は授業でDを取ったくらいしか勉強してなかったのです(だから今勉強している)。ただ、経済学部にいながら歴史勉強したので、経済理論やら、統計を使うものやらは必修のレベルであれば学習してきたので、両構えで見れるのだと自負しています。

 ちなみに大学の卒論の結論は、漁船の動力化は漁業技術の伝播に大きく影響したよね、というもの。なんじゃそりゃ?要するに、大学時代は釣りばっかりしていて、釣りバカだったということ(笑)もはや経済の欠片も感じさせないこの経済学部OBです(笑)

 そんなバックグラウンドを持つseriseriが、ちょっくらセイバーと日本の野球の指標の議論について語ってみようという、珍しく非常にアナログな試みです(笑)

 ちなみにこれ、基本的には「主観的なもの」で、確証はありません。こうであるように見えるな、という私の意見なんだよと理解していただければ良いのかなぁと思います。

 さて、ではまず歴史学とはなんでしょうか。歴史学は過去の史料を評価・検証する過程を通して歴史の事実を追及する学問です。過去の史料、つまり「記録されたもの」を評価・検証する訳ですから、記録とは親和性の高い学問です。というか記録がないと何もできない学問でもあります。

 また、過去の史料を評価・検証する仮定では、その史料を様々な形で加工していくことになります。次々とできる新しい指標とも親和性があり、それによって、埋もれていた記録や、あまり顧みられていなかったものへの再評価がなされる事も当然の様にあり得ます。

 これを野球に当てはめてみるのは非常に簡単なことですよね。つまり野球で起こった事象を記録して残してあるスコアブックやらボックススコア等。これらを加工して、選手や戦術などを評価・検証するという行為です。野球で日常的に行われていたデータ分析というのはまさにこの歴史学そのものだと言えます。つい昨日の野球の試合の分析記事であっても、それは過去の史料を評価・検証し、事実を追及したことには相違ないのです。

 日本の野球の分析は歴史学と共に発展してきたのです(まぁアメリカもそうですが)。

 歴史学であったとしても、単にそれを勉強するのが楽しいだけではなく、それを現在に活かそうとする試みも同じように行われてきました。これも広義の歴史学の範疇と言っても差し支えは無いでしょう。歴史学を今に活かすのは、同じような過去のパターンを洗い出して、それを参考にする方法が一般的です。歴史は繰り返す、を地で行っている形です。そして野球は非常にシチュエーションが少ないスポーツでパターン化が楽なのがこれがさらに発展した理由の一つですね。例えば試合開始して、先頭打者が打席に入ります。この先頭打者の打席が終わった時点で、1死無走者、無死1塁、無死2塁、無死3塁、無死無走者で得点1-0のわずか5パターンしかない訳です。それぞれのパターンについて考えておけば良いだけですし、投球間隔は長いですから、考える時間は十分あります。そういったデータの分析がなされてきたのが歴史学的アプローチですね。

 そういう歴史学的なアプローチに対して、後発で出てきたのがいわゆるセイバーメトリクスでした。セイバーメトリクスはその選手が、その球団が、近い未来においてどんな成績が期待されるかを高い精度で予測することを一つの大きな柱に置く学問です。ですから、極端な話、ある選手が過去に何千本ヒットを打っていようが、何勝していようが、WARがいくつだろうが、はっきり言ってどうでも良いのです。そんなものはむしろ余計なバイアスをかけてしまう要因と考えます。但し、それが未来の成績を予測する上での参考となるのであれば、詳しく調べるのがスタンスです。

 この目的に対して、セイバーメトリクス統計学的なアプローチを利用することで、未来の予想を行う手法をとりました。統計学は観測されたばらつきのあるデータから、規則性あるいは不規則性を見つけ出すものです。この手法を用いて、過去のデータを解釈し、「将来の予測」を行おうとする試みでした。

 そのため、元々のデータをさらに条件を細かく設定し、あるいはもっと大きなくくりで囲って、加工して使用しました。結果的に、様々な新しい指標が生まれてくることにもなりました。これらは新しい指標が必ずしも正しいことを示しているのではなく、より精度の高い将来予測をする上でどうしても出てきてしまった副産物でもあるのです。一概にセイバーだからといって鵜呑みにしてはいけない訳ですね。

 また、セイバーメトリクスにはもう一つ大きな柱がありました。それは攻撃は得点を取る・守備は失点をさせないことが勝利への最優先事項であることから、野球のプレーを勝敗に関係するように正しく評価しなおすものでした。これは将来予測をするものと並行して進み、かなりの範囲でオーバーラップをしていますが、結局正しくプレーを評価できない限り、統計学を用いたところで、精度の高い将来予測は困難ですから、正しい評価を与えるために、得点を用いて、それに絡んだ指標がいくつもできてくることになりました。

 ただし正しくプレーを評価することと、将来予測するのに必要なこととはオーバーラップはしつつも必ずしも一致しません。ここがセイバーメトリクスの難しい面の一つでもあると思います。

 例えば、日本で代表的なセイバーな指標として扱われているWHIP。セイバーメトリクス側から作られた指標です。ですから、セイバーな指標と言われれば確かにセイバーではあります。が、これらが将来の成績予測によく使われるかというと、そうではありません。むしろ使わないが正解です。例えばWHIP。投手が1イニング当たりに許したランナーの数ですが、これってただのOBP=出塁率の投手版です。で、この投手のWHIPは過去に残した実績としては間違いない事実ですし、出塁を許さない=さっさとアウトを取れる=失点が減るですから、意味が無い訳ではありません。ですが、このWHIPが良かったからと言って、翌年のWHIPも良いとは限りません…って調べるのは面倒なので誰か調べてあげてください。で、翌年以降への参考とならないのであれば、WHIPを投手の実力として測る物差しとしては使えませんから、近年のセイバーメトリクスでは重要度はかなり薄れているのです。

 このように必ずしもセイバー=成績予測に使われる・選手の実力を示しているではないのですが、それに向けた試みの結果なのだと言えます。私もこれを以前はセイバーじゃないとちょっと突っぱねていたところはありますが、セイバーはセイバーですね。使えるかどうかはともかくとして。そこは訂正させていただきます。色々スミマセンでした。

 セイバーな指標の中でも、様々なものがあり、選手の実力で残した指標、選手の運を表した指標、両方が混在しているが、とりあえず勝敗に貢献した指標、などなど。成績予測で使われる指標と言うのはこの中の極々一部に過ぎませんね。

 さて、ここから何がわかるか。歴史学的な手法に対して、統計学的な手法を用いた二つのアプローチ。当然求めるものが違うのですから、指標も、使い方も全然違ってしかるべきです。が、それをごちゃまぜに使ってしまうことが、セイバーメトリクスへのハードルを高いものにしてしまう理由なのではないでしょうか。歴史の授業だと思っていたら、数学の授業だったようなもんですから。

 また、その指標を知っても、活用の方法すら、歴史学的なデータ分析とは違うものですから、そこも変える必要があって、だから今までと同じようなもののつもりで使っても、さっぱり要領を得ないとなってしまうのです。

 さらに、歴史学的なアプローチのままであれば、どんな史料を用いても一緒ですから、わざわざ新しいものなど使う必要が無いということになります。そのため、わざわざへんてこな式を使ってまで求めるようなセイバーメトリクスには拒否反応が出てくる人がいるのだと感じます。

 さらにわからない人、わかっている人、わかってないで使ってる人、わかってるけど使わない人、少しだけわかる人などなど、さまざまでその人たちが勝手気ままに発言を繰り返すため、余計に混乱しているのです。ここら辺、変化球の名前の混乱と似ていますね。フォーク・パームの様な握り命名の変化球とカーブ・スライダーの様な投げた結果命名の変化球。両者をごっちゃにしちゃったナックルカーブや、投げた結果なのに握り命名に変化して変な名前になった縦のスライダー等が入り混じっている様子にそっくりです。

 日本での議論では、一部のブロガーやTwitterなどで議論されている以外の野球の議論はほとんどすべてが歴史学的アプローチに基づいたものになっています。仮にセイバーメトリクス側から発見された指標を用いていたとしても基本的には過去起こったことへの評価であって、将来の予測に使われることは少ないです。あったとしても統計学的なアプローチでは無く、まぁこれくらいは出来るだろうという主観的な期待値でしかありません。それに対して、統計学的なアプローチをドヤ顔で上から目線で言い切ってしまえば、歴史学的なアプローチをしている人からすれば受け入れがたい内容ですよね。

 それをまた、いわゆる「煽る」使い方をする人がいるものだからなおさら、へんてこな話になってしまうと感じています。そういった人達ですら、まともに数字をつかった証拠を見せるというよりは、貶めたいから数字を持ってくるに近いのが愉快ではありませんね。

 日本ではライター・記者・マスコミ関係ではこのセイバーメトリクスを専門で扱う人はほとんどいませんね。いたとしても、受けない記事になると判断されて、掲載されないのかもしれません。きちんと理解して書くことは非常に難しいですから、そこら辺の問題があったり、短くまとめると書くべきことがきちんと書けなかったりもするのでしょうか。

 ところが、データ分析と銘打った記事や、データによるとみたいなのは結構あるんですよね。これが受けるんでしょうけれどもこの記事たちがまた曲者でして、データ分析と称して、勝敗と全く関係のない分析記事になっている奴が多く、それといわゆるセイバー的なものがごっちゃになってしまうとどれがどれだかわからないんですよね。例えば今作ってみた奴だけどこんな感じに。

阪神優勝確率100%!?山手線に新型車両」

「スモールボールは時代遅れ?バントをしない攻撃的2番打者の時代」

「畠山大不振でもスタメンで出続ける理由は?」

「8番鳥谷の復調はあるか」

「優勝絶望 8カード連続負け越しでの優勝チーム無し」

「相性抜群!!!ドームラン量産します!!!」

 何が何だかって感じですよね。確かに過去はそういう「ジンクス」はあったかもしれないけれども全く勝敗と関係ないデータもあれば、なんかそれっぽいのもあれば、相関はなくは無いかもしれないが、というものもあります。そういうたまたまのものと一緒にされてしまうとセイバーはわかりにくく、受け入れられにくいのだと感じます。これもやはりデータ分析ではあるのですが、アプローチが歴史学的アプローチであることから発生しているもので、今後実際にどうなろうが関係ないし、相手の癖を見つけるみたいなのとなんら変わらないレベルの物でもあるのです。

 こういうごちゃごちゃな混乱がセイバーがきちんと理解されないところの一つなのかなぁと思った次第です。

 ついでに…Statcastの導入など、より細かい分析が可能になってきているここ最近のMLBセイバーメトリクスな人々。この結果、ひょっとすると統計学的アプローチから逸れた、あるいは統計学的アプローチ以外のアプローチも織り交ぜた分析が盛んになる可能性が高いですね。私としてはそれで本当に将来の成績予測が成り立つのかどうか、不安なところではありますが(要するにビデオ撮影して、癖がどうの、配球がこうのみたいなのと変わらなくなってしまうのではと言う不安)、逆に天気予報レベルでの成績予測が成り立つように変わってくるのであれば、それはそれで面白いとも思います。そこら辺、今進化の真っ最中ってのは何とも言えないですね。

 というところで無駄に長くなったのでここらでこの記事はおしまいにしましょうかね。いやー画を見せない自分語りのブログって核の楽ちんだわー(笑)

補足の欄

 NPBでは基本的には毎年毎年年俸は変化し、その年俸は前年に残した結果が基準となる場合が多い。であるから、期待値などは関係なく、単純に残した結果が重要になるのであろう。球団間の選手の取り合いも基本的には発生しないため、長期・年俸固定の契約をオファーすることは無く、投資という意味合いはほぼ無い。であるから、成績の期待などはしてはいけない(そういう計算はされていないから)。逆に言うと働かない高給取りに対して、給料泥棒とののしることはいけない。その年働いているかどうかではなく、前の年(やそれ以前)にどれくらい働いたかが基準だからである。

 逆にMLBでは球団間の選手の流動性NPBと比べると非常に高く、そのため選手の取り合いも発生する。契約額のオファーは投資と言う意味合いが強くなり、結果的に、どれくらいの成績を期待するかを強く意識する必要がある。そのため、過去の結果、歴史学を使わずに、統計学を使って、過大な投資を防ごうとしているのである。

 そういう違いが、セイバーメトリクスが受け入れられやすかったかどうかの差でもあるだろう。

☆本日のおまけ その1

 女子バレーのタブレット使ってて操作性が、の問題。デジタル化への移行は良いと思うんだよね。問題はタブレットなこと。正直スマホとかタブレットとか、なんでみんなあの形の電気式のタッチパネルなのかが分からない。アレ、操作性別によくないですよね。汗かいてたりすると余計に反応悪くなったりするし。デジタル化は良いけど、タッチパネルはDSみたいな感圧式か、普通にボタン式の方がよくないですか?ガラケーもPCもブラインドタッチできたでしょ?なんでみんな揃って電気式にする必要があるのか、全く理解できません。。。

☆本日のおまけ その2

 打者大谷に関しては私は未だに好きになれません。確かにパワーはあります。技術もあります。だから今、打っています。打者専念すれば、NPBでも屈指の打者にもなれるでしょう。ですが、それでもあくまで好みの問題ではあるのですが、私は投手大谷の方がよっぽど好きです。

 打者大谷。右投げ左打ちの打者で、左方向への流し打ちが多く、それでいて本塁打が多い。これが私が打者大谷を好きになれない理由です。私も草野球レベルではありますが、野球するのも好きな方です。で、ある時カッコいいって理由だけで左打ちになったのですが、最初は何せ、左方向へのフライばっかりで苦労したのです。右手の方が強いですから、テニスのバックハンドのように合わせるだけで日本では高い評価を受ける流し打ちができてしまうのです。ついでにちょっとバットのヘッドを下げればフライになってしまいますが、あとはパワーでスタンドを越えれば問題ないのですよね。

 やっぱり左打者はインコース高めをちょっと詰まったような形から思いっきり引っ張って1塁線へのライナーを打てないと。松中とか巨人にいた清水隆行みたいなそう言うバッティングができないと、左打者としては好きになれないです。あるいは松井秀喜か筒香のように、それが苦手でも技術でそれを克服したタイプか。

 やっぱり、きっちり引っ張れないと強い打球はとばせませんから。特に左打者ではそこを私は強く意識しますね。

 でも二刀流をすることで肩の消耗速度が落ちて、MLBに行った時にフレッシュな状態になるのであれば、二刀流は支持しますよ(笑)アレですよ、実力は認めるけど、そのアプローチは好きじゃないってだけですから。