過去のスタッツについて

1 スタッツの発生から
 
野球におけるスタッツの歴史は19世紀にさかのぼることができます。江戸幕府が終了する頃にはボックススコアが発明されていたということで、打撃率やエラーなどのスタッツがすでに記録されております。現在に至るまでこれらのスタッツは広く使用され、特に野球ファンがひいきの選手を語る際など、力量のバロメーターとされてきました。
 しかし、必ずしもこれらは選手の能力や価値を正確にあらわすものとはいえないようです。最も打率の高いチームが最も多くの得点を記録できない、あるいは優勝することはできないことなど普通にあったために、「野球は数字ではない」といった考え方が定着しました。日米ともに過去の球団は数字よりも専門家の目を重視してチームを作っています。確かに、打率の順番に選手を獲得するよりはましな考え方です。リーグや年次が違えば全く価値の異なるこのような数字を根拠にチーム造りなどできない、というのは球団が翌年度のチームを構成する際に、当然考えることでしょう。しかしこれは数字自体が信頼できないものなのではなく、数字の中に信頼できるものと信頼できないものがあることを考慮しないやり方でした。球団や専門家は本来、数字を無視するのではなく、また、すべての数字を盲目的に信頼するのでもなく、信頼できない、あるいは意味を持たないスタッツだけを排除するべきであったところ、全てのスタッツを遠ざける方向を選択してしまいました。スタッツを生かせないような状況では、チーム造りは必ずしも最も効果的なものとはいえないものとなったようです。
 その後、過去の欠点を補うような多数のスタッツが発明されたこともあり、統計的手法を採用するチームは増えてきています。数学的・統計的な考え方を徹底したマネーボールシステムを駆使するオークランドのようなチームは自分達に数倍する潤沢な資金をもったチームを餌食にし続けました。また、2004年のワールドシリーズを制したのはマネーボール理論の若き信奉者・エプスタイン(就任するはずだったB・ビーンの代わりに就任したとき20代)がGMをつとめるボストンでした。

2 リンゼイ&パーマーの時代 ライナーウェイトシステム登場
 過去においても打率・本塁打・打点よりも長打率や出塁率の方がチーム総得点増減との関連が深い、打者の本来の活躍ぶりを示すスタッツであることが知られていました。しかし、これらをもってしてもやはり不十分です。シングルヒットを1、二塁打を2、本塁打を4とする従来の数え方は現実の得点と必ずしも比例しないこともまた、既によく知られていたのです。塁打や出塁をそれぞれ1として数えることが実態と符合しないのであれば、一つ一つの現象に違った重みをつけるしかありません。たとえばシングルヒットを10ポイント、二塁打を15ポイントとするように適当と思われる重みをつけるのです。(漫画「野球狂の詩:恐怖のTO砲」の中にこの萌芽が見られます)
 しかし、個人用コンピュータの普及などは、ごく最近の出来事です。適当な重みといってもそう簡単に見つけられるものではありません。この加重については1950年代までには一部記録マニアが作成を試みたり、契約更改のため球団が独自に作成したりした形跡はあるものの、恣意的な加重の域を出るものではありませんでした。
 1960年代に入って、国防省と軍需産業関係者のリンゼイとパーマーの2人が得点に関する研究を発表しました。その研究はリンゼイが始めたものをパーマーが受け継ぎ発展させる形で進められています。彼らは「あるプレイが発生した時にどの程度の利益・不利益があるのかを前もって理論的に決定することはできない。よって、プレイの価値は統計により結果から判断するしかない。得られたサンプル数が大きくなれば、三振や盗塁や二塁打など、一つ一つのプレイの本質的な価値が解明できる可能性は大きくなる。」と考えたようです。そのために「得点期待値」の算出を試みました。
 まず、無死無走者から二死満塁まで24の状況に分け、それぞれの状況を迎えたチームがイニング終了までに何得点を得られたかをデータ化しました。パソコンのない時代とあって気の遠くなるような作業だったようですが、各状況における得点の期待値はやがて絞り込まれました。1962年頃にはこのデータが一部発表されていたようです。たとえば無死無走者の場合の得点期待値は0.48で、全打席に対する出現割合は24%。一死無走者の場合得点期待値は0.25で出現割合は17%ほど。無死満塁の場合の得点期待値は2.2ほどで、出現割合は0.3%などとなっています。(ちょっと古いデータです。70年代の新聞から)  これを活用することにより、ゲームにおいていろいろなプレイが起こったときの得点期待値の増減から各プレイの価値を算出することができます。
例1)無死無走者からの凡打は得点期待値を0.48から0.25へ減ずるので−0.23で、出現割合が24%であるのでこの状況における凡打の価値を−0.055と置く。以下、すべての局面での凡打による得点期待値を合算していくと凡打一般の得点期待値は−0.25となる。
例2)無死無走者からの本塁打は発生の前後で状況による得点期待値は変わらず、1点が入り、出現割合は24%なので0.24。無死満塁の場合の本塁打は発生前の得点期待値が2.2で、発生後の得点期待値が0.48であり、得点は4点で出現割合は0.3%。ここから、
(4−(2.20.48))×0.0030.007がこの場合の本塁打による得点期待値となる。このように、すべての状況における本塁打の得点期待値を合算していくと、本塁打一般の価値は1.4となる。
 こうして作られた総合指標は70年代に完成し、パーマーによりライナーウエイトシステム(LWTS)として発表され、初めて総合指標として一般的に定着しました。
 0.47(1B)+0.78(2B)+1.09(3B)+1.4(HR)+0.33(BB)+0.3(SB)0.6(CS)0.25(ABH)0.5(OOB)  (すみません。四球が抜けていたのを発見したので訂正します。2006.4.28)
イニング開始の段階で0.48点(平均的なイニング得点)の期待値を見込んでいますので、標準的なシーズンの標準的な選手が0点になるのが特徴です。
 これを完成させたピート・パーマーはTotal Baseballの編集にも関わっています。同刊における打者(攻撃者)最終評価はこのLWTSにより得点値に換算された数字をRuns Per Win 式により一種の傑出度に変換したものとなっています。

3 総合指標の発達 RCとXR
 最も有名なSabermetricianであるビル・ジェイムズも70年代から総合指標の作成にとりかかっていました。現実の得点と適切な加重を勘案し、膨大な手作業の結果、Runs Created(通称RC)の指標を作成しました。現在では十分な記録が残っていないような古いシーズンの指標を定めるためTech1から14までのスペックがありますが、現在ではTech1のうちRC1RC2及びRC27が一般的な形となっています。RC2から派生して一人の打者が1試合すべての打席をうけもった場合に(27回アウトになる間に)何点取れるかというのがRC27です。このRCは現代において最も一般的な総合指標であり、各指標の特徴としてはLWTSにおいて標準的な選手が0点となるのに対し、最初に0点であるところから始めて、得点換算された貢献度を積み重ねていく方式となっています。
 ただし、LWTSと同様にこの指標もある程度の攻撃力が打線にあるという前提で作られたもので、標準的なシーズンを基準に考えられているようです。また、得点の積み上げを記録するものであるのに、貧打の投手などについてはマイナスの得点という現実にはありえない事態が記録される場合もあります。
 RCの根底にあるのはアウト数の重視です。特にRC27にはっきりと作者の志向・主張が表れています。野球というスポーツの構造からして守備側にアウトを与えないことが最良の攻撃である、というわけです。実際のプレイでは「アウトを与えないこと」と「出塁すること」は同義になりますが、この指標では意識して前者と捉えているように見えます。
 その後、RCの改良版ともいえるXRが登場しました。こちらは、実際の得点と各事象の増減との乖離を最小とすることを眼目に作成されています。回帰システムを利用し、とにかく実際の得点との乖離が最小となるような算式を強引に捻り出したものであり、対象がたまたま野球であったような印象すらあります。性格的にも、また、式についてもRC1に良く似たところがあり、こちらも0点から貢献度を積み重ねていく方式になっています。
 あくまでも乖離を最小にすることを優先させた結果、初期のシステムにおいて二塁打より犠牲フライの価値の方が大きいといった矛盾する結果も生まれてしまったようですが、現在ではこれは改善されており、後発ながら指標も一般的に浸透しています。
 なお、RCやXR、LWTSなどの考え方を活用する限り、守備や走塁の価値は限定されたものとならざるを得ません。この結果、チームは打撃力と投手力を特に重視する強化方法をとることとなり、かなり太目の選手が多くなります。メジャーではウエイトトレーニングの成果だけではなく、80年代から比較するとはっきりと選手の平均的な体型が太めに太めにと変わってきています。

4 勝利そのものを指標とするPWA
 さて、先ほどの得点期待値に戻ってみましょう。このデータが発表されれば、各状況下における勝敗の期待値が出せるのではないか、と考える人がいるのは自然の成り行きです。
 たとえば1回表同点・無死無走者の勝利期待値5割から始まって試合終了時の勝利期待値10割(又はゼロ)まで、イニング・得点差・アウト数・走者別にすべての状況における期待値を算出すれば、ある状況が数字にしてどれだけ重要なのか判断できると考えられます。安打を打ったり凡退したりすることによりその期待値をどれだけ増加(減少)させたのかで選手の貢献度を測れる上、戦術を組み立てる上でも参考にできます。7回裏、1点ビハインド、1死無走者で自軍打者が打席に入るときの勝利期待値はどれほどなのか、なんて興味ありませんか? これは1970年頃にPlayer Win Averages という指標名で発表されました。個人成績としても勝利期待値を増減させた総計をカウントし、年間貢献度を測る方法を採ることができます。この指標は「実際に活用するには煩雑に過ぎる・勝利期待値はイニングの枠を越ており実際に戦術化するのは難しい」などの理由で定着はしませんでしたが、取り扱いを誤らなければ非常に強力なシステムであると考えられます。
 まず、日本シリーズのような場ではMVPの選定にはこれ以上の指標は考えられないこと。特に2チームだけの間の閉じた場におけるゼロサムゲームにおいては、煩雑といってもたった2チームのことでもあり、この指標を評価の最優先項目としていいかもしれません。次に、これはさらに重要な点ですが、勝負強さという点を語るときにはこの指標とXRなどの総合指標との組み合わせで考えるしかないであろうという点です。つまり、XRなどの総合指標による傑出度を、PWAによる傑出度が毎年続けて上回っている選手をもって勝負強い選手とするわけです。現在、勝負強さについては適切な指標がないといってもよい状態です。得点圏打率や打点などがその指標とされていますが、統計的にはほとんど信頼できないスタッツです。数学を強化に活用しているメジャーリーグ球団はこの2つスタッツを全く相手にせず、他のチームに強化の方法を誤らせるありがたいスタッツと考えている節さえ見られます。とにかくこの「勝負強い」という言葉は都合よく語られてすぎているようです。PWAと総合指標のコンビネーションはこのあやふやな勝負強いという言葉の意味を一刀両断する威力を秘めています。

5 総合指標についての付記
 さて、このように盗塁死から犠打まですべてを勘案し、数学を利用して生み出された総合指標ですが、取り扱いには注意が必要です。
@各事象の価値を均等とする限り得点との完全な合致は不可能であること。
A打者としての評価ではなく攻撃者としての指標であること。打者としての評価でいうなら他の指標の方が適切で、打撃項目だけを抜き出すことができる形式の指標もありますが、普通は打撃項目以外の項目を外した場合に式自体の有効性に疑問があること。また、分母にまで盗塁などがからむ指標についてはこれをはずすとバラバラになってしまいます。
B個人向けの指標とチーム向けの指標があること。例えばRC27などは本来的にはチームのための指標であること。FA選手を失う時、代わりにBかCを獲得するとしたきに、BとCのRC27を比較するのではなく、の昨年の打席数をにまかせた場合とにまかせた場合に分けてチームのRC27を積算してどちらがチームに必要であるか考える、といった使用方法がメジャーでは採られています。個人成績には打席あたりRCの方が適切かもしれません。
 なお、ジェイムズらと前後してトータルアベレージ・OPS・BRAなどといった指標が公開されています。これらは盗塁や犠打といった項目を考慮しない扱いやすさを重視した簡易RCといった性格の指標ですが、無視した項目があるにしては得点との乖離がRCやXRとあまり変わらないものとなっています。純粋な打撃以外の項目は意外にも得点効率に大きな影響を与えていないようです。「過去にもてはやされた監督の作戦は大概が的外れか、監督が恥をかかないための単なる自己防衛」(ビル・ジエイムズ)といった考え方はここに端を発しているようです。
そして、ついにボロス・マクラッケンにより野球の見方を根底から変えてしまうようなおそるべき指標(理論)が発表されました。
 「フェアグラウンドに飛んだホームラン以外の打球が安打になるか凡打になるかは結局のところ運である。」ここからDIPSeraという新しい指標が導きだされるわけですが、以下は「小ネタ」中のボロス・マクラッケンの章で。


HOME