[BRM]

3.12 はどこから来たのか

整理、混同


1. はじめに

以前、博物館報「日本のDIPS更新史」で DIPS という記録を取り上げた。日本記録の更新を追いかける中で「2点台がついぞ出なかった」「唯一1点台の記録」といった表現を使っている。記録の更新もさることながら、こういった基準を設定して見ていくのも、一つの面白さである。

ところで、その際使用した公式は、以下のようなものだった。

{ ( 与四球 - 故意四球 + 与死球 ) * 3 + 被本塁打 * 13 - 奪三振 * 2 } / 投球回数 + 3.12

見てのとおり、最後に 3.12 という数字を足している。仮にこれが 2.50 であったならば、当然 DIPS の値自体が変わってくる。この場合、記録同士の比較や記録の更新という点ではあまり問題にはならないが、先に書いたような何点台という表現には当然大きな影響が出る。この 3.12 という数字はどこから来たのだろうか。

本稿ではこの疑問を解いていく。3.12 という数字がいかなる由来を持つのか、あるいはどういった根拠によっているのか、そして、妥当な数字であるのかどうか、という点を探っていく。

なお予め断っておくと、この報告で紹介する内容は、この報告が初出というわけではない。ネット上で検索すればいくつかのサイトから答えを見つけ出すことができるものである。だが、この答えを出す過程で判明したいくつかの事実(それらも実は、既に指摘されているものであるが)についても触れておきたかったため、あえて本報告の形に取りまとめた次第である。

2. 公式をめぐる諸相

DIPS は NPB の公式記録ではないので、当然日本における公的な定義というものはない。上の公式の引用元である日本語版 Wikipedia の DIPS の項にも、特に数字についての解説は載っていない。また、このページには「初期の公式」とされる式も紹介されているが、そこでは 3.12 ではなく 3.2 が足されている。この2つの数字の違いについても、また述べられていない。

では本家ともいうべき英語版の Wikipedia ではどうか。 DIPS の項を繰っても、実は 3.12 の数字は現れない。似た数字が載っているのは、代わりの公式として記載されている DICE と FIP という2つの項目である。 DICE には 3.00、 FIP には 3.10 という数字が記載されている。次々と異なる数字が出てくるというのは何とも心許ないが、幸いこれらの数字について、それぞれの解説文にヒントが書かれている。

DICE の項には

That equation gives a number that is better at predicting a pitcher's ERA in the following year than the pitcher's actual ERA in the current year.
この公式は、翌年の防御率を予測する際に、今年の実際の防御率よりもより精度の高い根拠を提供する

とあり、 FIP の項には

That equation gives a number that is much closer to a potential pitcher's ERA.
この公式は、投手の潜在的な防御率に非常に近い数字を提供する

とある。つまりこれらは、防御率を意識しつつ防御率の代わりとなるような、より正確な値を導き出そうとする式である、ということがわかる。とすれば 3.00 や 3.10 といった数字は、防御率の数字により近づけるために足される一種の定数であると考えられるだろう。

これで数字の目的は判明したが、その由来まではやはり分からない。それだけでなく、式の種類によりその値はまちまちで、式の内容自体も似ているようで微妙な差異がある。

1. 日本語版 Wikipedia で初期の公式とされる式
( 与四球 * 3 + 被本塁打 * 13 - 奪三振 * 2 ) / 投球回数 + 3.20
2. 日本語版 Wikipedia でのもう一つの式
{ ( 与四球 - 故意四球 + 与死球 ) * 3 + 被本塁打 * 13 - 奪三振 * 2 } / 投球回数 + 3.12
3. 英語版 Wikipedia での DICE
{ ( 与四球 + 与死球 ) * 3 + 被本塁打 * 13 - 奪三振 * 2 ) / 投球回数 + 3.00
4. 英語版 Wikipedia での FIP
( 与四球 * 3 + 被本塁打 * 13 - 奪三振 * 2 ) / 投球回数
5. 英語版 Wikipedia での FIP
( 与四球 * 3 + 被本塁打 * 13 - 奪三振 * 2 ) / 投球回数 + 3.10

以上の式は、分かりやすくするために式の内容を(正確性を損なわない範囲で)一部入れ替えている。

1. と 5. が良く似ているが、それ以外は与死球と故意四球の扱いなどで差がある。なお、 FIP の項には他に説明文があり、

The Hardball Times, a popular baseball statistics website, uses a slightly different FIP equation, instead using 3*(BB+HBP-IBB) rather than simply 3*(BB) where "HBP" stands for batters hit by pitch and "IBB" stands for intentional base on balls.
野球の記録を扱う有名なウェブサイトである The Hardball Times では、 FIP の算出に若干異なった式を使用している。与四球 * 3の箇所に代えて、( 与四球 + 与死球 - 故意四球 ) * 3を採用している。(後略)

と記載されていることから、2. の式のような四死球の扱いについても一定の背景があることが分かる。

それにしても、5つの式全てで、足される値が一つとして同じでないというのは既に述べたところであるが、これらの数字に違いはあるのだろうか。

3. DIPS の真実

前章の式について、きっちりと述べなかった重要な一点がある。それは、英語版 Wikipedia における3つの式が、 DIPS の公式ではなく、 DICE や FIP の公式として掲載されていることで、すなわち DIPS の公式がどこにも書かれていないということだ。そして DICE や FIP は、DIPS の「代わりになる」公式として紹介されている。

より根本的な資料として、 DIPS の提唱者である Voros McCracken が、最初に DIPS を提唱した際の文書が保存されているが、こちらを見ても、 3.12 や 3.10 などの数字はおろか、前章のいずれの式も出てこない。これはどういうことか。

ずばり、DIPS には、その値を簡潔に算出するような公式というのは存在しないのである。

DIPS とはそもそも「守備から独立した投手成績」、つまり守備力の影響を除外しながら計算された投手成績を指すのであり、対戦打者数と与死球から出発して、DH 制の有無など所属するリーグによる影響や広さなど球場が与える影響をも考慮しながら再計算された、「守備力の影響を除外した」各項目の値を指すものである。

より詳細に見てみよう。 McCracken が提唱した DIPS の算出の出発点は対戦打者数と与死球で、この値を元に、与四球数を再計算する。その方法は、対戦打者数に占める与四球数の割合を算出し(故意四球についても考慮されているが詳細は割愛する)、リーグや球場の違いが与える影響を補正し、これを対戦打者数から与死球を除いた値に掛けることで、「本来の」与四球数をまず求める。

同様にして、「本来の」奪三振数や被本塁打数を算出していくのだが、こうして算出された値が、それぞれ「守備から独立した与四球数」や「守備から独立した奪三振数」と呼ばれるのである。

さらにこれらを基にして、対戦打者数とリーグ平均から各種の項目の値を算出する。その根底にあるのは「対戦打者数は、安打、四球、死球、三振、ゴロやフライのアウト(これを3で割ったものが投球回数)といった数値の合計になるはずである」という考え方である。つまり、対戦打者数に占めるそれぞれの項目のリーグ平均率を出して、それを個々の対戦打者数に掛けていけば、その選手の本来の、つまり守備から独立した、数値が出るはずだ、ということである。

これらの算出を繰り返してこのようにして最終的には「守備から独立した」投球回数と自責点を割り出し、これを元に計算された防御率こそが、「守備から独立した防御率」すなわち dipsERA なのである。

このように、直接最後の答えを出すわけではなく、個々の項目を補正しながら算出した値を回帰的に積み重ねて答えにいたる方式であるから、一足飛びに答えを出せる公式などというものは当然存在しないわけである。

では、日本において DIPS の公式とされてきたものはいったい何なのかというと、前章の式を見ると分かるとおり、英語版 Wikipedia で DIPS の代わりの公式として挙げられている、 FIP という記録の算出式である。それが、何らかの理由で日本においては DIPS の公式として誤認され、あるいは混同されてきたのである。

4. これまでのまとめ

アメリカで考案された DIPS は、投手成績から守備力の要素を排除して本来の投手の成績を導き出そうとする画期的なコンセプトであり、その要諦は、守備力の影響を受けない(とされる)被本塁打、与四球(故意四球を除く)、与死球、奪三振をベースに、守備力などの要素を取り除きながら他の各成績を再計算するところにある。

残念ながら日本においては、DIPS のコンセプトこそ理解されたものの、その要諦は正しく理解されなかった。コンセプトの中にある、被本塁打、与四球、奪三振といった目に見える項目名から、FIP の算出式があたかも DIPS の公式であるかのように誤って結び付けられ、あるいは DIPS と FIP が同一のものであるかのように混同され、その認識のまま現在に至っているのである。

DIPS と FIP が混同されている点については、本稿の最初に述べたように、既にネット上での指摘がある。例えばクロスケ氏は、氏のサイト Baseball Concrete の「DIPS再考」において、DIPS の公式とされてきたものについて「どうもマクラッケンはこういう式を定義したわけではないようで、このように簡単な形のものはTangotigerの仕事であるFIP(Fielding Independent Pitching)という式のようです」としている。

この混同については、いずれ正されるべきであると思うが、少なくとも現状にあっては、 DIPS についての資料を見るときは、 FIP の算出式を使ったもの(つまり FIP である)か、それとも本当に dipsERA として計算されたものであるか、その算出方法を常に意識してみておく必要がある。特に、海外のサイトで示されている数値との比較を試みる際などは、注意しておかないと、無意味な結果を招きかねない。

以上、 DIPS と FIP の混同という日本の事情を指摘してきたのだが、本稿のタイトルでもある「3.12 はどこから来たのか」という点については、 FIP の算出式において、出てきた値をより防御率に近づけるための値であったことが分かったが、その 3.12 であることの由来や根拠等については、今回は触れられなかった。この点については、 FIP についての解説と合わせ、稿を改めて記述したい。本章のタイトルが「これまでの」まとめ、となっている所以である。

また、そもそも DIPS と FIP の混同がどのようにしておきたのか、という点も興味ある疑問である。これについても、なぜそのように判断したのかを含め、別稿において検証してみたい。


written by Seiichi Suzuki, at 2011. 2.27. / updated at 2011. 2.27.