[BRM]

3.12 はどこから来たのか

由来、根拠、検証


5. 改めて、はじめに

前回の稿では、 DIPS の公式(とされた式)において足されていた 3.12 という数字を追いかける途中で、DIPS の公式とされるものが、実は FIP という値の算出式であり、現在の日本においては、両者が混同されている節がある、ということについて説明した。

しかし、前稿冒頭の「3.12 という数字がいかなる由来を持つのか、あるいはどういった根拠によっているのか、そして、妥当な数字であるのかどうか」という問いはそのまま残ってしまった。本稿では、改めて上の問いに対する回答を示したい。

なお本稿では以後、これまで日本で DIPS とされてきたもの(公式や、その公式により算出された値など)については、正しく FIP として扱うこととする。したがって、以後本稿に DIPS と書いてあれば、文脈から明らかに「日本の現状の DIPS 」を指すのでない限りは、それは Voros McCracken が提示した本来の意味での DIPS を意味するものと理解していただきたい。

6. FIP の歴史

3.12 という数字を追う前に、まず FIP についての説明をしておきたい。

FIP は Tom Tango が提唱した計算方法である。 Tango が FIP を最初に提唱した際の文書が「Defensive Responsibility Spectrum (DRS)」というページに残されている。 Tango がいつこれを提唱したのかは定かではないが、このページに収録されているデータは2001年のデータであることから、2001年末〜2002年ごろの文書であろうと思われる。

そこでは、投手の記録項目を、投手の責任が占める割合の高いものと野手の責任が占める割合の高いもの、そしてどちらとも言えないものとに分類した上で、投手の責任が占める割合の高い奪三振、与四球、被本塁打の3つから FIP の算出を試みている。そして Tango が当初示した FIP の算出式は以下のようなものであった。

FIP = ( 13 * 被本塁打 + 3 * 与四球 - 2 * 奪三振 ) / 投球回数

この式を見ると、何の数値も足されていないことが分かる。こうして計算された値は、負の値も取ることがある。そして、この時点での到達点として、以下の式を示している。

FIPruns = ( リーグ平均 FIP - 選手の FIP ) * 投球回数 / 9

この式で計算された FIPruns は、リーグ平均と比べてどの程度失点を防いだのか(正の値の場合)あるいは許したのか(負の値の場合)を示すものであり、DIPS における dipsERA と同様に、これをもって最終的な評価基準としている。

当初はこのような方法での評価であったが、後にこれに故意四球と与死球の要素を加え、さらに防御率と同じ形式の値で評価する(そうした背景には dipsERA の影響があったと思われる)ために元の式に数値を足す形を取ることで、現在の FIP の算出式が完成した。

7. 3.12 の正体

FIP を提唱した Tom Tango のサイトには、いろいろな文書が残されているが、その中にようやく 3.12 についての記述を見つけることができる。もともとは掲示板の一スレッドであったらしいこのページは、 Jay Jaffe が2003年の MLB 全投手の DIPS を計算したことを Tango 自身が紹介しているものである。この中で Tango は、 FIP に 3.2 もしくは 3.12 を足すことを提案している。

3.2 を足すことを提案した箇所には

(or whatever the 3.2 needs to be to best-fit to the 2003 data)

という注釈がついている。3.2 という数字は、2003年のデータに合わせる必要がある、というのである。そして 3.12 が提案されている箇所には

That's for 2003. The constant for the last few years is:
2003: 3.12
2002: 3.06
2001: 3.15
2000: 3.22

と記されている。

つまり 3.12 というのは、2003年の MLB のデータに合わせてはじき出された値に過ぎず、他の年度の計算を行う際は、それぞれの年に合わせて数字を改めて算出する必要があるということである。しかし、その 3.12 という値がそのまま固定された数値として日本に紹介され、 DIPS と FIP の混同と共に定着してしまった。 FIP に関する文書を探す限り、 3.12 という数字が出てくる箇所はここしかなく、これこそが 3.12 という数字の由来である。

この数字について Tango はconstantと表現しているので、本稿でも以後これを訳して、3.12 に当たる数字を「定数」と呼ぶことにする。

ちなみに、 3.2 のほうについては直接の言及はないが、他の年度の定数を計算してみると、定数はおおむね 3.2 前後の値になるため、とされている。この点については次章以降を参照されたい。

8. 定数の求め方

それから5年後の2009年、Tom Tango は1882年から2008年に至るまでの、リーグごとの定数を算出し、データベースに取り込める形の定数リストとして発表した。これは、 Tango が著者のひとりとなっている "THE BOOK - Playing rge Percentages in Baseball" という書籍の公式ブログの中で発表されたものである。

実のところ、 Tango が定数を算出した方法、あるいは定数の算出式については、今のところ明らかになってはいない。しかしこの定数のリストが発表されたことにより、答えから算出式を類推することが可能になっている。

そもそも FIP においてなぜ定数が足されるかと言えば、防御率の値に近づけるためである。防御率の値に近づけるのに最も確かな方法は、防御率のリーグ平均値と FIP のリーグ平均値が等しくなるようにするのが一番である。したがって、防御率のリーグ平均値と FIP のリーグ平均値との差が定数になるのではないかと考えられる。

そこで、公表されているリストから、リーグ全体の防御率と FIP を計算し、比較してみたのが以下の表である。なお対象は1999年から2008年までの10年間とした。また、表中の「算出値」は定数を足す前の FIP の数値であり、「計算差」は防御率から前述の「算出値」を引いたもの、「定数」は Tango のリストの定数であり、「誤差」は計算差と定数との差である。

ア・リーグ
    
1999 20076.2 8296 428 795 2619 13913 10832 4.86 1.60 3.26 3.27 -0.01
2000 20141.0 8390 466 681 2696 14033 10992 4.91 1.63 3.28 3.29 -0.01
2001 20213.0 7269 525 937 2483 14474 10047 4.47 1.30 3.17 3.18 -0.01
2002 20164.0 7290 497 863 2457 14020 9988 4.46 1.33 3.13 3.13 0.00
2003 20225.0 7111 522 893 2500 13735 10167 4.52 1.36 3.16 3.17 -0.01
2004 20248.0 7520 514 904 2591 14505 10416 4.63 1.40 3.23 3.23 0.00
2005 20180.0 6768 450 843 2401 13814 9755 4.35 1.24 3.11 3.12 -0.01
2006 20121.0 7128 528 779 2518 14397 10188 4.56 1.30 3.26 3.27 -0.01
2007 20178.1 7439 534 813 2256 14890 10099 4.50 1.13 3.37 3.39 -0.02
2008 20222.1 7470 513 793 2246 14925 9767 4.35 1.12 3.23 3.24 -0.01
ナ・リーグ
    
1999 23134.2 9595 679 784 2909 17206 11722 4.56 1.41 3.15 3.16 -0.01
2000 23103.1 9847 744 892 2997 17323 11884 4.63 1.48 3.15 3.15 0.00
2001 23074.1 8537 859 953 2975 17930 11168 4.36 1.24 3.12 3.12 0.00
2002 23105.0 8956 955 883 2602 17374 10539 4.11 1.11 3.00 3.00 0.00
2003 23110.1 8778 794 956 2707 17066 10986 4.28 1.21 3.07 3.08 -0.01
2004 23146.0 8702 867 946 2860 17323 11067 4.30 1.25 3.05 3.07 -0.02
2005 23052.1 8439 766 954 2616 16830 10807 4.22 1.14 3.08 3.09 -0.01
2006 23137.0 8719 882 1038 2868 17258 11534 4.49 1.27 3.22 3.22 0.00
2007 23247.1 8640 789 942 2701 17299 11430 4.43 1.16 3.27 3.28 -0.01
2008 23135.1 8867 797 879 2632 17959 11023 4.29 1.09 3.20 3.21 -0.01

この表を見ると、計算された差と定数リストの間には 0.01 前後の誤差はあるが、概ね近い値が出ている。この誤差の理由が判明しないのは残念なことだが、基本的な計算方法はこれででよさそうである。この計算方法を用いて、次に NPB における定数を算出することとする。

なお、上の表を見れば、前章において「定数はおおむね 3.2 前後の値になる」という点も見て取れよう。

9. NPB における実際の定数

NPB における定数の算出は、1955年以降のシーズンを対象とした。これは故意四球が記録項目として採用されたのが1955年からだからである。こうして算出した NPB 版の定数リストを、 Tango が作成した MLB の定数とともにグラフ化にしたものが以下である。

image005_1.jpg

MLB のデータについては「定数はおおむね 3.2 前後の値になる」と先に述べたが、実際に MLB で 3.20 前後に収まってくるのは1993年頃以降のことであり、それ以前は 2.90 前後になっている。さらに古い時期だとナショナルリーグで 2.75、アメリカンリーグで 2.55 程度というのが平均的な定数になっている。

NPB では、1975年頃を境に大きく変化していることがわかる。1958年〜1962年のパリーグを除くと、1975年以前はほぼ 2.10 〜 2.30 の間で安定しているのに対し、それ以後は一貫して増加傾向にある。1955年〜1974年の20年間の平均は 2.23 である(前述のパリーグの5年分を除くと 2.17 である)のに対し、1975年〜1984年の10年間の平均は 2.38 、1985年〜1994年が 2.64 、1995年〜2004年が 2.92 、そして2005年以降の6年間では今のところ 3.11 となっている。

以上の状況を踏まえると、FIP の定数を一定にして過去のデータを比較することは、いささか剣呑であるといえる。1960年代の選手と2000年代の選手とでは FIP に 0.80 程度の差が生じるからである。だが、各年度の定数を覚えて計算するというのは大変面倒であり、 FIP の持つ簡便性を損なう恐れがある。そこで、上の分析結果を踏まえ、1974年以前は 2.17、1975年以降は上の平均値に沿うように上昇していくような擬似定数の算出式を設定すると、以下のようになった。

定数 = 2.17 + ( Y - 1975 ) * 0.03 (Yはシーズン年度、ただし1975年以前は Y = 1975 で算出)

この式で擬似定数を算出すると、1975年以前は 2.17 、1980年で 2.32 、1990年で 2.62 、2000年で 2.92 、2010年で 3.22 という結果になる。ほぼ平均値に沿った値が出せるというわけである。注意すべきは上に示したパリーグの5年間だけで、その間の平均が 2.63 であるということを覚えておく必要がある。

最後にこの算出結果(「擬似値」欄)を含めた定数リストに基づいて作成したグラフは以下のとおりである。

image005_2.jpg

10. おわりに

今稿では、 FIP の公式において固定された値とされている 3.12 の由来を探ってきた。その結果、 3.12 はあくまで2003年の MLB のデータに適用される定数に過ぎず、本来の定数は各年度の防御率と FIP の関係によって変わるもので、決して固定された数値ではないことを明らかにした。

また、これを踏まえて定数の算出方法を探り、これを NPB に当てはめて各年度・各リーグの定数を算出した。その結果は、 3.12、あるいは Tom Tango が「通常この前後となる」と述べた 3.20 という値は、NPB においては当てはまらない、というものであった。

併せて、FIP の擬似定数を算出するための式 定数 = 2.17 + ( Y - 1975) * 0.03 を提唱した。これは FIP の簡便性を損なわないように、毎年異なってくる定数を覚えずとも FIP を計算できるようにするための式であり、言い換えれば、 NPB において「通常この前後となる」定数、という位置を狙ったものである。

前稿今稿の2回にわたり述べてきた主張をまとめると、一つは、日本で DIPS の公式と呼ばれてきたものは、実際は FIP の算出式であるということ、もう一つは、FIP の算出式の一部としてあたかも固定された値であるかのように認識されている 3.12 という定数は、FIP の計算結果を防御率に近づけるための数字であるが、年度やリーグ等、環境によって変える必要がある、ということ、の二点に尽きる。

以上の二点は、いずれも現在の日本では誤って認識されている(少なくとも正しくは認識されていない)状況にある。前稿でも述べたとおり、これらの認識はいずれ正されるべきであると思うが、ひとまずは、 DIPS や FIP の値を前にした時、どのように算出された値であるかという点を把握した上でデータに当たる、という意識を持ってデータに臨むべきであろう。


written by Seiichi Suzuki, at 2011. 3.13. / updated at 2011. 3.13.