棒球的語言,是圍繞著其一些最基本的數據所建立起來的。打擊率(Batting Average,簡稱BA),簡單把打者紀錄裡的安打數除以打數,是棒球裡討論「打擊王」的基礎。所謂「打擊王」,就是一個聯盟裡打擊率最高的選手。打者退休時,我們會去數他拿到過幾次打擊王,然後拿去跟其他拿過打擊王的選手相比,看誰次數多。比起生涯打擊率「只」有二成九九的選手,我們會格外敬重「生涯打擊率三成的打者」,彷彿他們晉身到了某種更高維度的存在。但打擊王的頭銜與那背後的數據,其實都有事情沒有告訴我們,也都沒有讓我們看到該打者表現的全貌。
我們可以來看看這些名人堂球員的銘刻上,都是怎麼說的:
「一名手持球棒的匠人,其日復一日對卓越的追尋,成果是生涯打擊率三成三八,生涯累積3,141支安打,以及平國家聯盟紀錄的8次打擊王⋯⋯」――節錄自東尼.葛溫(Tony Gwynn)的名人堂銘刻
「5次打擊王,並在上壘率與被故意四壞球保送次數上都曾6度領先全聯盟⋯⋯」――節錄自威德.伯格斯(Wade Boggs)的名人堂銘刻
「12次在美國聯盟打擊率上排名第一⋯⋯」――節錄自泰.柯布(Ty Cobb)的名人堂銘刻
這些球員的成就偉大歸偉大,但他們在古柏鎮(Cooperstown,名人堂在紐約州的所在地)受到的禮遇忽略了一個很關鍵的問題:光是在打擊率這個漏洞百出又有失完整的數據上排名第一,某人就值得被認為是全聯盟最厲害的打者嗎?如果其實有人比你打得更好,那你還應該被稱為是「打擊王」嗎?
從有打者把棒子揮向棒球以來,打擊率就一直在一堆打者統計數據中萬人之上。一般認為是英裔美籍統計學者亨利.查德維克(Henry Chadwick)在19世紀晚期創造出了打擊率(跟一干常見的棒球數據),而他當時的設計參考了板球版本的打擊率,也就是把打者的得分除以其出局次數。19世紀的棒球近似今日的棒球,但有幾點顯著的差異,像是有段期間打者可以按自己的心意,告訴投手該往哪兒投,或是有些時期保送不是「四」壞球,打者因為好球出局也不是「三」振,而是各有其他的數字。在19世紀,過大牆的全壘打少之又少(以1895年為例,那年國家聯盟的全壘打王也就打了18轟),畢竟大多數打者都只求把球打進場內。所以在當時,查德維克的想法有其優點:在打者鮮少被保送且一心要打中球的狀況下,安打數除以打數或許確實能挺好地反映出攻擊者的表現。
時至今日,打擊率也不能說是一無是處,但其價值確實受限了很多;打擊率的主要問題出在它太出鋒頭。如果打擊率可以安於二線統計的職責,只去傳達少量的資訊,而不去主張自己是那個無所不是也無所不包的終極打擊數據,那也許它就不會被雷達捕捉到,也就不會成為傳統派或數據派重點關注的對象。
(相關報導:
簽下7億美元合約!大谷翔平為何選擇加入道奇?內行揭世紀合約談判內幕
|
更多文章
)
啊,但你一旦宣稱自己是數據中的萬王之王,但又沒辦法拿出實績來的時候,我就看不下去了。就像圈內的分析師與棒球高階主管們也都在發出不平之鳴,畢竟他們如今都已體認到那些打擊率宣稱可以但未曾提供的資訊,都有其他更完整、更無漏洞的統計數據可以幫忙。所以即便我們還在為「贏得打擊王」的選手鼓掌,也還在因為某人的打擊率最高就說他是「聯盟中最強的打者」,但其實打擊率這個數據本身已經失寵了二十個年頭,而且其衰落的速度只會繼續增快。
這段歷史讀來或許讓人嘖嘖稱奇,但我們真正該聚焦的是打擊率究竟告訴了我們什麼東西。打擊率是國小三年級水準的數學,把打者的安打數調出來,除以該打者的打數,然後四捨五入到小數點後面三位數,這就是打擊率。而雖然在小樣本裡打擊率可以低到0.000,高到1.000,但在現代棒球裡,典型的打擊率一般會落在0.200到0.400區間。在從2011到2015的5年當中,沒有哪個有資格獲得打擊王的球員打擊率高過三成五,甚至突破三成四的人也只有兩個(荷西.奧圖維〔Jose Altuve〕一回,米格爾.卡布雷拉〔Miguel Cabrera〕兩回)。
你是否注意到了上面這句話裡,有個地方怪怪的:什麼叫「有資格」獲得打擊王?這話要從打擊率是一種比率說起,比率的意思就是要有分子跟分母(以打擊率而言分子是安打數,分母則是打數),大聯盟為個人獎項的得獎者都設定了競爭資格的門檻,以打擊率而言,門檻就是所屬球隊出賽一場,你平均要獲得算是很合理的3.1個打席數。由於大部分球隊整季都會打162場比賽,所以打者必須累積到503個打席數,才能在打擊王競逐中榜上有名,不管是不是第一名。
好喔,但我們剛剛一直聊的不是打數嗎?怎麼這會兒又冒出來一個打席數?的確,這種掛羊頭賣狗肉的做法暴露出了打擊率的第一個重大瑕疵。打擊率無法告訴你打者多久能打出一支安打,它只能告訴你打者在排除掉他「選到保送、挨觸身球、打出高飛犧牲打、犧牲觸擊成功,或是因為捕手妨礙打擊而上壘」以外的時候,多久能打出一支安打。以上這些狀況都不計打數,但要計打席數。(其中前三樣會納入上壘率的計算,而上壘率作為一項極具價值的數據,本書會在後頭專章討論。)
所以打擊率為什麼要無視這些不是安打或不是單純出局的事件呢?要知道在極端的狀況下,這些事件可以占到一名選手超過三分之一的打席數。(貝瑞.邦茲〔Barry Bonds〕就曾兩度締造這種紀錄,2002到2004年各一次,同時他也是史上唯一一個打席數比打數高出過50%以上的大聯盟球員。)關於這個問題的答案⋯⋯嗯,滿分的解釋還真不存在。我前面已經提到過了最可能的理論,那就是當查德維克創造出打擊率的時候,這些被排除的事件都還非常罕見,或是單純不被認為會涉及打者的技術或努力,所以查德維克便索性選擇忽視這些事件。光是這點,就可以讓你了解何以純用打擊率,或甚至以打擊率為主去評估打者的表現,會疏漏太多關鍵的資訊。把打者用重要的選球能力拗到的保送排除在分子外(讓分子只有安打數),也排除在分母外(讓分母只有打數),將讓你看不到打者全季表現的完整面貌。
(相關報導:
簽下7億美元合約!大谷翔平為何選擇加入道奇?內行揭世紀合約談判內幕
|
更多文章
)
不過打擊率的罪過還不只是選擇性忽視而已。打擊率的分子部分還有你所不知的缺陷,主要是這個完全由安打數構成的分子對所有的安打都一視同仁,不論你是一壘安打還是全壘打,在打擊率的計算中都有著一樣的權重,即使我們都知道一壘安打跟全壘打在比賽中的分量有多麼不同。
所以關於打者在某段時間內的表現,打擊率實際上告訴了我們什麼?它告訴了我們打者在沒被四壞保送、沒被觸身保送、沒打出高飛犧牲打或犧牲短打,乃至於沒發生其他不計打數的罕見狀況時,其剩下的打席數有多常打出安打;它只告訴了我們打者打出了一些安打,但沒告訴我們他都打了些什麼樣的安打。(所以才會有那句,當打者靠著軟弱內野安打上到一壘後聽到的棒球金句:「鳥安也是安打。」)這明明是個不好的傳統,但卻在糾纏我們長達一百多年後,仍舊在我們討論跟評價打者時帶有其不該帶有的重要性,尤其是我們會因此高估聯盟打擊率的領先者,只因為我們會說他們「贏得了」某種頭銜。我們容易受到混淆,是因為高打擊率的打者普遍來講也是好打者,這點無庸置疑;我們從打擊率處獲得的並不都是假訊息,但我們會受到打擊率之假精度的誤導,我們會以為打擊率精準到小數點後面三位數,就足以讓我們總結出對某個球員的判斷。而想完整了解打擊率的缺陷大到什麼程度,我們可以將之拿來跟其他更完備的數據比較。
我會常在這本書裡用上的一個基本統計工具,名為相關分析(correlation analysis),意思是我會把兩欄資料放在一起對比,然後得出一個數字在零與一之間,重點是這個數字會讓我們知道這兩欄資料的相關性強弱,而讀者可以將之理解為這兩欄資料亦步亦趨的程度高低,零代表兩欄資料毫無相關性,一則代表兩欄資料完美相關。基本上這個數字愈大,兩組數據的相關性就愈強,意即當A數據變動時,B數據也會跟著變動。但這並不代表A造成了B或B引發了A;你應該聽人說過「相關性並不能證明因果關係」,因為相關分析能夠告訴我們的,只是兩組統計數據間看不看得出某種關係。兩組數據之間的相關性背後可能是直接的因果,也可能純屬巧合,但總之這項工具能讓我們知道的,就只有兩個數據亦步亦趨的程度高低。在本書裡,我會經常在提及兩組數據的相關性時表示是其中一個數據「預測」了另外一個。
在下表中,我使用了大聯盟球隊在2011到2015年這5個球季中的統計數據來展示兩樣東西的相關性,一樣是整隊的四種常用打者比率數據,另一樣則是這些球隊的單場平均得分。
打擊率、上壘率、長打率、整體攻擊指數與團隊單場平均得分的相關性(圖/八旗文化)
上壘率(On-base percentage,簡稱OBP),顧名思義地採計了打者安全上壘的次數,然後將之除以犧牲觸擊與妨礙打擊上壘以外的所有打席數,藉此給出了打者能夠成功上壘的頻率。一個上壘率四成的打者除了代表他可以在聯盟裡傲視群雄,也代表他有四成的打席數可以上壘,其他六成的打席數會出局。放眼所有基本的打擊數據,也就是那些你可以在棒球卡背面或比賽秩序冊裡看到的數據,上壘率應該會是裡頭最重要的一個,因為它最可以告訴你一個打者的產出能力。
長打率(Slugging percentage,簡稱SLG)的計算近似打擊率,但它不以齊頭式的平等去對待每支安打。長打率的分母(就是下面那個)仍舊是打數,但分子從安打數變成了壘打數。壘打數的計算很簡單,一壘安打就是一,二壘安打是二,三壘安打是三,全壘打是四。這倒也沒辦法百分之百地反映每一支安打的相對價值;對於攻方而言,一支全壘打並不等於四支一壘安打,而是約當於兩支,但這確實在某種程度上滿足了我們把各種安打區分開的需求,而你也可以看出長打率確實與團隊得分能力有著非常好的相關性。你追求長打,你就能拿到更多分數。(事實上在這個樣本裡,光是每打席平均全壘打數本身與團隊得分的相關係數,就有0.623。即便完全不看球隊所做的其他任何事情,全壘打還是能為團隊貢獻一大塊的得分能力。)
整體攻擊指數的縮寫是OPS,展開就是On-base Plus Slugging,也就是把上壘率加上長打率,是個湊出來的數據。像這樣簡單粗暴地把上壘率與長打率送作堆,就數學論數學其實有不小的問題,但它卻在近年來的棒球圈內,不斷地累積著討論者間的人氣,連帶著媒體報導也愈來愈多,主要是這東西,好像還挺好用的。你可以看到整體攻擊指數與團隊得分能力的相關性左打上壘率,右踢長打率。整體攻擊指數不論是受歡迎的地方,還是有問題的地方,都多到我們得在這本書的後面另外開個房間詳談,但在此它可以先秀一手,讓我們看到打擊率少告訴了我們多少事。如果這些其他的比率都可以提供與團隊得分更好的相關性,而且又都輕輕鬆鬆就可以在個別球員的層次上取得,那打擊率跟它們比起來究竟有什麼競爭力呢?
作者介紹:基斯.洛爾(Keith Law)
畢業於哈佛學院(Harvard College),美國知名運動網站「運動員」(The Athletic)資深棒球作家。曾擔任「ESPN知情者」(ESPN Insider)專區的資深棒球作家、為棒球分析網站「棒球指南」(Baseball Prospectus)撰寫專欄。在加入ESPN之前,洛爾曾任職於多倫多藍鳥隊,擔任總經理特助,為期四年半,負責數據分析工作。洛爾現與妻女居於美國德拉瓦州,在台灣目前有《聰明看棒球》、《思維誤判》(The Inside Game,堡壘文化)兩本書翻譯出版。