2014年11月14日 星期五

棒球數據文

棒球雖然是數據運動,但是卻有不少誤解數據真正意義進而做出假解讀,其實這也是有一些東方萬歲論的看球者一直認為棒球不該只有數據的原因(雖然這種人我常酸稱日職ㄉㄉ)

我們探究一下各種新式數據的歷史,其實這只是一個重度棒球迷Bill James因為他"覺得"他手上擁有評價選手強弱的工具(數據)其實沒辦法真實呈現球員的能力

Era對於中繼投手來說參考用,可能在壘上有人的時候換他上來,他很容易讓壘包上的人回來得分,但是他的責任範圍的時候,卻又一分不丟,所以Era漂亮,但是球隊老輸,打擊率高的選手組一隊反而不是得分最多的球隊,所以他著手進行研究各種數據,其實Brad Pitt主演的魔球中就有提到,但是發展到現在,之所以被這麼多人重視的原因是因為運動家礙於預算有限GM為了要打造一個高CP值的球隊,每一塊美金的預算要有邊際效用最大的價值,而且大家認為不可能的事情,居然會真的成功

如果MLB各隊都有200M預算,或是像以前還沒有FA制度與球員工會制度的時候資方可以壓低薪資預算的時候,那他們根本不需要擔心票房跟收益的問題的時候,James這一套新世代理論根本不會有人使用 

所以這一套理論,我認為是天時地利人和各種條件下,Beane一定要嘗試看看的新理論

結果誰知道在win share指數出來後人家發現,這個數據"感覺"好準喔,所以之後又產生更多新的數據來評價選手,也逐步發展到現在得到結論一個選手在場上的表現,甚麼是真正的能力,何謂運氣,你有多少貢獻,進階棒球數據史,其實會被人家使用到的背景,可以說很簡單也可以說很複雜,有很多人開始拿美國的數據來衡量日本跟台灣的時候,我敢說一定會碰到阻礙,因為他們完全忽略了一個東西,那就是MLB與亞洲國家的職棒球員組成完全不同

MLB不管國籍,你有能力30支球隊你一定有位置

亞洲國家的職棒是國籍優先,所以就算你的攻擊,防守,存有一些缺陷,但是因為某一些技能凸出或相比之下位置不會用洋將取代的位置,例如說近幾年中華職棒幾乎沒有洋打者,所以就算弱,也有很多機會可以上場,這也容易造就強投低BABIP或是更強進階數據的原因

這時候數據魔人沒想過這些數據產生背後的原因,其實很多時候我不是這麼買BP等新生代數據的帳,VORP值在7~8年前很流行,現在呢?

數據當然很重要,但是數據是輔助器材,不是棒球比賽本體,我評價教練調度是否得宜,都是用預期勝率去思考,做甚麼事情會讓勝利機率提高,棒球一翻兩瞪眼,不是輸就是贏(MLB)所以多提高一點自己的勝率

誰有能力進入職業棒球聯盟累積數據?當然是體能天賦優異的選手

球是選手在打,人有體能與生理狀況,為了要讓一個選手繼續發揮某種價值,做出改變是很平常的事情,而且數據是集合了全部的選手真實打了幾萬場比賽下去推導後得到的結論,再用這些結論去看現在的選手並且預測他們的未來,未來當然是無法預測的,只是我們可以從大樣本中得到很接近的發展軌跡

另外說到調度,出一個數學題,今天你有兩組距間,一個是0~40,另一個距間是30~70,然後上天告訴你,你要抓一個比35還要大的數字,這兩個group給你選,請問你要怎麼選?不是說0~40這個距間的數字無法抓到>35的數字,也不是說30~70抓出來的數字一定>35,重點是你看完之後你會選哪一個group?

但是我看到很多數據人不去思考數據真正要表達甚麼,只是拿現有貢獻去預測未來貢獻,然後說誰誰誰應該要花多少錢來簽,如果這麼簡單,新數據理論出來之後,有最多預算的洋基應該會繼續稱霸MLB才對

上面談到數據就是一切的人跟普通人犯了一樣的問題,他在之前說民國60年代出生的女性之所以少子的原因是因為這些女性二十多歲的時候都繼續念書,所以晚生,但是他沒考慮到的是,女性生理結構,>30歲的女性身體狀況其實不孕/懷孕的風險很大,因為生理結構開始老化,也開始步入更年期

棒球說簡單很簡單,難也很難,這也是我愛他,一直想棒球的最大原因,因為我至今仍然想不出一個最好的說法來表達我所建立的棒球觀念

沒有留言: