2015年4月13日 星期一

賽伯計量學新手入門(一)-FanGraphs網站

翻譯文章來源:Getting Started@FanGraphs

為什麼要用賽伯計量學(Sabermetrics)?


賽伯計量學是用來試著更準確地衡量運動。過去數十年,我們都是用全壘打、打點、打擊率、勝場數及防禦率等數據來評斷棒球員的好壞。但隨著收集、採集及分享這些資訊變得越來越容易,有些棒球隊與分析師開始發展其他統計數據。這些數據在追蹤與宣傳方面比現有的資料來得稍微困難一點,但它們比較能反映出球員的天份或成績。

最明顯的例子是打擊率(AVG, Batting Average)與上壘率(OBP, On-base Percentage)間的差異。保送對打者來說是個正向有益的結果,雖然它的價值比不上一壘安打或二壘安打,但起碼比成為出局數要來好得多。而打擊率卻完全忽略了保送,無法捕捉到打者重要的訊息。除此之外,AVG與OBP皆假定每隻安打和每次上壘的價值都是相等的(但事實上並非如此)。所以我們需要一個方法來評價打者上壘的價值,並計算出各種不同上壘方式其各自的價值。賽伯計量學的核心就在於我們希望確認我們可以盡可能的捕捉到所有資訊。

這只是一兩項統計數據的例子,目標永遠是希望有更好的衡量方式以及使用適當工具來解決手上的問題。賽伯計量學將所有相關的資料做轉換,讓我們能夠解答對於比賽的種種疑問。


基礎(The Basics)


對賽伯計量學好奇但不熟悉的球迷最普遍的疑問之一就是:該從何開始。應該從哪些基本的數據來了解FanGraphs所提供的所有資訊。網站上有數百種的變形,了解以下四個數據/觀念有助於解釋大部分賽伯計量學的數據意義。

Weighted On-Base Average (wOBA) (加權過後的上壘率)

wOBA是一切的關鍵。如果你了解並接受wOBA這個數據,你就已經準備好FanGraphs將要帶給你的任何內容。本質上,wOBA是一個讀起來像OBP的攻擊等級數據,它試著為球員表現提供一個完整的面貌。它比AVG、OBP、SLG及OPS來得還要好有兩個理由:
1. 它涵蓋了從保送、觸身球到全壘打及犧牲打所有數據。
2. 它基於上述這些動作所貢獻的平均分數來做加權的分配。
大家都知道一隻一壘安打(1B)和一隻二壘安打(2B)的貢獻價值是不同的。如果要從兩個當中選一個,2B永遠比1B來的好。正因為如此,打擊率與上壘率無法捕捉到這重要的區別。而 長打率(SLG, Slugging Percentage)和整體攻擊指數(OPS, On-base Plus Slugging)沒有適當的解決這個問題,因為它們只以1-2-3-4這種簡單數壘包的設計來對各壘打數作權重。二壘安打比一壘安打來的有價值,但這價值並不是很剛好地如SLG中,將其視為1B的兩倍。就算 OPS大體上陳述的故事與wOBA雷同,但相較於OBP,OPS過度地加重長打(SLG部分)的重要性。

深入看wOBA的公式:



上列為 wOBA 2014年版本的公式,由於現在低得分的環境,聯盟平均的wOBA約為 0.310。為了方便閱讀,我們將聯盟平均的wOBA設定與聯盟平均的OBP相等。我們利用公式裡的權重值來給予不同功擊行為各自相異的評價。一隻1B的價值並不是2B的一半,其價值大概是2B的70% (加權係數0.892:1.283)。這些權重數值是根據線性權重得來,其實就是基於球季中一壘安打、二壘安打等各行為改變實際得分數而設定的。

球員的評價水準應該來自於他行為所製造的得分數,而wOBA提供了比RBI, AVG或OPS更完整詳盡的統計。想要對wOBA有更多的了解請參考FanGraphs的wOBA頁面以及wOBA as a gateway to sabermetrics這篇文章。

待續...接下篇


1 則留言: