PTT推薦

[閒聊] 進階數據RAPM簡介(末): RAPM

看板Spurs標題[閒聊] 進階數據RAPM簡介(末): RAPM作者
f820203
(Frank)
時間推噓 9 推:9 噓:0 →:10

Regularized Adjusted Plus-Minus (RAPM)

由於APM只用誤差最小平方法進行估算
若有球員表現呈高度相關性
則會出現多重共線性的問題
導致不同球員估算的正負值有劇烈的浮動
有的絕對值十分巨大 有的則趨近於0

此時可以在誤差最小平方合的矩陣外
額外加入λx正負值反矩陣x正負值矩陣
(可以想像成λx正負值平方和)
利用懲罰項λ讓正負值不會出現絕對值異常大的情況
這種作法稱為嶺回歸(ridge regression)
這也是RAPM以及許多新的籃球數據模型的基本方式


除了ridge regression之外
還可以加入幸運值的影響(luck-adjusted RAPM)
舉例來說隊友和對手罰球命中率不會受個別球員能力影響
但不同的命中率會影響球員的正負值
這個也能透過luck-adjust調整

小結

自從PER問世以來 進階數據已隨著資料科學的進步蓬勃發展。
除了引用基本數據做為公式之外
新的進階數據更像是透過新數據不斷修正的模型
有的主打動態數據 有的加入幸運值 有的則是能預測未來發展
甚至還有利用機器學習建立的模型

今天介紹的RAPM是很多先進模型會引用的
其實進階數據背後有很多數學以及原理
若能稍加研究
就能推斷出各個數據的優缺點以及適用範圍
個人覺得比起純粹比數字大小有趣多了XD

延伸閱讀

RAPM介紹
https://reurl.cc/Mk4Qyp

Ridge Regression (youtube 影片)
https://reurl.cc/V5NxNy

Luck-adjusted ratings
https://reurl.cc/OkGNGy

--

※ PTT留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 175.181.176.148 (臺灣)
PTT 網址
※ 編輯: f820203 (175.181.176.148 臺灣), 10/14/2021 21:53:07

blackdevil10/15 07:41推~

pescado10/15 11:06推,雖然門外漢只能模糊看懂個大概

vfgce10/15 12:35嚴格來說線性迴歸的迴歸係數才幾個,根本不是overfitting.

vfgce10/15 12:36會有很大預測誤差是因為共線性下符合最小平方的解不止一組

vfgce10/15 12:37沒有新的資料測試前根本不知道哪個預測效果較好。

vfgce10/15 12:39ridge ression的重要是盡可能選出小的迴歸係數。

vfgce10/15 12:40避免掉太大的迴歸係數造成過大的預測誤差。

f82020310/15 12:46樓上專業

f82020310/15 12:46線性迴歸的確是想辦法讓MSE壓到最小

f82020310/15 12:46而不是把所有值硬fit出來

f82020310/15 12:54Ridge則是收斂用的

f82020310/15 12:54我再修正一下文章

f82020310/15 12:54感謝V大提醒~

fated10/15 12:55感謝f大一直以來的用心分享諸多好文章

cowbay556610/15 22:23push

AriesC10/16 00:33感謝分享

mindd10/16 05:42push

softstar012510/16 10:39好文推

ThisIsNotKFC10/16 15:47

※ 編輯: f820203 (175.181.157.77 臺灣), 10/16/2021 17:01:50 ※ 編輯: f820203 (175.181.157.77 臺灣), 10/18/2021 13:37:06 ※ 編輯: f820203 (175.181.157.77 臺灣), 10/18/2021 13:39:32