Re: [心得] 認識正負值(Plus/Minus)- RAPTOR
※ 引述《driftcreator (北美漂流中)》之銘言:
這篇的介紹大概有30%是錯的, 但錯的還蠻關鍵的
: 正負值(+/-)可說是籃球數據界的殿堂名駒,現今你能拿來直接做球員比對的all in one數據,多帶有正負值血統。其血統表如下:
: ・第一代「原始數據」:正負值(+/-)、官網RTG系列
RTG不是+/-系列數據, RTG是基於Points Produced的進階數據
: ・第二代「迴歸分析修正」:APM → RAPM
: ・第三代「混合傳統數據」:ESPN RPM(2013年版)
: ・第四代「混合動態追蹤數據」:ESPN RPM(2019年版)、RAPTOR
: 個人當前較推薦使用RAPTOR。邏輯透明且能追朔至2013賽季。
: 新版ESPN RPM因為是黑盒子的關係,所以無從介紹驗證。目前RPM的產出結果,與其他版本(RAPTOR、BPM2.0、PIPM)存在較大的差異性。
ESPN得到RAPM授權之後, 推出了RPM
就RPM的說明, RPM是以RAPM為基底, 加上數據做調整, 但一直沒說明調整的方式
所以上面關於ESPN RPM的說明沒問題
但就RAPTOR的說明, 他並不是和ESPN一樣, 以RAPM為基礎加上數據做調整
而是直接用傳統數據+動態追蹤數據, 透過回歸分析去追蹤RAPM
這一點和BPM的做法類似, RAPTOR在網頁上也直說是由BPM得到靈感
為什麼BPM跟RAPTOR會這樣做?
RAPM的模型自從推出後就廣被推崇
但RAPM最大的問題, 就是需要夠大的回合數才能得到有效的數字
這邊的回合數在一開始RAPM的網頁中被定義為20000回合
但其實一整季都打不到這個數字
最操勞的球員都要三季才能得到20000回合數, 遑論有很多球員一輩子可能都達不到
因為RAPM計算不便, 又有短期效度問題
所以就有人嘗試以傳統數據用迴歸分析, 去追蹤長期RAPM
這種做法的想法就是
以長期RAPM作為應變項, 為每個挑出來的數據跑回歸分析, 找出權重
這樣找出來的所有權重*數據之後加起來, 就會近似於長期RAPM
那麼之後我們就可以直接把權重*數據當作長期RAPM
最初是2011年的ASPM
ASPM用傳統數據透過回歸分析去追蹤八年(2003-2011)的RAPM數據
ASPM後來授權給BR網站, 因為他是用傳統數據, 也就是Box Stats去追蹤RAPM
所以被取名為BPM
RAPTOR則是BPM的新一代版本
RAPTOR在傳統數據之外, 加上了官網在近六年提供的動態追蹤數據
簡單講, ESPN RPM是RPM的混合版本, 他仍然是基於原本的RPM模型, 但加上數據做調整
但BPM跟RAPTOR則是RPM的追蹤版本, 用回歸分析去追蹤某段長時間的RAPM, 以此產生公式雖然都基於RAPM, 但他們是完全不同的東西
把他們列為不同代的數據是不適合的
要比喻的話
ESPN RPM是RAPM+其他數據生的小孩
而BPM跟RAPTOR則是透過整形把自己整得像某一段時間的RAPM
: ---
: 使用正負值數據前,你需要有以下基礎認知:
: 正負值數據僅呈現「該球員於當前環境的已產出表現」
: a.預設球員表現穩定,不存在定位調整或化學反應。因此季中轉隊球員數據容易失真。
這邊的說明是錯誤的
RAPM並沒有預設球員表現穩定,不存在定位或化學反應
相反的, RAPM利用大數據去分析lineup與lineup的對抗
這是RAPM被推崇的主要原因
但也是RAPM的問題, 因為很多lineup的回合數不足以消除偏差
RAPM知道定位跟化學反應的影響, 嘗試用大數據去分析lineup的影響
你可以說他受限於數據做的不夠好, 但不能說他沒這樣做
: b.這類數據對未來的預測性低。只要隔季所待球隊環境改變,數據就很容易大變。
: 新一代數據的準確度,與位在高樓大廈內的GPS定位差不多
: a.注意概略落點即可,不要太執著在排名與微小的數字差異上。
: b.原始+/-與官網RTG系列評估球員的精準度非常差,不要拿來用。
: ---
: FiveThirtyEight RAPTOR
: https://projects.fivethirtyeight.com/2020-nba-player-ratings/
: a.加入了Second Spectrum的動態追蹤數據;能向前追朔至2013賽季。
: b.由85% BPM與21% RAPM組成,且有公開細部的權重分配。
這邊錯了, 網頁上85%跟21%指的是Total RAPTOR=85% BOX RAPTOR+21% On/Off RAPTOR
跟BPM和RAPM無關
: c.邊緣輪替球員(replacement level)的基準值:-2.75。
: d.有「球員未來預期版」,並額外添加了一堆參數進去。
: ---
: 以上是基於ptt閱聽眾特性的精簡版本。以下是解析文字較多的太長不看版
: https://vocus.cc/basketball/5dc88173fd8978000153fb0e
: 關於數據,Playtype與USG%則是球迷間最容易濫用與錯誤解讀的。相關介紹如下
: 認識Playtype
: https://vocus.cc/basketball/5d967bc0fd89780001a485ed
: 認識USG%
: https://vocus.cc/basketball/5dc88151fd8978000153fb01
--
願歲月靜好,現世安穩
--
推
推
推
推
推
我覺得搞懂這個比搞懂CBA還麻煩
推
推
推
有資料有推
推詳細說明與比較
CBA有時候需要的是時空背景的理解
而這種通常需要的是對分析假設及統計方法的理解
I大接受專業
先推
專業文推,專業到沒幾個人看得懂
推推 好奇如果拿短期球員的raptor去喂rapm會如何xd
如果短期和長期沒有系統偏差的話應該會有幫助?
原來raptor也是box metrics的產物 一直覺得這種類
型的數據 其命名裡面根本不該有+/-
扯
2
官網的RTG系列是把球員在場上時,球隊的得失分做百回合量化,跟+/-值一樣屬於結果數據,因此我把他們放在同一個類型下。 : 關於ESPM RPM 以下是沒有放上來的原文內容 正負值的核心問題是樣本不足的情況下準確度很差。RAPM具效性的樣本通說是三年起跳;也因此半季不到就能產出內容的正負值數據中,公開資料都是以高比例的BPM為基底,否則無法有效反應球員的當季表現。RPM雖為黑盒子,但普遍認為ESPN也是以相同的方式產出數據。 RPM對於box score的使用相當吃重是公認的,當然不一定是像RAPTOR這樣直接BPM系跟RAPM系兩組數據調比重混合出結果,但我個人不覺得只靠RAPM基底調參數就能讓結果敏感反應,特別在你2.0 matchup又多了更多小樣本參數的框框下。8
用百回合量化方式呈現的數據很多 但是否屬於+/-系列數據, 跟用百回合量化毫無關係 事實上原始的+/-數據就不是百回合量化 : : 關於ESPM RPM : 以下是沒有放上來的原文內容
爆
Re: [外絮] LBJ與龜龜同時在場時的正負值為-87,於單純比正負值會有很多雜訊。以這個題目為例: 團隊NetRtg 上場時間min LBJ on & 龜 on: -1.55 1,225 LBJ on & 龜 off: -3.00 620 LBJ off & 龜 on: -5.15 1,07573
Re: [情報] 到美國時間2/2止 所有NBA球員TPA圖: : 消息來源:(網址或出處) : : 內容: :34
[討論] 用 D-LEBRON 算出年度防守隊伍來分享BBall Index 的新數據:LEBRON Luck-adjusted player Estimate using a Box prior Regularized33
Re: [情報] 本季各位置ORPM、DRPM、RPM前五名ESPN的RPM在Jerry Engelmann 2019年去了獨行俠後,後面2.0版就爛了 2.0主導者Brian Macdonald花了近兩年結果爛尾,承諾的新版解析文沒寫完就離職,夾著尾巴躲回學界去了。後續換誰上我沒有追蹤 總之現在RPM在數據圈的地位低落,大概就跟看TPA差不多 所以等到Kevin Pelton跟Zach Lowe願意再度頻繁引用自家的RPM時,再來重新評價吧 NBA從業人員最偏好的正負值進階數據?30
Re: [討論] 這季第一中鋒是阿肥了嗎?Jokic從新秀賽季就是全聯盟中鋒RPM第一了,一直連霸到現在。不過是不是第一中鋒,我 就有點保留惹,附上他新秀賽季到現在的中鋒進階數據數據。順帶一提,我PO那年新秀榜 時就覺得他未來會是巨星,因為當時他的進階數據都很猛,而且也不是那種上場一下下而 已的 補充:數據都是從ESPN網站找的,因為PER跟RPM看ESPN最準,而ESPN把Anthony Davis擺在9
[閒聊] 進階數據RAPM簡介(末): RAPMRegularized Adjusted Plus-Minus (RAPM) 由於APM只用誤差最小平方法進行估算 若有球員表現呈高度相關性 則會出現多重共線性的問題 導致不同球員估算的正負值有劇烈的浮動8
[閒聊] 進階數據RAPM簡介(一): PER常常看到球迷引用進階數據分析球員 但往往都是直接拿數字來比大小 較少人會針對背後的數學公式/模型進行討論 因此想來介紹個在進階數據中鼎鼎大名的RAPM 要介紹進階數據之前要談一下進階數據老祖宗Player Efficiency Rating (PER)2
[閒聊] 進階數據RAPM簡介(二): PM and APM前面已經說明PER不能確實反映球員對球隊獲勝機率的影響 因此一個直覺的方法就是直接看球員在場上球隊會領先還是落後 正負值(Plus Minus, PM)還蠻簡單明瞭的 就是特定球員在場上的時候,(球隊-對手得分)是變大還是縮小 數值越大代表對球隊幫助越多,負值就是傷害球隊
60
[情報] Giannis Antetokounmpo將缺席今天面對騎士24
[情報] Giannis Antetokounmpo下家賠率11
[情報] 上週東西區最佳球員: Mitchell, Booker9
[情報] 尼克簽下Matt Ryan20
[花邊] JT 上Jeff Teague節目34
[外絮] 評價爵士拒絕湖人對Kessler的交易報價