Re: [外絮] 用機器學習模型預估MVP得主
※ 引述《timmyen (Ako)》之銘言:
: 今天早上在reddit看到的文章,覺得挺有趣,轉過來跟版友們分享。
: 小弟不是學資料科學的,如果內文有誤也請不吝指正
: 原文:https://perthirtysix.com/essay/2021-nba-mvp-race
: 懶人包:
: 作者(u/robmoo_re)利用了過去38年的NBA的球員資料以及MVP票選結果(包含排名及票數)
: 建造了一個預估球員得到MVP的機率以及MVP得主的模型,
: 利用這個模型,在過去38年中可以正確的計算出32年的得主。
: 在這個模型中,各項球員數據的權重(也就是這個模型認為影響MVP票選最重要的數據): 依序如下:
: https://imgur.com/33ouqUG
: 球隊勝率%
: 每場上場時間
: 球隊種子序
: WS/48
: 每場得分
: 出賽場次
: VORP
: 2分命中率
: 罰球次數
: 助攻數
: 每場籃板
: 整體命中率
: BPM
: Usage%
: 每場失誤數
: 真實命中率
: (以下不列,可以自己看圖)
: 模型利用以上數據算出每一個球員的candidacy score
: 這個分數越高者,即是模型認為越有可能得到MVP的人選
: 要特別說的是,某些數據本身是互相有關聯性的(譬如:兩分/三分命中率及整體命中率,: 或是整體命中率跟一大堆進階數據),由於已經被重複計算過,因此單項的權重會降低,: 不代表這項數據就不重要。
: ===
: 幾個有趣的結果
: 1. 誰是這38年來MVP分數最高的球員?
: 答案是08-09年的姆斯,分數高達4.49
: 2. 那最低分的MVP得主又是誰?
: 答案是04-05年的Nash,他當年的分數只有1.09
: 3. 誰的MVP被偷了?(誤)
: 剛剛提到38年中這個模型成功預測出32年的MVP得主,
: 這也代表其中有6年模型預測跟最終的結果是不一致的,
: (1) 2016-2017年的MVP,模型預測得主是Harden(2.73),最終由當年拿下平均大三元
: 的Westbrook(2.44, 第二)拿走MVP
: (2) 2010-2011年,當年分數最高的是LBJ(2.37),最終MVP被Rose(2.23)拿走。
: (3) 2004-2005年,也就是上面提到,Nash以史上最低分(1.09)拿下MVP的那年。
: 當年屈居第二的是Shaq (1.12,其實沒差很多),也難怪他老人家到現在還在記仇
: 另外,隔年(05-06)Nash連莊時MVP分數也不是第一(1.8),
: 當年分數第一的是LBJ(2.25),只能說Nash真的是這個模型的outlier
: 4. Kobe到底有沒有偷了CP3一個MVP?
: 如果用這個模型看,答案是沒有,當年(07-08)Kobe以2.62分拿下MVP,
: 屈居第二的CP3分數是2.2分
: 5. 38年來最大的一二名差距發生在1999-2000年,當年大歐以3.71分拿下MVP,
: 分數第二的是Alonzo Mourning -- 0.7分 (票選第二的是KG,分數0.55)
: 另外,Curry全票MVP那年分數是3.47分,第二名的可愛1.89分,也是不小的差距
: 6. 那今年的MVP會是誰呢?
: 模型預測今年的MVP會是阿肥Jokic
: https://imgur.com/KRIWmS9
: 本賽季截至目前為止,MVP分數最高的三人分別是
: Jokic (2.02)
: 字母哥(0.26)
: Embiid(0.04)
: 非常巨大的差距
: ====
: 有興趣的版友可以去看看這個模型是怎麼建出來的
: 裡面有個"Explore 1984 - 2020"可以拉出這38年間所有模型跑出來的結果
: https://imgur.com/ZU04aVC
: Reddit討論:
: https://www.reddit.com/r/nba/comments/n150xj/
討論這問題先搞懂MVP是啥好嗎?
最有“價值”球員
球員的價值又不是那些數據能完整呈現的
況且這些數據基本都是人為定義
老衲第一年會拿主因就是回歸後作為核心戰績躍升
你說這不能表現一個球員的價值?
Rose那年更好笑了
LBJ身邊有兩個去年前五的隊友戰績還輸
你跟我說他比較有價值?
龜龜那年就是大三元噱頭
我也覺得用數據有沒有湊到雙位數評斷球員加值扯到不行
但就是投出來的結果
另外這model 32/38的準確度還是在偷看答案的情況下得到的
就說明用這些數據看MVP本來就非常浮動
有個model出來大家討論/預測是不錯啦
但拿這個結果出來氣噗噗誰偷誰就好笑了
-----
Sent from JPTT on my Google Pixel 4 XL.
--
有些東西本就不是量化可以看出來的 數據都只是參考
這篇中肯
推
數據是死的,投票的人是活的,要拿MVP本來就會有諸
多因素影響,這篇正解
同感 拿結果套出來的模型 去argue哪年的結果不準 也
是蠻奇怪的 難道不是繼續修改模型嗎?
拿結果去弄出來的模型 結果38個sample就有6個是錯的
這種白癡模型也有人會信哦 笑死
別那麼激動 只是預測一下
所以姆斯去年該拿囉,沒有他一輪都沒有
氣成這樣 XD
但是總要有一個客觀的評價,大家在努力找啊
人家是拿數字去解釋 你拿感覺去解釋 還氣成這樣是
怎樣
你真的有搞清楚那個模型是從什麼角度解釋MVP拉嗎
笑死
至少比那些討論誰被偷的懂多了
人家就是用模型跑又沒有說他就是標準
你根本沒看懂我在說啥
大家就在討論啊 就你特別發一篇出來氣XD
說真的如果機器學習能得出跟人類投票完全符合的結果
,那在坐各位應該都不用工作了 不過就是分享個實驗
結果,這麼認真辯護幹嘛
你很氣欸 數據分析本來就是這樣了啊 連人為因素都能
那篇底下就一堆人在那邊偷來偷去的啊
分析的話ML就無敵了好嗎
這兩天太陽迷真是火力十足XD
模型就是推測跟參考而已 而且他的準度也不低
照這套賭,勝率32/38;要是原PO能弄出勝率更高的mo
del,賭客當然樂觀其成啊
我要說的是用這個去說誰是不合格MVP很蠢,就這樣
100%命中就會被argue過適了啊 XD
機器學習我只服濤哥
你是不是不懂數據分析
會很在乎,說是什麼偷啊、不如第二順位,大概就是
下重注的或是死忠粉絲啊!發洩一下無傷大雅,看球
本質就是娛樂嘛
笑死我從頭到尾沒有批評那model
一堆人中文不好在那跳針
無言
原po內文一堆矛盾==
人家認為這些數據配合權重就是可以某種程度上代表M
VP。要拿「不可見的感覺」出來講講的就是另外一件
事情了。
等等,那model難道不是拿那38年的MVP當作test data
嗎?train應該要用額外年度吧?
我是沒認真看啦 但這資料你哪來額外年度XD NBA環境變化那麼大40年前資料拿來train怎麼可能準
不要這麼中肯
好不容易有浮木飄過來
跟不是工程的人討論數據分析本來就別奢望他們懂
人家的模型在試圖算出可能被“選”出來的MVP 要是
有個單純只在量化球員個人表現價值的模型多好
其實32/38沒啥參考價值
你是不是看不懂原PO想表達什麼..
我又不是回原po
真的 32/38 還說誰偷誰的 根本自己做壞model還在吹
其實他不算32/38啊 因為那個是已知的資料
你用這組model用test之後還未知的數年mvp才知道準確
率
其實妳也可以用出38/38但這個預測之後的mvp一定很爛
那強者跟強者同隊數據會稀釋怎不說 只看戰績 那為
何不綁定只能頒給戰績第一 事實上就是戰績也只是數
據之一
幫補血 噓文的套路好一貫XD
一看就是不懂機器學習的文組
至少人家有數據,你只會通靈
supervised learning本來就要給training data好嗎
還在十進位湊雙位數??? 到底醒了沒啊
幫我看一下我這樣有符合一貫套路嗎
得分王 PER最高 單核帶隊 講幾次了還在人類十進位?
笑死
我也是沒認真噓
好了啦每年改標準最重要
都在湊答案了,應該有辦法全對,例如前後季戰績差
異大加分、或平均大三元加分 之類的
氣氣氣,嘻嘻
蠻想知道他是用那幾年的基礎資料當基底去回測過去過
去mvp的準確度
…
笑死
就是數據分析,那感覺跟人家吵啥,潑婦罵街喔?說看
看妳的分析方法看可以猜中多少個啊
爆
[外絮] 用機器學習模型預測MVP得主今天早上在reddit看到的文章,覺得挺有趣,轉過來跟版友們分享。 小弟不是學資料科學的,如果內文有誤也請不吝指正 原文: 懶人包: 作者(u/robmoo_re)利用了過去38年的NBA的球員資料以及MVP票選結果(包含排名及票數)爆
[外絮] Josh Giddey:最有價值球員是讓最多球員Josh Giddey:最有價值球員是讓最多球員變得有價值的球員 What makes an NBA MVP? Every single year, this question becomes the catalyst for debates around the community, as the criteria for actually winning the award se emingly change all the time. 什麼是NBA的MVP?每一年,這個問題都會成為社區辯論的話題,因為實際獲獎的標準似乎一爆
[專欄] 《NBA》Nikola Jokic邁向MVP三連霸之路《NBA》Nikola Jokic邁向MVP三連霸之路 編譯:運動喫羊肉 原文:Nikola Jokic is delivering another Kia MVP-caliber season 在聯盟充滿鬼神數據本季,季末的MVP票選肯定會非常激烈。目前Nikola Jokic手上握有 接近場均大三元、61.5%投籃命中率、24.1的ON/OFF DIFF等頂尖數據。如果他能保持整季44
[花邊] 嘴綠:我認為咖哩是MVP,從15勝打到西部嘴綠:我認為咖哩是MVP,從15勝打到西部第八就是價值所在 虎撲06月10日訊 今天,勇士球員Draymond Green在節目中談到了本賽季的MVP話題。Stephen Curry在MVP選票中排名第三,Nikola Jokic獲得了本賽季的MVP。 “我喜歡籃球,如果你喜歡籃球,那你就應該選Stephen(Curry);如果你了解籃球,你也應該選Stephen。” “如果賽季正常,我們就會進入季後賽,但這又能意味著什麽呢?歸根結底,每支球隊的陣容不一樣,我們的陣容不如金塊,不如76人。如果MVP的評選標準只是,‘那支球隊戰績最好,誰是這支球隊中最好的球員,那就是他了’,這是行不通的,因為每支球隊的陣容都不一樣。” “我們這支排在西部第八的球隊和去年是同一支,去年Curry受傷時,我們只贏了15場比賽,當你看看那支球隊,你會說‘我們今年的陣容實際上與去年沒什麽不同,但他們只贏了15場?’,對我來說,(Curry)這就是價值,這非常有價值。”58
Re: [討論] 還有哪些年MVP是有爭議或值得討論的?西河 那年最有爭議 根本不用討論 場均大三元確實很厲害 但雷霆卻只有西區第657
Re: [情報] 本季幾位MVP熱門人選賠率NBA球季進入尾聲,眾所期待的年度最有價值球員(MVP)獎項即將揭曉。在眾多優秀球員中, Joker和Embiid被認為是當中的佼佼者。我整理了兩人這兩年的四大正負值進階數據(EPM, D PM, LEBRON, RAPTOR)進行比較,得出一些有趣的結果。 根據比較結果,Joker的表現似乎略勝一籌,但Embiid在大部分指標上都位居第二名,表現26
Re: [花邊] Malone:Jokic從不傾向於自己的成就或吹噓TD 2次NBA最有價值球員 五度帶領馬刺隊在1999年、2003年、2005年、2007年和2014年獲得NBA總冠軍 年年進入季後賽 三度成為NBA總決賽最有價值球員22
Re: [討論] 2021 NBA歷史百大球員排行原PO的計算公式實在是讓人很難不聯想到為LBJ量身訂做 第一: 年度隊伍一二三陣基本上跟明星賽的球員重疊性高,會有重複計分的問題 另外要衡量一個球員的偉大,怎麼會去計算到明星賽? 那是娛樂球迷的單一比賽,單純的比人氣
爆
[花邊] Luka g2關鍵三分逆轉爆
[討論] Kidd是不是蠻有料的爆
[花邊] 西冠至今,AE和KAT合併命中率30.4%爆
[花邊] 巴克利很喜歡明尼蘇達爆
[花邊] 77:媽媽法克 你他X不可能守住我爆
[花邊] 77:我只要比狗貝快就好爆
[情報] AE第四節休息期間戴上面罩吸氧80
[討論] 所以KG的防守到底有多恐怖....73
[花邊] Edwards:我們沒人會感到恐慌,我們會沒74
[討論] 獨行俠的防守跟金塊太陽差在哪72
[情報] Kidd:本來是叫77搶兩分,但如同你看到的54
[情報] Tyrese Haliburton左大腿痠痛 G3出戰成疑爆
[花邊] NCAA允許付薪水給學生球員43
[討論] Gobert平常練球在練什麼?58
[花邊] Lonzo Ball說他必須從捐贈者處取得一個55
[花邊] 77:我沒想到他們換防,我正想打 Gobert56
[情報] Luka:Lively的天花板很高22
[花邊] 狼迷:嘴綠你好爛 嘴綠:狗貝才爛43
[花邊] Rich Paul:Bronny不會簽雙向合約18
[花邊] 老皮:Doncic&KI是史上最強的進攻雙人組30
[花邊] Irving的溜手救回空接給Lively19
[討論] Gobert算是最常被後衛點名的DPOY嗎?15
[討論] 有球隊能在客場拿到4勝嗎?53
[情報] 太陽將試訓Bronny20
[情報] 2023-24 NBA總冠軍 /系列戰賠率17
[情報] Luka:我沒有說髒話,我當時在說斯洛維尼9
Re: [花邊] 77:我只要比狗貝快就好11
Re: [花邊] Green:灰狼要多使用李凱爾,甚至可以讓