Re: [閒聊] 嘗試以機器學習排出P+前三隊

tony790927 發表於 2022/7/8 上午10:44:58

看板basketballTW標題Re: [閒聊] 嘗試以機器學習排出P+前三隊作者

(Chiao)時間Jul 8 10:44:58 2022推噓13 推:13 噓:0 →:22

感謝大大有趣的文～
剛看了下UCLA論文後有幾個機器學習的問題想問，因文長用回文形式，若不適合本版我再刪文

1. 關於features數目，原論文似乎自己挑18個數據，把一些數據如總籃板數、失誤（他們?得失誤比較無法顯示好壞表現）等拿掉

而原po似乎是遠多於18再用2次降維方式後再K-Mean

不過論文看起來他們只是拿降維後的做2D visual而已（下圖）

https://i.imgur.com/XbFWIRD.jpg

圖https://i.imgur.com/XbFWIRD.jpg?e=1667440594&s=HTLoJ7nI1JPaJp0mq2ocuA, 嘗試以機器學習排出P+前三隊

拿去K-Mean的是沒降維的，畢竟只有18維。這邊或許可以自己挑出類似features，才不會太雜亂數據影響。

以下是他們選的

https://i.imgur.com/pYlMp8f.jpg

圖https://i.imgur.com/pYlMp8f.jpg?e=1667479354&s=4PllK7ZRBpLLhPgeCi6_7g, 嘗試以機器學習排出P+前三隊

2. 論文最後是有說到其實「每個群是類似的」

如下圖, 每個群跟隊伍排名的線性關係p-value都很大（p-value 越大信心程度很小）

https://i.imgur.com/nx3TZqw.jpg

圖https://i.imgur.com/nx3TZqw.jpg?e=1667446853&s=bMDyDnENdtpaF8guIyxMOA, 嘗試以機器學習排出P+前三隊

“This suggests that there is no relationship between how good a team is and membership in a particular cluster. “

就是幾乎沒關係的意思

文中提到重點是「離每個分群質心的距離」才能顯現好壞球員，例如在x群中的離x群的中心越遠，則球員越猛

https://i.imgur.com/FZ7CUxK.jpg

圖https://i.imgur.com/FZ7CUxK.jpg?e=1667490956&s=TQcbHx-n2JuFzcZlnLZjMA, 嘗試以機器學習排出P+前三隊

可看到p-value才0.02左右（0.98的信心）

簡言之，如果直接拿每個群當成一二三隊似乎不適合，可能用與跟質心的距離排出各個球員才比較好。

而原PO現在分群中的第一隊，可能有些人是比較靠近質心，有些人則是遠離質心，比較好的式可以多列出他們與質心的距離，越大則是越厲害

不過上述都是建立在你是follow這論文的作法，如果你有修改的話可能就不是我上述所說的一樣了。

話說我也可能有錯，只是小弟的一些看法，歡迎指正。

發此文的用意只在推崇科學與運動的結合，很感動台籃版越來越活絡，也感謝原PO的effort
----
Sent from BePTT on my iPhone 7

--

※ PTT留言評論

※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 122.99.29.154 (臺灣)

※ PTT 網址

推

csro7788 07/08 10:48推推

→

Joshuaian 07/08 10:49推，大力推！

推

a21215540 07/08 10:50推

推

YYYero 07/08 10:52推這篇

推

bobon0921 07/08 10:54i7 原po手機好能撐

→

tony790927 07/08 10:57最近才從6s剛換成7 二手而已，小弟常摔手機，摔到

→

tony790927 07/08 10:57才不會心痛XD

→

shifa 07/08 11:00所以這篇是用分群去界定一二三隊的範圍，然後根據

→

shifa 07/08 11:00分群去找跟勝場有最高度相關的球員？

我的理解：這篇UCLA的論文是先找出”類似的球員”的分群，然後根據所有30隊nba隊伍算出每隊nba隊伍含有第一群、第二群的比例，（例如咖喱、k湯在第四群, 勇士隊含有第四群球員比例是2/n, 同樣地算出含有第一、二…群比例，以及其他隊如籃網隊的各群比例），? 現算出來含有各群比例跟不同nba 隊伍之間的排名沒有實質線性關係，進而間接發現其實每個分群其實都是均勻，沒有明顯哪個群比哪個群厲害。後來他們發現是群中的球員到群的質心距離才能代表球員好壞

推

a034506618 07/08 11:02推

推

pupss93101 07/08 11:04推整理，很清楚！

推

johnbill 07/08 11:11好文

→

lwswjs 07/08 11:31很好有文獻探討也有引用

推

xpope 07/08 11:31有點意思

推

lszh9999 07/08 11:46看來台籃板也是一堆ML的高手