PTT推薦

Re: [討論] 數字冷冰冰,解讀一下公布的民調

看板HatePolitics標題Re: [討論] 數字冷冰冰,解讀一下公布的民調作者
ecejc
(jc)
時間推噓 7 推:10 噓:3 →:16

剛剛在八卦回到新聞的文章被砍文且禁貼文了

在這邊重貼一次

誤差範圍是 3% + 3% = 6% 的說法在學理上也是錯的

要討論數字誤差,就要把數字當作機率變數來看才對

背景知識這裡有一些
https://web.ntnu.edu.tw/~algo/Number2.html\

可整篇看完也可以查關鍵字“隨機變數的四則運算”

E[X-Y] = E[X] - E[Y]
Var[X-Y] = Var[X] + Var[Y] - 2*Cov[X,Y]
==========
謝謝 chordate 版友指正

Cov[X,Y]這個數字是 X 和 Y 的相關係,兩者愈相關則數字愈大

這裡的 Var 就是是數值的 Variance ,用這個可以決定誤差值

X 對應柯侯民調數字
Y 對應侯柯民調數字

那麼兩個民調數字的差值也就是 X-Y
而根據“學理”公式,Var[X-Y] 不只是 Var[X] + Var[Y] (3% + 3%)
而還要扣掉 Cov[X,Y]
而Cov[X,Y]最大值可以是 Var[X]

因為 X 是柯侯 Y 是侯柯
所以 Cov[X,Y] 會是一個很接近 3% 的值

所以 X-Y 也就是柯侯 和 侯柯的差距的誤差值會接近 0%,而根本不可能到 6%


※ 引述《TheoEpstein (Red Sox→Cubs→?)》之銘言:
: 今天的民調,原始共有九份,有三份民眾黨要求不用,剩下六份是這六個:
: https://i.imgur.com/qbkMxDX.jpg

圖 數字冷冰冰,解讀一下公布的民調
: 第一個觀念「抽樣調查的誤差範圍,取決於樣本大小」。
: 這是統計學很入門的觀念。
: 所以全國調查時業界都會背了:「1068份問卷,基於95%信心水準,誤差為正負3%」。: N是抽樣數(這邊就是問卷數),N越大,誤差越小。
: 這樣子就可以看懂上面那張圖的一部份「為什麼誤差範圍每一份不一樣」
: 誤差範圍最小的就是第1項的「匯流民調」,
: 因為做到了2046份,N幾乎是別的民調的兩倍,所以誤差範圍只有正負2.17%。
: 誤差範圍這件事其實是科學,是統計,是沒有什麼好爭論的。
: 問題是解讀法。
: 國民黨的解讀法是,匯流那份 侯柯 46.10%、柯侯48.30%。
: 考慮到誤差範圍後是:侯柯48.27%~43.93%、柯侯50.47%~46.13%
: 由於"侯柯的最大值,高於柯侯的最低值",所以這份民調「國民黨解讀為侯柯勝出」
: 民眾黨內參那份也是一樣的道理,侯柯 39.7%、柯侯 44.0%,
: 樣本較少誤差範圍為2.98%,因此得到:侯柯 42.68%~36.72%,柯侯 46.98~41.02%
: 這份民調照國民黨解讀,也是侯柯勝出。
: 不過比較怪的是世新那份,那份 侯柯 40.82%、柯侯 46.01%
: 樣本少,誤差範圍為2.94%,可以得到侯柯 43.76%~37.88%,柯侯48.95%~43.07%
: 世新這份也應該是侯柯勝出(柯侯最低可能到43.07%,侯柯最高43.76%)。
: 所以,若依國民黨方式解讀,結論應該是侯柯 6:0 ,不是 5:1
: 因為沒有任何一個民調是「誤差範圍算下去後,柯文哲有贏的」。
: 是說,「侯柯/柯侯讓誤差」根本就是穩敗,這個我當天就講了,
: 到現在也沒人懂柯文哲為什麼會簽下去......
: PS.
: 紅酒大師剛剛發文講到重點「國民黨居然蠢到讓六份民調全部公開」。
: #1bM4ICaK (HatePolitics)
: 這六份數字攤開來,如果還是侯正柯副,那就是「讓民調低很多的人去選總統」,
: 民進黨會樂到開紅酒開PARTY了。
: 甚至連國民黨內參民調都是侯友宜輸:侯柯38.2%、柯侯38.8%
: (差0.6%,讓誤差後當然算侯柯贏)
: 朱立倫到底在想什麼........

--

※ PTT留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 122.116.74.16 (臺灣)
PTT 網址

DustToDust 11/18 21:02我們沒有討論那麼深入

朱立倫不是說根據統計學上的誤差來當標準嗎 我就告訴他根據學理 誤差就是接近 3% 說 6% 的告訴我哪一本統計學或機率學是這麼教誤差值不管三七二十一直接累加的

Heyer 11/18 21:03+-3%就是你要讓6% 就這麼簡單 不要揮

tsubasawolfy 11/18 21:03蔡正元有新算 差距-差距 的誤差值

tsubasawolfy 11/18 21:04不會是原本的正負% 會大概剩1/10正

tsubasawolfy 11/18 21:04負誤差

※ 編輯: ecejc (122.116.74.16 臺灣), 11/18/2023 21:06:25

Supasizeit 11/18 21:04柯被高估3% 侯被低估3% 不就6% 常識

Supasizeit 11/18 21:04好嗎

Heyer 11/18 21:04差不多一點 剩下1/10不就快全輸

thirtyto 11/18 21:05科學 還是 柯學

art1 11/18 21:05讓 6% 有這麼難以承認嗎?XDDDDDDDDDDDDD

chocoball 11/18 21:05雙方快去找3年的期刊啦 看能否有新解

chocoball 11/18 21:066%應該是教科書的算法沒錯 但就比較老

我敢說沒有一本教科書在誤差直接累加之前 沒有加一個旦書 兩個數字要對應完全獨立的兩個事件 而這個旦書在本次應用中 不成立

strawhatandy 11/18 21:06問就是要你讓6% 在那叫什麼

jenchieh5 11/18 21:06建議下周五開研討會 然後登記就過了

Heyer 11/18 21:06全輸我泱泱大黨不需要臉面嗎

※ 編輯: ecejc (122.116.74.16 臺灣), 11/18/2023 21:07:47

SHANGOYANYI 11/18 21:10朱老師數學的教材跟你的可能不同

zephyr105 11/18 21:12笑死 開統計大會了

zephyr105 11/18 21:13然後統計版還是很冷

chordate 11/18 21:19你算錯了

那你算給我看啊

※ 編輯: ecejc (122.116.74.16 臺灣), 11/18/2023 21:20:03

chordate 11/18 21:20是-2 Cov(X,Y)

chordate 11/18 21:20http://www.math.ntu.edu.tw/~hchen/

我重推導了一次 你是對的 抱歉

※ 編輯: ecejc (122.116.74.16 臺灣), 11/18/2023 21:21:36 ※ 編輯: ecejc (122.116.74.16 臺灣), 11/18/2023 21:22:52

chordate 11/18 21:22https://pse.is/5e7lty

chordate 11/18 21:22看Theorem 4.5.6

ariesbreeze 11/18 21:27如果是-2*Cov[X,Y],會不會相減值誤

ariesbreeze 11/18 21:27差甚至接近0%??

沒錯 如果 X 和 Y 是完全相關事件 那麼 X - Y 就不用考慮會有誤差 因為 X 或有誤差 +2 而 Y 又跟 X 是完全相關 所以 Y 也有誤差 +2 相減之後 (+2) - (+2) = 0 也就是沒誤差

Fallenshit 11/18 21:32以前的回憶都回來惹

※ 編輯: ecejc (122.116.74.16 臺灣), 11/18/2023 21:40:12

waitwind 11/18 21:54推~

※ 編輯: ecejc (122.116.74.16 臺灣), 11/18/2023 22:19:03

cvsi04236 11/19 04:23你推出了統計系大一大二公式 然後呢?

ecejc 11/19 11:04然後就可算啦 不知道怎下手看這 #1bMJBJkb