PTT推薦

Re: [討論] 民調統計之亂---最終章

看板HatePolitics標題Re: [討論] 民調統計之亂---最終章作者
chordate
(にんきもの)
時間推噓 3 推:3 噓:0 →:12

:
: 小弟看到版上很多人對民調統計很有興趣,
: 剛好這幾天我有一點粗淺的研究成果, 提出來和大家分享一下.
: 如果有錯還請不要見怪.
:
: 先講結論:
:
: 1. 如果沒有每一份民調原始數據, 無從判斷是3:3或是5:1,
: 2. 如果在某一份民調中, 柯侯和侯柯的正相關性r高達0.8,
: (這個r值每份民調都不一樣)
: 那麼民調之中柯侯只要領先侯柯2%,
: 統計上就代表柯侯顯著勝過侯柯
:
: 3. 如果r接近1, 那誤差範圍=0.001%, 柯侯與侯柯誰多贏一票就是贏了 ,
: 所以民眾黨用原始數據稱六份民調當中他們贏五份, 並非全無道理.
:

如果看版上說民眾黨的算法的話,
他們是應該是先算 柯侯-賴蕭1 和 侯柯-賴蕭2
這裡會先誤差放大約2倍(就是林教授的文章中的公式)

https://blog.udn.com/nilnimest/24057891

(附帶一提,上面的公式推導可以用二項分布的variance,
以及Var[X-Y]= 2Var[X]+2Var[Y]-Var[X+Y]得出)

然後再算 (柯候-賴蕭1)-(侯柯-賴蕭2)
這個時候兩個括號內的變數的相關係數會起作用。

假說檢定時,
如果不知道相關情況的話,就用常態分布或是Student-t test可以將就一下

其實這兩個數據本來是paired的(因為是問同一組人)
誤差範圍可以做到更小。不過不知道為什麼都不公布原始數據就是了。

推文裡面有提到加權的問題,
確實加權就會讓誤差先放大了,
不過看一般公布的民調似乎也都沒有在考慮加權的。

--

※ PTT留言評論
PTT 網址
※ 編輯: chordate (146.70.205.188 日本), 11/22/2023 03:18:14

henryliao 11/22 03:20主要是民眾黨的3份民調加權到超過常理

有權重數字的話就可以算算放大多少 variance會放大 權重平方和/權重和的平方 倍

Supasizeit 11/22 03:23市話年齡層加權有誤差、手機門號太多

Supasizeit 11/22 03:23也有誤差、這些誤差,都是柯主席答應

Supasizeit 11/22 03:23退讓的部分,所以請不要當民族罪人

※ 編輯: chordate (146.70.205.188 日本), 11/22/2023 03:26:48

forb9823018 11/22 03:35因為那些民調公司不是專門為他們服

forb9823018 11/22 03:35務,有些是拿現有公布民調直接拿來

forb9823018 11/22 03:35

forb9823018 11/22 03:35而且公布加權方式,就像餐廳把食譜

forb9823018 11/22 03:35配方公布出來,還是免費公布

kh749 11/22 03:42他們一樣假設r=0.9, 就會算出來黃珊珊記者

kh749 11/22 03:42會上說的1.34%2=2.68%, 讓3%已經太多的結論

kh749 11/22 03:43可是每份資料的r不一樣, 像聯合報的r=0

bakuman 11/22 05:201樓何不寫一篇哪裡不合理 還是只是聽別

bakuman 11/22 05:20人說不合理就在那邊很不合理?

bakuman 11/22 05:20我看很合理啊

henryliao 11/22 05:24那些資料15號之前有些就出現過了 有蠻

henryliao 11/22 05:24多人算過了

kg000005 11/22 08:01所以說,三角四角的第二輪投票比較符合

kg000005 11/22 08:01聯合政府的選舉