PTT推薦

Re: [問卦] 有沒有三方的統計學都超級爛的八卦

看板Gossiping標題Re: [問卦] 有沒有三方的統計學都超級爛的八卦作者
brian900530
(LmWAng9)
時間推噓31 推:34 噓:3 →:96

首先 抽樣誤差是在統計學上本來就會有的限制

只是用機率的形式來展現

拿抽樣誤差3%6%來說要讓幾% 根本就在亂用

到底指的是民調數字讓3%?讓抽樣誤差?

還是只要沒有統計上的顯著差異就讓?

講的不清不楚

更別說兩黨在比的東西不一樣吵的東西也不一樣

一邊比差距的差距,一邊比柯侯-侯柯

一個是相對數字一個是絕對數字

兩邊所謂的3%6%指的根本就不是同一件事

到底在吵什麼,也完全是看不懂



假設有效樣本數1068 在95%信心水準下

誤差就是+-3%,舉例來說就是100的正負3

但這只能用在計算單一統計值的時候



藍白是把一個民調裡面的兩個統計值拿來相比



下面就直接節錄一些臉書上教授寫的文



支持率的差異不一定要超過兩倍的抽樣誤差(柯文哲說的6%)才會達到統計顯著

第一因為3%是保守最大值的估計,實際上的「抽樣誤差」通常會比3%小。

再者信賴區間有重疊也不代表沒有達到統計顯著

第二,兩個人的對比支持率是同一個民調做出來的,不是獨立樣本,不能忽略相關性。



———————————————————————

以下是同一民調不同問題得出的支持度應該怎麼比較:

https://i.imgur.com/4sM2ya6.jpg

圖 有沒有三方的統計學都超級爛的八卦

以匯流為例,樣本數n = 2046,(1) 柯侯48.3%對比(2)賴蕭 39.2%,所以(1)-(2) = (3)


兩個統計量的差異的標準誤差是這樣算的 https://i.imgur.com/50DV1iY.jpg
圖 有沒有三方的統計學都超級爛的八卦



sqrt( { p1*(1-p1) + p2*(1-p2) + 2*p1*p2} /n )

=

sqrt( (0.483*(1-0.483) + (0.392)*(1-0.392) + 2* 0.483*0.392)/2046)

= 0.021



因為柯侯: 賴蕭 是在同一個問題問的,支持柯侯就不會支持賴蕭 (互斥)

所以這兩個支持率的相關性是負數,這就是為什麼公式後面為什麼會多出2*p1*p2。



所以柯侯對比賴蕭的支持率要超過1.96*2.1% = 4.1%,才有統計上的差異。



同樣的方式可以算出(4)-(5)=(6),兩個統計量的差距的標準誤差是0.0207。

所以侯柯對比賴蕭的支持率也是超過1.96*2.07% = 4.1%,才有統計上的差異。



但是如果要直接比較柯侯對侯柯的支持度,就得考量到這是兩個不同問題得到的

而且支持柯侯的人也會比較傾向侯柯,所以相關性為正。



而(1)-(4)的標準誤差會長得像這樣

sqrt( ( p1*(1-p1) + p2*(1-p2) - 2*v ) /n )

=

sqrt( (0.483*(1-0.483) + (0.461)*(1-0.461) - 2* v)/2046)

= ???



v 是柯侯跟侯柯在兩個問題的共變異數,得用原始資料去估計。



沒有v就算不下去



也就是說,不論是(3)-(6)=(7)還是(1)-(4)=(8)只要沒有原始數據

都算不出來應該怎麼決定有統計意義的差距。差距的誤差就不是抽樣誤差。



結論:

再怎麼說 藍白合民調比拼絕對不是拿兩個數字來相減然後說

喔你看在6%內然後另一邊說才不是明明是3%

這是需要民調專家學者去運算的
都已經找來兩個專業的來當裁判

原始數據都在這些人手上

明明是一翻兩瞪眼的東西結果演成這樣

所以我也看不懂朱立倫記者會到底在說什麼

至於柯說什麼3% 純粹是以為誤差值是固定3%


--

※ PTT留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.161.213.250 (臺灣)
PTT 網址

newwu 11/19 07:02說原始資料 倒也不複雜,就是要有多少比例

newwu 11/19 07:02兩個情況都投藍白或賴蕭

sunhero 11/19 07:04這劇本讓大家覺得腦容量都不足了

witJeff 11/19 07:05這麼認真,阿北只是在營造被kmt 欺負的氛

witJeff 11/19 07:05圍凝聚白黨的支持而已。

KoenigseggG 11/19 07:06吵啥都假的啦,只有柯說要挽回年輕

KoenigseggG 11/19 07:06人支持是真。

KoenigseggG 11/19 07:08那天簽完後的反應,他自己也知道後

KoenigseggG 11/19 07:08果,後續只是在補救。

※ 編輯: brian900530 (1.161.213.250 臺灣), 11/19/2023 07:08:28

tr920 11/19 07:13基本上,兩個機率值直接相加減,就是智障

tr920 11/19 07:13等級的算法。你去問朱如果一張彩券中獎率

tr920 11/19 07:1350%,連買2張中機率多少,他肯定回答50%+5

tr920 11/19 07:130%=100% ,結論是朱比國中生還不如

melao 11/19 07:17結結論是柯候對賴有顯著差異,候柯對賴可

melao 11/19 07:17能沒有

doohan01 11/19 07:18柯的認知應該是H0:柯-侯<=3%

doohan01 11/19 07:20朱講的是統計誤差訂在3%,但6%是什麼鬼

doohan01 11/19 07:22信賴區間檢定又不是比極端值

uranus99 11/19 07:45柯文哲是說願意讓3%,一直都說他願意讓

uranus99 11/19 07:46這麼多,而不是真的誤差值這麼多吧

doubleperson 11/19 07:46推! 另外他們比的是與賴蕭差距的差

doubleperson 11/19 07:46,我是很懷疑這種相依母體內差距的

doubleperson 11/19 07:46差,有沒有人導過變異數的公式,你

doubleperson 11/19 07:47還不如直接柯侯減侯柯再來算變異數

newwu 11/19 07:53最複雜的情形,就是考慮相關性下,比與賴

newwu 11/19 07:53蕭差距,不過有原始資料都不難算,你就把每

newwu 11/19 07:53個人都當成paired data求差距的差距,再求

newwu 11/19 07:53變異數就好

newwu 11/19 07:55大不了bootstrapping 假如他們真心相信科

newwu 11/19 07:55學,這都不是問題

eolnikon 11/19 08:00讓幾趴其實是誰出錢導致的問題

cmplbbl 11/19 08:05跟九二共識一樣 只有國民黨自為為已經取

cmplbbl 11/19 08:05得共識了

PeikangShin 11/19 08:09那個不是保守估計 是叫做最大概似

PeikangShin 11/19 08:09估計值 MLE 所以p會用0.5去代入

ztdxqa 11/19 08:11推!紅明顯。有raw data 絕對是可以算出c

ztdxqa 11/19 08:11ovariance的 。

rayjames38 11/19 08:11覺得看起來不是都超爛 是一邊在變形蟲

rayjames38 11/19 08:11規則想找到自己能贏(可能沒想過自家

rayjames38 11/19 08:11人表現這麼爛)另一個是根本沒想太多

rayjames38 11/19 08:11統計本身就不是重點 不過願稱11/18是

rayjames38 11/19 08:11台灣統計日 再補充點 本身民調單一值

rayjames38 11/19 08:11已經要考慮誤差範圍 差值是兩個有誤

rayjames38 11/19 08:11差範圍的值相減本身差值的變化就已經

rayjames38 11/19 08:11很大 最後一個更扯 是拿兩個不同基準

rayjames38 11/19 08:12的值在比

rayjames38 11/19 08:12然後別說什麼誤差+-3% 所以35%下 32%

rayjames38 11/19 08:12跟38%是沒有差別 錯 是在5%承擔風險下

rayjames38 11/19 08:12 如果得到35%結論 有5%實際是32% 那如

rayjames38 11/19 08:12果你同時一邊取最差 一邊取最好 就是

rayjames38 11/19 08:12最好發生機率5%且另一邊發生機率是5%

rayjames38 11/19 08:12也就是5%*5% 0.25%的機率會發生這情況

rayjames38 11/19 08:12...

kudoe 11/19 08:14同意

rayjames38 11/19 08:16講白一點 有raw data真的要算 根本不

rayjames38 11/19 08:16用什麼讓 可以直接算出 兩邊各自勝出

rayjames38 11/19 08:16的機率密度

PeikangShin 11/19 08:18大哥 這是抽樣 你的cov僅能解釋單

PeikangShin 11/19 08:18一筆抽樣數據而已

tanjau 11/19 08:18講統計沒人看到懂啦 有的炒 數字出來誰強

tanjau 11/19 08:18誰弱一目了然 這才是柯的目的

PeikangShin 11/19 08:21估計的不偏 一致性質用什麼來說是穩

PeikangShin 11/19 08:21健估計就可以吵翻天了 沒你想得那

PeikangShin 11/19 08:21麼簡單

duckosara 11/19 08:23專業統計

PeikangShin 11/19 08:33現在把獨立性質也拿掉了 自由度會變

PeikangShin 11/19 08:33怎樣 也還是待解決問題 蚵仔提出

PeikangShin 11/19 08:33差距的差距又考慮不獨立時怎麼檢定

PeikangShin 11/19 08:33 說不定都可以寫一篇論文了

Clieff 11/19 08:38其實3%直接乘以根號2,取對國民黨有利的

Clieff 11/19 08:38樂觀值,也是3:3,反而要用原始資料考量

rayjames38 11/19 08:38其實還有個問題 就是一直在講empirica

Clieff 11/19 08:39變異數檢討誤差區間,搞不好變異數會導致

rayjames38 11/19 08:39l rule上 民調實際為結果的+-3% 這個

Clieff 11/19 08:39柯再拿下1點。

rayjames38 11/19 08:39應該是指雙尾95%信心水準 而不是單邊5

rayjames38 11/19 08:39%雙尾其實是90%的信心水準(吧)如果

rayjames38 11/19 08:39是這樣 那一邊最爛一邊最好的機率是2.

rayjames38 11/19 08:395%^2=0.0625%阿

PeikangShin 11/19 08:523%是蚵直接訂死誤差為3% 依照美

PeikangShin 11/19 08:52好假設 各家統計誤差無誤 就是1.9

PeikangShin 11/19 08:526×(p(1-p)/抽樣數)^(1/2) @95%信

PeikangShin 11/19 08:53心水準 p代0.5(MLE性質) 這不用去

PeikangShin 11/19 08:53爭執了 重點這個誤差是針對個人支

PeikangShin 11/19 08:53持度而已 不能擴大去解讀兩方差距

PeikangShin 11/19 08:53 或是差距的差距 因為by CLT後的尺

PeikangShin 11/19 08:53度參數不一樣 這才是本文的原意

zxc0312 11/19 08:59光是國民黨拿不出原始資料 就不用討論讓

zxc0312 11/19 08:59幾趴了 真的要討論 聯合報那份也該剔除

zxc0312 11/19 08:59變成3:2 柯贏 柯已經讓很多了

Amiwen 11/19 09:05這篇有厲害的統計學大大!

PeikangShin 11/19 09:13補充下 兩方差距的誤差 或是差距

PeikangShin 11/19 09:13的差距構成的誤差

PeikangShin 11/19 09:13如果蚵的誤差指的是原本支持度的誤

PeikangShin 11/19 09:13差 那考慮獨立就是5:1 不考慮獨立

PeikangShin 11/19 09:13才有機會3:3 個人覺得蚵一開始誤

PeikangShin 11/19 09:13解統計用法 最終就是依賴模擬來判

PeikangShin 11/19 09:13定差距的差距所構成的誤差值了 很

PeikangShin 11/19 09:14不幸這個值也會有信心水準和誤差

PeikangShin 11/19 09:14只能說蚵把問題複雜化了

Caroney 11/19 09:24統研所明年碩班招生會大爆發嗎

PeikangShin 11/19 09:25然後豬頭敗類黨就是6%解釋方法錯誤

PeikangShin 11/19 09:25(跟蚵p犯了同樣錯誤?) 但豬頭主席

PeikangShin 11/19 09:25理論是OK的 所以得證豬頭不是叫假

PeikangShin 11/19 09:25的 而蚵專業知識似乎弱了豬頭一點

PeikangShin 11/19 09:25畢竟術業有專攻

hanmas 11/19 09:26

chkao 11/19 09:35柯說3%是簡略說法,此數依樣本數不同而變

PeikangShin 11/19 09:45誤差不只是依照樣本數而變 不同的p

PeikangShin 11/19 09:45也會變 所以才叫你用MLE估計 蚵

PeikangShin 11/19 09:45的3%明顯是對一個正常有效抽樣的支

PeikangShin 11/19 09:45持度 只是個人不想講得那麼明 不然

PeikangShin 11/19 09:46要像塔綠仔揮不完了 如果去揮說是

PeikangShin 11/19 09:46指差距的差距 小心迴力鏢打到自己

PeikangShin 11/19 09:46所堅持的科學

mikezip 11/19 09:56台大醫科教授怎麼可能不懂統計

hsuchengchun 11/19 10:08結論就是朱是假會計教授,亂算

intrepid123 11/19 10:250.5明明就會有比較大的區間 p(1-p) 0

intrepid123 11/19 10:26.25

intrepid123 11/19 10:26你用0.4*0.6會比0.25小 抽樣誤差0.4

intrepid123 11/19 10:26已經是極限了 考慮獨立 但事實上是相

intrepid123 11/19 10:26關 會更小

intrepid123 11/19 10:27總之不可能0.6這數字出來 而且95%信

intrepid123 11/19 10:28賴區間已經更大了 事實上也是讓到97.

intrepid123 11/19 10:285 因為不會出現另外的2.5% 用95%去做

intrepid123 11/19 10:28單尾檢定 1.64 比1.96 還更小

smallredshoe 11/19 13:04會計教授你敢嘴?

smallredshoe 11/19 13:07我從來沒要求讓幾% 是他說平手算

smallredshoe 11/19 13:07我贏

ccm0916 11/19 16:49反正現在明確知道侯有多弱就夠了

Amiwen 11/19 17:09會計師最厲害就是做帳啊!做到有錢人都不

Amiwen 11/19 17:09用繳稅,做到侯友宜有臉說自己要當正的~。

Amiwen 11/19 17:09