PTT推薦

Re: [爆卦] 科普:願某人念博時少學點話術多學點統計

看板Gossiping標題Re: [爆卦] 科普:願某人念博時少學點話術多學點統計作者
newwu
(說不定我一生涓滴廢文)
時間推噓推:103 噓:3 →:144

我覺得原文有很多錯誤,恕刪

首先,我必須要說一開始談成的條件就不合理,就統計而言

我可以理解誤差範圍內侯柯配的做法,這一開始也是柯提出的
這做法的概念在於,把侯柯當成虛無假設(預設值的概念),只有在對柯侯能表現較好有信心的時候才選柯侯(否定虛無假設)

但是,每份民調分開這樣比,再合計比分根本不合理
通常的做法是把民調合起來得到一個誤差比較小的統合民調吧
這樣的做法其實就很讓

首先,先講3%怎麼來的
通常要談信賴區間
要先定樣本數和信心水準
樣本數1000左右 信心水準取95%的時候
得票率50%左右 信賴區間大約是+-3%
這代表你量到的平均值+-3%這個信賴區間的範圍
包住真實母體得票率的機率有95%

我做個模擬,假設全母體會答要投柯侯配的有 45%
我假設對母體做了10000次一次 1055人的民調
以下是民調柯侯配比例的分佈

https://i.imgur.com/HfgGfeF.jpg

圖 科普:願某人念博時少學點話術多學點統計
可以看到這一萬次裡面,有大約500個信賴區間(+-3%)不包含45%這個正確結果


那我們再來談差距,
在誤差範圍內這講法,其實很不精確啦
四個博士怎麼搞出這規則的
應該就是我前面說的,他們的差距有沒有在95%信心水準下統計顯著。

也就是說 柯侯 - 侯柯 得到的值建構的信賴區間,不能包含0
那柯侯-侯柯的信賴區間應該是怎樣的範圍呢
我直接說結論,假設無相關性
不是3%或6% 應該是3 x sqrt(2) % ~4.2%
當相加減的時候
柯侯民調值-侯柯民調值 的變異數
等於 柯侯民調值的變異數 +侯柯民調的變異數。
因此標準誤是兩者標準誤的平方相加開根號

以下是假定母體侯柯41% 柯侯45%
模擬一萬次1055人的民調分佈

y柯 x侯
https://i.imgur.com/3OeZqZC.jpg

圖 科普:願某人念博時少學點話術多學點統計
柯侯差值
https://i.imgur.com/6pI9m4Z.jpg
圖 科普:願某人念博時少學點話術多學點統計

可以看到有大約500次的結果 +-4.2%不包含母體實際差值 (0.04)
所以6%的說法應該絕對說不過去。


但是,4.2就是對的嗎?
我覺得不對,因為侯柯和柯侯是有相關性的
假設同份問卷同時問兩個
因為兩者有一定重疊度
所以侯柯柯侯在每次取樣民調得到的結果應該是正相關
這時候應該把相關性扣掉
所以差值的信賴區間一定比4.2%小甚至比3%小


再來個模擬,
這次比較複雜 假設侯柯柯侯交集30% 侯柯非柯侯11% 柯侯非侯柯15%

x柯 y侯
https://i.imgur.com/rqbH5UQ.jpg

圖 科普:願某人念博時少學點話術多學點統計

柯侯差值分佈
https://i.imgur.com/oU5v2iD.jpg
圖 科普:願某人念博時少學點話術多學點統計

你可以看到在有相關性的時候,
這個分佈窄很多
目測信賴區間大概是3%(大約500個民調結果+-3%範圍不包含4%)

結論是,雖然打從一開始的設定就不是很合理,但是6%完全沒道理
不如就3%估一估吧
-----
Sent from JPTT on my iPad

--

※ PTT留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 67.168.192.176 (美國)
PTT 網址

Imotucc 11/18 15:32一開始談成的條件本來就不合理

garry5566 11/18 15:32給你一個讚

Imotucc 11/18 15:33重點是簽了之後就是照遊戲規則來

tsubasawolfy 11/18 15:33相關性也進來了…

deathrow 11/18 15:33喔喔原來是這樣

Imotucc 11/18 15:33不要玩完了才在吵說條件不公平

StylishTrade 11/18 15:33是負相關吧 哪來的抵銷阿

StylishTrade 11/18 15:34侯顆是對手 哪來的正相關???

StylishTrade 11/18 15:34哪來的扣掉誤差啦

taot917 11/18 15:35統計誤差要嘛就都+3,要嘛都-3

StylishTrade 11/18 15:35不是相關性高就是正相關好嗎

taot917 11/18 15:35哪有我+3,你-3的

StylishTrade 11/18 15:35有一種相關性高 是負相關

正相關啦 你就做我那個模擬 因為重複的部分是相關的

dw1293 11/18 15:35感覺這篇跟黃33的講法有點像

StylishTrade 11/18 15:36投顆猴的 搞不好另一提 投賴蕭咧

喔 我這討論不考慮賴蕭 就是單純投不投藍白

StylishTrade 11/18 15:36

hosenhttps://i.imgur.com/uQDVbwH.jpg 123.195.196.130 11/18 15:37

圖 科普:願某人念博時少學點話術多學點統計

attacksoil 11/18 15:38

chen1025 11/18 15:38讓6%是騙沒學過統計的

hosen 11/18 15:38科學就是科學,討論柯學滾去專版

※ 編輯: newwu (67.168.192.176 美國), 11/18/2023 15:39:45

wengeniusgod 11/18 15:38重疊在哪? 多重宇宙重疊?

就是有25%以上的人只要藍白都投

qilar 11/18 15:39我已經看不懂啦

vdrenike 11/18 15:39哪有每個都是我的極小值跟你的極大值去

vdrenike 11/18 15:39比,而且柯的本意就是3%,是朱寫成文字

vdrenike 11/18 15:40陷阱,一開始說要乘2,柯根本不會簽名

StylishTrade 11/18 15:40這民調是侯顆要對決用的

※ 編輯: newwu (67.168.192.176 美國), 11/18/2023 15:41:34

luckykk 11/18 15:40看不懂但不妨礙覺得你厲害

StylishTrade 11/18 15:40哪有都支持藍白就正相關這種事XDDD

所謂的正相關指的是 你取一群人做民調侯柯表現偏好的情形下高機率柯侯也表現偏好 為什麼這麼說呢 因為侯柯好很可能是你挑到比較多30%藍白不挑人 因此柯侯在這樣本下的表現也會比較好 在算差值標準誤的時候,這相關性應該被扣掉

city0416 11/18 15:41+/- 3%是要有中心值的情況下才能

MicroB 11/18 15:41看那數據哪個專家覺得侯比較強站出來好不?

StylishTrade 11/18 15:41要不要這麼天真

※ 編輯: newwu (67.168.192.176 美國), 11/18/2023 15:46:21

KHalan 11/18 15:43推推

amury 11/18 15:43看起來的結論是:柯在硬拗這是6%嗎?

SilverRH 11/18 15:43猴粉20柯粉30會有交集?

now99 11/18 15:45合約多不公平但是你簽約了啊,可以反悔嗎

SilverRH 11/18 15:45就已經1+1<2了還能說服有交集喔

now99 11/18 15:45?柯學還是科學?

glasseater 11/18 15:46我不會運算過程,但我知道的結論跟你

glasseater 11/18 15:46一樣XD

ZhouGongJin 11/18 15:46今天是全民科普統計學的日子,笑死

hhbbookao 11/18 15:47請三個代表上電視辯一下好了

demangel 11/18 15:47還好我統計弱爆

kinda 11/18 15:48推 可惜政治人不講科學。有理也沒用

davidaustin 11/18 15:48笑死,重點是沒讓分都輸光光還想選??

kinda 11/18 15:48他們是明知道自己錯,但還是硬凹的那類

davidaustin 11/18 15:49Lie會在投票的時候說輸6%算你贏?

Nemophila 11/18 15:49你的假設是理性下的結果,如果柯侯配有

Nemophila 11/18 15:49顯著差異才算贏,但他們兩方在算計的

Nemophila 11/18 15:49不是「只有」贏民進黨而已

scott123321 11/18 15:49這篇結論比較符合我所知道的統計學

Nemophila 11/18 15:50這一切都是倉促討論下的結論,更愚蠢的

Nemophila 11/18 15:50是有個媽寶還答應了才搞出這些

zxnm 11/18 15:50有點認真

mimicwpe 11/18 15:51

sheng319 11/18 15:52簽了才說要照我的柯學來 笑死

HongYang 11/18 15:52政治上的合約還真的是可以反悔的,因為

HongYang 11/18 15:52選民是可以妥協的

ckid 11/18 15:52推一個

b1izzard2000 11/18 15:52好難懂

lin0000030 11/18 15:52你跟那些看不懂數學的認真了

y11675 11/18 15:53八卦版都快變成統計學版了

boooozaaaa 11/18 15:53https://i.imgur.com/kbATvxc.jpg

圖 科普:願某人念博時少學點話術多學點統計

Spurious 11/18 15:54

utn875 11/18 15:54這篇看是讓三趴較合理

aron0425 11/18 15:55你算25%藍白都投,賴皮是30%起跳,過去

aron0425 11/18 15:55大選最爛的小敷也有41.55%

AresMars 11/18 15:56比起單純吵架 有過程有推理 這篇實在點

kkloo 11/18 15:58選個弱的上去打好了

artyman 11/18 15:58兩種組合有正相關 才有合的必要

HKJCCW 11/18 15:58

artyman 11/18 15:59如果侯柯配和柯侯配是負相關 不如不要合

L2197 11/18 15:59

airyptt 11/18 15:59推一個,

Athanasius 11/18 15:59推一個 這才是統計

Nemophila負相關還要合作就是結伴自殺啊 哈哈 59.126.91.141 11/18 15:59

eunicecypher 11/18 16:02推,莫名奇妙的3%,更神奇的6%

iamhemry 11/18 16:02認真推

Citer 11/18 16:02這才是統計 某黨在騙智障的

Tossdog 11/18 16:04深綠侯粉開始急了 反覆喃喃自語要照規矩

stroy 11/18 16:05

bart102617 11/18 16:05沒6% 你們都不懂統計學好嗎

rick917 11/18 16:07推統計

leo255112 11/18 16:08你這個考量的又更多了,我覺得最終還

leo255112 11/18 16:08是比個人民調比較準

waitwind 11/18 16:08好像很專業,推一下~

fu6ru8 11/18 16:09一直想等的答案出來了

JCfcuk 11/18 16:09跟我想的一樣

marke18 11/18 16:11認真推 XD

scum5566 11/18 16:11所以柯不讓 侯就輸到底

missin 11/18 16:12同一份抽樣,為什麼會有你+3%,我-3%的??

noyarc 11/18 16:12

missin 11/18 16:13這個誤差應該是指樣本跟母體的差距啊?

rkilo 11/18 16:15這篇比較合理,朱就是欺負柯不懂統計學做

rkilo 11/18 16:15了文字陷阱,柯就是自負認為是自己想的那

rkilo: 樣,比無恥硬要說還是藍略勝一籌 223.136.109.90 11/18 16:15

erichang 11/18 16:15好文

ikatsuki 11/18 16:15專業推 但說真的 政治人心怎麼會想用統

simonjen 11/18 16:16笑~科學說不贏只能說猜測和假設了!

ikatsuki 11/18 16:16計學分勝負啦

kimono1022 11/18 16:21之前郭正亮都說朱脖子上掛算盤

zxc1020305 11/18 16:22一開始只談方向不談細節,本來就有各

zxc1020305 11/18 16:22種解釋空間了

uwptd 11/18 16:22這篇好像比較對,推一個

uwptd 11/18 16:24推文一堆連正相關都不懂,笑了

vsbrm 11/18 16:25豬:我們再民調一次,應該是3%還是6%合理...

FannWang 11/18 16:26

jixiang 11/18 16:27統計學科普日

blueman1025 11/18 16:27感謝專業說明,尤其是對正相關這部份

vsbrm 11/18 16:29統計學老師:教這麼久的書,還不如一次選舉

vsbrm 11/18 16:29有用...哭

straggler7 11/18 16:30已經沒有3%了 最新消息是2.17%

b7278622 11/18 16:30就假裝專業啊 根本沒一個人懂統計出的

b7278622 11/18 16:30題目怎麼會有答案

dogfacehoho 11/18 16:30專業推 雖然看不懂@@…

straggler7 11/18 16:30還有3份被柯學家剃除

garyfire 11/18 16:31這篇講得很好,非常統計老師的講法

Demia不合理啊,大家都知道不合理。但利害關係 27.247.134.219 11/18 16:31

Demia 11/18 16:31人是柯、談判是柯,同意的也是柯,怪誰

straggler7 11/18 16:33朱講數學 柯講科學 總統是玄學

telescope 11/18 16:37柯學家身兼統計學者

要補充一下, 是同份問卷問兩題的狀況才能扣掉相關性

※ 編輯: newwu (67.168.192.176 美國), 11/18/2023 16:41:05

b3581475 11/18 16:38專業推

intrepid123 11/18 16:41P還不是0.5的話 區間會更小

intrepid123 11/18 16:41即使國民黨說要比完勝 那用單尾檢定

intointo 11/18 16:41@@

intrepid123 11/18 16:41區間也是更小

srarod 11/18 16:44專業推,更何況這是一次區間估計的狀況喔

srarod 11/18 16:44 現在可是有六份抽樣結果

kevinpart 11/18 16:46原來台灣的總統必須是統計系畢業

Forcast 11/18 16:49區間車

Jetame 11/18 16:56朱是做陷阱 但柯說讓6%也是錯的

Jetame 11/18 16:57實際上比較接近4:2 侯還是贏了

freeflying 11/18 16:58同意比柯侯,侯柯還要讓誤差不合理

tonist9808 11/18 17:02推演算,也跟民眾黨在記者會說明的一

tonist9808 11/18 17:02致,至於K黨,直接講我要當正的還沒那

tonist9808 11/18 17:02麼難看

GimO 11/18 17:03還好沒修過統計

calvincock 11/18 17:08我不懂你跟這些智障解釋統計學幹嘛

calvincock 11/18 17:08 一堆人還用自己的認知去理解名詞

spen2005 11/18 17:08這篇是正解

calvincock 11/18 17:08我覺得不理解不是錯 是根本就不理

calvincock 11/18 17:08解還在那邊嘴臭的人 看到這些推文

calvincock 11/18 17:08真的頭很痛

blackicbm 11/18 17:10黨主席笨就是這麼麻煩,還要一堆花式搶

blackicbm 11/18 17:10救。

snio2427 11/18 17:19

theshape87 11/18 17:24怎麼每篇解釋文都有人說錯 又不說錯

theshape87 11/18 17:24在哪,反駁的自己發ㄧ篇好不好

beepuffer 11/18 17:26不必管幾%,只要柯不讓分,侯幾乎全輸

beepuffer 11/18 17:26民調輸的要當正的,這還有天理嗎?

bnn 11/18 17:27獨立樣本下就3乘根號2 你加考慮重疊樣本就3

beepuffer 11/18 17:27為什麼不是國民黨及侯退讓呢?

aken59420 11/18 17:29猴民調就很差,還要加入深綠猴粉灌票

nu073616 11/18 17:316趴黨就是噁啦

space20021 11/18 17:31

iPadProPlus 11/18 17:31應該絕對?

t95912 11/18 17:39說真的要別人讓才會贏的人 有什麼條件 正

t95912 11/18 17:39式比賽會贏?

JonLo 11/18 17:41今天的統計學正確答案是6%,選我正解

KH91 11/18 17:443%在第一張圖就有結論了,後面無關吧?

neimad 11/18 17:46這篇容易懂多了 感謝

neimad 11/18 17:49推推推

Hahafan 11/18 17:58sigam多少是實際抽樣出來的,每份不一樣

Hahafan 11/18 17:59每份民調變異數不一樣,你這份是假設出來

Hahafan 11/18 18:00所以信賴區間隨變異數不同而不同

denpa5566 11/18 18:00重點不是統計邏輯,重點是猴猴只能

denpa5566 11/18 18:00

Hahafan 11/18 18:004.2是你的模擬結果,不一定是民調的結果

simga 11/18 18:21民調都是狗屎 哪有啥信賴區間

jack41402 11/18 18:24

Clieff 11/18 19:07光是誤差區間的算法,每個個案都是一篇論

Clieff 11/18 19:08文,就這個案例而言,柯侯vs侯柯同質性極

Clieff 11/18 19:08高(誰來都成),搞不好有6成,誤差值壓到

Clieff 11/18 19:082%都有可能,3%算是簡單易懂的處理方式

Clieff 11/18 19:08

feanor0709 11/18 19:11沒有原始資料當然數字不能直接當真

feanor0709 11/18 19:12但本文已經給出很清楚的算法了

feanor0709 11/18 19:13再凹可以上浮到6%真的是騙人不念書

fakeoldboy 11/18 19:17終於有一篇正解了

Enzofulgura 11/18 19:21推這篇 算是把統計學最重要的基本概

Enzofulgura 11/18 19:21念有說到位了 還看不懂的先去了解常

Enzofulgura 11/18 19:21態分佈的精神跟信賴區間就能更明白

Enzofulgura 11/18 19:27柯不懂統計學那期刊paper要怎麼發

Enzofulgura 11/18 19:27說中文不好我還比較信

jo3tin 11/18 19:29誰可以出個教學影片?敲碗碗李永樂老師!

shortcloud 11/18 20:15

yyest62845 11/18 22:01

okeasy 11/18 22:12推推 不過你跟那些硬凹的人說這個應該是

okeasy 11/18 22:12雞同鴨講 大概九成九都不懂 只會跳針

LPCbaimlly 11/18 22:29推 這才是學術論壇該有的樣子

ooqqqoo 11/18 22:52朱教授會把你當掉

jimhall 11/18 23:39感覺三位參與的統計專家 都不在意

jimhall 11/18 23:39專業 也不在意專業同行的評價的 這

jimhall 11/18 23:39三位怎麼不出面解釋給大家聽聽科學

jimhall 11/18 23:40上合不合理

jimhall 11/18 23:41這三位誰支持6%要自己出面解釋一下

jimhall 11/18 23:41 以後同行評估專業信譽的時候可以

jimhall 11/18 23:41參考

kshtainan 11/19 00:40

jasonpop 11/19 00:43推,好像有點料

g70245 11/19 01:10推推,這篇比第一篇正確多了

※ 編輯: newwu (67.168.192.176 美國), 11/19/2023 05:35:21

PeikangShin 11/19 05:49你的估計誤差要考慮不獨立的話 現

PeikangShin 11/19 05:49在想到解法只能用蒙地卡羅建構白努

PeikangShin 11/19 05:49力分佈Ui 在計算Var((U1-U2)-(U3-U4

PeikangShin 11/19 05:49))^ (1/2) 或是用拔靴法來估計 阿

PeikangShin 11/19 05:49伯要用原本的誤差去解釋他要的那個

PeikangShin 11/19 05:49統計量本來就是錯的 所以講究科學

PeikangShin 11/19 05:50的阿伯 至少要先認清這點 別胡扯設

PeikangShin 11/19 05:50,什麼6%了

PeikangShin 11/19 05:59豬頭黨你也不能說他錯 理論上假設

PeikangShin 11/19 05:59獨立且同分佈是理論做法 用該算法

PeikangShin 11/19 05:59的確該統計量的pool std就是原本誤

PeikangShin 11/19 05:59差的兩倍 只是考慮不獨立後偏離會是

PeikangShin 11/19 06:00多少 n夠大時會收斂到相同值嗎?這

PeikangShin 11/19 06:00些都是可以探討的 學術研究最好先

PeikangShin 11/19 06:00摒除意識型態

PeikangShin 11/19 06:12整個八卦就是政治蟑螂在亂帶風向

PeikangShin 11/19 06:12所以我早說 阿伯最好注意一下身邊

PeikangShin 11/19 06:12貌似忠良的人士 用科學對談就要有

PeikangShin 11/19 06:12科學的水準 阿伯這次掉入豬頭黨統

PeikangShin 11/19 06:12計陷阱 只能說知識不如人家 因為

PeikangShin 11/19 06:12他如果硬要套原本的抽樣誤差3%來解

PeikangShin 11/19 06:12釋他差距的差距的統計量 反而可能

PeikangShin 11/19 06:13變成是加嚴限縮信賴區間了

PeikangShin 11/19 06:19然後3%也不是讓分問題 統計上2.X

PeikangShin 11/19 06:19就是統計語言的顯著與否比較 硬要

PeikangShin 11/19 06:20說也是讓3-2.X才是 只能說版上愚

PeikangShin 11/19 06:20民真好操弄

newwu 11/19 07:36不獨立可以算啊 共變異數=侯柯柯侯交集-侯

newwu 11/19 07:37柯柯侯乘積

newwu 11/19 07:37另一個算法是直接每個答卷者都當成一個pair

newwu 11/19 07:37來算差值變異數 兩個結果應該一樣

PeikangShin 11/19 07:44你要不要看看共變異數的定義先 交

PeikangShin 11/19 07:44集?你真的知道自己在講什麼嗎? 他

PeikangShin 11/19 07:45也不是pair test……

PeikangShin 11/19 07:54每個抽樣者是白努力分佈 現在要算n

PeikangShin 11/19 07:54個白努力分佈平均和另外n個白努力平

PeikangShin 11/19 07:54均的共變異數 你不用模擬數據 那

PeikangShin 11/19 07:54你列個解析解來看看要代入那些數值

PeikangShin 11/19 07:54計算出

newwu 11/19 08:07就是因為是白努力分佈所以能算啊

newwu 11/19 08:07你想想怎麼算出 Var X = p (1-p)的

newwu 11/19 08:07就用類似算法

newwu 11/19 08:14應該說是你把結果分成四類 柯侯又侯柯 柯侯

newwu 11/19 08:14不侯 柯侯柯不柯侯 兩者皆否 下去算侯柯和

newwu 11/19 08:14柯侯的共變異數

newwu 11/19 08:14你會發現等於

newwu 11/19 08:14P_{侯柯又柯侯} - P_{柯侯}P_{侯柯}

chctonagisa 11/19 11:45推 終於看到一篇完全正確的

chctonagisa 11/19 11:47頂多就是根號二倍 根本不可能6%

wen17 11/20 21:10所以葉教授文章舉例假定互斥 很不合理

wen17 11/20 21:10有正相關的東西 你去假設互斥...