Re: [討論] 認真問民調的一個統計問題
※ 引述《kh749 (ReturnTo)》之銘言:
: ※ 引述《Mervivian ()》之銘言:
: : 請問如果是區間估計,
: : 假設統計誤差是3%,
: : 那麼做出來的民調看起來是40%的,
: : 其實真實值是37%到43%之間都有可能對吧?
: : (95%信心水平下)
: : 那問題是想問說,
: : 真實值是從37%到43%之間任何數的可能性都一樣嗎?
: : 還是說,真實值離40%越近的可能性就越大,
: : 而真實值是37%或是43%雖然也有可能,
: : 但是可能性會下降呢?
: : 謝謝!
這就是讀書沒有讀通的典形,連自己在說什麼都不是很清楚,更遑論解釋給別人聽。
: 初等統計(高中統計)會告訴你這段:
: 假設
: "所有選民都已經心有定見,
: 沒有心猿意馬臨時改變的空間"
: 例如, 10000個內政部登記符合投票資格
: 的選民當中有3800個支持. 那真實的p就是38%.
: 這是一個"未知的固定數".
: 那麼p=38%的機率是1,
: 其他37.1%,41.2%那些其他所有數字的機率都是0
有讀書
: 很明顯,以上這是一個反人類認知的說法
沒讀通。
: 大家心裡可能都不贊同以上說法,
你解釋一下,大家心裡就可以接受了。
或者你沒有能力,我就替你解釋。
這個P=1是什麼意思?
這是代表必然是這樣。
以上一次總統選舉為例,蔡英文得票就是817萬,
蔡英文得票817萬的機率就是1,P=1,
其他得票816萬,818萬,552萬的機率,全部都是0。
有很難理解嗎?反什麼人類?別因為自己不懂就拉低全人類的水準好不好?
: 不過參加大部的考試請照上面回答.
: ------------------------------
: 雖然37.1和41.2的機率都是0,
: 一個有用的訊息就是:37.1和41.2的發生機率是一樣的
: 不會因為41.2%比較靠近40%, 它發生的機率就比37.1%還來的高.
: 當然, 這又是另一個反人類認知的結論.
錯。
別人問你,37.1和41.2的%,是他看到某民調是40%,
所以想問最後實際某候選人的得票率。
這能和上面的提到的,"未知的固定數"對於某個數字
(816萬,818萬,552萬,或者P=1的817萬)的機率一樣嗎?
根本兩種東西,別牛頭不對馬嘴的,將兩樣東西扯在一起。
正確的回答是:
如果該民調可信,沒有做手腳,
那該民調是40%的話,
因為41.2%比較靠近40%,根據常態分佈,它發生的機率就是比37.1%還來的高。
這裡簡單的解釋一下,民調的%究竟和那"未知的固定數"有什麼關係。
事情是這樣的,雖然蔡英文的得票就是817萬,這是必然的,P=1,
得票率就817/1430,57%多一點,但那是選了之後的現在,
2023年才知道的。
如果是在2019年,有人要預測(預測,這2隻字很重要)選舉結果,
你就不能叫他等到2023年,說到時我們就知道那"未知的固定數"了,
可以十分準確的,必然的,P=1的,知道蔡英文有817萬票,
因為那顯然是沒有用的。
那要怎麼辦呢?
除了占卜、問卦、坐時光機之外,想預測未來,還有一種方法,
那就是做民調。
雖然2020年才選舉,但到時要投票的人,現在2019年不也是全都在這裡嗎?
那問一問他們就好了。
好吧,到時有1931萬人有投票權,那就去問……
呃。
實務上絕對不可能,只比坐時光機簡單一點。
於是,就只好問少一點的人。
假設2019年,你問了1000個人,550人說要投蔡英文,佔55%,
那到時選舉蔡的得票率多少?
57%多一點,蔡英文有817萬票,是必然的,P=1的。
又假設2019年,你問了1000個人,560人說要投蔡英文,佔56%,
那到時選舉蔡的得票率多少?
57%多一點,蔡英文有817萬票,是必然的,P=1的。
沒有其他可能。
其他得票816萬,818萬,552萬的機率,全部都是0。
那57%多一點,就是那在2019尚「未知的」一個「固定數」。
做民調就是想要「預測」它。
於是,那麼,問完1000個人,得來的55%、或者56%,又有什麼用呢?
首先要知道,這55%或者56%幾乎不可能準確的命中最後那固定數,
這是「連續區間」和「離散」的概念,是要自吹自擂自己有學統計時的基礎知識。
不嚴謹的解釋是,因為那是57%多一點,不是57%,
那個多一點是幾乎不可能命中的。
所以,要用「區間」來為那55%、或者56%,加闊猜度範圍,
通常是後面加個正負幾%。
然後這個加正負幾%,要加幾多才好呢?
其實沒規定。
但約定俗成,都是用95%信心區間。
信心區間不難,搞清楚就不高深,是很入門的,自吹自擂時要注意。
例如95%信心區間,就是有95%的信心,最後的那個「未知的固定數」,
會在猜度的區間內。
至於加正負多少%,才會令做民調的有信心,覺得最後「未知的固定數」會在區間內,
就倒是有點深,以下不細說。
結論是,
: : 假設統計誤差是3%,
: : 那麼做出來的民調看起來是40%的,
: : 其實真實值是37%到43%之間都有可能對吧?
連以1%和99%做中心的正負0.幾%的區間都有可能
嘻嘻,這就是民調。
: : (95%信心水平下)
對啊,在37%到43%之間,只保證了95%的信心,其他區間總共可以分到剩下的5%。
: : 那問題是想問說,
: : 真實值是從37%到43%之間任何數的可能性都一樣嗎?
不一樣。
: : 還是說,真實值離40%越近的可能性就越大,
以這份民調的猜測來說,是。
但真實值永遠都是那個「未知的固定數」,做民調充其量只是去猜,
嚴謹的說民調的%其實和真實值沒什麼關係。
: : 而真實值是37%或是43%雖然也有可能,
做民調只是猜,本質上和占卜問卦差不多,就你民調有根據科學方法,
預測起來理論上會稍微準一點。
所以真實值絕對有可能在1%或者99%,至於民調說40%什麼的,
嘻嘻,就猜不中囉,啾咪~
: : 但是可能性會下降呢?
我知道肯定有人要抬槓,說因為37.1和41.2的兩個點,其機率都幾乎等於0,
所以自己沒答錯。
但可惜,就算不看37.1和41.2為中心的附近「區間」41.2確實比37.1機率高,
單比較37.1和41.2,兩個幾乎等於0的點,也是可以的,41.2就是比37.1機率高。
: 不過想一想, 確實p只有一個, 就是38%.
: ------------------------------
: 後來有了貝氏統計, 但是貝氏統計更反人類認知,
拜託多讀書吧,這段是完全沒有讀書。
: 貝氏統計認為37~43的每個數字的機率都是0, 連同38在內
這不是貝氏統計的認為,這是「離散」和「連續」的問題。
不嚴謀的說法,如果充許37~43的每個數字都有為正的機率,
當然每個個別的數字的機率都是0,你個別數字在數線上就是一點,那自然只能是0。
像40,真的會那麼準中正40嗎?40.1呢?40.01呢?40.001呢?
有這麼多數字去分,分完當然是無限接近0,可以直接寫做0了。
: 不過貝氏統計定義了區間的概念,
錯。有好好上課嗎?還是沒讀過大學?
下面不逐一挑錯了。
: 你抽樣出來的1068個樣本是40%
: 那麼真實的p
: 落在40~43的機率是47.5%
: 落在37~40的機率是47.5%
: 落在37~43的機率是95%
: 總之符合以40%為中心的常態分佈.
: 不過以上是建立在一個中性的假設下.
: ----------------------------
: 但是貝氏統計不一定是中性假設,
: 例如有些學者認為這個候選人先天上看起來就不怎麼行,
: 雖然抽出來的1068個樣本是呈現40%支持率,
: 但是先天要扣幾分
: 所以最後可能得到一個以35%為中心的常態分佈
: 但是這種情況, 需要有一個很懂選舉的人,
: 來決定先天這個候選人要扣幾分.
: --------------------------------------
: 最後這項比較符合人類的認知,
: 也就是這個選舉專家能看出這個候選人的後勁是否夠強
: 配合民調的資料, 來估計這個候選人將來在投票的那天能得到多少選票.
: 可能是以35%為中心的常態分佈, 也可能是一個以45%為中心的常態分佈.
: 最後, 貝氏統計認為, 樣本數夠大的情況下, 選舉專家的主觀認知會被沖淡,
: 如果蒐集了10000個樣本, 支持率還是40%,
: 那麼貝氏統計會就會認為這是一個以40%為中心的常態分佈.
連基礎也錯,這想要做統計相關的工作一定是沒有位置。
難怪有這麼多高學歷的,卻總對社會不滿,就例如某族群……
--
這篇正解 一堆人不知道信賴區間跟總調查數
會影響後面那那個%數比例....
我看完你這篇,我就明白為什麼你這麼聰明還
找不到工作了。
你引出的是貝氏統計學和頻率統計學的爭議。
這沒有誰對誰錯的,就看哪種比較實用而已。
很明顯你是一個貝氏的信仰者。但是頻率統計
學不是你一個人就能完全否定掉的。
順帶一提,你同意民調支持率是固定已知數,
你又用貝氏的想法來解釋你所謂的機率。在我
看來你已經錯亂了。該好好複習頻率統計學的
內容。
現在的研究所滿好考的,如果考不上台灣的統
計所,申請一個國外水碩也不難的。或是台灣
的很多研究所都很缺博士,有些都要停招了。
趕緊去吧。
不要丟臉了好嗎 kh749
樓上,科學就是科學,不是人比較多就是真理
。
沒看懂為什麼p(41.2)>p(37). 是假設40
是真正的民調數字嗎?40本身是sample不?
kh749連P的定義都不懂 不懂閉嘴也沒人會
笑你
統計是統計,討論統計的時候請不要把政治帶
進來。
爆
Re: [問卦] 哪個統計學家說6%合理的是不是有很多人沒修過統計學? +/-3%的意思都不知道就在瞎掰 假如數字是40 +/-3% 你的區間會在37-43爆
[爆卦] 民調計算全詳解--------------------更新一下結論啦---------------------- 有推文說兩種問題是分開的,一個受訪者只會被問一個問題,所以把這種情況的結果也更 新一下: 柯侯對賴其中一項民調變不顯著:爆
[爆卦] 科普:願某人念博時少學點話術多學點統計願某人念博時少學點話術,多學點統計 前言(白話版): 所以柯侯、侯柯讓3%到底在統計上有啥意義? 把 (柯侯v.s賴 的得票率)-(侯柯v.s 賴 的得票率)畫成下圖後爆
Re: [爆卦] 科普:願某人念博時少學點話術多學點統計我覺得原文有很多錯誤,恕刪 首先,我必須要說一開始談成的條件就不合理,就統計而言 我可以理解誤差範圍內侯柯配的做法,這一開始也是柯提出的 這做法的概念在於,把侯柯當成虛無假設(預設值的概念),只有在對柯侯能表現較好有信 心的時候才選柯侯(否定虛無假設)99
Re: [問卦] 說真的,讓你6%你才贏,各位還敢出來嗎?略懂統計, 從統計的觀點來講一下這件事有多不合理. 大概很多人懶得看長文, 所以我先講結論, 要求每份民調都要讓 6% 的人不是智商超低就是臉皮超厚. 因為今天得到這樣的民調結果, 實際上的支持率侯贏柯的機率只有 1.8/1,000,000. - 只講 2 點, 懶得看的人可以只看我標 3 個星號 (*) 的部分75
Re: [新聞] 快訊/批讓6%「超過一般人常識」 柯這局國民黨真的輸到脫褲 直接把弱點攤到陽光下 現在全台灣都知道候柯配不一定贏賴了 一般平手,要嘛抽籤賭運氣 要嘛再列其他評比項目18
[討論] 咱來嘮一嘮真正的統計學 讓你對愚蠢免疫讓我來說一下真正的統計學 不知 母數 信賴區間率 不知 正負 3% 其實是 上下3% 你只會越看越茫 被名嘴政客感染愚蠢 民調就是去探測真正的支持度(母數)- 選總統 有兩種 一種叫投票 一種叫民調 差別在 投票是 有投票權的所有人 都會計算清清楚楚 民調是 因為事實無法統計所有人 所以我們只能抽取其中 部分人 做統計來預測
42
[討論] 黃國昌:柯文哲的善意換來無情的追殺40
[討論] 白色遊騎兵拿不到良民證10
[討論] 薄瓜瓜變台灣女婿5
[討論] 郭台銘還能再戰2028總統嗎?13
[黑特] 翁曉玲:司法院你們為什麼不提案?6
Re: [討論] 40歲以上的人看得到中共亡國嗎?14
[黑特] 為何對綠鬣蜥和流浪貓狗待遇差這麼多10
[討論] 翁曉玲指控參加遊行律師多是綠友友13
[轉錄] 獨立觀察:LSE終於屈服英行政法院判決19
[討論] 薄瓜瓜算是敵人的敵人是朋友嗎?8
[討論] 台灣法律允許馬斯克這樣的人當部長嗎?7
[討論] 真奇怪阿北性騷璩美鳳事件陳佩琪沒說話3
[討論] 波波有沒有可能靠努力變神醫?19
Re: [討論] 民眾黨為什麼不賣寫真集X
[黑特] 今年颱風有造成重大農損嗎?3
Re: [討論] 薄瓜瓜變台灣女婿2
Re: [討論] 翁曉玲指控參加遊行律師多是綠友友9
[討論] 郭正亮:鄭文燦會比柯文哲慘4
Re: [討論] 莫德納股價崩崩!反疫苗大將RFK上台了5
Re: [討論] 40歲以上的人看得到中共亡國嗎?7
[黑特] 雜草為什麼要詆毀阿北心目中的女神9
[討論] 薄瓜瓜岳家是深藍家族27
[討論] 郭正亮:國民黨2026可能贏南三都X
[黑特] 為什 麼我講偉大的民進黨沒人附和5
[黑特] 什麼都公開 但卻都是弊案??X
Re: [新聞] 強吻鍾沛君二審判11月 朱學恒將入獄1
Re: [新聞] 中配李貞秀遞補立委爭議 陸委會:我《1
[討論] 柯文哲家有鏡子嗎?2
Re: [討論] 薄瓜瓜可能當台灣總統嗎