Re: [問卦] 我不懂統計,有朋友送我這張圖有卦嗎?
認真回
這篇文章在講的事情是error propagation
如果我有兩個實驗數據
這兩個數據是獨立量測的
那我測到的第一組是A+/-a
第二組是B+/-b
假設你的實驗量總是常態分佈
有統計顯著意義應該是要
|A-B|>sqrt(a^2+b^2)
舉例來說 如果A=40 B=44 a=b=3
他認為統計顯著意義應該要是
|40-44|>sqrt(3^2+3^2)=4.26
但這條沒有成立 所以沒有統計顯著意義
那比較confidence interval的意義是甚麼呢
就是當我們設定95%信心水準樣本數1000
母體數很大的時候不太重要 但我們可以假設個一千萬
那對應的confidence interval大約是3%
也就是說我做無限次調查的時候
有95%的結果我可以肯定
支持某個選項的比例跟某個數值A的差距在3%之內
那在某些社會科學(有些自然科學好像也是)的慣例中
在誤差範圍內=在誤差範圍外的相反
甚麼是在誤差範圍外
就是我可以肯定我量測到的數值跟A的差距不是誤差導致的
換句話說就是
在誤差範圍內=A跟B的差距有可能是誤差導致的
但你可能會問這樣的機率很小怎麼辦
這就是為甚麼一開始要設定95%信心水準
當設定信心水準之後你基本上就可以確定95%情況(母體真實情況)的範圍
接著再來比較這95%情況下有沒有可能(有沒有一種母體)
抽樣調查有可能測到A也有可能測到B
如果有可能 就是在誤差範圍內
如果不可能 就是在誤差範圍外
舉例來說 調查你喜歡買星巴克嗎 1是喜歡 0是不喜歡
母體可能是
100011111000 支持率是41%
也可能是
110011111000 支持率是58%
也可能是
110000000000 支持率是17%
...
但你調查的時候只抽3個
你抽到 010 所以喜歡比例是33%
但有沒有誤差值? 有 95%信心下 誤差大概是50%
在這95%的母體中
有沒有可能有一個母體的真實支持率是60%? 有
有沒有可能有母體的真實支持率是90%? 沒有
(根據你的實驗結果 這樣的母體存在的機率不到5%)
為甚麼可以用實驗結果反推母體?
這也很簡單 因為你測到110
所以有沒有可能有母體是 000000000000?
不可能 所以實驗結果是可以反推可能的母體 跟他對應的比例的
所以統計觀念就進來了
95%信心水準下誤差50%的意思是
真實母體的支持率跟33%有沒有可能差超過50%
有可能 例如111111111110
但這種母體存在的比例不到5%
接著問題來了
現在有一間星巳克
你要調查對消費者來說喜歡星巴克跟星巳克有沒有區別
所以你做了一樣的調查
結果呢你一樣抽三個 這次抽到111 喜歡比例是100%
接著你問根據這樣的實驗結果
有沒有可能出現一種母體 消費者對星巴克跟星巳克的喜歡是一樣的
答案是有 而且還蠻常見的 大約有9成的母體容許這種實驗結果
舉例來說 母體可能是
111000000001
111100000001
111110000001
.....
如果你支持3% 你可能會覺得奇怪
支持率差距是66% 怎麼66%超過誤差50%還有這麼多可能的母體
但是但是 這些都是假設信心95%的情況下
95%只是常用的標準
你可以說 我想要誤差0.001%可不可以
當然可以 如果你的信心只有1% 誤差就會很小
換句話說 你做了一個測量
你只要求母體實際支持率跟你量到的差距在0.001%內
那你就只會撈到可能1%左右的母體
那用這個基礎進行討論你就可以說
你有不到1%的信心 消費者喜歡星巳克多於星巴克
當然這是極端的例子 也許你會有80%的信心可以下這種結論
但通常習慣是用95%90%之類的就是了
回過頭來講
要用error propagation通常的假設是你預期你做的測量背後有一個確定的真實值
你的平行世界就只有一個
不會有這種背後有不同母體不同情況的可能性
而因為誤差 你實際做測量的時候的測量值大約是常態分佈
至於喜好調查這種東西呢
當你只抽樣調查 你是不會知道背後母體真實長的樣子的
所以你只能討論眾多可能性中 在某種給定條件的各種可能性下的結果
我知道風向不對
但科學精神就是這樣
如果你說我錯 你要講出我哪裡錯
如果你提出一個說法
這個說法要有可以被證明是錯的可能性(不一定錯 但要有可證偽性)
※ 引述《Popechiou (是我)》之銘言:
: https://i.imgur.com/XpDyyD8.jpg
--
一場 選舉 全民上統計課 這畫面好美
前提是兩組獨立數據
沒有錯 如果數據不是獨立就要考慮相關性 第一種常態分佈的例子中誤差有可能修正 至於是變大還是變小要看兩者是正相關還是負相關 回到統計的例子 基本上你是星巴克星巳克分開問的 所以你得到的兩個對於母體推論基本上是獨立的
台灣人真可憐,一會兒要懂疫苗,一會
兒要懂統計
你假設錯了啊 柯侯跟侯柯就有相關性 而且是
如有天命 需要讓票?
正的 所以會比你估的小
我沒有在討論那個例子 你可以說這個假設下的論述不適用某個例子 而不是你假設錯了 再回來相關性這件事 首先你要放相關性進來考慮的就是第一個例子 假設有一個上帝知道的真實數值而不是有各種可能的母體 那確實正相關會使誤差傳遞比原本的誤差傳遞小 但問題來了 請問你如何知道cov(A,B)是多少呢?
看民調有沒有計算這項啊 我怎知==
民調當然沒有這項 因為通常計算covariance的時候是第一種例子 你在做實驗量測 量測一個數值 而不是做民調 調查支持比例 事情是這樣的
https://imgur.com/4zQ7Ztp這是covariance 如果假設支持算1不支持算0 讓x_i要嘛1要嘛0 可能可以算至於能不能用我持保留態度 畢竟第一種常態分佈的狀況假設的是常態分佈 但0跟1顯然不是常態分佈 總之退一萬步我們用0跟1做個估計好了 但只是估計所以實際計算結果也許跟估計不一樣 總之 甚麼時候會得到最高的負相關呢 就是同一個人喜歡星巴克就不喜歡星巳克 甚麼時候會得到最高的正相關呢 就是同一個人喜歡星巴克就喜歡星巳克 的確正相關會讓誤差變小 但是呢 我們要看的就是有沒有統計顯著可以證明喜歡星巴克的人多於星巳克的人 高度正相關基本上是否定這個看法 因為高度正相關代表的是多數人兩個都一樣喜歡
請問什麼是越位
正解就是沒有raw data都算不出來啦
沒有原始數據要怎麼知道共變異數XD
DD
9成的母體 你是假設各種母體機率均等吧
概念是這樣的 首先我們知道做了測量之後各種母體存在的機率就不均等了 舉例來說你測到111 母體就不可能是00000 所以一般來說我們看的是把9成5的母體挑出來 看能不能排除某種情況 換句話說 能不能挑9成6的母體出來 且這些母體實際支持率跟測量的小於3%呢? 答案是不能 一旦你做了1000份問卷 這種可能性就被排除了 至於挑出來的9成5的母體裡面各種比例是多高? 這跟誤差範圍內是兩件事 因為9成5的母體裡各種母體支持率分布的比例跟10成母體差不多 但10成母體統計誤差是100% 所以有兩個不同的問題 1.我能不能猜哪個母體最有可能 答案是可以 而且你八成會猜是你量到的那個 可是這時候你猜錯母體的機率也很高 2.我可不可以降低猜錯母體的機率 並在這個基礎上排除某事件發生的機會 可以 這就是統計誤差
也就是0 1都50% 這樣能maximize interval
我不是很確定同時比兩組數據這樣公平嗎
而且實際上因為有賴 所以其實不論柯或侯
母體比率應該都<<0.5 直接用0.5估
然後要求interval不能疊 怪怪der
這例子不太像星巴克 but anyway
為什麼智商157還有統計學博士簽的約
可以不清不楚 定義都沒定義好
學生時代的惡魔又回來了
我知道的是重點在如果你要比較兩組有差異
的數據是不是有顯著差異你會設定一個P值,
就是當你的假說是真的時候,你的結果出現
極端情形的機率(例如常態分佈單雙尾的5% 9
5%,P value=0.05), 你去計算你要比較數據
的p value是不是低於設定值你才會知道是不
是有統計上有顯著差距的意義
你說的沒錯 這就是第一種常態分佈的狀況 如果你在測量一個數值的時候 例如全班體重 我們會假設體重分布是常態分佈 再根據常態分佈各數值出現的機率去設定p value的閥值 至於問卷這種問題呢 基本上就是1跟0 畫成圖就是兩條bar 基本上不是常態分佈 並且處理的問題也不一樣 常態分佈是假設宇宙有個真實的值和真實的分布 這個分布就是常態分佈 所以他不用處裡母體的問題 也就是為甚麼你假設常態分佈之後就不用假設95%信心水準了 (這跟P value的5%是不太一樣的概念) 因為你的"母體"就只會是常態分佈 至於問卷呢 我們要做的事情是在95%的母體中 討論某事件發生的機會有沒有可能完全被排除
不是 我是指 假設母體有10個 你測2個
排除掉不可能發生的 剩下的用2選1 0/1去湊
猜0.5的好處是能CI啊XD 你單純要檢定一個
我覺得max CI很合理 CI最大都能跑出去
肯定能跑出去了 但如果想玩兩個CI不重疊
我不知道這樣做合不合適就是了
不過我覺得你的排除在今天的例子不太重要?
因為選民人數遠遠比民調樣本多
母體=全體選民 民調=樣本 在沒選舉之前我們做民調得到得結果呢 可以有N種對應的母體 換句話說有N種可能的選民結構 可以讓我們做出今天的民調 但是呢 我能不能猜真的選舉的時候支持率會怎樣呢 可以 你會用你做的民調結果估計 但是呢 因為你的樣本數遠小於母體 所以真實的選舉結果跟你的民調結果大概不會一樣 差距有多大呢? 你做1000份民調 真實結果跟民調結果差距在3%以內的 有95%的可能性 差距在2%以內的 有80%的可能性 有沒有沒有誤差的 有可能性很接近0 OK 讓我們再回到相關性跟常態分佈的討論 你如果問說 今天做了一個民調 我能不能用常態分佈那一套來處理 我只能說我持保留態度 但我可以告訴你為甚麼平常做問卷調查都不是用常態分佈那一套 1.0跟1不是常態分佈 所以假設只可能是一種近似 2.常態分佈是對母體的一種假設 當你要排除某種可能性的時候 基本上是盡可能做越少假設越好 畢竟沒有人有好的理由說服別人 為甚麼真實母體應該是常態分佈 有甚麼東西不是常態分佈? 很簡單年紀分布就不是常態分佈 為甚麼我是持保留態不而不是否定 是因為統計這個東西基本上還是共識決 你說你要95%信心 我可不可以說要30%就好了 可以啊 你也可以說1%信心那你誤差就不見了 或者說要99.99%信心 那你誤差可能就大到快100% 95%這個共識基本上是因為好用 但甚麼是好用 怎樣定義好用? 這都是人決定的 所以你要用常態分佈行不行 也許吧 如果你覺得很好用的話 我只能說 一般社會科學處理好不好要不要這種"民調"應該沒有人假設常態分佈 我想再補充一點 雖然這裡應該沒有人會看 為甚麼常態分佈這麼棒呢? 這是因為大部分時候我們定義"距離"的時候都是用L2 norm 舉例來說 X = {x1,x2,...} Y = {y1,y2,...} 如果XY間距離是sqrt((x1-y1)^2+(x2-y2)^2+...) 這就是L2n norm 基本上差距 誤差這種東西就是距離 如果我們是這樣定義距離的 那你要找到一個"正確"的分布 使得該分布跟所有可能分布的距離最小的話 那這個分布就是常態分佈 如果距離不再是L2 norm了 那這個分布就不會再是常態分佈
推
已經上了一天的統計學了
懂你的意思了 謝謝
但我沒有假設是常態分佈吧?
data當然不是常態分佈
但你抽出來的樣本參數 與平行世界比 會是
比方說你抽出來這次mean=0.42
假定母體mean=0.5 (最大化區間)
可以下去估如果你抽了很多次
這些mean的std 是這樣嗎?
抱歉我不確定你有沒有再講常態分佈的事 主要是因為我回的那篇文在講的是常態分佈的統計 所以我話癆就多講了一點 針對你這個問題 估計總是可以的 但估計會估錯 統計誤差範圍處理的問題是給定信心水準我不要我估錯 我要確定可以排除是誤差導致或是說不能排除誤差影響 換言之 估計做的是是說"很有可能" 但不能告訴你多有可能 統計誤差要說的是"哪些不可能" 事情是這樣子的 只做民調我們"可能"活在各種各式各樣的平行宇宙中 但歸根究柢 我們只活在其中一個 舉例來說 我們抽到111 母體有可能是111111 也有可能是111110 你問我有沒有可能知道我再做一次民調會出現甚麼狀況呢? 如果我要有100%信心 答案是不能 如果我有5%信心可不可以 可以 因為我有5%信心真實母體一定是111111 所以抽到0的機會就是0 但5%信心夠不夠? 別人可能質疑你說那111110你怎麼不說? 所以問題基本上就是這樣 如果你認為母體是某個樣子 理論上你應該只能有5%信心 如果你要有95%信心那你必須容許某些母體而不是一個母體 並且最後你知道你只活在其中一個 但即便是這樣你還是能排除某些狀況 因為在這些母體中還是有某些狀況是不可能發生的 只要這些可能性不能排除 基本上就是在誤差範圍內
也就說 你會有mean1 mean2 mean3..mean1000
是需要多懂?叫你讓就讓,不然自己出錢
考慮這些mean的分布,會是常態分佈?
一早起來上統計,傷痛都回來了
統計學答案不重要 國民黨就是要正的
推~~可以跟我說一下,民調結果就以你們專
家來看,猴猴是立論是正確的嗎?柯翻桌有
理嗎? 若你是柯,以當初協議來看這結果,
你也會翻桌嗎?謝謝。
不要說以你們專家來看 我不是研究統計學的 我只是常常會要用 如果你說以我看是怎樣 我只能說
https://imgur.com/Pmt6KOh這張圖的情況出現的時候是不能排除"社會科學普遍使用的"統計誤差的 但我再講一次 統計這種東西基本上是共識決 你常常要放一些假設 假設是人放的 你可以堅持不用別人常用的假設 我想沒有人可以反對
※ 編輯: Imotucc (76.53.238.53 美國), 11/19/2023 08:01:44謝謝您的解釋,但我仍聽不懂
至於我會不會翻桌
如果是我 我根本不會簽那張
因為規則設定本來就沒什麼勝算
舉個極端例子 每個民調只採取一個人
看N份記點
統計誤差內算A贏
那不管你用哪種定義A都會贏
理論還是跟現實,有一段差距,所以誤差
根本不用管實際支持率幾%
就是統計的美
還有啦 常常是這樣
你可以不用多數人用的定義
總是可以 你絕對可以重新定義3
或者是把2跟3互換
變成1+1=3; 3+1=2
這是定義問題 基本上愛怎麼訂怎麼訂
但人跟人互動通常還是用常用的
除非現在出現一個以前人沒有意識到的問題
讓你主張換一個定義更好用
吵一個晚上 統計上都沒有共識阿 有共識的
只有柯就是碾壓侯 之前不敢比 現在比下去
褲子都沒了
這不是人跟人互動問題也不是什麼常用問題
完全是解釋問題 所以那麼簡單草率的簽
名不用負責?
在當下你沒有發現問題的能力那就是你的
問題
推
上完之後每個人都值1.5個博士嗎
意思是母體未知時 誤差值可以隨人定義?
誤差越小信心越低 如果你可以接受0%信心的話確實誤差要多大都可以 但你設定了信心水準 根據你的樣本數 誤差就是確定的
※ 編輯: Imotucc (76.53.238.53 美國), 11/19/2023 09:45:36爆
Re: [爆卦] 科普:願某人念博時少學點話術多學點統計我覺得原文有很多錯誤,恕刪 首先,我必須要說一開始談成的條件就不合理,就統計而言 我可以理解誤差範圍內侯柯配的做法,這一開始也是柯提出的 這做法的概念在於,把侯柯當成虛無假設(預設值的概念),只有在對柯侯能表現較好有信 心的時候才選柯侯(否定虛無假設)63
[爆卦] 科普一下可以吧...那個老師教的統計誤差科普一下統計的區間估計 一般來說區間估計都會有一個信心水準 意思是母體真值落在這個區間的信心 (不是機率...因為信賴區間是「事後」的概念,因為是已經抽樣完了...不過在這裡不影 響理解)6
Re: [問卦] 台清交統計學權威教授不要再躲了統計就是參數未知,由抽樣的樣本去推估 參數就是最後真正的得票率等等 真正的參數就只有上帝才知道答案 比如侯柯配的真用得票率,只有上帝知道, 我們不是上帝,只能用有限樣本去推估17
Re: [心得] 簽協議都不弄清楚三、雙方同意,若超過統計誤差,由勝者得一點,若在統計誤差範圍內,由侯柯配得一點 。 沒有吧 第三點寫得很清楚啊 統計誤差這四個字 還有 統計誤差範圍這六個字 就有明確寫出來了 母體數1900萬左右 樣本數1000左右 95%信心水準 樣本差就是3%上下15
Re: [問卦] 哪個統計學家說6%合理的1.先釐清觀念 統計學信賴區間說的誤差3% 是指實際投票結果跟抽樣調查結果誤差會有3% 他們拿去比成兩種投票組合差到3%11
Re: [問卦] 兩個白癡比賽,事前都沒討論嗎?看了留言 本來就不能寫趴數 (除非大家抽樣的樣本數一樣) 寫誤差範圍我覺得也不是正確 (我覺得應該寫標準差)7
Re: [問卦] 認真問3% 6%哪來的大家好, 小弟文組剛剛看喉科回來, 機率,信心水準,誤差界線真的沒很難,我阿罵都會。 樣本從推論母體, 譬如普查柯文哲支持率 θ2
[討論] 誤差6%以上的機率所謂的統計誤差是, 用到的樣本跟實際的母體比例不一致。所以民意調查都會加註,信 心水準95%的誤差範圍是3%以內,也就是誤差超過3%以上的機率是0.05。 而侯陣營宣稱,作侯柯配與賴蕭配調查時,有0.05的機率,侯柯配真實3%以上支持度,跑 到了賴蕭配或是不表態,也就是有0.05的機率,真實柯侯配的支持度少了3%以上,而賴蕭 配多了3%以上,來回的誤差就是6%。所以在同一份民調裡,有0.05的機率兩者支持度的相3
Re: 誤差範圍是幾趴?1,000份樣本調查的誤差範圍就是+-3%啦!! 在這種情況下,如果柯輸侯3%內(就是柯-3%)本來就是柯輸, 只有柯贏侯3%內(也就是柯+3%),才是真正柯讓掉的部分, 所以+-3就是柯讓掉3%容錯空間; 現在是柯文哲要扯成3%是+-1.5%啊!!!1
Re: [問卦] 為什麼統計誤差一率是 3 趴?大家好, 小弟文組剛吃一包市場涼麵,配UCC 117 如果假設 有限母體簡單隨機抽樣,抽後不放回 樣本數n,信心水準1-alpha,誤差界線B,母體數N, n=n_0/(1+n_0/N) n_0=((z_(alpha/2))^2 PQ)/B^2
67
[問卦] 昨天那個光頭裁判是什麼洨?43
[問卦] 統神:我打算明年打館長,後年打toyz43
Re: [新聞] 藍白強行通過3法 台中罷免不適任立委人45
[問卦] 跑跑卡丁車1三服比賽 三服第一會是?(發$)爆
[問卦] 統神:當初協議我減到100kg以下 拿16oz打34
[問卦] 只有我不懂魷魚遊戲哪裡好看?35
[問卦] 抵制Netflix卻因魷魚遊戲沾沾自喜?34
Re: [問卦] 被台派出征的那個梅花糕 有人吃過嗎32
[問卦] 林夕 黃偉文 李焯雄 方文山 誰是詞神?31
[問卦] 看過夢幻遊戲都幾歲了??30
[問卦] 煤油是最屌炸天的暖爐吧55
[問卦] threads:高雄有魷魚遊戲根本首都爆
[問卦] 認真文 聽說明天就要起訴了19
[問卦] 跑船薪水高,為何商船系分數不高?29
[問卦] 吃過最難吃的名店是哪一家?17
[問卦] 烏龍派出所哪一集最好笑17
[問卦] 統神減肥完是不是真的有差18
[問卦] 滷味是怎麼取代關東煮的?26
[問卦] Tilda 在台灣的照片大家還有臉嗎?15
[問卦] 為什麼8+9都瘦瘦吃不胖的八卦?26
[問卦] 33K透天無貸和74K無房哪個有安全感14
[問卦] 統神會復胖120還是繼續瘦到807
[問卦] 沒人發現蔡依林紅這麼久根本莫名其妙嗎!72
[問卦] 魷魚遊戲為何在台灣選擇高雄當宣傳呢14
[問卦] 張柏芝算是香港第一美女嗎?10
[問卦] 統神不是賺很多嗎 不至於賠不起50萬吧8
[問卦] 阿拉丁電影版精靈是黑人?28
[問卦] Rose是怎麼逆襲成為Blackpink最紅23
[問卦] 穿這樣見網友可以嗎?(圖)12
[問卦] 為什麼不乾脆無差別格鬥算了