PTT推薦

Re: [新聞] 獨家/根本在誤導判斷!數學名師嗆:遊

看板Gossiping標題Re: [新聞] 獨家/根本在誤導判斷!數學名師嗆:遊作者
Glamsight
(安穩殘憶)
時間推噓 8 推:13 噓:5 →:45

43


不可置信

為了方便說明,先來看一個抽三次的例子,一樣每次 10%

假定抽樣間獨立,前面是否抽中不影響後面抽中機率

也就是穩定的 10% 抽中,1-10% = 90% 沒抽中

因為是抽三次,所以可能有 4 種


沒抽中 90% x 90% x 90% = 72.9%

中 1次 10% x 90% x 90% 第一次中
+ 90% x 10% x 90% 二
+ 90% x 90% x 10% 三
= [C 3 取 1] 10%^1 x 90%^2
= 24.3%

中 2次 [C 3 取 2] 10%^2 x 90%^1 = 2.7%

中 3次 10%^3 = 0.1%


從上述可以發現到不同抽中次數的發生機率是有計算規律的

不用去考慮什麼中央極限定理就可以知道抽中幾次對應到的機率

規則上就是總抽 n 次,中 x 次,每次抽中機率 p,則發生機率為

[C n 取 x] p^x (1-p)^(n-x)

而所謂的檢定粗俗點講,就是在「假設正確」下,觀察到的樣本罕見到「不可置信」嗎?

好比前例只說我們就只抽三次,然後中了兩次,你覺得機率有點低「機率小於 10%」。

那我們就去把抽中兩次以下的機率通通加起來,看他是不是小到不可置信。

現在先把原文中的 5% 當作基準,如果機率加完後小於 5%,我們就覺得不可置信。

72.9% + 24.3% + 2.7% = 99.9%

這個數值表示高達 99.9%,表示說在「機率 10%」下,這件事還真有可能發生。


以這個案例來說,如果你問「機率大於 10%」嗎?

那就是 2.7% + 0.1% = 2.8%,會覺得「還真有可能大於 10%」,係因 2.8% < 5%

換言之,就是要注意「提問對應的算法」。

但無論如何,都跟什麼中央極限定理無關。


你可能會想問

「機率小於 10%」為啥是要去把「抽中兩次以下的機率加起來」

我就是想「抽中兩次以上的機率加起來」不可以嗎?

來看看一個例子,或許可以比較理解。


天鵝的啟示

這裡以提問「天鵝是不是都白的」作為說明案例。

我們考慮關於是不是白的兩種等價敘述

1. 所有天鵝都是白的

2. 有一隻天鵝不是白的。

這兩敘述中的任何一敘述被確認真假後,另一敘述的真假便立即得知。

來討論看看,這兩敘述分別在敘述為真的情況下,哪一敘述「比較容易確認」。


首先來看看「所有天鵝都是白的」這句話。

在這敘述為真的情況下,想要確認就要檢查全部天鵝。

一隻隻檢查,直到最後一隻天鵝檢查完,只要還剩下任何一隻,就不算結束。

然後發出,喔,天啊,真的都是白的,這樣才驗證完。


再來是第二句話「有一隻天鵝不是白的」。

一樣一隻隻,但只要檢查到發現某一隻不是白的即可停止。

很顯然的,第二個敘述相對容易被驗證為真。


由此可知,我們即便是想要知道「所有天鵝都是白的」。

也是藉由確認「有一隻天鵝不是白的」這敘述是錯誤的來得知「所有天鵝都是白的」。

當檢查到最後一隻天鵝時,也都沒有發現任何一隻不是白的,則第二個敘述錯誤,以此得知第一個敘述正確。

在進行假設前提確認時,要以能否藉由資料否定假設,想要直接驗證假設一般是很困難的。

在不考慮一些特殊情況下,「一般我們同意」假設相對假設外「小」很多。

換言之,「操作」否定假設以回應「主張」證明假設。

好比以前面討論抽中機率,就可能有預期外的「當機=沒抽中」這種情況。

(還是有哪家會出現當機給你算抽中的?重抽就不錯了吧??)


該怎麼推論

根據上述說明,你可能會疑惑前面抽卡說明裡「機率小於 10%」是去算抽中兩次以下的。

這其實是沒有區分「主張」與「操作」的問題。

從前面天鵝的啟示裡可以知道,主張「A 正確」則是以操作「觀察 A 不正確」回應。

「機率小於 10%」是在「操作」,也就是觀察「有多麼不正確」。

實際上該操作對應的主張是「機率大於等於 10%」

流程大概如下


主張「機率大於等於 10%」

=> 現象「高機率觀察到抽中足夠多」

=> 抽中很少代表主張錯誤 (罕見事件)

=> 計算抽中兩張以下機率 (假設前提正確下的計算)

=> 看起來「像」主張機率小於 10%


之所以會「像」是因為我們「先天知道」只有「A 與非 A」兩種情況。

好比前面天鵝的例子,你實際上不知道白天鵝以外會是啥顏色。

不會有什麼「天鵝黑到什麼程度」的觀察,壓根就不知道會不會是黃的、藍的、紅的,怎麼會從「黑」去判斷 484


此外,在有更多資訊狀況下,我們能更明確地設定該如何去拒絕假設。

前面提及的 5%,具體而言係指「不小心把假設拒絕掉的機率」型一錯誤率 alpha。

但很多時候我們在意的可能其他,好比「假設不對,有真的拒絕假設」檢定力 beta。

如果知道各種判斷時的損益,則可以計算經濟收益矩陣。

假設正確 錯誤

拒絕假設 alpha;A beta;B

不拒絕 1-alpha;C 1-beta;D

A;B 表 機率;損益

則可以去操作最大化期望損益

A x alpha + B x beta + C x (1-alpha) + D x (1-beta)

以本抽卡案來說,就是可以考慮評估該案對未來的「社會損益」去代入 A,B,C,D。

(不過對某一造來說,可能只在乎假設正確/錯誤中某一個)

另外,beta 有的時候不知道,需要去估計評估。

考量經濟收益矩陣對於實際應用非常重要,只會問「Yes or No」會造成許多問題。


所以本案呢?

以此案來說橘子方應該是主張「機率大於等於 10%」

那操作就是計算抽 175 次中 4 次以下的機率

根據數感實驗室 https://bit.ly/3ZBWv63 計算,機率為「十萬分之 7」。

(我算好像是萬分之七啦)

即便考慮前後抽 475 次中 11 次,機率也非常之低。

我用 https://stattrek.com/online-calculator/binomial 算,機率顯示 0,應該是小到不給算了。

若採用原文所約定的 5%,將其視為「不可置信」來說,算是拒絕該主張的。

不過我不知道具體法院有沒有約定什麼數字,或是有其他資訊之類的,無法作完整判斷。

好比說可能有約定說機率不獨立,抽中後會不中多少次之後才重置卡池之類的。

沒玩手遊,不是很確定契約怎麼寫的。


其他

從上述來說

抽卡本身就是可以用二項式分佈算

根本就不需要啥中央極限定理、抽樣次數、常態

--
[閒聊] 統計套利的配對交易策略:回顧與展望
I #1XwxemWa (Quant)
II #1Xxbw-nv (Quant)
III #1XxwEddS (Quant)
IV #1YRZo4j9 (Quant)

--

※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.164.23.34 (臺灣)
PTT 網址

whitenoise 01/14 00:09謝謝老師!

brianuser 01/14 00:16你很認真可是我看不懂推一下好ㄌ

QAQ

lupin2401 01/14 00:18讀到大學就是要秀

lupin2401 01/14 00:19不然小學幾何題目 還在用小學算法會被

lupin2401 01/14 00:19

通通秀起來

schumi7401 01/14 00:26囉哩八唆 不要玩就好

喔。

※ 編輯: Glamsight (1.164.23.34 臺灣), 01/14/2023 00:29:13

marquess2980 01/14 00:31用信賴區間這個可以嗎?

不行 信賴區間是描述「區間裡包含真實值的可能性」 你是以觀察到的值去展開區間,然後說「這個範圍裡大概有真實值」 即便區間裡包含 10% 也並沒有說明他是 10% 而若以不在區間來說不是 10%,則是先天預設非 10%。 畢竟你「將觀察值當成正確值去操作」

※ 編輯: Glamsight (1.164.23.34 臺灣), 01/14/2023 00:39:43

radiodept 01/14 00:40欸你根本張飛打岳飛,你用機率算別人用

radiodept 01/14 00:40t檢定算,你不用中央極限定理別人必須

radiodept 01/14 00:40要用呀,t檢定的基本假定不就有母群常

所以我說「不需要」添加其他假設也能處理

radiodept 01/14 00:40態?

然後漸進的話不用考慮常態吧?抽卡這例會收斂到常態ㄅ

radiodept 01/14 00:42然後信賴區間和假設檢定根本是一題兩面

radiodept 01/14 00:42好嗎···

工沙小 =.=

※ 編輯: Glamsight (1.164.23.34 臺灣), 01/14/2023 00:43:42

radiodept 01/14 00:43你不需要別人需要,結果你說人家說錯,

radiodept 01/14 00:43這就是算法不同需要的假定也不同而已

哀,題目沒有的假設你加進來還要說對喔

※ 編輯: Glamsight (1.164.23.34 臺灣), 01/14/2023 00:44:57

radiodept 01/14 00:45你連信賴區間和假設檢定是一體兩面都不

radiodept 01/14 00:45知道,笑死,初統重修吧

令人無言

※ 編輯: Glamsight (1.164.23.34 臺灣), 01/14/2023 00:46:44

radiodept 01/14 00:45哀啥?被打爆臉回不了話?

即便我跟你說我在大學裡開過課也沒啥意義吧 看起來就沒有討論空間 說再多又有何用呢

※ 編輯: Glamsight (1.164.23.34 臺灣), 01/14/2023 00:48:46

radiodept 01/14 00:50喔是喔,我還說我是美國總統咧

是是,您說的是,美國總統陛下。

※ 編輯: Glamsight (1.164.23.34 臺灣), 01/14/2023 00:50:38

radiodept 01/14 00:50信賴區間和假設檢定之間的關係都搞不懂

radiodept 01/14 00:51,大學怎麼開課的?

阿災,可能缺老師吧 ^.^

※ 編輯: Glamsight (1.164.23.34 臺灣), 01/14/2023 00:51:30

radiodept 01/14 00:51你可以退下了,跪安

晚安陛下

※ 編輯: Glamsight (1.164.23.34 臺灣), 01/14/2023 00:51:47

radiodept 01/14 00:52然後總統會稱作閣下不會稱作陛下

radiodept 01/14 00:53連國文似乎都不行,我美國人都比你強

睡不著想我啊 <3

※ 編輯: Glamsight (1.164.23.34 臺灣), 01/14/2023 00:55:43

radiodept 01/14 00:57你可能是機率強但統計還好吧,我認真的

radiodept 01/14 00:57

不知道,但真要說我研究統計檢定的。 然後,我想你是考慮了本文說的只有 A 與非 A = B 的情況。 實際上許多時候我覺得你的說法會有問題。 好比你的說法或許在抽卡上可以,但天鵝的例子不行。 這樣會在對立假設上用虛無假設展開某個東西。 或者說,你也沒具體說明你的意思,就單純衝出來一直噓而已。 看起來沒有討論的打算,我好像也沒法回什麼 484

※ 編輯: Glamsight (1.164.23.34 臺灣), 01/14/2023 00:59:28

radiodept 01/14 00:57我賭你就算真的有開課,也不會是開統計

多重檢定算統計嗎?還是說那算機率? 就當成我做機率的吧

※ 編輯: Glamsight (1.164.23.34 臺灣), 01/14/2023 01:03:29

radiodept 01/14 01:03都研究到多重檢定應該是厲害的,那怎麼

radiodept 01/14 01:03連信賴區間和假設檢定的關係都不知道?

我就說我只看到你衝出來噓而已齁 天知道你想表達什麼

※ 編輯: Glamsight (1.164.23.34 臺灣), 01/14/2023 01:04:54

radiodept 01/14 01:06好了啦,有什麼是假設檢定能做然後信賴

radiodept 01/14 01:06區間不能做的?說來聽聽。別硬凹了

cointegration test 你試試 @

[email protected]

※ 編輯: Glamsight (1.164.23.34 臺灣), 01/14/2023 01:06:52

radiodept 01/14 01:08這什麼啦,美國總統才不會這麼難的,我

radiodept 01/14 01:08只管大事好嗎

他檢定空間的維度,應該是無法展開信賴區間的。 我是這樣認為啦

※ 編輯: Glamsight (1.164.23.34 臺灣), 01/14/2023 01:10:19

radiodept 01/14 01:11你不能說些t檢定z檢定簡單一點的嗎?我

radiodept 01/14 01:11美國總統哪有時間管你這些,我不是不會

K-S test 檢定一個分布是不是常態 虛無假設「是常態分布」,對立假設「不是常態分布」 對立假設不具體時,我覺得不能展開信賴區間。

※ 編輯: Glamsight (1.164.23.34 臺灣), 01/14/2023 01:12:44

radiodept 01/14 01:11我是怕其他人聽不懂好嗎?

radiodept 01/14 01:17這又是我不是不會我怕別人不懂的檢定,

radiodept 01/14 01:17你是不是不會z、t檢定呀,看來我覺得z

radiodept 01/14 01:17、t檢定才是統計最精華的部分

K-S test 初統必學好ㄇ =.=

※ 編輯: Glamsight (1.164.23.34 臺灣), 01/14/2023 01:18:22

radiodept 01/14 01:18好啦對不起我錯了,美國總統的位子還是

radiodept 01/14 01:18讓賢給你

radiodept 01/14 01:21不過K-S檢定初統教,這老師也太狠了

我是沒聽過學生抱怨啦 基本上為了避免我前面說的那種主張與操作的誤會,都一定要講個對立假設模糊的。 然後順便說明 alpha beta 的關係在對立假設模糊時會怎麼變化。 不講 K-S test 就沒簡單的例子了吧?我是沒想到啦

※ 編輯: Glamsight (1.164.23.34 臺灣), 01/14/2023 01:24:53

radiodept 01/14 01:22公式背的起來就阿彌陀佛了

firejox 01/14 02:17wolfram alpha 是好用的計算機

講到這個我就森 77 之前 iPhone 買了 WolframAlpha 後,又給我推一個新的 Wolfram Alpha

※ 編輯: Glamsight (1.164.23.34 臺灣), 01/14/2023 02:27:19

DuckSouls 01/14 02:37寫得真好 半夜睡不著看剛剛好 文組也

DuckSouls 01/14 02:37看得很開心

firejox 01/14 02:48https://i.imgur.com/3xPTCpp.png

firejox 01/14 02:51我只有在用網頁版的0.0

用 beta 分布也太潮了吧~~ 不過你用 beta 可當檢定嗎? 那個參數裡的 12 是觀察值不是嗎? 順帶一問,有辦法畫兩個 beta 的疊圖嗎 我試不出來 @

[email protected]

(雖然很顯然地 4/175 約等於 11/475)

※ 編輯: Glamsight (1.164.23.34 臺灣), 01/14/2023 03:20:44

DuckSouls 01/14 03:12回來留言下,因為法庭上雙方是在爭論

DuckSouls 01/14 03:12有無違反契約精神,其中包含但不限於

DuckSouls 01/14 03:12經營方式、過去有無相關狀況、事後有

DuckSouls 01/14 03:13無恰當反應等;數學模型是否正確只是

DuckSouls 01/14 03:13其中需要考慮的一部分,不完全能證明

DuckSouls 01/14 03:13什麼,才會出現數學老師怒噴的情況

DuckSouls 01/14 03:19簡單來說,雖然主張是抽卡本身有問題

DuckSouls 01/14 03:19,但法庭爭論上不僅僅只討論這個主張

DuckSouls 01/14 03:21處罰是因為違反契約精神,不是因為行

DuckSouls 01/14 03:21為與僅僅一句話不符

謝謝說明 那個有無相關情況,因為他有間隔一段時間分開兩次抽,所以應該是可以主張一下存在惡 意之類的?(經告知後仍未改善) 應該可以用 f 大用的那個 beta 分布做檢定。 好像網路上沒人做這個,可能哪天我有空做個瞧瞧。 說到這個法庭爭論嘛 基本上確實是考量的點很多,即便是「有沒有錯」也都要衡量錯多少。 (有關刑事非告訴乃論的,事後態度更是一項重要參考資料) 好奇問個 有一項不符,且有造成損失,就算是有責了吧? 說實在地,我覺得板友也只在乎有或沒有而已 (判決符不符合民意,好像也都只是死刑不死刑,無期跟輕判??)

※ 編輯: Glamsight (1.164.23.34 臺灣), 01/14/2023 03:43:39

iampig951753 01/14 07:09那為什麼民調會做信賴區間

iampig951753 01/14 07:10民調可以,抽卡不行?

95% 信賴 [47%, 53%],你要推論說勝選這樣?因為 51% 在裡面呢! 你怎麼不說敗選,49% 在裡面? 數字你當然是可以算,但不代表可以這樣用 真實值有信心落在裡面,就這樣 然後我想你 87% 是指「虛無假設」下的那個東西去做信賴區間 (相當給出拒絕域) 但前面我指的是觀察值去開的那個區間,十之八九你應該沒有看清楚前面討論

※ 編輯: Glamsight (1.164.9.232 臺灣), 01/14/2023 09:22:34

DawnSlight 01/14 18:12我也搞不清楚幹嘛中央極限定理

三樓 lupin2401 說的那樣吧,就是想秀技 一下中央,一下又極限的,聽起來就夠中二 吃我的中央極限拳~~~

eachau 01/14 18:27辛苦您了 您講的是最標準的通例,一堆用慣

eachau 01/14 18:27例的想打臉你,想必一定回應的很無奈 XD

搞錯是無所謂,我也不見得對 但「我就對」、「聽我的」這種根本就沒打算討論的態度就...

※ 編輯: Glamsight (1.164.9.232 臺灣), 01/14/2023 19:31:48