PTT推薦

[閒聊] 樣本數要多大才能適用大數法則?

看板C_Chat標題[閒聊] 樣本數要多大才能適用大數法則?作者
justgetup
(Kono Dio Da!)
時間推噓38 推:38 噓:0 →:107

從比較老的骰子比大小,百家樂的莊閒,
總會有一派人覺得開了10次獲更多一樣的結果後,
下一次開相反的機率比較高,因為他們覺得照理來說,
這個大小或莊閒應該要趨近一半一半,結果總是要補正的,
但這時更常見的理論是,每一次執骰或發牌,都是獨立事件,
看所謂的"路",是不存在的,你不管壓哪邊,贏的機率都是約50%。

近期的手遊的抽卡或橘子的紫布等等,
就照理來說也是每次都獨立事件,
假如中獎機率10%好了,你也依然有可能抽1000次都還是歪掉,
之前有個數學youtuber算過,丁特的樣本是足夠支持橘子公布的機率騙人,
當時他算的樣本數是475次,這樣本數放在遊戲上很多沒錯,
但對於整天泡在賭場的人,這樣本數應該很低?


所以獨立事件到可以採用二項分布有沒有一個明定的次數啊?
如果500次是一個坎,那手遊有在課金抽卡的是超容易超過,
例如賽馬娘抽中3星的機率是3%,
但抽100、200次以上都沒出彩的狀況也很常見。

--

※ PTT留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 60.248.181.122 (臺灣)
PTT 網址

nahsnib08/24 15:52看你p值

lolic08/24 15:52統計課本寫30吧

hk12990008/24 15:54一般要達到統計有效就30啊

Yukirin08/24 15:55用二項分布沒有門檻 你要說的是二項分布會逼近常態分佈

Ayanami556608/24 15:55統計什麼的都沒用 我覺得臉比較有關係

arrenwu08/24 15:55你講的大數法則是 law of large number嗎?

arrenwu08/24 15:56如果是,那跟你的取樣沒什麼關係

emptie08/24 15:56感覺你要先定義一下你真正想問的是啥

lolic08/24 15:57為什麼以前統計課本寫30我也是搞不懂 50不是更好看嗎

kirimaru7308/24 15:57大數法則沒有所謂的上限,他就跟你講要越大越好了

tacticalandy08/24 15:58植木法則

justgetup08/24 15:58就是比如我抽卡要抽多少的量,

justgetup08/24 15:58才能足以證明官方公布的機率是沒有騙人的?

justgetup08/24 15:58開大小要開多少次?才能證明賭場沒有作弊?

zyxx08/24 15:59看你的機率分佈

zyxx08/24 15:59算信賴區間

justgetup08/24 15:59像丁特這個就是法官認為他有達到證實義務了?

ki8065508/24 15:59請翻開抽樣統計課本

arrenwu08/24 16:00你看起來想問的是假設檢定?

justgetup08/24 16:01或許應該這樣問,多少樣本量是法律上認為的足夠取樣?

arrenwu08/24 16:01這可能要...看法官? XD

ki8065508/24 16:02讀法律的又沒學統計 他們哪真的知道

arrenwu08/24 16:02這樣問好了,一個人丟硬幣連續丟出 10 個正面,法律上

arrenwu08/24 16:02能說「這個人丟硬幣絕對有問題」嗎?

crimsonmoon908/24 16:03你覺得法官懂統計嗎

arrenwu08/24 16:03我也不太清楚實務上是怎麼樣

arrenwu08/24 16:03假設檢定的統計知識很多社會組的都學過吧?

arrenwu08/24 16:03不是還有用 SAS 還是 SPSS 的?

kirimaru7308/24 16:03法官有義務去找懂的人問啊,連程式碼都能找人來看

zseineo08/24 16:03統計課本有寫 但我整堂課上完還是搞不懂統計怎麼來的

kirimaru7308/24 16:04法官不懂不是問題,不作為才是問題

zseineo08/24 16:04為什麼我算個檢定就可以說他達到我要的效果

lolic08/24 16:04純文組跟商科還是有差別的謝謝

arrenwu08/24 16:04但統計沒辦法回答上面那個 連續丟出10個正面 的問題吧XD

zseineo08/24 16:04法官不懂就是問專家意見啊 法官哪可能什麼都懂

arrenwu08/24 16:04以假設檢定的角度來說一般會覺得那硬幣絕對有問題

arrenwu08/24 16:05可是問題不就在妤要怎麼知道是不是剛好那個人運氣好?

jerrykuo051808/24 16:05現在不少管院的會教R吧 經濟系可能會選修STATA

kirimaru7308/24 16:05假設宣稱硬幣公正,則連續丟出10個正面勉強落在99%的

aiiueo08/24 16:05都2023了還是有人把法官當包青天或玉皇大帝

nahsnib08/24 16:05十次還好啦,大概千分之一的機率

kirimaru7308/24 16:05信賴區間內,連續20正面則超出了99.99%的信賴區間外

justgetup08/24 16:05但連續開大或開小10次,去問有在賭博的都會說很常見?

arrenwu08/24 16:05這等於是在問「怎麼樣的機率邊界」才是能接受的

aiiueo08/24 16:06還不如叫回推事,起碼比較貼切實務態樣

nahsnib08/24 16:06真的二十次要嘛硬幣有問題要嘛拋硬幣的人有問題

kirimaru7308/24 16:06這東西絕對不可能100%,但法律上不可能讓被告拿著那一

arrenwu08/24 16:06如果正面機率0.5,10個正面大概在 99.9%

kirimaru7308/24 16:07點點機率在凹,所以在無其他證據可以判的情況下應該是

kirimaru7308/24 16:07會有個公定標準

zseineo08/24 16:07問某人的記憶是最不準的 就跟你去問抽卡歐非一樣

arrenwu08/24 16:0720次正面我會說上帝要收他 去死吧XDDDD

kirimaru7308/24 16:0899%是信賴區間的算法,單純機率是約千分之一

justgetup08/24 16:09一樣舉丁特,被算出如果機率正確,

justgetup08/24 16:09那200億人只出現他一個,

justgetup08/24 16:09很明顯不正常,但硬要說他臉黑,我不能反駁什麼

crimsonmoon908/24 16:09是說擲筊能超過15次是不是很常見啊 不過是不是5050

crimsonmoon908/24 16:09就不知道了

kirimaru7308/24 16:10法官可以在嫌疑夠大的情況下要求被告把程式碼交出來給

kirimaru7308/24 16:10專家審,專利權訴訟就會做這種事情,至於你說把證據先

arrenwu08/24 16:10null hypothesis 是 正面=反面=0.5 的話,10個正面的

kirimaru7308/24 16:11搓掉這件事,法官也想的到,怎麼制衡就要問專家了

arrenwu08/24 16:11p-value 是千分之二吧?

homeboy52808/24 16:11統計課本不是說30,適用樣本數是另外有公式的,30是大

homeboy52808/24 16:11數法則的抽樣數

k96060808/24 16:11你會記得你(或是身邊所有人)天胡的那次 但是不會記得剩下

jimmy1233208/24 16:11大數法則是說樣本數趨近於無限的時候 樣本平均數趨

jimmy1233208/24 16:11近於期望值 你說要多少?無限啊

k96060808/24 16:11的次數

justgetup08/24 16:12擲筊有連擲20個聖筊的紀錄

kirimaru7308/24 16:12啊抱歉,我道歉,是我看錯了,99%是(01正和01反)相加

zseineo08/24 16:12擲筊紀錄本來就是 你連過一堆的才會被記得吧

zseineo08/24 16:12(是說擲筊那個形狀本來應該就不是5050吧?)

kirimaru7308/24 16:13美國有人用美國硬幣統計過1/7000會出現側面朝上

homeboy52808/24 16:13形狀有沒有影響哪面朝上這就不是統計學的範圍了XD

justgetup08/24 16:14擲筊本身就有三種結果了,至少絕對不是5050

homeboy52808/24 16:15他說的不是結果50,而是單一個丟下去哪面朝上的機率

homeboy52808/24 16:15是不是剛好各一半

zseineo08/24 16:15是說單個筊

justgetup08/24 16:16單一個丟下去,光那個形狀也不會是5050就是了

homeboy52808/24 16:16不過以結果來說,聖筊確實占1/2沒錯XD

arrenwu08/24 16:16一般來說「取樣」這行為牽扯到的就是統計了

justgetup08/24 16:16連硬幣都不能真的5050 orz

kirimaru7308/24 16:16那種形狀可以調整內餡到接近50/50 但大概撞兩天就沒了

crimsonmoon908/24 16:16這樣抽卡用的亂數演算法是不是要也列入考慮XD

homeboy52808/24 16:16畢竟就正正、正反、反正、反反,聖茭1/2,另外兩個1/4

zseineo08/24 16:18要吧 反正就是抽卡有關的通通都要交出來 然後給專家驗

zseineo08/24 16:18應該是這樣吧

kirimaru7308/24 16:19正常的偽隨機產生器不足以造成公平性的質疑

kirimaru7308/24 16:19機率造假是參數直接寫錯,不會是產生器的問題

k96060808/24 16:20每個結果出現的機率不是一樣的阿

Bugquan08/24 16:20答案就是要問專家

minuteC08/24 16:22正反沒50/50的話聖茭不會1/2喔

kirimaru7308/24 16:2340/60的話聖筊會是48/100,筊越破神越不高興

k96060808/24 16:23你想成極端一點的10/90下去算就不是50%了

lolic08/24 16:29硬幣側面向上或然輪低於0吧

pauljet08/24 16:30反推法 以前就是廣發垃圾廣告信 10次都中的機率1/1024 1

pauljet08/24 16:30000人有一個白癡中就夠啦

kevinduh408/24 16:3830

Peurintesa08/24 16:40我很好奇就算法官要到程式碼要怎麼知道版本沒問題

Bugquan08/24 16:45跟專業的人審啊

Bugquan08/24 16:45

Peurintesa08/24 16:47我是不知道權力有多大 除非能要到完整GIT歷程

Peurintesa08/24 16:47不然單純給一兩個版本做測試驗不了什麼的

homeboy52808/24 16:51不如問說,法官要到的怎麼知道是遊戲裡真的抽卡那段的

homeboy52808/24 16:52我搞不好提供的程式碼裡面機率那邊改過了,不然就是你

homeboy52808/24 16:52看的時候我貼這段,你看完我hot fix玩我自己的

Peurintesa08/24 16:53我已經先假設工程師有給抽卡段落了 但版本可以不老實

JER272508/24 16:5930

ifiamadj08/24 17:43……前一兩週不是才版上人稱四大國立理科百萬年薪,作為

ifiamadj08/24 17:43商理通用的統計學網路上都有資源,結果怎麼討論都像門外

ifiamadj08/24 17:43漢?

ifiamadj08/24 17:43台大有生物統計的開放課程,裡面就已包含日常生活常見統

ifiamadj08/24 17:43計,也會解答為何民調僅需1024樣本即有很高的信賴區間且

ifiamadj08/24 17:43兼顧效益

EXlikeim508/24 17:44講三十的絕對會被我教授當 最簡單的判斷就是看樣本標

EXlikeim508/24 17:44準差啊 越大代表其為期望值的機率越小

Bugquan08/24 17:45這邊有讀過統計的當然不多

ifiamadj08/24 17:48每年高考的衛生技術、衛生行政也有生物統計的考科,這個

ifiamadj08/24 17:48考科是試金石,因為這是不需要論述就能拿90分以上,比免

ifiamadj08/24 17:48疫學都還好拿分,真想知道自己有沒有通徹理解可以立刻去

ifiamadj08/24 17:48拿歷年考題寫了

papertim08/24 17:49你知道嗎,高中老師也可以百萬年薪,所以百萬年薪真的

papertim08/24 17:49不代表程度多好

papertim08/24 17:50至少當老師沒有考統計

ifiamadj08/24 17:55如果瞧不上眼高考三級也可以考慮博弈工程師

ifiamadj08/24 17:55軟體工程師不排斥灰色產業的話就以博弈工程師上限最高,

ifiamadj08/24 17:55如果不排斥國外菲律賓、香港、澳門也有相關博弈工程師工

ifiamadj08/24 17:55作職缺,統計相關通透理解又懂球版相關內容的,是能輕鬆

ifiamadj08/24 17:55領高薪,前幾年帶我的前輩也常常說自己未來摸透球版就要

ifiamadj08/24 17:55加入博弈

Gjerry08/24 18:35其實可以用貝氏的統計隨著抽樣逐步去修正機率,跟以頻率

Gjerry08/24 18:35基礎假設母數不變的統計觀點不同

newasus08/24 19:19連續十次正面有很難嗎 也才1/1024 過年宮廟聖筊大賽一堆

newasus08/24 19:19超過十次的

bigweedgreen08/24 21:40你的問題跟你的標題對不上,大數法則單純在講樣本

bigweedgreen08/24 21:40越多平均數會往母群平均數收斂,基本上沒有什麼一

bigweedgreen08/24 21:40定的標準,因為他在講的就是「樣本越多的話樣本平

bigweedgreen08/24 21:40均數越會往母群平均數收斂」這件事,他比較跟抽樣

bigweedgreen08/24 21:40造成的變動(反正就是平均數分配的標準差有關),

bigweedgreen08/24 21:40至於二項分配分佈多少會近似常態分配則是30以上

bigweedgreen08/24 21:48至於抽卡其實用二項分配算就是用高中那個公式算就

bigweedgreen08/24 21:48是了,但他也不是算保底,是算你抽多少次,抽到的

bigweedgreen08/24 21:48機率有多少(你要算抽不到的機率也行),不過抽卡

bigweedgreen08/24 21:48一般都用期望值當基準吧?