PTT推薦

[討論] YT民調結果資料查詢工具

看板HatePolitics標題[討論] YT民調結果資料查詢工具作者
Tpintrts
(Tt.梅梗)
時間推噓23 推:25 噓:2 →:83

https://www.aweb.tpin.idv.tw/president2024/
簡單的說是整理一些YT頻道的民調結果的工具。

你可以透過篩選「日期區間」、「訪問縣市」、「頻道」的方式,來查詢相關結果。
頻道可以選擇複數的頻道,下面的圖表會加總他們的結果,
例如你認為A頻道和B頻道特別可信,
那你就可以勾選這兩個頻道來混合他們的樣本。
https://i.imgur.com/ICIkBn2.png

圖 YT民調結果資料查詢工具

其中包括了篩選條件下的結果圓餅圖,如果頻道有做年齡收集,那也會有年齡分佈的長條圖,然後會有每支影片的民調結果列表和連結。
https://i.imgur.com/fqkxBD7.png
圖 YT民調結果資料查詢工具

在列表中點選「細節」則會有該影片調查結果的圓餅圖與年齡分佈(如果有)的細節資料https://i.imgur.com/2TjqDhY.png
圖 YT民調結果資料查詢工具

然後會有篩選條件中的年齡取樣分佈及地區取樣分佈
https://i.imgur.com/kWPkaog.png
圖 YT民調結果資料查詢工具
https://i.imgur.com/a8DWCmj.png
圖 YT民調結果資料查詢工具

點選「全部頻道圓餅圖比較」則可以觀看全部頻道的圓餅圖
https://i.imgur.com/4QwquQc.png
圖 YT民調結果資料查詢工具

點選「查看樣本細節」則會回到單一頻道的上述資料內容。


以下一點感想:
一邊輸入資料,一邊感受到抽樣的重要。

實際上,有時我們會覺得民調的結果和自己「體感」不同,其實有時候也不是民調「做假」,可能只是他的抽樣方式的關係。

像「街頭麥克風」他可以做出柯文哲60%以上這樣的支持度,然而你會發現在的年齡分佈中,他訪問了壓倒性大量的年輕人,而且地點也只有花蓮的東大門夜市,在這種情況下,我們頂多只能講「柯文哲在會去東大門夜市的年輕人裡,有60%以上的支持度」而不能說「柯文哲支持度超過六成」,甚或,你還可以歪樓說「柯文哲的支持者可能都喜歡逛夜市」。

對照其他的頻道訪問夜市的影片,也可以發現柯文哲總是會得到壓倒性的票數,可以說柯文哲是夜市的霸主。

但「桃園孫先生」,就很容易做出藍營第一的結果,即使如此,當他訪問地點是在晚上
的西門町一類的地方時,一樣也會做出柯文哲壓倒性的票數,
他會經常做出藍營第一的結果,
恐怕是因為他調查的區域經常是在台北桃園的早上,這些時間老人較多,又是北部,按照過去選舉的結果,藍營支持者本來就比較多。

不過值得注意的是,除了「街頭麥克風」以外的頻道,當累積樣本數達一千以上時,無論柯侯的比例如何,綠營的比例總是在30%以上。

就目前來看,其實YT街訪能做出明確的結論的東西和傳統民調沒兩樣「柯文哲年輕者支持度極高」、「綠營鐵票有30%左右」

樣本數太少時,按照抽樣方式,某方面來說可以控制結果,
如果你想做出侯第一的結果,就去雙北的早上市場訪問。
想做出柯第一的結果,就去全台各大夜市。
想做出賴第一的結果,就去雲林以南的早上市場訪問。

YT民調最大的問題就是單一影片取得的樣本數太少,街訪型式又使地域受限,集合多支影片的樣本數又可能時間太長,如果不假設「投票意向不會有變動」的話,過長的時間也會成為失真的因素。

但反過來說,市話和手機也同樣有這種型式下的限制存在,而且YT影片的好處是你可以知道他的訪問和抽樣方式,進一步知道他的調查缺陷,再來決定它的參考程度可以到哪裡,或要做什麼樣的加權去調整它,但傳統民調基本上你一無所知,從他的問卷設計,到打電話的廣度、幾點打電話都不知道,例如用前面得到的結論,如果你總是在早上打市話訪問,那麼接到電話的是老人的機會就比較高,自然訪到支持柯文哲的機率就低。所以民調也未必需要「做假」,它只要設計一個符合期待結果的抽樣規則就好。

所以到頭來盡量讓樣本數多一點,分佈廣一點,大概是讓調查更接近真實的唯一解,只是這樣就要花很多錢,所以今天有一些youtuber願意自發的做田野調查,這些資料其實還是滿珍貴的。

然後不得不說「木炭民調」和「阿凱街頭民調」是有比其他頻道更認真,他們訪問了年齡也試圖平衡訪問年齡區段的樣本,也盡可能的訪問不同的縣市讓區域擴大。而「桃園孫先生」的毅力也令人佩服,他一個人至今就貢獻了雙北和桃園地區共超過4000份的樣本,即使他抽樣的廣度不足,但其實可以把它視為該區域該時段的調查人員,之後與其他YT在不同時間不同地點訪問的結果做統合,或許也能得到接近真實的結果。


--

※ PTT留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 59.115.132.20 (臺灣)
PTT 網址

Robben 09/18 13:37接訪的問題就是 沒有帶入模型

skylion 09/18 13:37孫先生其實賴第一的次數似乎比侯多

hydra6716 09/18 13:37這大家都懂阿,就白癡想黑繼續黑

herboy 09/18 13:38傳統民調打電話時間那些也會調整,這些人

herboy 09/18 13:38最重要的功能是賺抖內

KONAMI 09/18 13:38電話通常晚上吧

圖 YT民調結果資料查詢工具

chu 09/18 13:40柯屁連20歲都輸賴神17% 你說夜市柯屁屠殺?

其實我也就只是針對YT的做出結果有這個現象,當作例子說頂多可以這樣做結論。 不過我知道這種錯置延伸別人講的內容的方式,是一種找架吵的方式。 所以,嗯,我覺得你說的對。

iamdota 09/18 13:40街訪輾壓電話老三只能說明一件事

iamdota 09/18 13:40柯粉平常沒人對話,特別愛跑出來表態抬槓

hydra6716 09/18 13:41笑死 以前的說法好像是現實沒人敢承認

chu 09/18 13:41美麗島有無敵參數可以調整年輕人 你敢質疑?

victoryman 09/18 13:41

hydra6716 09/18 13:41照這邏輯 那就是塔綠斑現實都不敢承認

hydra6716 09/18 13:41只敢躲在電話裡 嘻嘻

hydra6716 09/18 13:41看現實敢說挺賴皮的幾乎都無腦老人

chu 09/18 13:42早上+市話 搭配無敵參數 一樣知道柯屁20崩了

s81048112 09/18 13:47照某人邏輯 716柯粉不就更慘更無腦

s81048112 09/18 13:47只能躲在八卦

excia 09/18 13:48不要再市話=老人了 認真的民調公司會把超

excia 09/18 13:48過樣本比例的年齡層按比例縮小 少於比例的

excia 09/18 13:48放大 如果太少就一直打到一定數量為止 不

excia 09/18 13:48要再自我安慰市話都是老人不準

其實也不是說民調公司就不準,大家會質疑,主要就是你也看不到他們原始樣本, 也不知道他們的加權方式、抽樣方式,結果開始有人想知道怎麼回事, 這事就成為一種題材,所以才會搞到一些YT跑出來做調查。 民調公司如果重視自己的信用,當然也是會想盡力認真做準, 無不可否認的,民調還是具有影響選舉結果的功效, 即然如此,自然也會有人想把它當操作工具了。 即使這些YT在有限的人力物力下,做得調查無比粗糙, 但大膽假設,設法求證,還是個不錯的精神吧, 而且收集到的樣本也不能說全無意義啊。 至於很多人喜歡酸他們為了流量,一般民調如此花錢, 他們以流量當報酬去做這些事,其實也還好吧, 大家想知道他們就做,而且觀眾還不用付錢。

add20716 09/18 13:50現實不敢承認 2020有817萬票 笑死

add20716 09/18 13:50柯粉只敢躲在網路叫囂

※ 編輯: Tpintrts (59.115.132.20 臺灣), 09/18/2023 14:01:08

excia 09/18 13:53街訪取樣方式 比例都不對 樣本數再大都無

excia 09/18 13:53法推估母群體

你這說法可能就有語病了,如果樣本數大到接近或等於母群體數,那就有用了吧, 不過我不是要和你吵架,確實,投票人數有1950萬,YT再努力也不可能做那麼多, 就算做了十萬份,如果全部都是集中在某個時間區域的人口,那也沒有用。 不過他們收集的東西還是可以透露一些現象才是,也不能說全無價值吧。

GYGY5566 09/18 14:012020有817不代表什麼

GYGY5566 09/18 14:012022沒看到市長選舉死成那副德性

neverfly 09/18 14:01garbage in garbage out

※ 編輯: Tpintrts (59.115.132.20 臺灣), 09/18/2023 14:05:30

chu 09/18 14:08我也不是很想相信美麗島

chu 09/18 14:08只能盡量相信 然後投票去打臉美麗島

chu 09/18 14:09就像三立自由 不管做什麼什麼民調 根本沒人信

aling1205 09/18 14:10純市話就是90%老人民調啊,選民又不是

aling1205 09/18 14:11只有市話的會去投票,TVBS都改50/50了

aling1205 09/18 14:11,別再安慰自己市話才準了

chu 09/18 14:11YT唯一好處就是可以統計民眾的理由

chu 09/18 14:11一般民調只有數據

excia 09/18 14:14某人根本就不看別人講什麼 就說會按比例調

excia 09/18 14:14整 假如20-29本來需要100人只有50人 就會

excia 09/18 14:14把50人的結果放大成100人 反之亦然 不要把

excia 09/18 14:14民調公司當白癡

sariel0322 09/18 14:15做了很多敘述性統計,除了比起這些yte

sariel0322 09/18 14:15r更有整理的意義以外,基本上是garbag

sariel0322 09/18 14:15e in garbage out

excia 09/18 14:18有時候一些民調波動過大 就是樣本數沒有做

excia 09/18 14:18足 例如可能20-29只有10人要100人就放大10

excia 09/18 14:18倍 但10個樣本很容易發生極端的結果 放大

excia 09/18 14:18就失真

Slzreo1726 09/18 14:19街頭訪問的民調只能做敘述統計而不能

Slzreo1726 09/18 14:19做推論統計 也就是你做出來只是給自

Slzreo1726 09/18 14:19己看得爽 根本不能推估母體 還以為樣

Slzreo1726 09/18 14:19本放大就能解決?館長民調樣本幾萬票

Slzreo1726 09/18 14:19

你不需要為了別人不懂統計學而那麼生氣, 街訪民調在統計學上被罵爆我也知道, 缺乏設計下,不能用於推估母體,我也知道, 可是你要罵人家,總要提出一點理由吧? 這個東西某方面就是說明了YT街訪光是從「抽樣」開始就大有缺陷, 所以大家要小心看待。 至於做再多也不能推估母體(除非樣本數極端到接近母體),我也很同意, 館長民調幾萬份,比起1950萬的投票人口來說仍是遠遠不足的。 但我也必須說,如果我只是想做小規模的統計研究, 例如:「會去東大門夜市的人的支持傾向」, 那「街頭麥克風」的繼續做到二十萬份的數據會不會就有點意義了? 說不定他就是想知道東大門夜市的支持度麻。

※ 編輯: Tpintrts (59.115.132.20 臺灣), 09/18/2023 14:34:51

Antler5566 09/18 14:23garbage in, garbage out

excia 09/18 14:23敘述性統計不是毫無價值 但拿來推估母群體

excia 09/18 14:23就不對

excia 09/18 14:26比如說那些車友民調 讓大家知道跑山的族群

excia 09/18 14:26支持柯比例非常高 這個就無需懷疑

圖 YT民調結果資料查詢工具

excia 09/18 14:31去集中訪問例如跑山車友 眷村老人 百貨貴

excia 09/18 14:31婦 八大小姐 宮廟+9 針對特定族群去主題性

excia 09/18 14:31研究 我會認同的這種做法 但拿來跟傳統民

excia 09/18 14:31調比就是搞笑

我明白你生氣的原因了, 我想我會讓你覺得拿來根傳統民調比,應該是我表達方式不好。 傳統民調,有民調公司的專業,只是因為大家不相信, 才會搞到有YT出來做,而他們做的目的,有一些確實是想要「打臉傳統民調」, 或質疑傳統民調,所以他們確實是想和傳統民調「比較」, 但這種比較會有有很多統計學上的問題。 我想表達的事其實和你差不多啊, 或許最後一段讓你覺得,我好像是在說如果收集了很多份就有用, 進一步說,我的意思是,如果每個縣市都有四個孫先生, 並且分別在不同的時段做調查,最後收集這些樣本, 「或許」就有點用。 然而現實確實是每個YT個自為政,所以最後出來的數據大概無法推估母體, 所以我們其實是有共識的吧?

Maniacs 09/18 14:38推這篇

※ 編輯: Tpintrts (59.115.132.20 臺灣), 09/18/2023 14:46:18

VicOladipo 09/18 14:38柯韓粉真的表態率很高啊

shiriri 09/18 15:04garbage in garbage out

zebra7 09/18 15:06民調公司有沒有做都不知道了 有種錄音公

zebra7 09/18 15:06開 不然都在唬爛而已

chivalry10 09/18 15:18抽樣和拒答率!你為何要浪費才能啊

jim052 09/18 15:30就算像你所說的,每個縣市都有四個孫先生

jim052 09/18 15:30,這樣的街坊民調也是沒用的

jim052 09/18 15:30

jim052 09/18 15:31因為你所挑選訪問的對象本來就會有潛意識

jim052 09/18 15:31的偏好

jim052 09/18 15:31所以結果很自然會放大你的偏好

jim052 09/18 15:33更別說如果我是yt,我多做幾次大約知道怎

jim052 09/18 15:33樣的人會有怎樣的政治偏好後,我就針對那

jim052 09/18 15:33些人訪問就好。不一定是年齡,還有穿著等

jim052 09/18 15:33等其他各種可以挑選的差異

jim052 09/18 15:34甚至還有逆向挑選的問題

jim052 09/18 15:34這些都是無法解決的

HyperPoro 09/18 15:36也不用在這邊吵 等選舉結果出來就知道

HyperPoro 09/18 15:36誰比較準了

其實,我個人覺得民調最後終究是不會準的。 因為這世界是二階混沌系統,天機一但洩露就不再有用, 選舉最明顯的例子就是棄保,也許你今天調查我,我要投給A,而且不想讓C上, 但後來我「體感」覺得B比較有可能打敗C,所以我最後投了B 這時候,你能指責之前調查我要投給A的人是「不準確」的嗎?不公平吧? 所以其實吵民調,對於一些選民來說,是棄保或當天要不要去投票的判斷準則, 對於堅定支持者來說,則是判斷自己支持的候選人的「勝率」而已, 娛樂效果的意義可能還大一點。 它對候選人的意義則是當下努力的方向。 所以嚴格來講,頂多只能求「當下」它是「準確」反映現況的, 但它究是不是真的「準確」反映現況,只有神才知道, 對個人來講,只有信不信的問題而已。

jim052 09/18 15:37就算yt比較準,那還是沒用的,壞掉的時鐘

jim052 09/18 15:37一天也會準兩次

※ 編輯: Tpintrts (59.115.132.20 臺灣), 09/18/2023 15:45:59

jim052 09/18 15:37本質上其挑選的方法就是無法經過學理證明

jim052 09/18 15:39當然民調公司的民調有他本身的問題,但這

jim052 09/18 15:39不代表我們就可以用街坊取代

jim052 09/18 18:14如果你只是覺得想要看爽的,當然任意數字

jim052 09/18 18:14都可以,但你的最新回文跟你的內文講法不

jim052 09/18 18:14一致

jim052 09/18 18:15如果每個縣市都有四個孫先生,

jim052 09/18 18:15並且分別在不同的時段

jim052 09/18 18:15做調查,最後收集這些樣本。

jim052 09/18 18:15 這還是沒有用的

你這說法讓人有一種「只要是用街訪方式收集的樣本就一定沒有用」 你明明知道我指的「四個孫先生」只是一種比喻的說法, 或者,我換個方式比喻, 全台灣各縣市各派四個和起來溫和無害也看不出政治立場的人, 分別在不同的時間與地點以街訪方式收集資料, 最後每個縣市都收集到一萬個樣本,這樣的情況下,收集到的樣本應該有用吧? 還是就算這樣,還是隨機性不足,那應該怎麼做才能克服隨機性的問題? 才能讓街訪的方式能夠成為有效樣本? 我統計學知識不多,還是說田野調查一律不能實地街訪, 否則得到的資訊就一定沒用? 統計調查的方法本來就是一連串的設計, YT的調查和分析方式粗糙這當然可以批評,但講到無論如何都沒用, 是不是太極端了點?

jim052 09/18 18:16以yt民調來說,你講的只有這句話正確:個

jim052 09/18 18:16人來講,只有信不信的問題而已。

其實我的意思不只是YT民調,是「所有」民調。 因為當下真相如何只有神能驗證, 對人來說,就只是調查方法能不能取信你的問題而已。 就像現在,街訪的方法對你來說就是不可信的, 但有些人覺得這樣簡單直接的方式,他們覺得真實可信啊。 今天傳統民調不也是想要取信大家嗎?所以相較於過去公佈了更多的細節。 然後,我也沒有說YT民調的方法是準確的, 相反的,我是在說光是「取樣」的情況,就大有問題。

jim052 09/18 18:18但是不可能說它的方法是準確的

lbowlbow 09/18 18:43來源就是垃圾的東西完全沒有統計意義

講真的,來源算不算垃圾,還是要看你打算統計什麼。 我想統計「會去東大門夜市的人,支持候選人的比例」, 用這種方式調查個一萬份,還是能得到一點有用的東西吧? 但用來當作全台灣的支持度,當然就沒有意義了, 畢竟極大部份的人應該連去都沒去過東大門夜市。

kaede0711 09/18 19:10我覺得不用這麼認真分析吧 這些街訪在

kaede0711 09/18 19:10我看來跟他們想要導向或暗示的結果來

kaede0711 09/18 19:10說幾乎可以算垃圾進垃圾出了 而且這些

kaede0711 09/18 19:10街坊的主要目的是流量和抖內 這和傳統

kaede0711 09/18 19:10民調的生財方式不一樣 傳統民調大可以

kaede0711 09/18 19:10質疑抽樣方式 但終歸而言每家本來就有

kaede0711 09/18 19:10自己的一套加權跟修正係數 而且也不是

kaede0711 09/18 19:10只有一家 如果特立獨行不是超準就是超

kaede0711 09/18 19:10雷 下次也沒搞頭了

※ 編輯: Tpintrts (59.115.132.20 臺灣), 09/18/2023 20:26:07

pastevil 09/19 00:11我們現在是以 市話民調 為準,謝謝