PTT推薦

Re: [問卦] 簡訊實聯制資料龐大疫調緩慢根本騙人

看板Gossiping標題Re: [問卦] 簡訊實聯制資料龐大疫調緩慢根本騙人作者
dhccc
(楓糖蛋糕)
時間推噓 X 推:3 噓:5 →:24

※ 引述《wayne4321 ()》之銘言:
: cdc有沒有跟地方政府講過資訊龐大
: 調取很慢
: 如何應用在疫調上還要研議
: 有嘛
: #1WuQ7-XX
: https://www.ptt.cc/Gossiping/M.1625399806.A.861
: 然後還有一堆護航仔護航1700萬筆很大
: 電腦跑不出來是哪招
: 連我跑了一百萬筆還是可以護航
: 我就不能因為隨身碟不足 切成22個縣市來做嘛
: 好吧那我再把隨身碟清出1G
: 隨機產出八百萬筆資料 接近1G
: https://imgur.com/TCJCoyn

: https://imgur.com/uU0jaAT
: 我一天分成白天 早上 兩個時段存成兩個table
: 這樣817可以不要再找理由了嘛?
: 明明就是很小的資料
: 我存成Access一樣搜尋匡列者 秒出
: 搜尋時間不到一秒
: 找到131位匡列者
: https://imgur.com/rLscEP5
: SQL指令跟上一篇文章一樣
: 只用了一個SELECT句子
: 連再匯入SQL Server都懶得匯
: 直接用最爛的Access解決
: 噓 yymeow: 你把資料從100萬膨脹到1000萬就知道了 114.37.64.139 07/04 02:11: 噓 Fantasywind: 資料十倍速度不會只慢十倍,還好你不 114.34.162.26 07/04 05:48: → Fantasywind: 是工程師 114.34.162.26 07/04 05:48: 推 chen1025: 你可以實作一千七百萬筆 索引要建立多久 61.230.193.140 07/04 06:58: 噓 vermilion: 你懂這個是N ^2的複雜度嗎 1.164.57.119 07/04 09:08: → chigi: 一天1700萬,然後你只產生了100萬 111.250.82.148 07/04 12:05: → ckw: 才100萬筆也好意思出來嘴 220.135.58.147 07/04 12:08: → chigi: 然後要是要跟你要跨區資料就等著裝死 111.250.82.148 07/04 14:47: → ralfbrian: 你只有要求分忘記要求小時,還有十倍資 126.215.103.143 07/04 22:59: → ralfbrian: 料不等於只需要十倍時間,還要看記憶體 126.215.103.143 07/04 22:59: → ralfbrian: 會不會炸掉 126.215.103.143 07/04 22:59: 好了可以下去領便當了
: ※ 引述《wayne4321 ()》之銘言:
: : CDC說 簡訊實聯制資料龐大 疫調緩慢 如何應用還在研議 使用上有困難
: : https://www.chinatimes.com/realtimenews/20210701001128-260407?chdtv
: : 真的是這樣嗎?
: : 之前有鄉民算出
: : 一天簡訊的量約1700萬則
: : 只要存28天 超過的刪掉就好
: : 就分28個表格存
: : 我剛用我的2015年 Macbook pro做個試驗
: : 因為我外接usb開機成window usb空間有限 裝了SQL Server後只剩幾GB
: : 所以簡化計算
: : 我只隨機產出100萬筆資料
: : 跟簡訊實聯制一樣 包含三個欄位 電話 商店代碼 時間
: : 這樣的純文字檔資料不到100MB
: : 目標是找出確診者進入商店後
: : 十分鐘內出現的人 把他匡列出來
: : 不管用SQL Server或是最爛的Access
: : 查詢結果幾乎都是秒出 找出56位匡列者(我沒有濾掉確診者本身)
: : https://i.imgur.com/7t2Q2Hy.jpg
: : https://i.imgur.com/c2vbQax.jpg
: : SQL指令就那幾行
: : 這麼簡單的工作也可以推諉卸責

如果是政府創一個單一疫調系統 當然簡單
現在是資料散落在各家電信系統
例如有一百個人的疫調分散在五家電信系統
你要跟這五家電信調資料 或者是請他們匯入中央疫調系統
然後如果是調資料的方式 還要整合各家的格式
每間電信公司同步的時間也不一樣

如果有人這段時間NP來NP去 或者有兩支手機
你又要整合兩三間不同電信公司到同一人身上

總之就是很麻煩

--

※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.46.77.8 (臺灣)
※ 文章網址: https://www.ptt.cc/Gossiping/M.1625458485.A.7FA
※ 編輯: dhccc (114.46.77.8 臺灣), 07/05/2021 12:15:17

james732 07/05 12:15所以掃碼到底有沒有意義啊我掃也很麻煩

kivan00 07/05 12:15要花8億不就是要整合這些資料 結果根本

kivan00 07/05 12:15RAW Data

PantheraLeo 07/05 12:16所以結論是有沒有用?

Hsins 07/05 12:16即使簡訊同步時間不一樣,照目前狀態來看,

Hsins 07/05 12:16疫調也不會是調當天資料,至於時間欄位抓的

Hsins 07/05 12:16是簡訊傳送的時間…

gibaman5566 07/05 12:17請20個人來釐清這些 也不需要花到3億

※ 編輯: dhccc (114.46.77.8 臺灣), 07/05/2021 12:17:57

Hsins 07/05 12:18而且資料散落本來就是一開始推行就該考慮到

Hsins 07/05 12:18了,要做疫調不會蠢到只存在電信系統吧?各

Hsins 07/05 12:18家電信自己獨立建一張表出來,以一天 1700

Hsins 07/05 12:18萬來說分攤到五家電信更是沒多少

Hsins 07/05 12:21你是在反諷對吧?

bbaad 07/05 12:24一定是文組

Gamelop 07/05 12:24有多門號影響不大啊,正常人大多就是常用

Gamelop 07/05 12:24某個號碼再掃啊

mioaria 07/05 12:268億還搞不定這種事情,是需要給你8000億

mioaria 07/05 12:26對吧

tengerinedog 07/05 12:28就不搞健康碼要吹這個沒用的爛東

tengerinedog 07/05 12:28西

DPP48 07/05 12:31資料散落?騙人不懂喔,簡單說五家電信每

DPP48 07/05 12:31家寫一支匯出程式匯到統一格式的資料庫就

DPP48 07/05 12:31結案了啦。不要騙文組不懂好嗎?

mastoid 07/05 12:39阿? 你知道你在說什麼嗎?

dovepacket 07/05 13:03你知道電信業者誰管嗎?

Sacral 07/05 13:10麻煩並不代表做不到,有時候只是複製貼上

Sacral 07/05 13:10很麻煩而已=_=

Sacral 07/05 13:11而且你各家格式才五家,看來你是沒整合過

Sacral 07/05 13:11有幾百個不同格式的資料齁

wavier 07/05 13:31所以8億花在哪?你腦袋要不要拿出來用?

best0811 07/05 13:52總之就很麻煩? 是你的x容量不夠處理吧

archinjj 07/06 07:51浪費民眾的時間,政府跟店家都在演戲