PTT推薦

Re: [討論] 中央的數位疫苗證明怎麼沒有個資疑慮阿

看板HatePolitics標題Re: [討論] 中央的數位疫苗證明怎麼沒有個資疑慮阿作者
jayfrog
(寫不出coding)
時間推噓19 推:19 噓:0 →:13

一般來說,這種私人資料應該都會去識別化後才儲存。


什麼是去識別化。
就是將資料動點手腳,讓看到資料的人會不知道這筆資料指的是誰。

像新聞常見的哆啦O夢、O筆小新之類。
不過上面的例子很明顯是失敗的,這代表這去識別化的手腳動的不夠多。


比較常見的去識別化的手法還有:

不儲存特地的值,而是儲存的值的區間。
這個例子比較常見,就是在填問卷的時候,年齡是用10歲為一個單位來填。



然後再搭配上K-匿名(K-anonymity)

K-匿名的意思就是說,
不論你條件怎麼設,你最後找到符合條件的人,至少有K個人相符。



或是自行加入不存在的資料。


當然還有很多手段,不過最主要的目的就是,
當別人可以看到所有資料時,他並沒有辦法從這些資料找到特定的人。


這樣看起來,只要資料去識別化,應該就沒有隱私的問題吧?

可惜事實沒有那麼簡單。


假設今天有兩個資料庫,裡面的資料都是經過去識別化處理過的。
不幸的事,只要將這兩個資料庫合在一起,就有可能找到特定的資料。


所以只要資料一經過整合,就會有洩露隱私的風險。


像我基本上也是不贊成可以在超商用健保卡領口罩這件事。
因為就可以將超商的消費記錄跟你個人的資料(健保卡)做連結。

所以說為什麼台北通會有洩露隱私的問題。
因為他什麼都想包進來。


當你可以包進來的項目越多,很明顯的,要找到特定的人就越容易。


就像你想找一個人是竹中、台大的。那會有上千上萬的人符合。
但如果你又知道那個是台大醫科,那範圍就會小很多。
又再知道對方是重考上台大醫科的,那符合的人又更少。
最後,還知道對方曾經當過縣市首長,我想這個人應該很容易就找到了。

但我想只要上述的條件少了一個,符合的人就不會那麼少。

那可能會人有問,這種事就算被知道也沒會怎樣吧。

這時候我的答案會是,隱私這種事就像裸照一樣。
你或許不在意也覺得沒影響,但是有時候就會很麻煩。

--
「台灣 + 中國 = 經濟肯定會成長。我發現了一個非常漂亮的證明,

但 8 年實在太短,沒有足夠的時間容我來證明它。」

轉自 <廢馬大定理>-民明書坊

--

※ PTT留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 123.192.81.78 (臺灣)
PTT 網址

jorden01/21 14:54好的 塔綠斑

Chen7301/21 14:55韭菜 沒犯罪就不怕人家看

Riyuberg01/21 14:55好的 大家記得綁台北通

tony12101001/21 14:58資料就是這樣啊,只要流通越多次就會洩漏

其實去識別化的的動作,就是不怕資料會被洩漏。 因為處理過後的資料,看了"基本上"得不到什麼資訊。 但如果拿來跟別的資料庫整合,就會有比較大的問題。

meowgy01/21 14:58

tony12101001/21 14:58北市就是一定要自己搞一套疊床架屋

tony12101001/21 14:58反正你資料多轉一手,就是多一重風險

lordray101/21 14:59好文章總是有4%來鬧

※ 編輯: jayfrog (123.192.81.78 臺灣), 01/21/2022 15:05:57

syw2001/21 15:01推,隱私這種事就像裸照一樣,你不在意不代表別人不在意

syw2001/21 15:03另外台北通最讓人受不了的是公共服務同捆包,使用公共服務

syw2001/21 15:04的唯一選擇,強迫一定要用= =

s8104811201/21 15:05台北通本身有帳號資料 介接已識別化資料 就能知道誰

weijade01/21 15:18說得很清楚,推!

scorpio092001/21 15:34很清楚,推

benothing01/21 15:36說得很清楚阿

kouta01/21 15:44柯韓粉看不懂 不要強求

hulu6301/21 15:46嗯嗯,你把我想說的都講出來了

malisse7401/21 15:46推 淺顯易懂

djdjdj01/21 15:51

thirtyto01/21 15:55推 強迫用台北通就是爛

elainakuo01/21 16:09推 柯文哲只覺得整合起來方便 但暴露的風險很大 或者

elainakuo01/21 16:09他就是要大數據 隨便他用

jerrylin01/21 16:55去識別化後店家要怎麼確定這資料是你的啦

jerrylin01/21 16:56現在這個就等於數位身分證 只是上面登記的是施打疫苗

Doralice01/21 17:05台北是從小哪一所小學選課後社團都包進來

shermantan01/21 17:26要抽公幼公托就被綁進來了;柯認為個資才是他要的,去

shermantan01/21 17:26識別化後大樹鋸就不能夠精準抓到,價值不夠

大數據其實比想像中的強,所以就算去識別化,還有有可能抓到東西的。

※ 編輯: jayfrog (123.192.81.78 臺灣), 01/21/2022 17:59:22

whiteheart01/21 18:10所以醫學上使用資料庫一定要交代儲存使用去識別化方

whiteheart01/21 18:10式,還有保存期限,不可能像台北市這樣亂搞

whiteheart01/21 18:11交叉使用還有再重送一次IRB,柯文哲明明都知道卻這樣

whiteheart01/21 18:11亂搞,有夠爛

rayven01/21 20:45推解說