PTT推薦

Re: [新聞] 蘋果將偵測兒童色情影像 用戶上傳iCloud

看板MobileComm標題Re: [新聞] 蘋果將偵測兒童色情影像 用戶上傳iCloud作者
CardLin
(卡林)
時間推噓 9 推:10 噓:1 →:19

AI可以將圖片分類,找出有問題的圖片


具體做法有很多種,我們先簡介目前效果最好的神經網路

首先會用數學模擬神經元的運算

簡化來說每一層的網路輸出(Output)就是輸入(Input)乘上權重(Weight)再加上偏移(Bias)

Output = Input * Weight + Bias

而每個 Input 可以是一維、二維或三維的矩陣,Weight, Bias也是特定大小的矩陣

所以 Output 就會很像是腦袋裡面神經網路的連結

https://imgur.com/fBbB0HA

所以當我有很多層的時候,就會像是小型腦袋

https://imgur.com/4QEmiLF


而這個小型的腦袋就可以透過已標註資料進行訓練

假設 Apple 已經人工標定好 1000 張照片,其中 800 張正常,另 200 張異常

我們就可以透過訓練這個小型腦袋,讓他逐漸地學會如何分辨正常與異常

學習過程會計算最終的輸出(FinalOutput)與真正的答案(GroundTruth)的差異(Loss)

透過這個 Loss 就可以透過數學的運算來微調需要修改的權重(Weight)與偏移(Bias)


最後訓練完的神經網路的最終輸出(FinalOutput)就會是以下例子:

一般照片:正常:0.99 (99%) 異常:0.01 (1%)

異常照片:正常:0.22 (22%) 異常:0.78 (78%)


通常類神經網路並不會用原始解析度進行訓練

需要降維,例如先縮小到 224*224 的大小再進行訓練

而經過訓練後的神經網路就能很好地將圖片進行分類


其實這種類似的做法已經有在手機相機軟體上應用: 場景智慧辨識、眨眼偵測...等

如果有足夠多的人工標註資料進行訓練,已經可以輕鬆達到 99% 以上的成功率

如果設計夠好,一台伺服器一秒要處理 100 張照片應該也沒問題

畢竟在手機端的運算能力也都可以即時辨識場景

不在手機端分析照片的原因可能是避免增加耗電


Apple會對照片進行分析,主要當然是希望降低虐童犯罪

我剛剛 Google 了一下查到 "美國一年有高達76萬5000名兒童失蹤"

我不知道數據是否準確,但這些失蹤兒童可能有大部分都跟虐童犯罪有關

希望 Google 也能跟進,讓兒童更安全!

--

※ PTT留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.44.67.182 (臺灣)
PTT 網址

kkcity59 08/08 02:17聽起來好像很厲害...可是我看到的版本只是取Hash值

kkcity59 08/08 02:17去跟已知違法圖檔做對照

s25g5d4 08/08 02:18你看到的版本不夠詳細

kkcity59 08/08 02:18如果要這樣分析的話大概得多放幾個核心跟電池囉

ZnOnZ 08/08 02:19希望 Google 不會跟進,這樣很不安心

s25g5d4 08/08 02:19那是蘋果要擔心的事情,為什麼你要幫他們擔心 XD

kkcity59 08/08 02:20一般人不開心的點是我明明不是性犯罪者

kkcity59 08/08 02:20你要花我手機電力跟運算力來檢查我自己手機上的資料

kkcity59 08/08 02:21來跟你證明說我是清白的。

s25g5d4 08/08 02:25好,不爽不要用

destiny3952 08/08 02:26我覺得應該比較像是用autoencoder這類的方法

CardLin 08/08 02:26原文只有上傳iCloud才審查吧,不會用你手機的電量

CardLin 08/08 02:28Autoencoder的特性是不在資料集內的照片就會警報喔

s25g5d4 08/08 02:42會喔,比對是在裝置端運作的

abadjoke 08/08 02:45不是希望估狗跟進 是估狗早就有了

benedict76 08/08 03:03模型建立好手機餵圖進去用aie運算沒多久就有結果,

benedict76 08/08 03:03又不是要在手機上訓練模型。

puffycat 08/08 04:09google早就這樣做了!最近沒看新聞嗎?

Benetnasch 08/08 18:39不要放照片在海水上不是基本共識嗎?

RonanXidi 08/08 18:40上傳圖片前,愛瘋有說會檢查嗎?

awerte 08/08 18:45google早就做了,apple是最近才有消息

spath 08/08 18:51一年有76.5萬兒童失蹤是怎麼來的?逛賣場時亂跑之

spath 08/08 18:51後找回來這樣有算嗎?

evanade 08/08 19:00那是累積報案數,一年少10%兒童人口數你會信?

smallcar801 08/08 19:54一秒100張… 沒概念就不要誤導人家了

https://imgur.com/50OIHT5

NVIDIA Tesla V100 使用 FP16 精度可達 28.26 TFLOPS EfficientNet 的推論效能甚至每秒可以破 1000 張 我估計 100 張確實有點太少了,誤導大家了,抱歉

yahappy4u 08/08 21:54希望不要被獨裁政府拿來打壓異議者就好

trywish 08/08 22:27其實在手機上做也沒啥問題,每次增加一張照片比對一

trywish 08/08 22:27個數字是能吃你多少電,當然從雲端上比對也可以,像

trywish 08/08 22:28google就有新聞是"巡查"到照片才抓的,也都幾年前的

trywish 08/08 22:29事情了,當然排除這些,光侵犯隱私就是不可取。

※ 編輯: CardLin (114.44.83.81 臺灣), 08/08/2021 22:50:15