Re: [新聞] 蘋果將偵測兒童色情影像 用戶上傳iCloud
※ 引述《s25g5d4 (function(){})()》之銘言:
: : - Hash 值: 每個檔案都有一個唯一的 Hash 值 (指紋的概念) 科學家用數學保證他幾乎不會重複
: : 每個雲端空間基本上都會在你上傳檔案的時候計算 Hash 值
: : 為了要避免他們儲存太多重複的檔案
: : 有兩個用戶上傳一樣hash的檔案可以只存一份就好
: : (例如 lol.exe 一百個用戶上傳到自己的帳號 存一百份根本是浪費空間)
六七年前在讀研究所的時候,因為主題是影像分析比對,所以有找了許多論文
我就看過幾篇google 發表的論文 透過快速比對 hash 值來快速搜尋圖片
論文中就提到他們把 原先比較距離使用的 兩個值相減平方 這類的概念
直接改成把所有資料簡化成0與1 利用 OR XOR 的方法 來高速比對
當然 論文中並沒有提到 google 是如何對圖片做hash的 或是 用什麼方法取特徵點的
但我不認為 那個hash 是單純用來比較檔案完整性的那種,一定還保留了一定程度的圖片特徵
資訊
例如我在實驗用的廠景資料庫中,就是儲存把圖片處理過的特徵點資訊
我們在研究的 就是找訓更高效率的特徵點比較方式或是更精準更有效的擷取特徵點
: 用檔案 hash 比對圖片實在太不可靠了,改個 1 bit 資料就可以讓 hash 不同
: 我覺得蘋果不會做這種智障系統,否則這系統根本沒用
: 所以去翻了一下相關文件
: https://www.apple.com/child-safety/pdf/CSAM_Detection_Technical_Summary.pdf: 看起來是用蘋果自己開發的新演算法 NeuralHash
: 看名字就知道一定跟神經網路有關
: 大意是說用一個神經網路訓練過的模型,去計算照片的描述特徵
: 最後再把特徵用 locality-sensitive hash (LSH) 算出雜湊值
: LSH 與一般 hash 算法不同的地方在於普通 hash 會將差異最大化
: 以避免相似的資料產生一樣的 hash
: LSH 則否,越相似的資料產生相同 hash 的機率越高
: 以上述文件的範例來說,直接把照片灰階化處理也可以得到一樣的 NerualHash
: 是很厲害的技術
這大概是我前面說的那個吧 反正我當時沒找到相關論文,論文說用了xx hash計算
再轉化成32位二進位資料
,但我相信GOOGLE也有自己的一套方法,有效率的擷取每張圖片的特徵資訊
我認為 這類技術對google來說並不難,他們在搜尋引擎上本來就有以圖搜圖的功能
而運用在雲端儲存功能來說可能更為輕鬆,他們甚至可以把每張圖片的預處理工作
讓各位的手機/電腦 幫你算好一定程度的資料,google 只需要去做比對即可
再說了
google 都可以幫你把照片中的 人物/場景 標記出來
或是自動幫你把多張照片合成一張環景圖
順手檢查一下 幼女什麼的 沒啥難度吧
--
用hash判讀你覺得有可能?相當於解hash^-1再丟AI
我前面就說了 google 所使用的hash 並不是 我們通常使用只是用來比對檔案相同性的 而是一種 用來擷取圖片特徵資訊的演算法,在雜湊的過程中 保留了圖片比對所需的資訊 只是我看到的論文 只介紹了 hash過後 如何大幅度加快比對速度,並沒有說明hash 的 細節 至於效果google都已經展示給你看了
對啊。總之就是會侵犯隱私嘛,應該可以有其他方法
的
youtube 都有辦法推薦你類似影片了,何況圖片?
yt推薦影片是因為你點過類似影片啊,你是有看過你D
槽的影片被yt推薦過嗎
一樓這不是傳統的hash上..而是神經網路吐出來的embe
dding
google圖搜有時候不好用,要用yandex才可以找到…
不是傳統高強度hash很容就能破解吧,相當於資料外洩
8
在開一篇特地來打爆安卓仔最後的幻想 人權聲明: 我自己也用 Android + Google 雲端空間 之前有一篇在八卦板蠻轟動的新聞 拍表妹下體上傳雲端 Google通報台灣警卻因這點難成罪32
Apple 設計這套系統的時候就考慮過有人會出來靠北隱私了 背景知識 - Hash 值: 每個檔案都有一個唯一的 Hash 值 (指紋的概念) 科學家用數學保證他幾乎不會重複 每個雲端空間基本上都會在你上傳檔案的時候計算 Hash 值 為了要避免他們儲存太多重複的檔案9
AI可以將圖片分類,找出有問題的圖片 具體做法有很多種,我們先簡介目前效果最好的神經網路 首先會用數學模擬神經元的運算 簡化來說每一層的網路輸出(Output)就是輸入(Input)乘上權重(Weight)再加上偏移(Bias) Output = Input * Weight + Bias3
我只能說不管怎樣 他們一定會侵犯隱私 人工審核照片的 如果是我來設計抓未成年影像的AI 我會先判斷年齡,用臉或是體形,判斷是否為未成年 再判斷圖片是否有裸露,性行為13
用檔案 hash 比對圖片實在太不可靠了,改個 1 bit 資料就可以讓 hash 不同 我覺得蘋果不會做這種智障系統,否則這系統根本沒用 所以去翻了一下相關文件 看起來是用蘋果自己開發的新演算法 NeuralHash9
美國司法部的官網對兒童色情有簡要說明,最好去看一看,免得惹上大麻煩: 有幾點特別值得注意的: 1. 美國聯邦定義的「兒童」指的是18足歲以下。 2. 明確的性行為的法律定義並不要求一張圖片描述一個孩子正在進行性活動。
58
Re: [情報] 蘋果新的照片審查機制原文恕刪 因為覺得兒童色情及用戶隱私是相當重要的議題,但使用者對於其技術的誤解容易造成議 題失焦,所以希望透過這篇回文拋磚引玉吸引更多人的討論,也懇請各位大神對於我說錯 的地方不吝指教QQ。 在討論運作方式前,先來看看幾個技術文件提到的大前提XD14
Re: [情報] 蘋果新的照片審查機制嗨又是我XDD,因為蘋果釋出了一份新的說明文件,正好解釋了一些我上一篇 文章中尚待釐清的問題,所以再寫一篇文與板友分享與討論~ 註:以下內容皆是我個人對於文件的解讀,完整的資訊請參考官方文件,且 如有說錯的地方也請不吝指教!- 上完成,而不是雲端。 在本地端進行比對? 所以是每次上傳 iCould 前,都要把"整個資料庫"的圖片的hash code 下載到本地端嗎? : 反之,若用戶認為他們的帳戶被偵測錯誤,可以向蘋果提出上訴。蘋果表示,新軟體只對 : 上傳到 iCloud 的照片起作用,所以用戶可以自行關閉,只要設備中的照片沒有上傳到蘋
- 我想你圖片檔有2-3萬張,用雜湊比對會比較快, 下面是perl的寫法,看看適合嗎? #!/usr/bin/perl use File::Copy; $PWD = `pwd`;
- 作者: abc0922001 (上士abc) 看板: MobileComm 標題: [新聞] Google 讓你比對自家寵物與世界名畫「撞 時間: Tue Nov 9 15:49:31 2021 1.原文連結:連結過長者請使用短網址。
23
Re: [心得] 小米14T Pro隨便快速開箱22
[討論] 小米14T系列 CPU疑似沒調好 跑分偏低22
[情報] VIVO X200系列京東預約介面曝光17
[討論] 種花購機轉移eSIM免費8
[心得] 今天辦5G易付卡17
[情報] 小米14T pro的玻璃為第五代康寧大猩猩5
[購機] Fitbit Sense 2 / Google Pixel Watch4
[購機] 平價影像護眼高通手機3
[問題] 請推薦好用的內錄音app(三星)2
[討論] 小米14T Pro vs 小米14 選哪一個?1
[討論] Redmi Note14 Pro vs 紅米Note14 Pro+16
[閒聊] 充電器統一規格前 是什麼樣的世界?