Re: [閒聊] 因為用了浮水印 追蹤少了1000人
※ 引述《mizuarashi (米茲阿拉西)》之銘言:
: 推特上有個日本繪師最近也用了浮水印,但用了之後追蹤直接少了1000多人。
: https://i.imgur.com/knrf5g0.jpeg
雖然知道這位畫師應該是想玩梗和酸馬斯克,但是這方法建議別用。
不能說完全無效,但是可以說微乎其微。
AI對於圖片中的異物,也就是浮水印、簽名、商標等等有很高的辨識力,
若是再加上提詞區分的話,浮水印基本上是擺好看的。
我就直接用這案例,做個簡單的實驗當栗子。
我模仿這位畫師,用素材網站隨便抓來的貓貓圖蓋在圖片上做一個風格Lora模型訓練集,底圖則是我測試時用同一個模型產生,風格類似的AI廢圖,大概長這樣:
模擬一下實際使用情況,
訓練的底模用Illustrious XL,然後再用noobAI來生圖。
先測試一下沒套風格模型,
也沒有任何品質提詞(Masterpiece等等)和負面提詞生圖的結果。
https://iili.io/2AGBD7a.png
然後我們套上用貓貓圖訓練的風格Lora模型後,用相同的提詞跑第一張。
https://iili.io/2AGC4vs.png
欸,貓貓出來了。你看,很有用吧這招。
等等,相同參數我們再跑個幾張。
https://iili.io/2AGx9hx.png
https://iili.io/2AGxHLQ.png
貓貓沒有每張圖都出現,實際上是跑了30張圖出現了8張貓貓圖。
約1/3。
https://iili.io/2AGIBWv.png
1/3看起來已經很高了吧?是不是達到汙染的目的了?
那我們加上品質提詞試試看,就用我平常用的這組。
正面是
masterpiece,best quality,high quality, good quality very aesthetic,absurdres,
負面是
(bad quality,low quality,worst quality:1.4),bad anatomy,signature,watermark,
backlighting,shaded face,
產生的結果長這樣:
https://iili.io/2AGAmp1.png
https://iili.io/2AGYP9V.png
https://iili.io/2AGaKVn.png
https://iili.io/2AGaFoX.png
還是有浮貓印,但是已經降低到30張只剩兩張了。
而且如果有觀察降躁細節的話,有時還可以看到貓貓被AI逐漸分解成背景的過程。
最後一步,在訓練打標時有兩個敏感度特別高的提詞,分別是cat和too many。
我們把它丟到負面提詞去做區隔。
只要以簡單以提詞處理區隔,
這30張乍看之下被浮貓印蓋得七零八落的圖片也能被訓練成一個正常的風格Lora模型。
有用,但就只有那麼一點點。
這個Lora就只是不太能生成和貓有關的圖片而已。
或許浮貓印還可以再強化,
例如分布隨機化、加入狗狗鳥鳥龜龜兔兔等等,應該能讓AI更混淆。
但扣除怒噴馬斯克,引導粉絲去bluesky的宣示意味之外,
真的有必要花時間做這些事嗎?
好像沒有。
第一點。
馬斯克就算用X上的資料訓練AI,那這些浮貓印圖片也只會是數億張圖片中的少少幾張,在沒有特別針對學習(應該沒有那麼閒)的情況,
不管有貓沒貓都不會在成品有任何肉眼可辨認的影響。
(而且我不相信只靠X就能搞出能用的模型,大概最終還是得去找類似LAION的資料庫 ==)
第二點。
不是只有X在爬資料訓練模型,他肯告訴你還算好的。
沒有公開資料來源,連訓練方都不知道自己到底拿了啥在訓練的大模型比比皆是。
以上這還是用爬蟲當前提。
假設有人想訓練這位畫師的畫風模型Lora,那可能連爬蟲都不用,
直接去bluesky拿圖就好。
第三點,也是最重要的一點。
ACG畫風的AI模型的直接資料來源不是推特或其他社交平台,
甚至有時候連Pixiv或deviantart等等投稿網站都不是。
事實上,自從NovelAI用爬蟲爬了某個盜圖網站訓練出第一款普及的ACG畫風模型以來,
那個盜圖網站就一直是所有大型ACG風格模型的主要學習對象。
現今被稱為「咒語」的標籤式提詞其實就是源自該網站對於圖片的詳細分類標籤。
甚至,由於該網站有清楚的標示角色、作品、畫師等資訊,
所以現今模型經過學習後也可以單純靠輸入上述資訊的提詞來生成標籤標註的圖片。
至於盜圖網站的圖片哪來的?
很單純,就只是使用者從各處的網站右鍵另存檔案再上傳,然後再人工打上分類標籤。
該網站也很清楚的將AI圖從圖庫中區隔開來,
所以一直被視為「清潔」又有效的訓練資料來源。
所以只要圖片有上傳到網路上,就有可能被人上傳到該網站上,
然後再被AI模型所學習。
那該怎麼辦?浮水印又沒啥用,難道畫師就沒有反制的方法嗎?
也不能說沒有,其實可以只上傳在訓練時會被剃除的圖片來防爬蟲。
因為大模型不可能像我搞Lora一樣手搓調整訓練集,
所以勢必得用自動縮放調整圖片大小和比例。
這其中就有一些圖片被認為無益或是會污染資料而被剃除。
以能模仿畫師畫風的開源模型Illustrious-XL來講,
他們公開的paper其實有講了有三類圖片會從訓練集中被剃除。
1.太小的圖片,未滿768*768。
2.太大的圖片,超過4000萬像素。
3.比例太極端的圖片,超過1:10。
簡單來講,太小AI可能不要,太大AI可能也不要,太長太寬AI也不要。
在我的認知無誤的前提下,
與其上浮水印,不如單純不要公開大小為768*768以上的圖片就好。
由於AI訓練的解析度一直在拉高,已經從最早的512*512一路飆到有人在搞2048*2048,
因此避免上傳大圖理論上可以防一些爬蟲。
或者上傳版面尺寸比例超過1:10的圖片,主要視覺部分不變,
其他版面拉空的部分看要塞貓貓還是狗狗,這樣目前應該也能防一些爬蟲。
當然,以上這都是防爬蟲不防人手。
講白點,就像看到好圖右鍵一樣。
真的像盜圖網站那樣用人力蒐集資料,或是爬蟲飢不擇食的話那是不能防的。
只是上述的圖片處理方法理論上可以勸退,或污染某些比較隨興的Lora製作者的成果。
--
(と・てノ) 翼龍欸
--
29
[AI] 如何訓練LoRA? 猴子都學得會的手把手教學!先附上預覽圖,幼妲貼貼: 網頁好讀版: 前言都是一些廢話,如果只是想知道如何訓練LoRA,可以直接往下跳至分隔線。22
Re: [情報] 推特將強制所有圖文無償用於AI訓練其實我很想跟各位繪師說一下 不要認為換到其他平台就沒事情 除非你們朋友就是管這些社群平台後端的大主管 不然你也不知道對方後端怎麼設計的 除了telegram這種奇特設計以外16
Re: [討論] AI跟二創哪個侵權多?不是喔, 這概念完全不對 現在的著作權法, 會告訴你, 怎樣的行為算侵權, 好比沒有經過授權的重製, 散布, 公開播送等等 那拿AI圖片去訓練神經網路模型, 並沒有任何法定「侵權」行為, 除非修法, 加上一條「機器學習」。9
Re: [閒聊] 所以AI應用到繪圖領域,爭議怎麼這麼大棋譜沒有版權,圖畫有 AI生圖的版權糾紛很難處理 而且這次stable diffusion其中的waifu模型,或是NovelAI 都使用了圖庫danbooru 包含大量非正式授權圖片,網站本身已有人幫圖片上標籤省去超大量人力10
Re: [問題] AI為什麼不去吃動畫就好?我自己整的比較大的 馬娘 怕痛 不當哥哥了 養老8
[閒聊] 來聊聊AI輔助作畫的願景首先novel-ai過份了 手腳的問題解決了 馬賽克問題解決了 四肢亂跑的問題解決了 多人的問題也解決了 下面第三張極度nsfw注意 (全裸無露點)5
[閒聊] 反魔法屏障 NO-AI 浮水印工具簡介: 部分AI繪圖工具會讓生成的圖片加上一個隱形的浮水印,避免被AI模型二次訓練, 過去有人提議用這個辨識是否是AI生成的圖,但破解方法太多了。 (也不是所有AI軟體都會加上,甚至能關掉這樣的功能,也還是防堵不了描AI圖之類的)4
Re: [閒聊] AI模型破壞器Nightshade 正式推出這邊要說明一下,所謂的喂AI指得是在訓練模式下,阿肥稍微看了paper主要是透過微小 的相素變化產生的被下毒的圖片影響基石模型中正常圖片的高維空間分佈,所以就可以讓 生成模型你跟他說要產生哈士奇圖他給你緬因貓,因為模型產生的高維空間分佈已經被下 毒的圖破壞了。 不過這只限於訓練階段,一但fixed住的模型就影響有限,論文的假設就是以後所有的創3
[轉錄]AI必定成為設計/行銷/繪圖/美編業的標配轉錄自FB生活中的城市 建議可以看FB 有各步驟參考教學圖 例:修動漫圖片的兔耳2
Re: [討論] AI跟二創哪個侵權多?著作權法不保障畫風 所以如果未來技術發達到一定程度 製作底模的人或許可以聘用 很會「模仿畫風的人」 跟 「很會到處拍照的人」
72
[鳴潮] 椿還是愛我的48
[問題] 赤坂有達成在 VT 直播上說的諾言嗎?75
[毒物] 已經……不想再工作了44
[MyGO] 愛爽偷捏43
[閒聊] 台灣版的蒸氣龐克作品會怎麼演?41
[閒聊] 看膽大黨第七集要注意什麼42
[MyGO] MyGO!!!!! x Lawson 中國聯動46
Re: [閒聊] 白雪公主真人版預告 倒讚比已達93.2%!35
[情報] 五等分的新娘新作《春夏秋冬》 1月發售37
[閒聊] 今天11/15是聲優富田美憂的生日!36
[閒聊] 碧藍航線 X ToLove黑出包聯動生放串32
[閒聊] 大賀!闇龍紀元4狂銷百萬套34
[閒聊] 你妄想過什麼IP和玩法的結合?42
[閒聊] 如果要變成寶可夢,要變成哪一隻?34
[閒聊] 開後宮不被分屍的關鍵是什麼?30
Re: [閒聊] 看了中國毒物反而看不下日本毒物46
[GKMS] 十王星南 實裝直前SP生放30
[地錯] 「一心憧憬」算不算極度op技能?29
Re: [毒物] 已經……不想再工作了27
[航線] To LOVE連動角色一圖流29
[閒聊] 東雲うみ 八咫烏26
[閒聊] 任天堂鬧鐘 Alarmo 一週使用心得26
[閒聊] 吸血鬼倖存者類型遊戲25
[閒聊] 碧藍航線 出包聯動 沒有美柑25
[情報] 學偶 新角色 雨夜燕24
[龍珠] 為何悟空長大後就不愛用如意棒了?22
[討論] 歧路旅人 vs DQ321
[holo] 佩可拉談公司方針改變的影響33
[閒聊] 仙境傳說3試玩影片60
[絕區] 1.4內鬼情報 這下動搖米本了