[閒聊] 驚!看色圖不求人 AI是否也能畫色圖?

cybermeow 發表於 2022/9/6 下午2:08:08

看板C_Chat標題[閒聊] 驚!看色圖不求人 AI是否也能畫色圖?作者

cybermeow

(北歐組一生推)時間Sep 6 14:08:08 2022推噓34 推:34 噓:0 →:12

PTT推薦

雖然下了很農場的標題

但這一篇認真的研究論文

大家或許以為AI跟色圖很遙遠但事實真的是這樣嗎

在一年前可能沒有錯但經過最近的突飛猛進

故事已經進入了新的轉捩點

讓我們歡迎今天的兩個主角

1. 由好心人士在四個A100跟一個小的 Danbooru dataset

在 stable diffusion 經過「不到一天」fine tune完成的 waifu diffusion

https://huggingface.co/hakurei/waifu-diffusion

2. 怕你不會下 prompt 叫你給圖片直接幫你學習文字 embedding 的 textual inversion

https://github.com/rinongal/textual_inversion

先聊聊限制

首先很明顯這麼模型可能根本沒看過ACG的色圖

也就是只能用真人了解色的概念在生成偏向全身圖片的時候

比例容易受到影響造成換臉效果

再來就是用 textual inversion 只能給予極少張圖學習固定概念

因為沒有對於學習概念專門的處理

能學到的東西不一定是你想要的

再來是結果我們當然不能在這裡貼色圖

但大家不妨體會一下這套模型能做到什麼什麼程度

-------------------- 泳裝鯊鯊 --------------------

首先是用7張泳裝古拉做輸入得到的部份結果

https://i.imgur.com/IW9jLzH.jpg

講評:

這裡使用鯊鯊並非筆者興趣

而是因為此角色的某種屬性可能在資料集裡面比較缺乏

為了測試模型在 out of distribution 的成效如何特定選用

可以看到雖然大致成果還算不錯但模型無法抓到髮型特徵

同時由於資料集裡面東方角色過多

很大一部份可能直接利用學到的琪露諾造型進行代替

另外真人的影響也可以從部份圖的比例觀察出

注意到這裡選用了固定角色跟服裝的作法

因此生成的圖平均相似程度高品質高

但已經綁死難以經由其他文字再做調整

至於色圖的部份嗎資源都放在上面了成效如何可以自己驗證

-------------------- 百鬼 --------------------

利用約12張百鬼作為輸入

得到的圖片相較的雜

https://i.imgur.com/Pmz4PmF.jpg

可以看出這裡最大的難點在角的生成

跟鯊鯊一樣這個東西在資料集裡面大概非常稀有

因此生成的常常以獸耳或鑑娘儀裝置換

還以為是色違天津風

另外跟上面一樣有奶子忽大忽小的問題

幾乎下泳裝相關關鍵字奶子就會變大

完全顯示了資料集的 bias

關於這種大男人主義下的產物我們應當強烈譴責

特別好的幾張在這裡
https://i.imgur.com/FQZ6nMe.jpg

圖https://i.imgur.com/FQZ6nMe.jpg?e=1666667879&s=OIiRjIf5UIrSROZCOX0BNQ, 驚!看色圖不求人 AI是否也能畫色圖?

-------------------- 茸茸鼠 --------------------

飲水思源測試完美國日本的vtuber後當然要回來測測台V代表的茸茸鼠

這裡是以九張差異頗大的圖片為參考 (畢竟茸茸鼠圖片也相較少

得到了以下成果
https://i.imgur.com/zvJeiSv.jpg

圖https://i.imgur.com/zvJeiSv.jpg?e=1666652945&s=entXUYZXvtwuqcO2bewATA, 驚!看色圖不求人 AI是否也能畫色圖?

不知道是不是因為圖沒去背有些蛋糕之類的

導致生成的圖片常常衣服跟蛋糕甚至美露露合為一塊
https://i.imgur.com/NMvOTaW.jpg

圖https://i.imgur.com/NMvOTaW.jpg?e=1666667282&s=86Tyx1-LJY9IhjXdNVfAbA, 驚!看色圖不求人 AI是否也能畫色圖?

無法正確掌握胸部大小的問題依舊存在
https://i.imgur.com/qSKFGI5.jpg

圖https://i.imgur.com/qSKFGI5.jpg?e=1666649724&s=i2A-x9x-RpdLoqWuQ6ImvA, 驚!看色圖不求人 AI是否也能畫色圖?

嘗試跟真實世界混雜會很可怕
https://i.imgur.com/5HEzPoQ.png

圖https://i.imgur.com/5HEzPoQ.png?e=1666656898&s=cwp9DPdtySS7f8zT67IhBQ, 驚!看色圖不求人 AI是否也能畫色圖?

沒臉沒手沒腳生成內褲容易多了
https://i.imgur.com/LaSTMJP.png

圖https://i.imgur.com/LaSTMJP.png?e=1666697033&s=ySD5dptpnl4G5t0Sg2xzbw, 驚!看色圖不求人 AI是否也能畫色圖?

-------------------- 私心同場加映光輝魔女金妮 --------------------

因為金妮實在太可愛了所以抓了六張動畫截圖來測試如下
https://i.imgur.com/zFMAM0V.jpg

圖https://i.imgur.com/zFMAM0V.jpg?e=1666668483&s=_tpJdO9OYdfVkoSbyoh9Vw, 驚!看色圖不求人 AI是否也能畫色圖?

這邊可以明確感覺到

對圖片要求更改越大越會失去角色特質

從這樣 https://i.imgur.com/KiC3NhL.jpg

圖https://i.imgur.com/KiC3NhL.jpg?e=1666669596&s=QxSn5nPA4kMWHW0sC5GHNg, 驚!看色圖不求人 AI是否也能畫色圖?

到這樣 https://i.imgur.com/oanEDnj.jpg

圖https://i.imgur.com/oanEDnj.jpg?e=1666710743&s=g0xSMgNExBEYt2dnSxqTVw, 驚!看色圖不求人 AI是否也能畫色圖?

除了已經提過好幾次的胸部大小問題

髮色頭髮長度也都會改變

我好幾次還以為看到了桑妮亞

這告訴我們金妮跟桑妮亞果然師出同源吧

-------------------- 你可以做什麼 --------------------

要得到上面成果可以使用hugging face的diffuser
https://github.com/huggingface/diffusers/tree/main/examples/textual_inversion

只要準備好四五張圖片照著說明跑就可以了

圖片大小改成484x484可以在12G vram跑所以1080ti, 2080ti都ok

不過就像前面所說如果沒有在正確的資料集訓練過你永遠達不想要的效果

而想要 fine tune 模型的話據說至少要 30G vram

大概都是要到 A100 層級或是等 4090ti

回到一開始的問題 AI能夠生成色圖嗎

只能說真人的都生成這麼久了潘朵拉的盒子早就被打開了

一直都不是技術層面的問題

而是沒人敢明目張膽去做而已

如果你現在訓練了一個色圖產生器可能會一夜致富

但也可能會被抓走

-------------------- 上面的圖看起來還是普普啊 --------------------

必須說目前的圖都是靠少數資訊生成整張的

中玩不中用

真的要做就是做類似修圖軟體

實際你光把四肢分開用乾淨資料集訓練可能就可以解除目前手腳壞掉的問題

更甚者敝人覺得AI紙娃娃換裝系統才是大家該努力的目標

又舉例來說

https://www.reddit.com/r/AnimeResearch/comments/w17ttl/collaborative_neural_rendering_using_anime/

這個用四張圖配真人舞蹈直接生成動漫角色3d舞蹈這種東西

可以利用姿勢讓產生的圖片有參考依據絕對會比現在效果好上不少

-------------------- 延伸閱讀 --------------------

1. AI不存在只有統計模型
https://www.pttweb.cc/bbs/C_Chat/M.1661681711.A.DE3

2. 中國人也做了一套但當你只能用別人的API 就永遠都是被管的那一個
https://www.pttweb.cc/bbs/C_Chat/M.1661896344.A.3BA

--
北歐組一生推
https://i.imgur.com/ydMoryp.jpg

圖https://i.imgur.com/ydMoryp.jpg?e=1666678916&s=BXeVwLkJxYgIn7G_eXMr4Q, 驚!看色圖不求人 AI是否也能畫色圖?

https://i.imgur.com/njHa0OA.jpg

https://i.imgur.com/KVrWmNb.jpg

https://i.imgur.com/leUc4jP.jpg

https://i.imgur.com/aWFuDE4.jpg

※ PTT留言評論

※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.34.19.251 (臺灣)

※ 文章網址:

https://www.ptt.cc/C_Chat/M.1662444496.A.2E6

※ 編輯: cybermeow (114.34.19.251 臺灣), 09/06/2022 14:08:49

推

doramon88809/06 14:09好胸~

→

Israfil09/06 14:10窩懷疑你有ㄌㄌㄎ傾向而且好像有證據

推

Dacamiya09/06 14:10懷疑是一成

推

pheather09/06 14:10TECHNOLOGY IS FOR PORN

→

medama09/06 14:10好

※ 編輯: cybermeow (73.222.84.130 美國), 09/06/2022 14:11:16

推

rayli122409/06 14:11所以之後有機會生出一個很懂的AI陪我聊acg嗎

推

diplomaMill09/06 14:11等等來畫鯊鯊琪露諾好了

推

dafeichai09/06 14:12ㄌㄌ就是讚啦想舔

推

neetarashi09/06 14:12推

推

erhumm09/06 14:13你喜歡蘿莉對吧沒事我也喜歡

我只是為了嘗試理解這模型在不同的情況下表現如何而已

※ 編輯: cybermeow (73.222.84.130 美國), 09/06/2022 14:14:03

推

hank8117709/06 14:14茸茸鼠旁邊的美露露是被輻射照射過嗎？

ai的世界跟你們想的不一樣

※ 編輯: cybermeow (73.222.84.130 美國), 09/06/2022 14:15:44

推

AdmiralAdudu09/06 14:16沒關係啦蘿莉控就蘿莉控

推

uohZemllac09/06 14:18推

推

rongrong42109/06 14:19先推

→

hk12990009/06 14:22那個用百鬼做圖出來的的角有點獵奇啊看了會降SAN

推

ntupeter09/06 14:22可以色色

推

opeminbod00109/06 14:24怎麼不把好狐做成waifu

推

GiantGG09/06 14:32https://i.imgur.com/wOe7nsb.jpg 抓到了，茸茸鼠最近胸

圖https://i.imgur.com/wOe7nsb.jpg?e=1666705833&s=bpv9ZcBv1uQNcnBPA7u47g, 驚!看色圖不求人 AI是否也能畫色圖?

→

GiantGG09/06 14:32部變大，果然是偷塞蛋糕

推

Riziesi09/06 14:37推

→

jarr09/06 14:40只能在linux環境嗎還得裝WSL好麻煩R

→

CoMiyuki09/06 14:41這不就可以幫因為描圖的vt解套嗎？可以描圖又不會炎上

推

DarkyIsCat09/06 14:44這是學術研究

推

LoserLee09/06 14:49推實測

推

s801857209/06 14:56我覺得san值有點低這裡面有幾張都有說不出的詭異感

真實系的san值才低我看完整個人都不好了詭異感就我說的這些都是玩具沒有真的認真調整過

※ 編輯: cybermeow (73.222.84.130 美國), 09/06/2022 15:00:09

推

jeremy798609/06 15:05原來是學術研究文啊我還以為是一成的文章呢

推

SangoGO09/06 15:10有些胸罩已經是神力胸罩了，但真正要產生的是...

推

guogu09/06 15:11原來茸茸鼠自己塞蛋糕還敢笑人塞麵包

推

iwinlottery09/06 15:23這是一成資料庫吧

推

loki521009/06 15:29雖然我看不懂你在說什麼但是好像很厲害

※ 編輯: cybermeow (73.222.84.130 美國), 09/06/2022 15:30:54

※ 編輯: cybermeow (73.222.84.130 美國), 09/06/2022 15:36:07

→

wetor09/06 15:42小張圖還不錯放大有點怕

推

truelife00909/06 16:06還看了一下id是不是一成

※ 編輯: cybermeow (73.222.84.130 美國), 09/06/2022 16:10:56

推

KangarooDad09/06 16:11滿崩的啊

那個要付錢效果看起來好的midjourney是別人精心訓練過的而且不太能真的生成一般動畫類型圖片至於像waifulab這種可以算是上一代圖像生成模型一路調整的結果他們dataset也都是特別清理簡化過這一代模型目前還沒有人真的在動畫上面做過這些都是像我說的由個人(好像還是個學生)在不到一天獨立完成的這才是驚人的點可以想見如果有更多人投入不久的將來可以用這套方法去生成真的consistent的ACG圖片

※ 編輯: cybermeow (73.222.84.130 美國), 09/06/2022 16:19:32

※ 編輯: cybermeow (73.222.84.130 美國), 09/06/2022 16:22:39

推

nilr09/06 16:49推

推

pomelolawod09/06 16:53茸茸鼠時大時小蠻正常的XD

→

obeytherules09/06 17:18鯊鯊的好色

推

n55512309/06 18:58推

推

yiefaung09/06 19:53推diffusion model解釋得很清楚之前看一堆討論實在是…