Re: [問題] 描圖比較可惡還是Ai比較可惡?
※ 引述《Satoman (沙陀曼)》之銘言:
: → h0103661: 2024怎麼還有人雲ai是拼圖 10/17 19:04: → FoxWu930065: 原理就不是拼圖啊 還是你指的切是random crop 10/17 19:16: → protoss97: 原理不是拼圖 如果只是拼圖這種東西 各大廠就不會搞軍 10/17 19:18: → protoss97: 備競賽了 10/17 19:18: 我一直很好奇說AI不是拼圖的根據在那裡 ==
: 因為實際上目前的模型就是真的用圖片去拼出來的 ==
: 我舉個比較完整簡單的栗子 ==
: 我在看我的幸福婚約的時候,一直覺得後母這角色很○○。
: 查了一下沒人搞她的pony模型,所以自己做了一個來玩。
: 我先回去把自己知道她有出場的部分的圖片截下來,官網的人物介紹圖也抓下來,
: 然後開始處理,該去背的去背、該修圖的修圖。
: 下一步分類。
: 第一個資料夾我會先抓出輪廓清楚的全身圖或七分身圖。
: https://i.imgur.com/cW0HmCz.jpeg
: 對經常把日式ACG角色身體蘿莉化的pony底模非常重要。
: 第二個資料夾裝這個角色裝角色的大頭照。
: https://i.imgur.com/oZ2OcUP.jpeg
: 目的當然是就是讓AI知道這個人物的臉長怎樣用的。
: 第三個資料夾,角色的背影和側身的圖片。
: https://i.imgur.com/0kqE7YA.jpeg
: AI對於背面一直都比較不敏感,
: 沒有特別針對這背面訓練的話,有可能造成頭轉過來但是身體沒轉的貓頭鷹現象。
: 也可能會學不到角色背後的特色。
: 這個角色背後有個髮髻,加上這件和服背後的飾帶有特別的設計,
: 所以這些圖片必須額外分開來。
: 第四個資料夾,角色上半身和輪廓不是很清楚的圖片。
: https://i.imgur.com/jDJeLrZ.jpeg
: 這類的圖片數量一定最多,和其他圖片混在一起容易造成AI只訓練到上半身,
: 沒有訓練到下半身的情況,所以也得分類出來。
: 這個資料夾我沒注意到夾了一張穿另一件和服的圖片,
: 但是因為我打tag的時候本來就有區分出這件衣服,所以沒影響到訓練結果。
: 最後一個資料夾,一張穿上另一件和服的圖片。
: https://i.imgur.com/G6YNz1V.jpeg
: 這不是我的訓練目標,但是這張圖片我認為對訓練這個角色有正面助益。
: 所以我額外拿出來,準備將它當正則化用的圖片來處理。(本來另一張也是丟這邊)
: 之後打標,將我想訓練的目標標出來讓AI去拼。
: https://i.imgur.com/lHUAlsJ.jpeg
: 臉部的部分確認都有被加上"close-up"特寫的標籤,讓AI知道這只是特寫,
: 不要真的給我生出一堆大臉圖。
: 然後設定訓練權重。
: https://i.imgur.com/zw6L5tH.jpeg
: 其他的圖片只是給AI參考的,所以一輪只跑1次。
: 臉和上半身圖片最多,平均下來一輪各4次。
: (其實可以丟同一個資料夾,但是分開來比較好分類)
: 背面圖片約是上半身的一半,所以就一輪*2跑8次。
: 全身圖圖片最少,簡單估一下大概一輪15次應該夠了,
: 也不能再多不然AI只會給你一堆全身圖。
: 然後去睡覺,睡醒驗收成果,叫AI生一張側身的圖片讓我瞧瞧。
: https://i.imgur.com/NpeYEHE.png
: 很好,該學的都有學到,不該學的也沒混進去,一發入魂不用調整直接收工。
: 再舉兩個將圖片拼成模型的栗子。
: 這是我的86蕾娜模型的圖片。
: https://i.imgur.com/wq69nnB.png
: 這個模型能生出類似動畫23話感覺的圖片,
: 運氣好的話還還可以看到後面的鐵幕。
: 但是按照上面的流程是訓練不出能生出這張圖片的模型的。
: 因為實際上這個場景的圖片不多,
: 過於提高蕾娜站在花海圖片的訓練步數則是會造成過擬合,連帶影響其他生成結果。
: 那怎麼辦?我就讓AI去拼,方法說真的也不難。
: https://i.imgur.com/cF8v95c.jpeg
: 就把23話的純背景圖片截出來,放進訓練集裡面當令一個訓練目標給AI學。
: 在生成時輸入兩個概念同時叫AI生成,就能生出上面那種風格的圖片。
: 只是目前解析度好像沒辦法讓AI能認出彼岸花,所以看起來完全是另一種花就是了。
: 當然,如果我不輸入背景相關的提詞,這個蕾娜也不會動不動就被一堆紅色花朵包起來。: 如果我把提詞改一下,換成水仙花,衣服也換為藍色沒挑染的版本。
: 也能生成這種氛圍類似,但是結果不同的圖片。
: https://i.imgur.com/jfH4xZV.png
: 又或者像這個桔梗。
: https://i.imgur.com/ABzEnXs.png
: 我在做模型的時候想把能死魂蟲和桔梗本人一起練出來。
: 但是兩個概念沒區隔的話,要嘛死魂蟲打死生不出來,要嘛每張圖旁邊都有白色條狀物。: 那怎麼處理呢,一樣。
: 打標將死魂蟲用特別標註,
: 打上"sinidama"這個概念區分用的題詞,
: 以及影響生圖結果用,AI知道其含意的題詞"white dragon"。
: https://i.imgur.com/rkBt8nh.jpeg
: 最後同上,額外挑出特寫死魂蟲的圖片,
: 並且確認都有標上"no humans"這個提詞標籤,作為和桔梗本身的區分。
: https://i.imgur.com/Pi7uNI9.jpeg
: 這樣AI就能理解,當我打出"sinidama, white dragon"加上桔梗本人的提詞,
: 但是又沒有"no humans"時,它就應該生成一個有死魂蟲,又有桔梗本人的圖片。
: 結果就是這樣,勉強還行:
: https://i.imgur.com/TceOsvz.png
: 再舉一個拼圖的反例,這是別人的桔梗模型,
: https://i.imgur.com/0IVyDNA.jpeg
: 我就是因為覺得這模型用起來怪怪的所以自己又去搓了一個出來。
: 這模型產出的圖片乍看之下很正常,該有的都有,也很還原動畫的畫風,
: 不像我這樣犯賤,故意偷塞料把畫風破壞掉。
: 但因為我是以前每天下課準時收看犬夜叉的怪叔叔,
: 所以生了幾張圖就發現有點怪怪的。
: 這是這個模型的桔梗。
: https://i.imgur.com/7ysGB7K.jpeg
: 這是本來動畫的桔梗,來找找看哪裡不一樣。
: https://i.imgur.com/uyncmY4.jpeg
: 對,瀏海。
: 瀏海中間怎麼常常空出一塊?
: 如果你和我一樣,以前下課就是等著看犬夜叉的話,可能已經猜出答案了。
: 解答是:
: https://i.imgur.com/yaMHKnM.jpeg
: 對啊,珊瑚的瀏海就是長那個樣子不是嗎?
: 會造成這種結果的原因是這位作者在製作模型時採用流水自動化作業,
: 他的圖片是用AI辨認角色自動截圖下來的,並且在自動打標後就丟給AI進行訓練。
: 由於珊瑚和桔梗本來就長得有點像,AI肯定會將兩個人搞混,
: 珊瑚的登場機會遠高於桔梗,所以他的訓練集裡肯定包含了大量珊瑚的圖片。
: 再加上珊瑚和桔梗兩者的瀏海給AI辨認自動打標時,
: 一定都會被標上"blunt bangs"齊瀏海和"hime cut"公主頭這兩個標籤,
: 所以也無法被提詞區隔。
: 最終這個同時包含桔梗和珊瑚的訓練集,結果就造成了AI將這兩個角色拼成了同一個:: 一個有著珊瑚瀏海的桔梗。
: 再一個栗子。
: https://i.imgur.com/HuuT5RA.png
: 戰隊黑禍源死死美,如果有看過愛在世界征服後,
: 那應該知道這張圖片的概念不存在於動畫之中。
: 動畫只有兩幕主角的妄想,而且是戴著頭盔的。
: 而這張圖的生成原理是:
: https://i.imgur.com/wlR0pmu.jpeg
: 我把其他兩個女性戰隊成員的頭砍掉氇,然後把衣服染成黑色。
: 最後打標加上"faceless",讓AI能將衣服與塗黑的砍頭標示分開。
: 這樣AI就能幫我拼出一個穿著戰隊服的死死美。
: 其他的栗子像是:
: https://i.imgur.com/tquAgKY.png
: 氣噗噗的鞘姬。
: https://i.imgur.com/u0DSFkS.png
: 穿著第一季衣服,但是髮型是劇場版版本的菲特。
: 這些都是我用類似手法,用訓練權重與提詞區分概念,之後生圖時讓AI去拼的結果。
: 還有另一種就是更為確實的拼圖,像是用controlnet換臉。
: 當然,換臉這個行為這東西比起AI本身又是更惡劣的勾當,進警察局也是活該的那種。: 我就用比較沒爭議的歷史人物做個示範:
: 像是阿希和阿史
: https://i.imgur.com/7TBSGjc.jpeg
: 或阿史+阿希
: https://i.imgur.com/SGiDHHd.jpeg
: 直接實現法西斯主義和馬克斯主義的殊途同歸。
: 同樣的原理,叫AI拼圖換衣服、換動作、換背景、換表情都做得到。
: 之前巴哈換頭活俠傳就是用這個方法搞出來的。
: 當然,我知道我講那麼多,可能還是有人會想用論文砸我臉說「AI不是在拼圖」。
: 真的要這樣我也尊重。
: 但是我也必須講,實務上目前的AI產圖模型就是用圖片拼出來的,
: 既然模型是用圖片拼的,那用那個模型生出來的圖片算不算拼圖呢?
: 我覺得算,起碼我玩AI也玩兩年了。
: 這期間我一直覺得自己在搞模型的時候是讓AI認知概念,
: 而生圖時則是想辦法讓AI把它認知的概念拼起來。
: 大概就醬。
首先 先定義"拼圖"
一般人認知中的"拼圖" :
將輸入的圖片剪碎後拼成一張圖
所以說你輸出的圖片必然會可以在輸入圖片中找到相對應的區域
而剪碎的區域至少要有一定大小
定義到像素級別我只能說來槓的
請找一張人畫的每個PIXEL不是用RGB0~255範圍內畫出的JPG
以五等分為例 假如你輸入只有五姊妹各一
那出來的圖片就要類似一花那樣
這是一花的身體 右手是二乃的 左手是三玖的 右腳是四葉的 左腳是五月的
都可以在輸入圖片找到對應區域
但你自己文中就反例了 因此很明顯 現在DM不是這定義的拼圖
而這也是一般人主要在戰的點
那再來 如果你像儺寶一樣和魔爸爸學了擴增定義
把拼圖的定義擴展到概念上 也就是你那篇的"拼圖"定義
那DM是不是拼圖呢?
我也懶得講原理了 當然是阿
擴展成這樣不如說哪個創作不是?
現在所有琴棋輸畫的創作
請找一個跟創作者過去所有了解過的"概念"完全無關的創作
你要怎麼做出一個你完全不知道的東西?
------
https://i.imgur.com/a1gZQQ5.png
--
可是真的要套人類學習來說人類學習繪畫不會只用到圖形
記憶而已
他們堅持是拼圖就讓他們堅持吧
這樣講只會變成人類不但拼圖,拼圖還更大塊
ai警察
所以我在那篇底下就講了 啊他也知道用這邏輯他完全站不住
腳 沒有打算要回我
簡單
同人圖是畫的不是貼的
wres666你說的東西是"概念" 但ai其實是沒有"概念"的
原串會說是在拚圖的其中一個原因就是因為沒"概念"
他的意思就是你不理解一個東西畫出來就叫做"拼圖"
問題是這跟一般人的拼圖定義相去甚遠而已
而且這定義是模糊的 到底要到多理解才能算理解?
比如說"手" AI只知道大概是一片上面加上幾根東西
一般人知道有幾根手指有幾節 那這樣就算理解"手"了嗎?
高維空間中的Feature就是對模型的"概念"阿
知道手指有5根 但不知道為什麼會是5根算理解嗎?
然後 一個"概念"是怎麼儲存在人的大腦?
現在是人類不理解AI的理解
也有很多研究嘗試讓AI的理解能讓人類理解
你輸入五等分到了AI會變成5個8*8
再*8 再*8 分到至少上萬個面數
(dall-e最少200*300)再開始對每個圖像
分析這個點放頭幾分放身體幾分放手幾分
而不是先知道頭在上面身體在下面才開始放
*點數
所以不討論這些定義 ai繪圖的原理到底是什
同人是「再現」拔= =
對他來說人類看參考圖畫圖也是拼圖
所以跟他吵AI是不是拼圖意義就不大
這個拼圖太偏離一般人的認知
簡單來說 人類太可惡
他就只是學個lora就當成ai了連sd運作原理都沒理解
跟他解釋他聽不懂還反過來說別人沒用過 超搞笑
確實
3
首PoRT 描圖 就抄你的骨架~但其他地方完全不一樣 而且是人畫的 因此被炎上的不少爆
→ h0103661: 2024怎麼還有人雲ai是拼圖 10/17 19:04 → FoxWu930065: 原理就不是拼圖啊 還是你指的切是random crop 10/17 19:16 → protoss97: 原理不是拼圖 如果只是拼圖這種東西 各大廠就不會搞軍 10/17 19:18 → protoss97: 備競賽了 10/17 19:18 我一直很好奇說AI不是拼圖的根據在那裡 ==5
問題在於D你不能說AI不按照人類的方法理解就是"不充分理解",人類在畫一個蘋果的時候也是先找腦中的形狀,然後光影,以及對應的顏色,最後把這些部份拼起來,這是人腦的理解方式。 但對於AI來說,它的理解方式就是這一坨向量就是蘋果,這一坨向量本身就包含了足以讓它作出的畫產生光影、形狀等。這就是它的認知,它不在乎向量的源頭,只在乎如何生成一個逐步降噪的過程,讓它長得像是一個蘋果。如果它畫得不好,那是它對於如何降噪理解的不夠好,而不是因為它的思考方式不像人類。 所以我不贊同是拼圖,它的確有認知邊界,但使用認知邊界內的東西作畫就是拼圖嗎? 就像如果你這輩子都只看過紅心的西瓜,突然叫你畫一個小玉西瓜,那你畫出來的黃色一定不會是小玉西瓜的黃色,但也不會有人說你的黃素色是從鳳梨拼圖過來的 -----7
AI生圖只是數據整理的方式是向量方式儲存的 因為前身NLP自然語言模型的處理就是儲存向量 不是說訓練圖或產生的圖是向量圖… 你自己都提到噪聲了 AI圖就是在訓練過程中把清晰的圖依各像素點19
先讓我們假設一下 阿布德爾是一個沒看過青蛙(活的、死的、繪畫、雕塑等都沒有)的人,請問他畫得出青蛙的樣子嗎? 沒辦法對吧? 現在我們給阿布德爾一張青蛙的照片,然後請他畫青蛙。他大概就只能畫出同樣角度、同樣品種的青蛙。
17
[閒聊] AI自動生成插畫的持續進展最近 AI 畫圖似乎又有很大的進展 OpenAI 日前公佈了 DALL E 2: 可以輸入任意文字轉成圖片 比如說這張是浮世繪風格的泰迪熊購買雜貨圖 ->15
[自介] KiniroMosaic沒填寫的項目請刪除減少文章長度,標題統一格式:[自介] 自己的ID ※ 每個人一年內限PO一篇自介文,超過者從最新一篇開始刪除 ※ ╭────────╮───────────╮──────╮ │ 基 本 資 料 區 │個 人 ACG 經 歷 區 │聯 繫 方 式 │  ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄6
[問卦] 拼圖的樂趣在哪裡?魯魯有些朋友 蠻愛拼圖的 感覺就是花時間在找那一塊塊的圖片 拼完之後 又弄回去5
[情報] TAITO 五等分的花嫁 超特大娃娃 一~三一花 二乃 三玖4
[情報] 「春節拼拼樂」活動開啟「春節拼拼樂」活動開啟 2020年02月17日 參與活動,獲取豐富的獎勵! ★★★★★春節拼拼樂★★★★★3
[閒聊] 選擇較多的拼圖店請問市區的拼圖店: 一中雷諾瓦、拼圖密室、 pintoo, 跟美術館附近的吉徳, 以及東區的拼圖總動員, 那一家的拼圖的種類比較多呢? (不只圖片,希望材質、型式也有多元選擇)3
[閒聊] 黃金拼圖推特圖分享2
[閒聊] 我想到iwin的必勝法了概念是這樣 這樣是不是就變成 1.左邊是身材矮小的輕熟女 2.右邊是童顏但身材爆好的還是輕熟女
54
Re: [閒聊] 中國情境:當買了蜜雪冰城一口未喝就挨刀47
Re: [閒聊] 中國情境:當買了蜜雪冰城一口未喝就挨刀34
[閒聊] 中華一番 極 168 不可以色色34
[閒聊] 金搖桿2024開獎56
[Vtub] VSPO 甘結もか 快打6 立川瑪儂芭蕾教室31
[情報] DQ3 HD-2D 重製版日本首週賣了82萬套32
[慶生] 今天11/22是高松燈跟我的生日43
Re: [閒聊] 中國情境:當買了蜜雪冰城一口未喝就挨刀28
[閒聊] 角川可能為防Kakao惡意收購主動聯繫索尼26
[閒聊] 海外特有的CP組合25
[24秋] 膽大黨 08 這個樣子的愛羅真的讚~24
[鍊金] 看書的托托莉24
[閒聊] 美國隊長4 新預告23
[MLTD] 偶大百萬的手遊畫面太讚了吧!25
[閒聊] 今天是好伊布日17
[閒聊]棒球中好球的真正意思是鼓勵擊球嗎?22
[BGD] 今天11/22是高松燈生日!!22
[情報] 台灣百合漫畫原作者楊双子獲美國國家圖…46
[閒聊] 有什麼萌屬性是以前流行但現在式微的?21
Re: [閒聊] 中國情境:當買了蜜雪冰城一口未喝就挨刀20
[Vtub] 11/20同接鬥蟲19
[獵人]凱特能打贏幻影旅團團長嗎?17
[閒聊] 敗北女角 SSS 生日特典 有糖15
[Vtub] 帕魯跟卡店,哪款害holo不能玩ptcg的15
[閒聊] 支那人沒有一個是無辜的20
[閒聊] 宅宅都是怎麼逛東京!?20
Re: [閒聊] 怎麼?你當台灣人當得很難過嗎?13
[閒聊] ヨルシカ - 太陽13
[閒聊] 哇靠木村拓哉這個Gatsby舞技也太帥了吧12
Re: [閒聊] mygo看了兩集覺得還好要撐下去嗎