Re: [閒聊] 中國有配音員的聲音被偷走了
※ 引述《Mayfly (Baccano)》之銘言:
: 老實說我最近也偶爾會在B站上聽一些AI代唱
: 就是讓ACG人物的AI語音唱某些樂曲,比方說草神唱大悲咒什麼的
: 對岸最近有個梗,什麼薩菲羅斯男人中的男人
: 就是用AI編曲演唱歌頌薩菲羅斯什麼的
: 還有個遊戲直播主,他之前發了個影片鑑賞那些用他的聲音為免洗遊戲打的廣告
: 只能說,當初大概也很少人預測到,最先被AI打成手工業者的,竟然是創意產業和流行設計
: 或許也是側面表現了現代人類的精神生活有多空泛吧……
準確來說是替代了部分創意、流行的生產步驟,AI只是降低製造的門檻。
不然像...
薩菲羅斯男人中的男人、歐金金是奶茶...
不管誰來都不會覺得這玩意是AI想出來的
=============================================================
配音領域的話,對岸常用的3個開源項目
Bert-VITS2、GPT-SoVITS、Fish-speech
至於唱歌方面的我沒太研究,不過據我所知唱歌AI目前還是比較粗糙的
Bert-VITS2
去年就有了,開源版預訓練模型無法用來推理
必須使用者自己收集素材,然後自己煉丹。
GPT-SoVITS
還是要自己去煉丹,原始項目沒法直接推理,
不過他的LLM參數量太小,常常出現幻覺。
Fish-speech
原理跟第上面的差不多,
不過重製了聲碼器,然後把LLM的參數量堆到1B,
初步解決比較常見的多音字發音問題。
比較雞賊的是,這玩意有做小樣本推理功能,
只要提供一個參考音頻,就能還原個7788,
不過要達到最佳效果還是要自己重煉聲碼器。
我這幾個月都拿這些聽書,體驗下來....
目前在自己有煉丹能力的情況下,音色跟韻律可以做到非常出色的還原。
但配音還需要情感演繹之類的功能,這點目前的TTS技術,
不管是商用項目還是開源項目,都遠遠達不到預期。
想要達到感情也很匹配的程度,需要大量人工進行微調,
如果是這樣的話,成本還是請真人配音比較便宜。
目前這技術,可以拿來整活、做二創、自己練著玩之外,
現階段要拿來直接給遊戲、動畫、配音,目前差距還很大。
除非你用人工干預一句一句精調。
記得yt上有個日本搞得很鬧的AI 安倍就是用BV2生成的
--
我覺得用AI做音樂比做配音簡單多ㄌ
畢竟音樂本身的和弦都很簡單 甚至大部分都是用
機器在微調ㄉ
所以AI隨便都可以出一首妳聽不出差別的音樂
但聲優很難 去聽YT就知道AI和真人聲還是差太多ㄌ
語音的話,目前能做到長音頻30秒幾乎聽不出與真人的區別, 但聽個3~5分鐘就能明顯察覺問題了,情感表達上現在還很糙。
唱歌的話Suno AI吧
邦邦也把香澄跟友希那的聲音拿來做AI唱歌了
歐金金是奶茶那是抖音擦邊自媒體搞的吧,跟AI沒關係
83
Re: [討論] 郭台銘剛說AI可以幫素還真配音?四年前的文章現在重新再看一次, 目前科技應該是可以做到還原黃大的真人原聲了。 最近的AI孫燕姿相信大家都知道, 只要餵AI一定歌手的高度樣本學習數量,就可以唱出不輸真人的聲音34
[討論] 中研院繁中LLM被爆直接拿對岸的來套!中央研究院詞庫小組(CKIP) 中研院資訊所、語言所於民國75年合作成立 前天釋出可以商用的繁中大型語言模型(LLM) CKIP-Llama-2-7b 以商用開源模型 Llama-2-7b 以及 Atom-7b 為基礎X
Re: [爆卦] 中央研究院詞庫小組大型語言模型對於LLM只有這一點認知程度的話,最好不要就這樣出來帶風向會比較好,不然先去 跟陽明交大校長先去旁邊先學習一下什麼叫做LLM,不同LLM之間又有什麼差異。 第一個錯誤的認知是認為LLM就應該要提供正確的答案,事實上LLM是一個機率模型, 它所做的事情是基於模型的權重預測下一個token(詞塊)最高的機率是那個,它不是資 料庫,所以你不能因為它答的一個答案不是你所想的就是說這個模型如何如何。4
[情報] 星際大戰黑武士將繼續以AI配音經典角色永將流傳:《星際大戰》黑武士將繼續以 AI配音 AI 語音技術日新月異,只要資料數量夠、參數設定正確,要用 AI 模擬真人語音已經不 是難事,現在迪士尼想好好利用這項技術,為經典角色繼續賦予新生命,首先就是《星際 大戰》中最為人熟知的角色「黑武士」達斯維達。 達斯維達以它獨特的呼吸氣音以及冷酷語調著稱,根據外媒報導,在烏克蘭新創公司X
Re: [問卦] 中研院自己做的大型語言模型怎麼了?這語言模型基礎是建構於Llama 2,meta提供的開源模型 另外Atom 7b則是中文社群跟一間中國公司在Llama 2之上訓練成中文使用者適合的模型, 也是開源且開放商用 技術上也不用解釋太多,反正開源模型他本來就不會像GPT或百度的文心一言那樣限制某 些爭議性回答3
Re: [討論] 中研院繁中LLM被爆直接拿對岸的來套身為LLM猴子,大多同意DrTech的看法,只是台智雲這塊有點不一樣。 其實台智雲有幾乎一半台灣杉2號的機器可以用, 也克服很多開源軟體無法解決的問題;例如硬體是V100不是A100, 又要能夠做3D model parallelism,又要同時能跑LoRA,RLHF, 在100Gbps網路中維持GPU使用率滿載等等。在meta llama出來之前,3
Re: [問卦] ChatGpt為什麼開始變笨了?正好半夜看到這篇無聊來回一下 GPT4能力下降大概5月多開始就有人注意到了 但你要怎麼定義能力衰退這件事而且量化他? 於是七月就有一篇論文在討論這件事1
Re: [新聞] 台版ChatGPT雛型曝光 國科會用4個月秀TAI版 : 的生成式AI模型,耗時4個月今(14日)宣布第一階段成果,目前已投入70億個參數量 , : 針對繁體中文訓練,實測已達自動摘要、翻譯文本、寫信與寫文章,都有不錯表現,並 首- 請容我搬運一篇對岸知乎的文章, 這是一篇非常長的文章,其中大部分片段與本文無直接關聯,而且是2023/02寫的. 我只搬運本串相關的記憶體的部分,還有尾部的結論.且未修飾原文用字 詳細的有興趣請直接去原網址看吧. ChatGPT背後的經濟賬
爆
[情報] YOASOBI 抽選結果通知完畢91
[推薦] PS5 PRO大禮包83
[閒聊] 巴哈姆特動畫瘋廣告以前是幾秒啊87
[閒聊] 推特趨勢:おしっこオムライス 小便蛋包飯87
[發錢+推薦] 為何定要隨波逐流71
[問題] 求推薦動畫,大小作不拘68
[閒聊] 郡ㄉ…毒ヶ衣みなみ 受誹謗的賠償金額67
[Vtub] 螺鈿:咦...這個聲音是..66
[妮姬] 有皇冠還要抽艾比嗎?66
[妮姬] 灰姑娘諮詢是不是最麻煩的女人:(63
[閒聊] 台灣新生代很難有YOASOBI等級的搶票潮吧57
[閒聊] 這把OO局 算是支語嗎?58
[閒聊] 魔物獵人的龍哪條能摧毀現代人類?67
[閒聊] 現實裡4000人死亡的恐攻是什麼水準55
[妮姬] 日本IOS營收榜第一又被PTCGP守門54
[閒聊] 想去香格里拉還是SAO玩61
[妮姬] 妮又送47
[閒聊] 川普主張降低重視多元化並終止DEI計畫42
[索尼] PS5 Pro於全球正式推出!但光碟機仍缺37
[閒聊] YOASOBI 抽票的邏輯是什麼啊?40
[討論] 中國為什麼內卷不出yoasobi48
[情報] 我推的孩子 動畫銷售額過40億39
[哈波] 哈利波特攻擊咒語的強度排名?37
[閒聊] 庫珥修太雖了吧45
[閒聊] PTCGP新活動34
[討論] 哈利波特咒語的繁中翻譯算傳神嗎?33
[閒聊] 隔壁的大姐姐送來了禮物32
[閒聊] 大逃殺的劇情是不是怪怪的32
[妮姬] 接下來想看誰的故事35
[閒聊] FLOWGLOW 支援插畫與三視圖