Re: [問卦] 口說講解影片是不是快被AI完全取代了?
※ 引述《horseorange ()》之銘言
: 網路上會滑到的口說講解影片
: 光講話的部份之前就被微軟雲希搶了一半以上的工作
: 至於其他的部份
: 剛剛在看別人貼的教學
: 現在文本也可以用AI寫
: 甚至你覺得影片沒有人
: 也可以叫個AI人像在前面講話
: 文本、口說、影像AI都能做到了
: 這樣看來口說講解影片被AI完全取代剩沒多久了吧?
阿肥外商碼農阿肥啦!認真說,這幾年口說上字幕甚至翻譯,還有有字幕上語音這幾年都獲得不錯的進展,包含openAI、Google、Amazon、Meta實驗室都有不錯的產出,而且這些都是依靠當前所謂的多模態零樣本學習的大力進步,很多轉換錯誤或是機器音都減小很多,不過偶爾還是會有出槌需要人工修正的部分。
所謂的多模態零樣本其實就是換一個思維過往很多工作需要大量標注工跟資料工程前處理來完成,但是這樣的成本往往都非常高,而我們其實人類原始的數據來源是很大只是雜訊很高,往往在傳統機器學習會認為是很難學習的,不過現在就是透過大量GPU大力出奇蹟,反正先訓練一個夠大夠強的模型不管他是不是有偏數據,然後再利用這樣的大模型我們透過有限監督來微調,這邊有很多方法,包含把多模態(圖像、語意、文字)來結合再一起,或是透過主動學習、強化學習來監督新模型輸出結果。
這樣就不需要落入我們一定要先有標注資訊才能做,像openAI的新模型whisper就能不須要傳統做音訊前處理直接把環境音加人聲一起喂入,直接給出人聲轉文字結果,這種做法在很多實驗跟研究中也發現你只要夠大模型的魯棒性越高,加上用所謂的對比方式來學習那要達到不須要額外新樣本就可以在新樣本上達到SOTA越容易。
差不多4醬
--
※ PTT留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 101.10.13.42 (臺灣)
※ PTT 網址
※ 編輯: sxy67230 (101.10.13.42 臺灣), 01/08/2023 12:16:03
→
看到zero shot就想吐
40
Re: [外絮] 用機器學習模型預測MVP得主大略看了一下原文 提供我的一點淺見 首先 使用機器學習處理問題 是假設實際存在一個真實的模型29
Re: [問卦] 杜奕瑾:烏俄戰爭駐批踢踢內應的也沒阿肥外商碼農阿肥啦! 剛好阿肥是這塊領域的研究員,大概工作也有六年是在這塊機器人語意理解領域了。 直白來說,現有的不管你要叫AI或是內行一點要叫ML/DL,這塊領域當前最好的SOTA模型 從數學直觀理解都驗證機器對於模式識別是很強的,但是分析永遠不是ML的強項。 也就是說當前不管是BERT還是GPT 3等等等,他們強項就只是找到序列詞組的關聯性,最17
Re: [新聞] AI「薪」貴!科技業祭出年薪200萬搶人才認真說,這個立場有點偏頗,先說,我贊成你所謂的拼數據,但機器學習一直都是資料、統 計導向的學門,data driven本來就機器學習的一環,DL只是機器學習的一個子方法,他依 舊脫離不了資料統計建模,而所謂的AI是一個模糊超集,他包含專家系統、統計建模、機器 學習、範疇論、消息理論等等等,只用AI等於DL是一種不太健康的心態。 然後可以看看Stanford HAI REPORT根據2022全球關於AI(ML/DL)的領域產業發展概況其實可12
[請益] 為什麼現在新的深度學習模型都很少割出te"為什麼現在新的深度學習模型都很少割出test dataset?" 在進行實驗的時候, 發現近三年來的研究工作, 很多都沒有切割test dataset, 論文裡也沒有列出test dataset的實驗結果.12
Re: [閒聊] 繪師是怕畫不過AI還是怕AI會創作?怒刪,剛好碩班是研究AI領域,以我的角度來看 其實人工智慧這一塊的發展跟人類特徵學息息相關。人類從自我的習性套用到機器上,透 過流程特徵化後編制pipeline讓機器模仿人類的習性。 先說結論,Machine Learning(ML)不可能只靠「單一」一張畫師的畫就可以訓練成一個有 效的模型;相反地它需要透過大量的數據去臨摹某一種畫風。10
Re: [討論] 2021 NBA歷史百大球員排行首Po賺個P幣 個人對Learning to rank略有接觸,想說從一個不同的角度切入百大排名這件。 首先找到一組權重去對球員排名本身就是非常困難的問題。像前面版友講的,有人會說得分王重要乘以2,有人會說強分區要加權,還是不是要考慮DPOY/正負值/季後賽勝率/明星賽次數...要考慮的特徵排列組合非常非常多,還要幫每個特徵選出一個權重。 所以從資料科學的角度,常用的方式就是用監督式機器學習從現有的資料裡學出權重,這種方式必須要標記的資料。舉個例子: 大家都把自己的百大排名打在下方,這樣我們可能就得到了一些樣本可以去建立回歸模型。5
Re: [問題] 要怎麼讓AI記住一件事情?小弟本身是相關的研究領域的剛好在西恰看到就簡單回答,chatGPT當前是沒有所謂記憶這 件事的,他其實是用到一個Trick就是直接把你前面的對話直接併到當前對話,由於目前有 最大字數上限(印象中是4000還是40000,有錯還請見諒)超過就直接把你前面的對話都丟掉 ,所以你常常會發現他好像講一講就自己忘記了。 GPT系列本身其實就是有點像接龍一樣的語言模型,你問馬可就會去預測一般人類遇到最常2
[問卦] 為什麼現在新的深度學習模型都很少割出te"為什麼現在新的深度學習模型都很少割出test dataset?" 在進行實驗的時候, 發現近三年來的研究工作, 很多都沒有切割test dataset, 論文裡也沒有列出test dataset的實驗結果.1
Re: [新聞] AI機器人ChatGPT爆紅 紐約憂學生作弊全面edium=facebook&fbclid=IwAR2F7vp--YvkSZGtMUlcvv9NipFo2CjETp0ng7cykSBZuMzgUi1Iz3i1 1PE 這個算是比較Lag的新聞了,已經有知情微軟已經有意把整個chatGPT跟Bing綁在一起了,微 軟投資openAI算是投資對了,不過倒也不是chatGPT用了多強大的技術。
爆
[問卦] 認真文 聽說明天就要起訴了爆
Re: [新聞] 擋3大法案? 柯建銘稱「不急」:藍白委6284
[問卦] 為什麼身份證拿出來國家會滅亡?89
[問卦] 新北耶誕城是不是退燒了???67
[問卦] 魷魚遊戲為何在台灣選擇高雄當宣傳呢47
[問卦] threads:高雄有魷魚遊戲根本首都50
[問卦] threads上面因為建中放女學生立牌吵翻了爆
[問卦] 為什麼8+9都可以穿名牌、開雙B?55
Re: [新聞] 民眾黨版財劃法遭藍營丟包 黃國昌喊可接50
[問卦] 蔡依林為什麼要把香爐穿在身上==48
[問卦] 以前班上不念書的8+9長大後真的撿角了嗎?33
[問卦] 1000萬房貸 壓力有多大?43
[問卦] 一樣宣傳魷2 為何差別待遇呢?33
[問卦] 小鍾:請統粉不要公布我的個資爆
Re: [新聞] 卓榮泰:天災來時 地方要自己面對45
[問卦] 每年中央少的錢 就撤掉數發部 不就好了78
[問卦] 政黑:財劃法 台北拿那麼多錢幹嘛用29
[問卦] 高雄人一直看造型氣球不會膩嗎28
[問卦] 房價這波要跌十趴?甘安捏?28
[問卦] 看過夢幻遊戲都幾歲了??21
[問卦] 新聞可以這樣拍大腿擦傷嗎?27
[問卦] 蹦闆整場壓低頭真的沒違規嗎27
[問卦] 人力費上漲 未來長照怎麼辦?21
[問卦] 穿這樣見網友可以嗎?(圖)23
[問卦] 台達電以後還招得到清交的員工嗎?20
[問卦] 曼谷觀光是怎麼打造那麼強的36
[問卦] 如果超哥 蹦闆打起來要選一邊?19
[問卦] 10度寒流也擋不住綠鬣蜥氾濫?17
Re: [新聞] 元旦起禁止旅宿提供「一次性盥洗用品」19
[問卦] Rose是怎麼逆襲成為Blackpink最紅