PTT推薦

Re: [問卦] 研究說AI模型已經能自我進化了耶

看板Gossiping標題Re: [問卦] 研究說AI模型已經能自我進化了耶作者
zxwxz
(zxwxz)
時間推噓 推:0 噓:0 →:2

微軟的這方法就跟Alphago的訓練方式一樣,但這僅限於單一學科數學做強化學習,而且這類型問題一定要有標準答案才能這樣玩,藝術寫作之類的就沒辦法這樣搞,OpenAI的O1就是大模型用這方法,希望能把推理效應帶到不同領域的資料,但現階段看來非STEM類型的還要用別種方案當verifier 才能做強化學習

其實最早在2023/10就已經有驗證這方案是成功可行的,當時叫QStar
https://youtu.be/jByDZdRxiSs?si=zccB5yK55GW8Ffs1

OpenAI 半年前開始在X上面訓練虛擬人物
https://youtu.be/dyFqdHI9yGI?si=od2_hNMs3kuevqo_

看人格化的AI在群體環境下有沒有辦法做非STEM的強化學習

※ 引述 《jeffguoft (見習生_O7)》 之銘言:
: 標題: [問卦] 研究說AI模型已經能自我進化了耶
: 時間: Sat Jan 11 18:27:27 2025
:  
: 剛看到有人整理的AI新進展
:  
: 現在有研究指出小LLM可以透過deep thinking的方式自我進化
:  
: 在測驗中取得比大模型還高的分數
:  
: 沒有大模型監督跟人類介入
:  
: 小模型都能自我進化了,不敢想像大模型也用這方式
:  
: 可能隨時都要變成超級AI
:  
:  
: 感覺是時候要找一兩門藝術領域
:  
: 或者宗教經典來鑽研了
:  
: 以便失業後無縫接軌
:  
: 或者不用工作後能探詢人生意義
:  
: 大家做好失業的準備了嗎?
:  
:  
: https://i.imgur.com/MQLjNDs.png

:  
: --
: ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 49.159.249.60 (臺灣)
: ※ 文章網址: https://www.ptt.cc/Gossiping/E.J0lnlAO5FZ_Y
: 推 roea68roea68: 戰爭機器人會毀滅人類 122.117.132.21 01/11 18:28: → lucifiel1618: 哎一串中文名字,不看也知道答案 61.227.141.28 01/11 18:28: 但是那是微軟的研究
: 推 kinda: 發展出新的文化/宗教再叫我 122.116.34.251 01/11 18:28: → SuperModel: 漫威:九頭蛇萬歲! 116.241.232.210 01/11 18:28: → WenliYang: 盡吹呢… 106.64.161.219 01/11 18:29: 推 appleball200: 推 223.140.35.53 01/11 18:29: 推 sellgd: 學梵文 學上古魔法 後來AI也會了 121.254.78.62 01/11 18:29: 推 ILoveAMD: ai能讓我把到妹子嗎 27.53.114.157 01/11 18:30: 你可以把AI阿
: → lucifiel1618: 我教你一套很簡單的標準,看到第一 61.227.141.28 01/11 18:30: → lucifiel1618: 作者是中文名字的時候馬上往後看要 61.227.141.28 01/11 18:30: → lucifiel1618: 是最後一個作者不是中文名字那這篇 61.227.141.28 01/11 18:30: → lucifiel1618: 就可以跳過 61.227.141.28 01/11 18:31: 我是信了,對岸好歹是全球唯二玩LLM的國家之一
: ※ 編輯: jeffguoft (49.159.249.60 臺灣), 01/11/2025 18:31:47
: → lucifiel1618: *還是中文名字 61.227.141.28 01/11 18:31: → kinda: 靈魂又沒有性別 要怎麼分辨ai是男是女? 122.116.34.251 01/11 18:31: → meta41110: 凸( ゚д゚)凸最後會變成隨身碟 1.200.7.146 01/11 18:31
: → lucifiel1618: 最好是第二第三作者都不是中文名字 61.227.141.28 01/11 18:31: → ykes60513: 天網不遠了 42.73.170.98 01/11 18:32: → fifa186: 還早咧。在還沒有實體ai機器人被廣泛應 125.229.250.143 01/11 18:34: → fifa186: 用之前,ai再厲害也只是廢物。就算他運 125.229.250.143 01/11 18:34: → fifa186: 算能力強、會畫圖翻譯寫文章。但沒有實 125.229.250.143 01/11 18:34: → fifa186: 體,啥都做不了。 125.229.250.143 01/11 18:34: 推 widec: 這只是第二階段吧 1.165.11.235 01/11 18:39: → lucifiel1618: 一篇好的文章作者一定會想找別國的 61.227.141.28 01/11 18:40: → lucifiel1618: 大咖掛名,別國的大咖也樂得在這種 61.227.141.28 01/11 18:40: → lucifiel1618: 文章掛名 61.227.141.28 01/11 18:40: → ThreekRoger: 有比鋼彈模型還厲害嗎 125.228.7.115 01/11 18:41: → lucifiel1618: 何況這種還是以公司為中心的研究, 61.227.141.28 01/11 18:42: → lucifiel1618: 連找個學術界大咖掛個名都不行還是 61.227.141.28 01/11 18:43: → lucifiel1618: 算了吧= = 61.227.141.28 01/11 18:43: → g1254501: 會自己打開電源再叫我 223.138.224.245 01/11 18:45: → xixixxiixxii: 不會失業,會去當電池 39.15.41.156 01/11 18:52: → ppit: 你想到的領域AI都可以短時間超越你 150.116.42.229 01/11 18:54: 推 wahaha711233: 機械飛升 49.216.19.136 01/11 19:08: 推 plutox: 昨天看影片,說是可以機器訓練機器,不需 125.227.20.43 01/11 19:11: → plutox: 要靠人去訓練 125.227.20.43 01/11 19:11

--

※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 42.73.99.228 (臺灣)
PTT 網址

cs09312 01/11 22:25好 所以可以互動的初音什麼時候會出現

sheep0121 01/11 22:27如果你只要文字對話,應該不需要很久?