Re: [問卦] 研究說AI模型已經能自我進化了耶

zxwxz 發表於 2025/1/11 下午10:25:06

看板Gossiping標題Re: [問卦] 研究說AI模型已經能自我進化了耶作者

(zxwxz)時間Jan 11 22:25:06 2025推噓推:0 噓:0 →:2

微軟的這方法就跟Alphago的訓練方式一樣，但這僅限於單一學科數學做強化學習，而且這類型問題一定要有標準答案才能這樣玩，藝術寫作之類的就沒辦法這樣搞，OpenAI的O1就是大模型用這方法，希望能把推理效應帶到不同領域的資料，但現階段看來非STEM類型的還要用別種方案當verifier 才能做強化學習

其實最早在2023/10就已經有驗證這方案是成功可行的，當時叫QStar
https://youtu.be/jByDZdRxiSs?si=zccB5yK55GW8Ffs1

OpenAI 半年前開始在X上面訓練虛擬人物
https://youtu.be/dyFqdHI9yGI?si=od2_hNMs3kuevqo_

看人格化的AI在群體環境下有沒有辦法做非STEM的強化學習

※ 引述《jeffguoft (見習生_O7)》之銘言：
: 標題: [問卦] 研究說AI模型已經能自我進化了耶
: 時間: Sat Jan 11 18:27:27 2025
: 　
: 剛看到有人整理的AI新進展
: 　
: 現在有研究指出小LLM可以透過deep thinking的方式自我進化
: 　
: 在測驗中取得比大模型還高的分數
: 　
: 沒有大模型監督跟人類介入
: 　
: 小模型都能自我進化了，不敢想像大模型也用這方式
: 　
: 可能隨時都要變成超級AI
: 　
: 　
: 感覺是時候要找一兩門藝術領域
: 　
: 或者宗教經典來鑽研了
: 　
: 以便失業後無縫接軌
: 　
: 或者不用工作後能探詢人生意義
: 　
: 大家做好失業的準備了嗎？
: 　
: 　
: https://i.imgur.com/MQLjNDs.png

: 　
: --
: ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 49.159.249.60 (臺灣)
: ※ 文章網址: https://www.ptt.cc/Gossiping/E.J0lnlAO5FZ_Y
: 推 roea68roea68: 戰爭機器人會毀滅人類 122.117.132.21 01/11 18:28: → lucifiel1618: 哎一串中文名字，不看也知道答案 61.227.141.28 01/11 18:28: 但是那是微軟的研究
: 推 kinda: 發展出新的文化/宗教再叫我 122.116.34.251 01/11 18:28: → SuperModel: 漫威：九頭蛇萬歲！ 116.241.232.210 01/11 18:28: → WenliYang: 盡吹呢… 106.64.161.219 01/11 18:29: 推 appleball200: 推 223.140.35.53 01/11 18:29: 推 sellgd: 學梵文學上古魔法後來AI也會了 121.254.78.62 01/11 18:29: 推 ILoveAMD: ai能讓我把到妹子嗎 27.53.114.157 01/11 18:30: 你可以把AI阿
: → lucifiel1618: 我教你一套很簡單的標準，看到第一 61.227.141.28 01/11 18:30: → lucifiel1618: 作者是中文名字的時候馬上往後看要 61.227.141.28 01/11 18:30: → lucifiel1618: 是最後一個作者不是中文名字那這篇 61.227.141.28 01/11 18:30: → lucifiel1618: 就可以跳過 61.227.141.28 01/11 18:31: 我是信了，對岸好歹是全球唯二玩LLM的國家之一
: ※ 編輯: jeffguoft (49.159.249.60 臺灣), 01/11/2025 18:31:47
: → lucifiel1618: *還是中文名字 61.227.141.28 01/11 18:31: → kinda: 靈魂又沒有性別要怎麼分辨ai是男是女？ 122.116.34.251 01/11 18:31: → meta41110: 凸( ﾟдﾟ)凸最後會變成隨身碟 1.200.7.146 01/11 18:31
: → lucifiel1618: 最好是第二第三作者都不是中文名字 61.227.141.28 01/11 18:31: → ykes60513: 天網不遠了 42.73.170.98 01/11 18:32: → fifa186: 還早咧。在還沒有實體ai機器人被廣泛應 125.229.250.143 01/11 18:34: → fifa186: 用之前，ai再厲害也只是廢物。就算他運 125.229.250.143 01/11 18:34: → fifa186: 算能力強、會畫圖翻譯寫文章。但沒有實 125.229.250.143 01/11 18:34: → fifa186: 體，啥都做不了。 125.229.250.143 01/11 18:34: 推 widec: 這只是第二階段吧 1.165.11.235 01/11 18:39: → lucifiel1618: 一篇好的文章作者一定會想找別國的 61.227.141.28 01/11 18:40: → lucifiel1618: 大咖掛名，別國的大咖也樂得在這種 61.227.141.28 01/11 18:40: → lucifiel1618: 文章掛名 61.227.141.28 01/11 18:40: → ThreekRoger: 有比鋼彈模型還厲害嗎 125.228.7.115 01/11 18:41: → lucifiel1618: 何況這種還是以公司為中心的研究， 61.227.141.28 01/11 18:42: → lucifiel1618: 連找個學術界大咖掛個名都不行還是 61.227.141.28 01/11 18:43: → lucifiel1618: 算了吧= = 61.227.141.28 01/11 18:43: → g1254501: 會自己打開電源再叫我 223.138.224.245 01/11 18:45: → xixixxiixxii: 不會失業，會去當電池 39.15.41.156 01/11 18:52: → ppit: 你想到的領域AI都可以短時間超越你 150.116.42.229 01/11 18:54: 推 wahaha711233: 機械飛升 49.216.19.136 01/11 19:08: 推 plutox: 昨天看影片，說是可以機器訓練機器，不需 125.227.20.43 01/11 19:11: → plutox: 要靠人去訓練 125.227.20.43 01/11 19:11

※ PTT 留言評論

※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 42.73.99.228 (臺灣)

※ PTT 網址

→

cs09312 01/11 22:25好所以可以互動的初音什麼時候會出現

→

sheep0121 01/11 22:27如果你只要文字對話，應該不需要很久？

同系列文章

[問卦] 研究說AI模型已經能自我進化了耶