Re: [問卦] 研究說AI模型已經能自我進化了耶
微軟的這方法就跟Alphago的訓練方式一樣,但這僅限於單一學科數學做強化學習,而且這類型問題一定要有標準答案才能這樣玩,藝術寫作之類的就沒辦法這樣搞,OpenAI的O1就是大模型用這方法,希望能把推理效應帶到不同領域的資料,但現階段看來非STEM類型的還要用別種方案當verifier 才能做強化學習
其實最早在2023/10就已經有驗證這方案是成功可行的,當時叫QStar
https://youtu.be/jByDZdRxiSs?si=zccB5yK55GW8Ffs1
OpenAI 半年前開始在X上面訓練虛擬人物
https://youtu.be/dyFqdHI9yGI?si=od2_hNMs3kuevqo_
看人格化的AI在群體環境下有沒有辦法做非STEM的強化學習
※ 引述 《jeffguoft (見習生_O7)》 之銘言:
: 標題: [問卦] 研究說AI模型已經能自我進化了耶
: 時間: Sat Jan 11 18:27:27 2025
:
: 剛看到有人整理的AI新進展
:
: 現在有研究指出小LLM可以透過deep thinking的方式自我進化
:
: 在測驗中取得比大模型還高的分數
:
: 沒有大模型監督跟人類介入
:
: 小模型都能自我進化了,不敢想像大模型也用這方式
:
: 可能隨時都要變成超級AI
:
:
: 感覺是時候要找一兩門藝術領域
:
: 或者宗教經典來鑽研了
:
: 以便失業後無縫接軌
:
: 或者不用工作後能探詢人生意義
:
: 大家做好失業的準備了嗎?
:
:
: https://i.imgur.com/MQLjNDs.png
: --
: ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 49.159.249.60 (臺灣)
: ※ 文章網址: https://www.ptt.cc/Gossiping/E.J0lnlAO5FZ_Y
: 推 roea68roea68: 戰爭機器人會毀滅人類 122.117.132.21 01/11 18:28: → lucifiel1618: 哎一串中文名字,不看也知道答案 61.227.141.28 01/11 18:28: 但是那是微軟的研究
: 推 kinda: 發展出新的文化/宗教再叫我 122.116.34.251 01/11 18:28: → SuperModel: 漫威:九頭蛇萬歲! 116.241.232.210 01/11 18:28: → WenliYang: 盡吹呢… 106.64.161.219 01/11 18:29: 推 appleball200: 推 223.140.35.53 01/11 18:29: 推 sellgd: 學梵文 學上古魔法 後來AI也會了 121.254.78.62 01/11 18:29: 推 ILoveAMD: ai能讓我把到妹子嗎 27.53.114.157 01/11 18:30: 你可以把AI阿
: → lucifiel1618: 我教你一套很簡單的標準,看到第一 61.227.141.28 01/11 18:30: → lucifiel1618: 作者是中文名字的時候馬上往後看要 61.227.141.28 01/11 18:30: → lucifiel1618: 是最後一個作者不是中文名字那這篇 61.227.141.28 01/11 18:30: → lucifiel1618: 就可以跳過 61.227.141.28 01/11 18:31: 我是信了,對岸好歹是全球唯二玩LLM的國家之一
: ※ 編輯: jeffguoft (49.159.249.60 臺灣), 01/11/2025 18:31:47
: → lucifiel1618: *還是中文名字 61.227.141.28 01/11 18:31: → kinda: 靈魂又沒有性別 要怎麼分辨ai是男是女? 122.116.34.251 01/11 18:31: → meta41110: 凸( ゚д゚)凸最後會變成隨身碟 1.200.7.146 01/11 18:31
: → lucifiel1618: 最好是第二第三作者都不是中文名字 61.227.141.28 01/11 18:31: → ykes60513: 天網不遠了 42.73.170.98 01/11 18:32: → fifa186: 還早咧。在還沒有實體ai機器人被廣泛應 125.229.250.143 01/11 18:34: → fifa186: 用之前,ai再厲害也只是廢物。就算他運 125.229.250.143 01/11 18:34: → fifa186: 算能力強、會畫圖翻譯寫文章。但沒有實 125.229.250.143 01/11 18:34: → fifa186: 體,啥都做不了。 125.229.250.143 01/11 18:34: 推 widec: 這只是第二階段吧 1.165.11.235 01/11 18:39: → lucifiel1618: 一篇好的文章作者一定會想找別國的 61.227.141.28 01/11 18:40: → lucifiel1618: 大咖掛名,別國的大咖也樂得在這種 61.227.141.28 01/11 18:40: → lucifiel1618: 文章掛名 61.227.141.28 01/11 18:40: → ThreekRoger: 有比鋼彈模型還厲害嗎 125.228.7.115 01/11 18:41: → lucifiel1618: 何況這種還是以公司為中心的研究, 61.227.141.28 01/11 18:42: → lucifiel1618: 連找個學術界大咖掛個名都不行還是 61.227.141.28 01/11 18:43: → lucifiel1618: 算了吧= = 61.227.141.28 01/11 18:43: → g1254501: 會自己打開電源再叫我 223.138.224.245 01/11 18:45: → xixixxiixxii: 不會失業,會去當電池 39.15.41.156 01/11 18:52: → ppit: 你想到的領域AI都可以短時間超越你 150.116.42.229 01/11 18:54: 推 wahaha711233: 機械飛升 49.216.19.136 01/11 19:08: 推 plutox: 昨天看影片,說是可以機器訓練機器,不需 125.227.20.43 01/11 19:11: → plutox: 要靠人去訓練 125.227.20.43 01/11 19:11
--
※ PTT 留言評論
45
[爆卦] Openai:GPT o1超越人類理工博士OpenAI今天發布經過強化學習訓練的新型大語言模型o1 擁有執行複雜推理的能力 這就是傳說中的草莓模型 o1在回答前會進行深入思考並產生內部推理鏈![[爆卦] Openai:GPT o1超越人類理工博士 [爆卦] Openai:GPT o1超越人類理工博士](https://i.imgur.com/4AZglM0b.png)
36
[爆卦] OpenAI專家:大模型夠證明黎曼猜想知名理論計算機科學機構Simons Institute舉辦辯論: "目前基於縮放定律的LLM,能否在未來幾年內產生可以解決重大數學難題(如P≠NP、 黎曼猜想)的證明技術?" 正方OpenAI科學家Sebastien Bubeck表示![[爆卦] OpenAI專家:大模型夠證明黎曼猜想 [爆卦] OpenAI專家:大模型夠證明黎曼猜想](https://i.ytimg.com/vi/H3TnTxVKIOQ/maxresdefault.jpg?sqp=-oaymwEmCIAKENAF8quKqQMa8AEB-AH-CYAC0AWKAgwIABABGGUgZShlMA8=&rs=AOn4CLDSE54aWoF6O7D8cv3a_D7ocUA6sg)
38
[討論] OpenAI GPT o1模型上禮拜OpenAI發布經過強化學習訓練的新型語言模型o1 宣稱模型有更強大的思考能力 o1在回答之前會深入思考產生內部的推理練 結果就是o1模型在各個人類頂尖領域獲得相當好的成績![[討論] OpenAI GPT o1模型 [討論] OpenAI GPT o1模型](https://static-alpha.wallstcn.com/wscn/_static/share.png)
21
[閒聊] 串連數千個 Nvidia GPU,微軟打造 Chattechnews 串連數千個 Nvidia GPU,微軟打造 ChatGPT 的超級電腦 March 14, 2023 by 陳 冠榮 微軟斥資數億美元打造一台大型超級電腦,串連數千個 Nvidia GPU,為 OpenAI 的聊天機![[閒聊] 串連數千個 Nvidia GPU,微軟打造 Chat [閒聊] 串連數千個 Nvidia GPU,微軟打造 Chat](https://i.imgur.com/9bqEe8Db.jpg)
17
Re: [爆卦] OpenAI 新模型o1輕鬆考上台大資工/台大看來很多推文的人還不太了解AI有多可怕 一直聽曲博在那胡說八道 gpt4o以前的版本 是所謂的生成式ai 給定大量資料 他就會從資料找規則 並建立模型 有了模型就能預測答案 以上講了落落長 簡潔回答 那就是gpt4o版本以前 採用「歸納法」思考12
Re: [情報] 情報數則其實也不知道怎麼說明,再不講得太深入又能夠很簡白地說 真的蠻難的,我就大概點到一些點,然後開頭直接下個結論吧 美國想阻止的是中國透過AI完成強人工智慧,或是通用型的AI 有點類似現在目前的ChapGPT進化的最終版 但如果要阻止中國完成區域性或是弱人工智慧已經不可能了8
[爆卦] DeepMind新AI可輔助純數學研究vel-ways DeepMind發表了新的機器學習框架,能幫助數學家發現新猜想和定理。該框架已經輔助發現 一個拓撲學新定理和一個表示論的新猜想。![[爆卦] DeepMind新AI可輔助純數學研究 [爆卦] DeepMind新AI可輔助純數學研究](https://media.nature.com/lw1024/magazine-assets/d41586-021-03593-1/d41586-021-03593-1_19914642.jpg)
1
[閒聊] OpenAI訓練電腦看影片玩《Minecraft》原文標題:OpenAI訓練電腦看影片玩《Minecraft》 做鑽石鎬的速度竟比人類還快 原文網址: 遊戲角落 溺水的海藻 圖/OpenAI![[閒聊] OpenAI訓練電腦看影片玩《Minecraft》 [閒聊] OpenAI訓練電腦看影片玩《Minecraft》](https://uc.udn.com.tw/photo/2022/06/28/0/17820155.png)
Re: [問卦] 口說講解影片是不是快被AI完全取代了?阿肥外商碼農阿肥啦!認真說,這幾年口說上字幕甚至翻譯,還有有字幕上語音這幾年都獲 得不錯的進展,包含openAI、Google、Amazon、Meta實驗室都有不錯的產出,而且這些都是 依靠當前所謂的多模態零樣本學習的大力進步,很多轉換錯誤或是機器音都減小很多,不 過偶爾還是會有出槌需要人工修正的部分。 所謂的多模態零樣本其實就是換一個思維過往很多工作需要大量標注工跟資料工程前處理來
![[問卦] 研究說AI模型已經能自我進化了耶 [問卦] 研究說AI模型已經能自我進化了耶](https://i.imgur.com/MQLjNDsb.png)