[問卦] 通用人工智慧(AGI)是不是快了?
剛剛看完OPEN AI憋了12天的壓箱寶影片
https://youtu.be/SKBG1sqdyIU
提到已經完成最新的 O3推理模型
寫程式方面輾壓現在開放給大眾用的最強的O1,
而且分數(2727)還比畫面上白衣服那位(2500)跟它們團隊首席科學家高XD
https://i.imgur.com/oV8surS.png
給他做美國數學奧林匹亞測試是96.7分,剩下的3.3分是因為有一題總是會算錯
博士等級的科學問題看起來是沒領先O1太多
https://i.imgur.com/CgnjplM.png
研究型的數學問題,專門給那些資深數學家去探索的,沒發表過的資料
O3達到25.2%,其他類模型只有2%正確率
https://i.imgur.com/AYcARqi.png
不過最驚訝的是請來外部團體測試AGI的分數
ARC-AGI用像這種圖去測試AI是不是有達到人類推理水準
https://i.imgur.com/jr1rU9j.png
https://i.imgur.com/Jl7fhOS.png
然後在相對應的方形外用該顏色跟數量當寬度去把方形框起來
現在的O1給他足夠時間也只能到32%,O3在低計算環境下有75.7%
如果要O3想久一點的話可以到87.5%
重點是跨過85%這個門檻就算相當於有人類的推理能力
https://i.imgur.com/Gx77oLi.png
好奇去找了一下這測驗對人類難度有多少
2024年紐約大學找了1729人測試,正確率落在73.3%-77.2%
但是98.7%的問題至少有一位普羅大眾可以解完
不過O3目前還沒要釋出,OPEN AI還要幫他加上各種安全裝置
在各種安全裝置下能不能達到基本AGI的水準就是大問號了
人類想創造出接近人類但是又不能超過人類的心理真是奇妙
--
※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 61.227.13.117 (臺灣)
※ PTT 網址
→
點越高攻速越快,不過沒點DEX打不中
推
台灣繼續做血汗晶片吧,以後美國用AI做
→
還早
推
成為亞洲第一互動社群平台 快了
噓
做夢吧,又一坨欸癌炒作罷了
45
[爆卦] Openai:GPT o1超越人類理工博士OpenAI今天發布經過強化學習訓練的新型大語言模型o1 擁有執行複雜推理的能力 這就是傳說中的草莓模型 o1在回答前會進行深入思考並產生內部推理鏈28
[爆卦] Nature論文:語言≠思維 AI業界崩潰一篇發表在nature的論文表示,人類大腦生成和解析語言的神經網路並不負責形式化推理 ,提出推理並不需要語言作為媒介。語言主要是用於溝通的工具,而不是思考的工具,對 於任何經過測試的思維形式都不是必需的。 該文回答了大語言模型為什麼空間概念不足,GPT-4為什麼用語言之外的資料訓練就能變聰38
[討論] OpenAI GPT o1模型上禮拜OpenAI發布經過強化學習訓練的新型語言模型o1 宣稱模型有更強大的思考能力 o1在回答之前會深入思考產生內部的推理練 結果就是o1模型在各個人類頂尖領域獲得相當好的成績29
Re: [討論] OpenAI GPT o1模型OpenAI 最近推出了 GPT-o1,但很多人可能還沒意識到這件事的嚴重性。事實上,OpenAI 已經找到了一條通往 AGI(通用人工智慧)的階梯!這個新模型的關鍵在於,它已經整合了 ToT(思維樹)和 RL(強化學習),在大型語言模型(LLM)領域達到了類似 AlphaGo Zer o 的水準。 很多人以為 LLM 就是個「刷題機器」,記住了大量的資料,所以我們在人類記憶力上輸了17
Re: [爆卦] OpenAI 新模型o1輕鬆考上台大資工/台大看來很多推文的人還不太了解AI有多可怕 一直聽曲博在那胡說八道 gpt4o以前的版本 是所謂的生成式ai 給定大量資料 他就會從資料找規則 並建立模型 有了模型就能預測答案 以上講了落落長 簡潔回答 那就是gpt4o版本以前 採用「歸納法」思考3
Re: [新聞] 馬斯克xAI推新AI訓練系統Colossus 採10萬現在AGI最大的問題 就是算力提升 AGI的智能和能力 這個結論484有問題的 如果只要算力提升2
Re: [討論] OpenAI GPT o1模型嗨 科技板首PO 關於這篇 Open AI發展的新聞 肥宅不懂AI 但高中有參加過AIME 只有寫出四題 被AI屌打 嘻嘻 但肥宅還是想幫人類平反一下3
[問卦] 明天最新GPT模型即將發佈最近OpenAI的發布內容都很無聊 今天總a在推特上意有所指 然後被認為明天即將發佈GPT-o3 目前最強的模型是o1,已經是博士等級1
[問卦] AGI要出來了的掛?輝達的老黃前幾天說通用人工智慧AGI 大概在五年內會出來 現在OpenAI流出AGI時程 時間對一對也差不多五年左右 若AGI真的在五年內出現1
[問卦] 通用人工智慧是不是炒作以下由gpt生成 --- 目前的人工智能系統都是狹隘人工智能(Narrow AI),只能解決特定任務,無法像人類一樣具 有通用的理解和推理能力。要實現AGI需要有突破性的技術創新,目前還遠未達到。 AGI需要模仿人類大腦的複雜性和靈活性,但我們對大腦的運作原理還有很多未解之謎。單憑
爆
[問卦] 尹錫悅:愛國市民們 韓國正被親北勢力威脅爆
[爆卦] 劉靜怡:監察院彈劾立委?爆
[問卦] 女山友如果死了 其他山友會被告嗎99
[問卦] 微熱山丘是得罪誰了嗎?爆
Re: [問卦] 為什麼八卦要一直護航貪污犯66
[問卦] 為什麼以前遊行比現在有用多了?48
[問卦] 八卦除excel 其他證據都視而不見 怎反駁69
[問卦] 有人對活體以外的東西注入感情的嗎?61
[問卦] 北檢如果出書 書名叫什麼會大賣?55
Re: [問卦] 陳梅慧的事就這樣過了?爆
[問卦] 瘋狂機師詹姆士有料嗎?46
[問卦] PTT 草板跟鳥版要不要打一架算了?44
[問卦] 如果一直羈押1年3個月最後無罪算冤獄?49
[問卦] 日語N1薪水在台灣月薪可以到多少錢!?38
[問卦] 老三被關 老二下一屆總統是否會復仇?60
Re: [新聞] 失聯10個月…彰化賣鹹粥阿嬤19歲孫 疑涉詐騙被大陸拘留37
[問卦] 台灣教育是出錯什麼導致低端很多?38
[問卦] 戒嚴有沒有更好聽的說法?36
[問卦] 找一部打麻將很厲害的片33
[問卦] 台灣誰長的最像哥布林王?32
[問卦] 有哪些合法的工作不用面試33
[問卦] 樂高(LEGO)這家公司有可能會倒嗎?16
[問卦] 靠!果真蔡壁如背刺柯文哲爆
[問卦] 老二怎麼開始幫老三說話了?32
[問卦] 如果汐止跟新店2選1,你們選哪裡住?25
[問卦] 在象山被丟包怎麼辦??????????26
[問卦] 老大為什麼這麼氣老三?15
Re: [新聞] 女高山症發作「遭同伴放生」獨留山上3X
[問卦] 為什麼八卦要一直護航貪污犯26
[問卦] Uber Eats 的廣告 到底是誰想出來的