PTT推薦

[討論] OpenAI GPT o1模型

看板Tech_Job標題[討論] OpenAI GPT o1模型作者
NTHUlagka
(拉卡)
時間推噓38 推:38 噓:0 →:33

https://openai.com/index/learning-to-reason-with-llms/
上禮拜OpenAI發布經過強化學習訓練的新型語言模型o1
宣稱模型有更強大的思考能力
o1在回答之前會深入思考產生內部的推理練


結果就是o1模型在各個人類頂尖領域獲得相當好的成績

o1數學方便相當於美國奧林匹克AIME前500名的選手

程式方面位居Codeforce前11%
上禮拜的Leetcode雙週比賽 https://leetcode.com/contest/biweekly-contest-139/ranking/
以12分鐘通關

在物理生物化學領域(GPQA)已經超過人類博士的程度

對科技業比較相關的是 看來以後線上面試考白板題
可能都還要關注面試者眼神有沒有亂飄以防用GPT作弊 但如果是OA好像就無法可防了

--

※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.250.51.3 (臺灣)

※ 文章網址:
https://www.ptt.cc/Tech_Job/E.TCdAVg9RZT3Q

mydear3310 09/17 10:22太興奮了看成OL模型

hips 09/17 10:29現在可以解3.11vs3.9哪個大了嗎?

koushimei 09/17 10:42但是沒辦法貼圖片或者附檔比較麻煩

somerabbit 09/17 11:23搭配cursor使用 ng立刻變senior level

lemonsheep 09/17 11:29不用防吧 以後就不用考白板題啦

lemonsheep 09/17 11:29Gpt 已經比99%的面試者強了

lemonsheep 09/17 11:29以後只剩know how比較重要了

這樣看來白板題八股文是不是要走入歷史了 以後也不用刷題了 只是是說這些know how未來也會被GPT取代吧 現在都已經能達到這個程度了 SWE以後可能就是負責下指令然後幫gpt review吧

※ 編輯: NTHUlagka (42.70.92.176 臺灣), 09/17/2024 11:35:00

HiHiCano 09/17 11:45軟工刷題仔逝去

HiHiCano 09/17 11:46還好台灣大部分是不用刷題的硬體工作

musashi023 09/17 11:46leetcode這種陋習早該下去了

Wishmaster 09/17 11:51gpt的知識量真的屌虐,自己研究個東西可能要兩三小

Wishmaster 09/17 11:51問一下答案直接套用,雖然不能每次都work也夠了

HiHiCano 09/17 11:52軟工的知識在網路上太多了 很容易訓練

※ 編輯: NTHUlagka (42.70.92.176 臺灣), 09/17/2024 11:58:58

reprobate 09/17 12:04看什麼時候能讓我當甲方直接開需求就把軟體含UI都

reprobate 09/17 12:04寫好

※ 編輯: NTHUlagka (42.70.92.176 臺灣), 09/17/2024 12:08:38

NTUCS5566 09/17 12:41好像網頁製作可以正確產生 bilibili有人測試

NTUCS5566 09/17 12:41直接提需求 code直接寫完 成品網頁直接產生

NTUCS5566 09/17 12:42但我走FW的 看不懂他們在幹嘛 感覺有點厲害就是了

darkangel11909/17 12:43先拿台灣學測的數學戳戳看

MAGICMCGRADY09/17 12:45刷題其實不算陋習

MAGICMCGRADY09/17 12:49台廠聊天面試比較像陋習

yoyoyolin 09/17 13:03以前就說了,現場考實作題比較有鑑別度。考那個leet

yoyoyolin 09/17 13:03code 還不如直接挑本科系人選就好。

yoyoyolin 09/17 13:05考實作題本科系還不一定答的出來。

MAGICMCGRADY09/17 13:07還好啦,面試還會考系統設計 那才是定級的關鍵

MagicMomo19 09/17 13:42是說還真的把整份需求丟上去過,寫是寫的出來但是畫

MagicMomo19 09/17 13:42面醜爆,有資安檢測也不可能過的那種,頂多就是單一

MagicMomo19 09/17 13:42功能能跑能動,可是串不起來整個流程這樣

lemonsheep 09/17 13:43系統設計大部分人也都是唸書本上的再想辦法兜啊 只

lemonsheep 09/17 13:43要是套現成系統性的知識99%的人都贏不了gpt 的 只

lemonsheep 09/17 13:43剩最後1%真的能做開創性東西的人才還有一席之地

sy2es6404 09/17 13:50https://reurl.cc/OrRqaX 新智元這篇報導說o1 門薩

sy2es6404 09/17 13:50測驗IQ超過120

ejnfu 09/17 13:53刷題慢慢式微也不錯,本來太偏重刷題也不太正確

yunf 09/17 13:55沒差吧他們應該會調整難度

yunf 09/17 13:57畢竟真的問題他解不了

yunf 09/17 14:06上次有個門薩的說pchome會倒閉後來也沒有

yueayase 09/17 15:57其實這些工具出來,即使取代了一些功能,總有別的方

yueayase 09/17 15:57面可以去努力吧

strlen 09/17 16:42還考啥?連職缺都可以關一關了喇

rodion 09/17 17:04不能驗證自己說出口的話 就依舊只是高級 google搜尋

a9101214 09/17 17:54好猛喔拉卡

create8 09/17 18:41也進步太快了…

andy810306 09/17 19:41雙週賽Q4解法醜到爆,這絕對過不了面試的放心

hobnob 09/17 20:10我分享一下我寫1000多題的心得啦,講好聽是單純講

hobnob 09/17 20:10難聽是死板,幫你複習大學學過的資結演算法而已,去

hobnob 09/17 20:10想我們用的工具哪個不是以資結與演算法為基本的?

hobnob 09/17 20:10不知所以然的人還是很多啦,不要說刷題面試是陋習,

hobnob 09/17 20:10題刷不好才有問題

hobnob 09/17 20:13但是週賽是competitive programming,題目本質跟面

hobnob 09/17 20:13試有差

dont 09/17 20:32真要防只能回歸疫情前 onsite都進公司考白板題了吧

steak5566 09/17 21:47應該會回歸真的on site 然後很多場擠在同一天這樣

VScode 09/17 22:01以後應該會優先考system design了

shortoneal 09/17 22:10是說copilot最近變好笨,有甚麼方法可以重製嗎

shortoneal 09/17 22:10他會auto complete一些別的repo的structure...蝦寫

shortoneal 09/17 22:10一波

bitcch 09/17 22:22以後測驗大概會變成看你是否能理解除錯AI生成的答案

bitcch 09/17 22:23以及如何用最佳的prompt來快速建構出程式碼

AudiA4Avant 09/17 22:53說真的,AI寫題這麼強的情況下,以後考算法絕對不是現

AudiA4Avant 09/17 22:53在這樣

AudiA4Avant 09/17 22:54甚至 system design prompt 下對的情況,也能在很短

AudiA4Avant 09/17 22:54時間內透過互動得到一個還行的架構

TSMCfabXX 09/17 23:57HTML 碰到特殊字元還是不行

dj025258 09/18 07:40聽休學後待業超過10年的人談論努力,真是醍醐灌頂,

dj025258 09/18 07:40謝謝開示

nxuanr 09/18 09:09ai 會解決一切問題

X28338136X 09/18 15:54所以現在會寫verilog 了嗎

Izangel 09/18 18:39Nvda內部就有verilog生成器了好嗎

aasssdddd 09/19 09:554o 9.11>9.9 o1 9.9>9.11 但明顯算比較久

Izangel 09/19 10:31你先提示他9.11跟9.9是純數字,就不會算錯了啦