Re: [爆卦] OpenAI 新模型o1輕鬆考上台大資工/台大
剛推出出來的時候我拿了幾題邏輯題出來考他
正確率很高我很驚喜覺得太神啦
剛剛看到下面推文
說他答不出來9.9跟9.11誰比較大
我想說不可能這麼簡單的答不出來吧
就測試了一下 結果…下面是我的對話
真的答不出來 我還試著引導他用程式來解決
但完全沒有幫助
這代幻覺好像更嚴重了 連你質疑他都不會想改答案
我相信未來能解決的 我比較擔心一些人開始依賴他把他當google 他們會逐漸喪失辨別真偽的能力 AI輸出什麼就是什麼 AI犯錯不可怕 可怕的是犯錯了沒人知道他犯錯了
https://youtu.be/4EayaPNo6pk?si=XPOsISjXtbvi7cQA
--
辨別不了真偽的慢慢就會被職場淘汰
你講的最後一段早就發生了 一些白癡好像完全
當模型能力越強 信賴就會越深…有一天會有一群人相信9.9<9.11
不懂AI會無中生有編假的答案給你 連驗證都不
知道要做 還有ChatGPT以後就不需要估狗 笑死
不用什麼模型能力強 第一代GPT就有這問題了
如果你熟悉的東西你還知道它在唬爛 如果是
你完全外行的領域 你連它在唬爛都看不出來
看起來是當成日期了 中文問答較差
那他的算式意思是9月9日-9月11日=-0月21日囉
偏偏現在一堆XX GPT講什麼就信什麼 只能說87
Bing會附上reference這點是好很多 但性能差
九月11確實比九月九大
誰來試一下13.11和13.9看看? 這不可能是日期
他答對了 但就如我所說 真真假假 才是最可怕的
https://i.imgur.com/Gg3qyuk.png
會不會上面這個就答對了不會出錯?
問問AI 如何用數學證明9.1大於9.9
說不定你發現AI 才是世界真理
我感覺ai的正確率也不比記者低,在特定議題
睜眼說瞎話程度兩者相當。記者的話都有人在
信了,信AI看起來也就沒那麼不可接受了吧?
都說9.9-9.11=-0.21了,所以實際上是把9.11
當作10.11,感覺只是小錯
可是我要他驗算的時候抓不出來啊 他一直自圓其說
※ 編輯: imhan705 (122.99.24.246 臺灣), 09/17/2024 02:30:31※ 編輯: imhan705 (122.99.24.246 臺灣), 09/17/2024 02:31:55
除了文書處理外 還是小心求證得好...
ChatGPT本來就瞎掰王了,是你打開的房市錯
我覺得離譜的地方是我請他用程式來計算了 他直接無視程式的輸出 繼續講他的
了
最近職場上真的很常聽到"可是GPT說...
" 嗯... 好唷
我成功教育瞎掰王把13.11也算錯了
XD
※ 編輯: imhan705 (122.99.24.246 臺灣), 09/17/2024 02:37:17
感覺人類哪天被AI滅了也會是因為一
些愚蠢的邏輯錯誤
想像哪天全人類要移民火星了 結果AI分不清楚9.9 9.11誰大 太空船路線直接衝向太陽 然 後船上的人也都不覺得有問題XD
FUCK
工程用的模型不一樣就是了XDXD
其實也很多在質疑目前AI的邏輯訓練方式
反正未來誰能更準確更厲害.誰就是對的
現實沒有所謂「最準確、最合理」若一直用這
標準去訓練AI模型,就只會持續做出瞎掰王
那問他0.1+0.2是否等於0.3這個經典
問題呢
用9.90-9.11問她 他就會了
他是語文模型 本身是不懂的思考的 可悲
無聊的AI 走倒退路罷了
若這種都不會,AI真的會泡沫化 zzz
9.9<9.11? 你傻了嗎?
你問它:我可不可以說1+1=3。
不用問數學,問chatgpt raspberry 有幾
個r,它不會說3個,因為它不是真的給你
乖乖去算
推
你講的這些不就是人類行為嗎
假做真時真亦假 不代表AI就是人了?
第一次回答錯誤 叫他寫證明
用程式也沒問題啊 你用盜版嗎
他就只是個大數據而已 沒多神
為啥copilot也會答錯
兩個AI都答錯 大數據裡應該不是這樣吧
累死 終於矯正成功
我的還真的不會算耶,還給錯誤的證明
,整個廢到笑
恭喜掰正
gray大 它方法1是對的耶
看不出ai對錯的比ai還敢更糟
ai這種錯中有對,對中有錯最讓人害怕
真的有在用的都知道AI超會唬爛。 但現
在真的有白癡把AI產出當成正確的證據
只要加寫出你的思考過程就會對了
剛下試了一下發現它幹話講的很有道理,
我差點以為我錯了
在法界早就發生了
早就一堆人把AI當神 毫無判斷能力了
ai目前錯誤還是很多,碰到不知道的事情
還會隨便唬爛,但可悲的是一堆低能兒跟
你討論事情時只會拿ai的回答當佐證
比如像這樣亂算一通
pg
但是這題用google gemini就有答對
無法辨別真偽的,用google只會更慘
完美模擬台灣司法
ChatGPT是數學白癡 應該說他的模型就
不是用來算這個的
算數學要數學特化的ai,有人做
這不叫AI 沒有分辨能力 餵他屎他就出屎
prompt要下好
你的問法不對 問9.90跟9.11哪個比較大就行了
g
o1好像會說服人,蠻恐怖的
不是Ai犯錯,而是答案本來就沒對錯
逆向思考,也許錯的答案也是對的
真的沒救
結論
數學部分 相信AI程式碼執行出來的東西 不
要直接相信AI
確定只有數學部份嗎
gpt4 反而沒有這個問題
試了一下還真的分不出9.9 跟9.11誰大,
copilot的理由是9.9可當成9.90, 比較
尾數1>0,所以9.11比較大。真是笨的不
可思議
就問的方式他聽不懂,別怪工具不好
連問9.9跟9.11哪個數字大也聽不懂,還
不能怪ai不好?
這樣問又知道答案 不曉得問題出在哪
結果他還把9.90-9.11=0.79改成錯的 笑爛
開始讓我懷疑9.9是不是9.90了
9.9 and 9.11 are both float which
對啊,缺點只能不要太深入的問題,還要檢
視答案
微軟的copilot真他媽辣雞
o1幻覺更嚴重不意外啊
LLM本來就有幻覺,你還CoT串起來疊加
這就是為什麼有些問題o1表現更鬼扯
至於9.9和9.11的問題在於LLM的全名是
arge language model
Large language model
它處理的最小單位是語言中的單字token
不是設計用來處理數字的
他就不會推理啊
他就不是拿來問數學的....
根本是你問錯方式 誰知道你問的是日
期 版本號 還是數值?期待AI通靈?
9.9跟9.11這數學問題討論很多次吧...我還測
試了一下大部分的AI,GPT4o剛開始還會跟你
硬拗不認錯
喔好像只有gemini答對是不是?
沒有背景知識能力使用generative a
i 幫助有限
有沒有可能ai的推論才是真的
開始虎爛不認錯後,信任度下降就慘了XD
我是叫他再想想就正確了
表達能力有問題嫌工具爛
51
首Po原文網址:軟體工程師Roger 以下文章由Claude 生成 各位鄉民們注意了OpenAI 的新模型 o1-preview 剛剛參加了 2021 年指考數學甲,成績簡17
看來很多推文的人還不太了解AI有多可怕 一直聽曲博在那胡說八道 gpt4o以前的版本 是所謂的生成式ai 給定大量資料 他就會從資料找規則 並建立模型 有了模型就能預測答案 以上講了落落長 簡潔回答 那就是gpt4o版本以前 採用「歸納法」思考1
一點也不可怕啦,Ai 考試很厲害,但是能考過這關嗎? 如果讓 Ai 判這個案子 像是某 A 因為 B 說 A 的論文抄襲,告 A 誹謗, A 有教授說沒抄襲的信 然後 B 告 A 誣告, 結果這邊 Ai 會判無罪 但是實際上是法官判有罪,Ai 就大錯特錯2
AI考試沒什麼用處 有本事就畢業後去台G輪班,顧24小時比較實在 不然就考上醫科,畢業後去外科動手術,因為他自己就是AI機器人 剛好達文西手臂的自費還可以幫我們省下來 如果AI可以做到這樣,再來說嘴吧。1
用AI模型考試,不就是open book在考試嗎?雖然open book 不等於能考高分,但是認真 準備考試後,能open book查資料,自然能考更高的分數。 --3
先不要急 今年的論文 幾位大佬說LLM無法達到AGI 所以你各位不用擔心 AI幹掉你應該還會很久 你該擔心的是你同事1
AI不只可以考試,現在AI甚至可以當科學家, 會自己訂研究題目、實驗、寫成論文再自己審查。 看看這篇文章: -- AI 自己寫論文、自己審查?日本 Sakana AI 推出「AI 科學家」3
google在20年前就已經把很多冤枉路簡化 單純尋求問題答案的話 可以在極短的時間內得知 上一代要去圖書館翻書翻論文找答案 你用google找X
不奇怪啊,現在的教育就是填鴨式,逼學生考試考試考試,掌權的上位教育者自己不願去 面對不願改革,只會在那邊緊張「哇~~電腦超過人腦」 外國怎麼教學生的,誘導、想像、思考、批判 舉例,法國怎麼培養地質教育,帶你去爬山,摸那片岩石,試著想像它是怎麼形成的,請 你表現出來
46
[爆卦] 比爾蓋茲:AI的時代已經開始了原文出處 The Age of AI has begun Artificial intelligence is as revolutionary as mobile phones and the Internet. By Bill Gates | March 21, 202323
[問卦] CHATGPT 已經可以考上中國大陸的大學了?CHATGPT 已經可以考上中國大陸的大學了? ChatGPT參加北京高考,能考上哪個大學?你能比它分數更高嗎? 李永樂老師用ChatGPT參加2022北京高考 因為ChatGPT眾所周知資料只有到2021 而且不會上網找答案 所以可以確定ChatGPT不可能做過那些題目。9
openAI發明的chatGPT太強大了吧由矽谷公司openAL開發的chatGPT語言模型,能使用自然語言來回答人類問題 先上圖6
[問卦] AI只是依據大數據回答而已啊!如題啦! 比如什麼gtp 還是gpt的 我問他問題 他根本就只是從google搜尋答案來回答我的問題 而且很多都答的不精準 不完整5
[問卦] OpenAI o1可以考上台灣司法官嗎開放AI新模型o1 聽說在各方面都贏過gpt4 有博士生等級 那它可以考得上台灣的司法官嗎? 會怎麼處理弊案
爆
[問卦] 笑死 邰智源這麼嗆喔56
[問卦] 有人發現中國團隊運動都超爛!70
[問卦] 這晚餐210元你可以嗎?☺63
[問卦] 林昱珉:小國(台灣)也能成為世界冠軍61
[問卦] 台灣複姓還真的都是姓疊加 有很帥的嗎42
[問卦] 民視一直報導棒球冠軍44
[問卦] 找一部保鑣跟女主談戀愛的電影?38
[問卦] 中華隊也能有酷酷的外號了嗎?40
[問卦] 找一部當兵一直重來的片75
[問卦] 幹你娘為什麼雲端發票又沒中???78
[問卦] 日本s級投手這麼多 昨天怎不早換?爆
[問卦] 雲端中獎號碼36
[問卦] 李連杰從影多年的醜聞只有利智嗎?27
[問卦] 這次接機LIVE怎麼亂七八糟?91
[問卦] 幹 122張發票都沒中68
[問卦] CT可以改成Chinese Taiwan嗎?90
[爆卦] 中華男籃 64 : 81 紐西蘭24
[問卦] 台男173還算半殘嗎?25
[問卦] 財政部今天會有人中發票嗎?17
[問卦] 棒球板是政黑二板嗎?20
[問卦] F-16V放熱焰彈迎棒球英雄回國?16
[問卦] 澤倫斯基越來越像蔣介石了?20
[問卦] 做什麼事找包手8+9就對了?26
[問卦] 為何很多人不推薦買D-Link的路由器?58
[問卦] 有台女在北車開放做愛19
Re: [新聞] 任命拍馬屁的洪申翰接部長 媒體人解讀賴19
[問卦] 台灣有王建民真的很幸福吧19
[問卦] 日本網友:他們已有赴死的準備10
[問卦] 我相信ptt結果變成是白癡小丑11
[問卦] 刺青很普遍為什麼還要特別放大