Re: [心得] 蘋果揭露人工智能並不思考
首先啦,在公眾對於AI發展的看法,有個很有趣的現象。
就是只要AI會做了某件任務,就會直接說,這不需要"思考"。
譬如AI在二十幾年前打敗西洋棋棋王,後來華生也打敗益智節目的人類冠軍。
人們直覺反應就是這不是思考啦,西洋棋就是暴力算棋譜,益智節目背題庫就好啦。
到了十年前還有人認為AI永遠不可能擊敗人類棋王,因為圍棋不是硬靠算力可以暴力解的。
還需要人的模式辨認與推理能力,而AI不會。
結果嘛,現在變成幾乎每個棋手都要靠AI訓練,還要尊稱AI為老師。
到現在LLM文字接龍因為量變產生質變,開始湧現出各種當初想不到的能力。
譬如翻譯、寫故事、甚至是更高階看起來需要推理的寫程式、在各種限制下規劃行程。
那現在的AI真可以直接說他不會思考thinking嗎?
心理學家把人類的thinking歸類為兩大系統(快思慢想)
系統一(快思): 不需要意識控制,常靠經驗與啟發法(heuristics),
例如九九乘法表的乘法計算、開車時的習慣反應。
通常都是直覺、快速、自動化的"快思"任務。
系統二(慢想): 需要意識控制,用來做邏輯推理、計算、分析與抉擇,
例如解數學方程式或做財務規劃。
通常是需要邏輯、緩慢、且偏代理型的"慢想"任務。
目前LLM這系列的AI湧現出來的能力大都是系統一的快思任務,所以AI當然會thinking。
配合了一些CoT等後訓練技術甚至可以湧現出一些些系統二慢想的任務。
但我猜還是有極限啦,像是要有意識的知道自己搞錯了就需要系統二的能力。
因此LLM常常被人認為是一本正經的胡說八道。
又或者一些代理agent任務,就極需要系統二的規劃能力,
現在的LLM就算使用推理模式,也會因為token預算不足而無法長時間執行。
像是蘋果這篇論文反而展示了LLM會思考的一面,他有許多問題都過於困難。
思考token預算不足,當然就直接放棄,但這不代表AI不會thinking。
只是AI目前的確很難處理非常大的問題,需要新的思考預算控制模式。
這也就是現在AI領域積極想要突破的agent領域。
Apple Intelligence之前Siri就已經很多agent類型任務的展示,也難怪一直生不出來。
連最近推出的通用型agent Manus都做不好了,慢人百步以上的Apple怎麼弄得好?
像是Meta的YanneCun就一直認為現在的LLM是弄不出AGI的,而是需要導入新的世界模型。
假如真的要能讓AI長期執行agent類型等系統二慢想任務,以及機器人能夠長期自主運作。
那這些AI的內心必須錨定一個世界模型,知道自己在這個世界中的狀態與定位。
才能夠調和自己的任務需求與外部的總總限制,而不是卡在死胡同裡。
而且能夠整合自己的工具與感官不斷地調整權重去做學習。
這些都是目前AI都還很欠缺的。若無法突破就很難達成人類等級的AGI。
而這方面能突破,那真的就可以期待AI能直接"取代"人力,達到新的工業革命。
--
台肯
圖靈是神的地方在圖靈測試,不跟你廢話五四三的!
實際上lecun一直在吹的世界模型很多人也在搞 目前
李飛飛的公司和Google 的demo我覺得不錯 倒是lecun
自己的V-JEPA2 沒啥驚艷
我們要先定義思考?? 耍嘴皮
當然要先定義思考,這很重要的
但現在AI確實很容易鬼打牆+唬爛 講了也不聽
因為糾錯與重新規劃算是系統二的能力
我用AI寫程式也是一樣,debug非常困難
其實普通人的思考 也比不上LLM系統的直出回答...
想不到這個非常小的題目 竟然可以討論這麼多篇...
是啊,所以我覺得讓外星人來評估思考能力
大部分的人類群體會被歸類成不會思考的....
像是幣圈就被玩成蠢幣進化論,真是笑死外星人
你說的其實就是我一直以來對這件事情的認知
的確就是快思慢想的概念
快思慢想我熟 一個靠老公亂翻的
你用啥寫啊 我用sonnet 配cursor debug 蠻強的
我現在已經不能沒有他們
靠老公接案 靠學生亂翻 就唬蘭啊
現在除非公司規定,不然應該沒有程式設計師不用AI了
先定義人類思考是什麼
一些執行期才會發生的非重現bug還是要自己trace就是
還有那種元件耦合性錯誤,AI也很難跨那麼遠去抓
新或再優化的AI模型 肯定很多研究者投入
當初Manus不是炒超大的 帳號能賣好價錢 結果ㄏㄏ喔?
是的如haha98所言,其他路線也有人在研究了。
我們需要重新定義蘋果AI的思考
ai現在做不到的是後設認知,直接跳脫內容,回到互動
本身來思考
爆
首Po看到一個影片,非新聞報導,僅創作者想法 討論蘋果揭露關於人工智能當中的最大謊言 之前也看過一個影片指出 AI無法產出指針在10:10以外的手錶![[心得] 蘋果揭露人工智能並不思考 [心得] 蘋果揭露人工智能並不思考](https://p16-sign-va.tiktokcdn.com/tos-maliva-p-0068/o4LfaEAbvSdAleefUAAA4aFxvfTANdCxALQihf~tplv-photomode-video-share-card:1200:630:20.jpeg?dr=14555&refresh_token=e9192c61&x-expires=1781535600&x-signature=Q%2FzWQ3Qk0Uwsbisl4NOj8U%2BEB%2BE%3D&t=4d5b0474&ps=13740610&shp=55bbe6a9&shcp=9dfa7f7f&idc=my2&ftpl=1)
14
目前與論是這篇測試方法有問題... @@ 旁邊吃瓜中 不過作者裡面有Samy Bengio 是AI三巨頭 Yoshua Bengio的弟弟 他們蘋果在去年底之前也發過類似風格一篇 說LLM推里有問題59
大語言模型(LLM)它的原始目的是要「模仿人類回答出人類看得懂的答案。」 但跟人類的語言不同,你我使用的與言語表達會是一系列的文字規則, 例如「主詞,動詞,受詞」的SVO結構。 但模型本身並不是這樣學習的,它是把你看到的字,拆成詞素(token) 然後將這些詞向量化,變成一系列數列:9
這不是常識嗎??? 你用LLM最常看到的不就免責條款 你有沒有想過 為什麼那些免責條款需要存在 僅僅是因為現在技術力不足???![Re: [心得] 蘋果揭露人工智能並不思考 Re: [心得] 蘋果揭露人工智能並不思考](https://i.ibb.co/KxjdpPQS/Screenshot-2025-06-16-05-59-00-273-com-openai-chatgpt.jpg)
26
1. 首先 , 蘋果是最沒資格說話的 先看看蘋果AI的鳥樣 2. 蘋果 : 人工智能不能思考 這句話有很大的問題 現在的AI主流是經由大量資料訓練4
發完原文之後,我嘗試讓gemini模擬自己是嬰兒 一個一歲的嬰兒,他什麼都不懂 然後我把圍棋組放到他眼前,他會做出什麼反應? 首先他用狀聲詞咿咿啊啊搭配敘述構成畫面 我提示他並沒有溫度、軟硬、數量、大小任何概念5
蘋果要讓AI變強當然是難 不然siri早變強了 蘋果要找AI毛病當然是容易的多 其實改進AI的人也常常發現各種毛病 只是不一定會針對毛病作為研究成果發表 發表側重點不一樣罷了1
問題是人類大腦難道就不是這樣思考的嗎? 大腦也是區分語言模組 負責特殊功能的區塊受損 可能導致聽得懂 說不出來 看到懂 卻聽不懂4
我覺得大家對AI要求過多了 設想一個情況 中餐的廚師 他們如何學習廚藝? 答案是21
是這樣的 蘋果這一步棋其實是下對的 只專注在用戶體驗上 從10年前開始 從電動車 元宇宙 到AI
爆
[情報] 50美元訓練出媲美DeepSeek R1標題: 李飛飛團隊用不到50美元訓練出媲美DeepSeek R1的AI推理模型 來源: Futu 網址:![[情報] 50美元訓練出媲美DeepSeek R1 [情報] 50美元訓練出媲美DeepSeek R1](https://i.imgur.com/kFg9GjUb.jpeg)
92
Re: [新聞] 矽谷又拋震撼彈!美國2大科技巨頭同時QQ 很多人都在說AI根本沒獲利 現在AI軍備競賽都只是泡沫 在講真實情況前 先來簡單科普一下genAI這鬼玩意 genAI是自從foundation model這玩意興起後出現的一種顯學 大體而言就是透過用一堆野生資料 去做預訓練(pre-training) 使得這類模型 之後在做下游任務(有答案數據標籤) 可以透過少量資料 去做許多高效能任務![Re: [新聞] 矽谷又拋震撼彈!美國2大科技巨頭同時 Re: [新聞] 矽谷又拋震撼彈!美國2大科技巨頭同時](https://img.youtube.com/vi/xe9BCwD_yVw/mqdefault.jpg)
73
Re: [請益] NVDA跟AMD怎麼突然崩了週末有點時間 之前寫的老黃故事 這幾年AI模型突飛猛進的一個關鍵點就是 泛化的能力 簡言之 2018以前 AI模型 都是透過數據 去學習資料上的標註資料 來做人類事先規範好的目的 而機器透過這些標注數據 去達到人類要求的事情 當模型遇到一個沒看過的數據 或者場景變得不同 模型就會失效 甚至無法處理![Re: [請益] NVDA跟AMD怎麼突然崩了 Re: [請益] NVDA跟AMD怎麼突然崩了](https://img.youtube.com/vi/eMx-2s7mZ24/mqdefault.jpg)
31
Re: [新聞] 美監管機構調查:特斯拉自駕系統存在「週末貢獻我兩分錢意見 竟然有人說waymo要收掉 在自從LLM Agent出現後@@ 機器人領域瘋狂發展 尤其自駕又開始捲起來 在大好戰場線整合戰前 把waymo收掉 @@? (=_= 讓我想起2024 1月 提到業界要把LLM整合自駕 一堆人噴我不懂) 給個時間線29
Re: [討論] OpenAI GPT o1模型OpenAI 最近推出了 GPT-o1,但很多人可能還沒意識到這件事的嚴重性。事實上,OpenAI 已經找到了一條通往 AGI(通用人工智慧)的階梯!這個新模型的關鍵在於,它已經整合了 ToT(思維樹)和 RL(強化學習),在大型語言模型(LLM)領域達到了類似 AlphaGo Zer o 的水準。 很多人以為 LLM 就是個「刷題機器」,記住了大量的資料,所以我們在人類記憶力上輸了![Re: [討論] OpenAI GPT o1模型 Re: [討論] OpenAI GPT o1模型](https://i.ytimg.com/vi/eaAonE58sLU/sddefault.jpg)
17
Re: [請益] 為什麼有人說AI會讓資工人失去工作?先講結論, 後面再從AI原理開始解釋. 1. AI會不會取代人類? 就目前人類技術所產生的AI不會取代人類, 但是不會使用AI的人會被懂AI的人取代. 2. AI極限在哪裡? 他的潛力在哪裡? AI的潛力: 將人類的抽象思考或概念轉換成與讓機械實際執行步驟的介面,![Re: [請益] 為什麼有人說AI會讓資工人失去工作? Re: [請益] 為什麼有人說AI會讓資工人失去工作?](https://i.imgur.com/3677Fwjb.jpeg)
10
Re: [討論] 大家會擔心 ai 寫 code 讓工程師飯碗不解決幻覺,不一定要從LLM解, 而是靠系統架構解。 例如,做一個問答系統,很多人減少幻覺是這樣做的: 0. 預先整理好QA問答資料集 (人工整理,或機器輔助整理)4
[問卦] AI的湧現能力以及人類智慧的起源最近AI很夯 但是大家有沒有想過 其實大型語言模型做的事情就只有一個 就是“文字接龍” 那為什麼文字接龍可以讓AI看起來似乎有了智慧![[問卦] AI的湧現能力以及人類智慧的起源 [問卦] AI的湧現能力以及人類智慧的起源](https://img.youtube.com/vi/iP_7y6n2IFo/mqdefault.jpg)
Re: [請益] 下一波泡沫 會遠比網路泡沫嚴重嗎講一些自身經驗好了 自從AI領域在生成式題材大火後 全世界就進入到AI軍備競賽 所有的AI基礎研究都是以週甚至日為單位在迭代 舉個例子 當年Robert G. Gallager 在1960提出類神經網路的LDPC code到2004年才大放異彩 無限接近shannon bound 光這個演進就花了40年 對照這幾年的AI科技樹發展 根本就是指數在成長![Re: [請益] 下一波泡沫 會遠比網路泡沫嚴重嗎 Re: [請益] 下一波泡沫 會遠比網路泡沫嚴重嗎](https://pic1.zhimg.com/v2-63720ccb03e4a336652f3a0200ca7944_l.jpg?source=172ae18b)
爆
[請益] 0056可以這樣操作嗎![[請益] 0056可以這樣操作嗎 [請益] 0056可以這樣操作嗎](https://i.imgur.com/z8X13Bfb.jpg)
爆
Re: [心得] 山椒魚盤勢觀察![Re: [心得] 山椒魚盤勢觀察 Re: [心得] 山椒魚盤勢觀察](https://i.mopix.cc/LLOj00.jpg)
62
[情報] 114年12月05日 三大法人買賣金額統計表![[情報] 114年12月05日 三大法人買賣金額統計表 [情報] 114年12月05日 三大法人買賣金額統計表](https://i.imgur.com/roBWXt2b.png)
54
[情報] 2344 華邦電 114年11月營收![[情報] 2344 華邦電 114年11月營收 [情報] 2344 華邦電 114年11月營收](https://i.mopix.cc/JF4BB2.jpg)
54
Re: [新聞] OpenAI危險了!DeepSeek正式發佈V3.2 性![Re: [新聞] OpenAI危險了!DeepSeek正式發佈V3.2 性 Re: [新聞] OpenAI危險了!DeepSeek正式發佈V3.2 性](https://img.youtube.com/vi/H_suOWdYLq0/mqdefault.jpg)
38
Re: [新聞] 川普希望美國製造全球5成晶片 賴清德紐![Re: [新聞] 川普希望美國製造全球5成晶片 賴清德紐 Re: [新聞] 川普希望美國製造全球5成晶片 賴清德紐](https://i.imgur.com/maDWxU7b.jpg)
29
[情報] 3443 創意 11月營收16
Re: [新聞] Fed主席大熱門哈塞特表態:下周應降息 預17
[請益] 第一金最近有什麼大事要發生嗎?![[請益] 第一金最近有什麼大事要發生嗎? [請益] 第一金最近有什麼大事要發生嗎?](https://i.mopix.cc/vMDTOu.jpg)
15
Re: [標的] 記憶體族群回檔 彎腰撿鑽石多![Re: [標的] 記憶體族群回檔 彎腰撿鑽石多 Re: [標的] 記憶體族群回檔 彎腰撿鑽石多](https://i.imgur.com/MO9jzZjb.gif)
13
[情報] 日本兩年期公債收益率升至1.03%29
Re: [新聞] OpenAI危險了!DeepSeek正式發佈V3.2 性11
Re: [新聞] OpenAI危險了!DeepSeek正式發佈V3.2 性22
Re: [新聞] 川普希望美國製造全球5成晶片 賴清德紐7
[情報] 2548 華固 10月營收 MoM 702% YoY 37447%![[情報] 2548 華固 10月營收 MoM 702% YoY 37447% [情報] 2548 華固 10月營收 MoM 702% YoY 37447%](https://i.meee.com.tw/gQ7aplg.png)
8
[情報] 1205 上市投信買賣超排行
Re: [請益] 0056可以這樣操作嗎4
Re: [新聞] OpenAI危險了!DeepSeek正式發佈V3.2 性![Re: [新聞] OpenAI危險了!DeepSeek正式發佈V3.2 性 Re: [新聞] OpenAI危險了!DeepSeek正式發佈V3.2 性](https://i.imgur.com/4uwgTa3b.png)
3
[情報] 2383 台光電 11月營收1
Re: 00641R 富邦日本反1 小單多
[情報] 工紙族群多
[標的] 2454聯發科2330台積電 哪個好![[標的] 2454聯發科2330台積電 哪個好 [標的] 2454聯發科2330台積電 哪個好](https://i.imgur.com/TbK5aJcb.jpeg)
Re: [請益] 0056可以這樣操作嗎
[情報] 2317 鴻海 2025年11月營收
[請益] 說AI會跟.com一樣泡沫化是假議題吧?![[請益] 說AI會跟.com一樣泡沫化是假議題吧? [請益] 說AI會跟.com一樣泡沫化是假議題吧?](https://img.youtube.com/vi/e0CJBzGa0hQ/mqdefault.jpg)