Re: [新聞] ChatGPT-5波折超乎想象!奧特曼急回應:
放大假閒來無事
正好一堆AI公司推新品
無職碼農就再來測試測試
半年前DS之亂時
測過讓各家AI寫一個註冊頁
現在我把同樣提示詞再讓各家AI做一次
看看有多少進步
Gemini 2.5 pro:
https://thelonesomeera.com/signuptest/gemini.html
ChatGPT 5 thinking:
https://thelonesomeera.com/signuptest/chatgpt.html
Claude sonnet 4:
https://thelonesomeera.com/signuptest/claude.html
Grok 4 Heavy:
https://thelonesomeera.com/signuptest/grok.html
Deepseek R1:
https://thelonesomeera.com/signuptest/deepseek.html
Qwen:
https://thelonesomeera.com/signuptest/qwen.html
以上提示詞都完全一樣
各家表現大差不差
但多多少少都有些小bug
這部份就算大家都進步到差不多的程度
既然過了半年
那就要有相對應更進階的測試 對吧?
所以這次追加了以下提示詞
「請使用 HTML 前端技術
製作一個模擬太陽系的網頁
相關程式請集中在一個 html 檔案」
Gemini 2.5 pro:
https://thelonesomeera.com/solarsystem/gemini.html
ChatGPT 5 thinking:
https://thelonesomeera.com/solarsystem/chatgpt.html
Claude sonnet 4:
https://thelonesomeera.com/solarsystem/claude.html
Grok 4 Heavy:
https://thelonesomeera.com/solarsystem/grok.html
Deepseek R1:
https://thelonesomeera.com/solarsystem/deepseek.html
Qwen:
https://thelonesomeera.com/solarsystem/qwen.html
喔喔喔
這個需求就蠻有鑑別度了
大家可以自己比較一下呵呵
方便瀏覽的集成頁:
https://thelonesomeera.com/ai-hub.html
最後是股點
這樣測下來
有點讓我想出掉狗家股票勒
狗狗
加油
好唄?
嗯.....
備註:
以上網頁完全沒有寫到任何一行程式碼
全都是複製貼上
應該說我連看都沒看...
--
狗家在幹嘛笑死
QQ 好強 大大
碼農吃飽太閒而已 不強 QQ
※ 編輯: strlen (1.160.12.18 臺灣), 08/10/2025 15:19:27狗家還以為是太陽要把大家吃掉XD
好強,謝謝,好險上週沒有加碼googl
或說各家各有擅長
前陣子西洋棋大賽 狗狗被grok幹掉了QQ
我覺得辦比賽一定是未來AI的看點之一
問題就是要辦什麼比賽了
Ani跳啦啦隊大賽
臭谷狗就是噓而已沒啥好說了,比柵欄仔還不如
哥 狗我也有持骨齁...
GPT的還是最完整 軌道可以縮放 只是太陽大小不會變
軌道縮太小會像是類地行星都被太陽包覆
GPTc96u.3
GPT還有時間 冥王星勾選
能用GPT>Claude 堪用DS>Grok 不能用Qwen>Gemini
我看到的Qwen永遠九星連珠
棋類完全資訊遊戲都有先手優勢,不讓子或雙循環根
本不準
就出一題而已
到時候Google又有更強模型出來,然後配他的全家桶
你只能哭在路邊
用同一個prompt不一定是個好主意 能看看具體的promp
t嗎
只有GPT軌道稍微正確 其他的九軌道都等距 不合理
我現在用Cloude
Gemini2.5pro你是用AI Studio的還是Gemini版的?
一直撞一直爽
我用你的prompt 太陽系不會錯成那樣
窩只能說寫Code,Gemini 就是一坨
可是notebooklm很好用耶
Gemini強項就不在coding
這種題目沒有辦法體現Gemini 2.5 Pro 1M上下文優勢
等到你的專案足夠複雜, 足夠大, 其他模型如同不停
失憶的新人, 必須反覆閱讀技術文檔, 你就知道差距了
有限空間解的問題測試才能知道基本推理能力的強弱
這種問題等於考99x99乘法表來考驗哈佛,劍橋,史丹佛
數學博士生的數學能力. 除了顯示誰99x99乘法表背得
熟以外, 跟數學能力根本無關
Gemini 畫圖很不錯 其他爛爛的
很有趣耶 讓我想試做看看托勒密的地心說模型
寫程式不要用google
沒有冥王星嗎
Gemini真的很搞
Gemini喔,去 reddit 找一堆崩潰圖,還會給你刪 co
de 呵呵
之前用它還直接給我 git reset --hard,幹
Gemini 適合做大量重複無聊的工作,比如說提取超長
文中出現多次,不同但有一定特徵的資料
這種用GPT 都會偷懶,找個三四個就開始瞎掰
用在研究上把亂七八糟raw data轉換成表格還行,這種
超無聊的工作用GPT從來沒弄好過
你把題目換成解微積分給他pdf 考古題,最強可能就
變成pro2.5了
其他家可能解兩題就開始像上面講的偷懶不解了
然後gpt5 現在糟糕到吃不進去非文字解析pdf 其他家
都可,就知道出多大包了
12
[問卦] 各位都怎麼註冊DeepSeek?各位都怎麼註冊DeepSeek? 剛剛刷到DeepSeek除了成本極低 ,在高難度提示詞、代碼和數學等技術性極強的領域,DeepSeek- R1 拔得頭籌,位列第一 。 想要注冊DeepSeek玩玩看![[問卦] 各位都怎麼註冊DeepSeek? [問卦] 各位都怎麼註冊DeepSeek?](https://i.imgur.com/hcoetVOb.jpg)
7
Re: [問卦] deepseek強在哪裡我已從付費版本claude 轉到deepseek 了 首先我最重要的核心需求是寫程式 deepseek可以一次上傳超過五個檔案,claude 是5個,然後我要用一個檔案當提示詞所以是4個,然後claude 如果問太長次數用很快,我也不知道他怎算的, 一個程式專案很少小於五個檔案 反之deepseek 用起來真的好用,有類似你去買淘寶那邊客服秒回服務又好的感覺8
[問卦] 哪個AI才是霸主?該儲值哪個Pro如題啦 二兵準備玩看看最近很好用的AI,目前大概聽過六個 ChatGPT: 最資深,樣樣精通但也樣樣不通 Claude : 最有責任感常常拒絕,邏輯跟敘事都不錯 Grok : 非常狂野跟她老闆一樣,可以色色6
[情報] Claude 3.5 Sonnet新增操作電腦能力Claude 3.5 Sonnet大升級!新功能「電腦操作」可解放雙手,能代訂機票的AI秘書不遠 了? 數位時代 AI新創公司Anthropic於10月22日發布升級版Claude 3.5 Sonnet,以及全新模型Claude![[情報] Claude 3.5 Sonnet新增操作電腦能力 [情報] Claude 3.5 Sonnet新增操作電腦能力](https://s4.itho.me/sites/default/files/field/image/1023-computer_usebeta-claude_3.5_sonnet_model_upgraded.jpg)
3
[問卦] deepseek 沒辦法執行程式碼玩了一下deepseek 發現不能自省以外 連ChatGPT 4會的執行程式碼 deepseek 也是不行的 請他說“哈哈哈”一百次![[問卦] deepseek 沒辦法執行程式碼 [問卦] deepseek 沒辦法執行程式碼](https://i.ytimg.com/vi/AVIKFXLCPY8/hqdefault.jpg?sqp=-oaymwEXCOADEI4CSFryq4qpAwkIARUAAIhCGAE=&rs=AOn4CLDuFYN7ph85tMAC7yQeO-DQZUs__w&days_since_epoch=20115)
4
[問卦] Qwen沒有上限使用量嗎南無阿彌陀佛 最近AI大亂鬥 光是可以白嫖的就有 chatGPT grok claude 顏色不對的有3
[討論] 吹deepseek的有用過嗎?工作關係我應該算是跟AI聊天的中度使用者 每天都會聊上百句 真的有人使用過deepseek嗎 我都問沒幾句他就掛了... 無論是chatGPT Gemini Claude 或是最新的grok 33
Re: [問卦] 哪個免費AI,比較好用呢南無阿彌陀佛 有正常付費的都是直接claude + cursor 沒毛病 免費仔我都開一排 chatGPT grok claude qwen deepseek gemini(免費版)不在賽道上直接忽略2
Re: [問卦] chatgpt付費版和其他AI都幾Gemini 2.5 pro: 用Gemini整理宏觀知識,用GPT/o1系列進行深度解題,再用Wolfram|Alpha確保計算精準 GPT4.5: GPT-4 負責系統化與推理,Gemini 搜題與找圖解影片,Claude 幫你做筆記與複習大綱 Claude:
Re: [閒聊] 從網絡讀者心理看待“大中國思想”我拿了這段話去餵了ai聊天機器人 : 現在的讀者特點如下: : 1.沒耐心,你花大力氣寫景寫主角心境,就算是花幾百字寫一頓吃食,他們會駡你水字數 : ,他們只想推地圖。 : 2.不能對敵人心軟,屠美滅日要心狠,只要你在文中出現一絲絲對方不全是壞人,也有好
爆
Re: [心得] 山椒魚盤勢觀察![Re: [心得] 山椒魚盤勢觀察 Re: [心得] 山椒魚盤勢觀察](https://i.mopix.cc/LLOj00.jpg)
爆
[請益] 0056可以這樣操作嗎![[請益] 0056可以這樣操作嗎 [請益] 0056可以這樣操作嗎](https://i.imgur.com/z8X13Bfb.jpg)
96
[情報] 114年12月05日 三大法人買賣金額統計表![[情報] 114年12月05日 三大法人買賣金額統計表 [情報] 114年12月05日 三大法人買賣金額統計表](https://i.imgur.com/roBWXt2b.png)
67
[情報] 台灣2025年11月份CPI 1.23%![[情報] 台灣2025年11月份CPI 1.23% [情報] 台灣2025年11月份CPI 1.23%](https://i.imgur.com/pLLp0M0b.jpeg)
85
[情報] 2317 鴻海 2025年11月營收69
[情報] 2344 華邦電 114年11月營收![[情報] 2344 華邦電 114年11月營收 [情報] 2344 華邦電 114年11月營收](https://i.mopix.cc/JF4BB2.jpg)
58
[情報] 00631L 預估分割17倍決議表決![[情報] 00631L 預估分割17倍決議表決 [情報] 00631L 預估分割17倍決議表決](https://imgpoi.com/i/6GBH1D.jpg)
55
[情報] 1205 上市外資買賣超排行![[情報] 1205 上市外資買賣超排行 [情報] 1205 上市外資買賣超排行](https://i.imgur.com/cvoXoMub.jpeg)
48
[請益] 說AI會跟.com一樣泡沫化是假議題吧?![[請益] 說AI會跟.com一樣泡沫化是假議題吧? [請益] 說AI會跟.com一樣泡沫化是假議題吧?](https://img.youtube.com/vi/e0CJBzGa0hQ/mqdefault.jpg)
56
Re: [新聞] OpenAI危險了!DeepSeek正式發佈V3.2 性![Re: [新聞] OpenAI危險了!DeepSeek正式發佈V3.2 性 Re: [新聞] OpenAI危險了!DeepSeek正式發佈V3.2 性](https://img.youtube.com/vi/H_suOWdYLq0/mqdefault.jpg)
33
Re: [心得] 周冠男:珍愛生命,遠離高股息![Re: [心得] 周冠男:珍愛生命,遠離高股息 Re: [心得] 周冠男:珍愛生命,遠離高股息](https://i.imgur.com/QUlaRGZb.jpg)
32
[情報] 0050、0056等成分股調整31
[情報] 3443 創意 11月營收31
Re: [請益] 0056可以這樣操作嗎![Re: [請益] 0056可以這樣操作嗎 Re: [請益] 0056可以這樣操作嗎](https://i.imgur.com/QUlaRGZb.jpg)
38
Re: [新聞] 川普希望美國製造全球5成晶片 賴清德紐![Re: [新聞] 川普希望美國製造全球5成晶片 賴清德紐 Re: [新聞] 川普希望美國製造全球5成晶片 賴清德紐](https://i.imgur.com/maDWxU7b.jpg)
16
Re: [新聞] Fed主席大熱門哈塞特表態:下周應降息 預20
Re: [心得] 周冠男:珍愛生命,遠離高股息![Re: [心得] 周冠男:珍愛生命,遠離高股息 Re: [心得] 周冠男:珍愛生命,遠離高股息](https://i.imgur.com/5f96blgb.gif)
18
[請益] 第一金最近有什麼大事要發生嗎?![[請益] 第一金最近有什麼大事要發生嗎? [請益] 第一金最近有什麼大事要發生嗎?](https://i.mopix.cc/vMDTOu.jpg)
15
[情報] 2383 台光電 11月營收15
Re: [標的] 記憶體族群回檔 彎腰撿鑽石多![Re: [標的] 記憶體族群回檔 彎腰撿鑽石多 Re: [標的] 記憶體族群回檔 彎腰撿鑽石多](https://i.imgur.com/MO9jzZjb.gif)
14
[情報] 日本兩年期公債收益率升至1.03%11
[情報] 1205 上市投信買賣超排行8
[情報] 2885 元大金 11月自結 0.24 累計 2.509
Re: [請益] 說AI會跟.com一樣泡沫化是假議題吧?![Re: [請益] 說AI會跟.com一樣泡沫化是假議題吧? Re: [請益] 說AI會跟.com一樣泡沫化是假議題吧?](https://img.youtube.com/vi/XwG3w4jL0wM/mqdefault.jpg)
7
[情報] 2548 華固 10月營收 MoM 702% YoY 37447%![[情報] 2548 華固 10月營收 MoM 702% YoY 37447% [情報] 2548 華固 10月營收 MoM 702% YoY 37447%](https://i.meee.com.tw/gQ7aplg.png)
8
[情報] 2498 宏達電 114年11月營收8
Re: [情報] 2317 鴻海 2025年11月營收7
[情報] 2891 中信金 11月自結 0.36 累計 3.766
[情報] 2545 皇翔 買台積電 210張,均價:1469.417
[情報] 3167 大量 114年11月營收