Re: [問卦] DeepSeek怎突然沒人用了
其實現在差距不是在DS不好
而是LLM本身的上限差不多就到這了
ChatGPT已經不是單純語言模型在為你服務
他背後已經是多個模型協作的Agent
在搭配各種工具使用
你問一個問題
他會去翻查一大堆資料
最終給予較佳的回覆
同樣的做法中國能辦到嗎?
答案是可以的
但為啥現在效果這麼糟
單純就是因為算力太過受限
如果能買到輝達最新的GPU那結果可能就不一樣了
現在對岸想要搞國產晶片禁用輝達
最後就是陪葬整個AI產業
對面現在AI研發能力是真的超強 DS Qwen Kimi Zai都很猛
只能說可惜惹
--
※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 202.39.243.162 (臺灣)
※ PTT 網址
→
但我感覺對岸檯面下NV卡買爽爽...
→
算力問題中國似乎先搞應用落地,花里胡哨
→
燒錢的服務暫後。大不了借國外算力小玩一
→
下。最終算力成本會落到每個使用者身上,
→
再來看多少人會買單
→
中國說要用國產晶片 這會被拉開差距
推
主打一個長痛不如短痛啦
那這個短痛真的會很痛 以AI從業人員的心態 如果算力不足 對她來說就會是不停的想 "好想有更多算力" 最後優秀的人才就會出走 半導體自主有國安必要 但應該與通行輝達晶片不衝突 畢竟中共應該是能有強制力要求企業把華為晶片買完的
推
DS的MoE就是為了節省算力 很客家的
能節省的有限 結果就是像現在這樣比不過GPT5 如果你要讓DS收到問題後去查詢大量資料再輸出 那就算是DS也是需要消耗大量算力
※ 編輯: TameFoxx (202.39.243.162 臺灣), 10/15/2025 15:28:47→
你不禁用輝達,美國也只賣你垃圾晶片
川普後來態度其實有軟化 他說要賣比最新晶片降50%效能的給中國 NV最新Blackwell的晶片就算砍50%也是超可怕 就看中國能不能在這次談判談出點東西
※ 編輯: TameFoxx (202.39.243.162 臺灣), 10/15/2025 15:54:01爆
Re: [新聞] 輝達H100晶片紓壓了 訂單大戶開始轉售你劃錯重點, 先不論這篇論文的可行性與實用性, 你真的劃錯重點了 算力重要嗎? 重要但是不是影響販售/採購晶片的主因,![Re: [新聞] 輝達H100晶片紓壓了 訂單大戶開始轉售 Re: [新聞] 輝達H100晶片紓壓了 訂單大戶開始轉售](https://i.imgur.com/GxJuHEib.jpeg)
87
[情報] 產生式 AI 大爆發 NVIDIA GPU 恐供不應求生成式 AI 大爆發,NVIDIA GPU 恐供不應求 來源 微軟 Bing 搜尋引擎整合 ChatGPT,加上其他生成式 AI 工具的需求攀升 都相當依賴人工智慧處理能力,正是 NVIDIA GPU 優勢所在 當科技公司利用 NVIDIA GPU 滿足增長的 AI 需求![[情報] 產生式 AI 大爆發 NVIDIA GPU 恐供不應求 [情報] 產生式 AI 大爆發 NVIDIA GPU 恐供不應求](https://img.youtube.com/vi/0dmzRwvObaE/mqdefault.jpg)
79
Re: R: [請益] 為什麼中國越來越強?怎抹這邊突然變AI版 =_= DeepSeek 有件事情幹得比矽谷好 就是AI Backend 優化(這玩意就是需要懂架構 和軟體 就是一個苦力枯燥活) 大體而言 在A100架構以前 大部分訓練都還是用fp32 少數模型對精度不敏感會用到fp16 (浮點16進位)主因是用16進位去訓練 精度不夠 容易模型崩潰 尤其用P100的fp1654
Re: [新聞] 市值蒸發19.7兆!輝達聲明:DeepSeek未Deepseek用更多輝達晶片有兩條路 第一、用更多H100,輝達跟這個ai產業鏈股價崩盤, 現在市場給輝達跟Ai產業鏈的股價是基於必須生產更高階的晶片, 如果Deepseek證明大型ai模型只需要H100等級的晶片就足夠, 那市場還會買單gb200、gb300甚至輝達說一年隔代一款ai伺服器的構想嗎?![Re: [新聞] 市值蒸發19.7兆!輝達聲明:DeepSeek未 Re: [新聞] 市值蒸發19.7兆!輝達聲明:DeepSeek未](https://i.imgur.com/N5n7y8Ob.jpeg)
15
Re: [新聞] 跳過 CUDA,Deepseek 用精細的 PTX 寫成《轉載》 網路上傳deepseek繞過了輝達cuda,我跟大家講一下deepseek到底做了什麼。 輝達嚴格來說是一個平台性公司,並不止是硬件,硬件只不過是一個載體,它的護城河是cuda計算平台,所有高性能並行計算的祖師爺,只要你用輝達的顯卡做高性能計算,就要透過cuda計算平台。 你說用AMD的顯示卡,嗨,它沒有生態呀,就像android和windows phone那麼大的差別。 你買蘋果手機,不是買的硬體,而是IOS整個生態,這個生態也是用戶黏性的核心,cuda也是如此,你搞高效能運算,週邊的配套生態工具都是cuda的,你總不能自己再開發一套出來,就像你一個開發電商的會去再造個JAVA的輪子嗎? 輝達打來十年的領先時間。 所以各大公司都被英偉達狂宰,有苦難言。 總之一句話,英偉達創造了當代高效能運算的所有標準軟體、硬體以及工俱生態,你想寫個demo用啥都行,你想上生產除了輝達別無選擇,這就是過去十年AI圈的現實 ,天下苦達子久矣。12
Re: [討論] 其實Deepseek真的很厲害了DeepSeek可以下載到自己電腦跑、ChatGPT不行, 這在商業使用的場景上就有蠻大的差異 昨天很多人在傳說用(線上版)的DeepSeek會把資料傳給中國,這當然是對的, 但過去一兩年我們幫客戶評估AI專案時, 在串GPT-API上常常會碰到我們或我們的客戶其實也不想把資料傳給OpenAI,4
Re: [新聞] 路透:美國暗裝追蹤器查AI晶片非法轉運《經濟通通訊社14日專訊》據英國《金融時報》報道,中國人工智能公司DeepSeek在使用華 為芯片訓練失敗後推遲發布新AI模型DeepSeek-R2,這凸顯了北京方面推動取代美國技術的局 限性。 綜合市場報道,DeepSeek-R2大模型原定5月推出,其後再傳將於8月15日至30日期間發布,惟接3
Re: [新聞] 雷蒙多態度髮夾彎 允輝達向中國出售AI晶這是最近幾天TSLA那邊AI晶片訊息 現在看來就是NVDA+AMD會繼續有機會在AI晶片市場拉一波 最近另外一個比較紅的新聞是 Mistral AI小公司開發的LLM模型吸引不少人 而Misral AI是用CoreWeave租借算力 開發出來的大模型 這些小公司能靠租算力媲美大公司發展的模型![Re: [新聞] 雷蒙多態度髮夾彎 允輝達向中國出售AI晶 Re: [新聞] 雷蒙多態度髮夾彎 允輝達向中國出售AI晶](https://img.technews.tw/wp-content/uploads/2023/12/11095228/Ganesh-Venkataramanan-.jpg)
[討論] Deepseek 指出了AI發展的方向Deepseek 指出了另一種輕資本高效率的AI運作模式,有助於 AI提供者的價格, 與上層AI服務的價格,但是對於AI底層建設,如GPU、晶片的需求卻可能減少。 中國是最沒有辦法從Deepseek獲利的國家,因為他們太怕 自己的AI服務失去 控制,誘導民眾民主自由,更怕AI模式被教壞,這跟中國的牆思維本質是違背 的。![[討論] Deepseek 指出了AI發展的方向 [討論] Deepseek 指出了AI發展的方向](https://i.imgur.com/UDLWl2Gb.jpeg)
X
Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據你發這種文章 大陸人就知道這裡是井蛙版了 : 別別這種蒸鰡效果是基於原有資料的基礎上加工 : 如果原本的資料無法回答的問題 : 蒸鰡出來的結果也不可能![Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據 Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據](https://i.imgur.com/Hq1Xx9mb.jpeg)