Re: [新聞] DeepSeek爆紅引熱議 傳偷用5萬顆輝
各位科技業的專家們
Deepseek 目前是不是在當機? 無法使用了?
重裝 更新都無法登入
請問這是硬體問體嗎?
官方剛剛說太多人使用伺服器爆了
像這種狀況,GPU真的夠? 算力真的夠嗎?
有人目前還能使用deepseek嗎?
※ 引述《boards》之銘言
: DeepSeek爆紅引熱議 傳偷用5萬顆輝達H100晶片
: ETtoday新聞雲
: 2025-01-27 15:28
: ▲▼NVIDIA創辦人兼執行長黃仁勳。(圖/記者高兆麟攝)
: 記者廖婕妤/台北報導
: 中國AI大模型深度求索「DeepSeek」近期先後推出DeepSeek-V3、DeepSeek-R1兩款開源大
: 型語言模型(LLM),據說性能與OpenAI的o1相當,引發科技圈熱議及恐慌;但知情人士: 透露,DeepSeek偷用輝達5萬顆H100晶片,疑似是透過走私的方式非法取得。
: 根據外媒報導,美國AI新創公司Scale AI創辦人Alexandr Wang透露,DeepSeek偷用5萬顆
: 輝達H100晶片,但這些晶片早在拜登執政時就被管制,根本無法出口給中國的公司。
: 輝達的GPU是世界上最受歡迎的產品之一,由於其潛力無窮,因此相關產品出口也受到美: 國政府監管;輝達的Hopper GPU系列包括H100和H200,都是世界上使用最廣泛的GPU之一: 。
: 外媒指出,中國實驗室擁有的H100比人們想像的還要多,且據悉DeepSeek 擁有大約5萬台
: H100;但這顯然不能公開談論,因為這違反美國實施的出口管制,不過中國人可能會發現
: 很難採購額外的晶片,但從長遠來看,他們也將受到現有的晶片管制和出口管制的限制。
: https://reurl.cc/ge3Q4R
----
Sent from BePTT on my iPhone 16
--
通常訓練跟推理的機器應該是分開的
如果本業不是做什麼大流量的服務
伺服器會爆好像不意外?
剛剛看富途推播 好像已經好了
爆
[問卦] 中國有Deepseek 臺灣有什麼?今天有一條震撼消息 中國自己做出了Deepseek 讓科技界跟大數據研究專家都瑟瑟發抖 現在中國遊戲也有搞頭 手機也有搞頭 還有個Deepseek爆
[情報] AMD 興奮宣布 Instinct MI300X GPUs 支援 DeepSeek-V3標題: AMD Instinct GPUs Power DeepSeek-V3: Revolutionizing AI Development with SGLang 來源: AMD's X (Twitter) 網址:53
Re: [心得] DeepSeek對AI產業鏈影響懶人包我看完幾個在討論DeepSeek優缺點的討論影片 最後的結論都是,其實DeepSeek還是有受制於硬體算力的影響,所以能夠記下的容量 不多的嚴重缺點,也就是你只要輸入的資訊多,他的處理能力不足,就得另外再開 新的對話,這個問題就反映出這套語言模型的嚴重缺點就是在算力不足阿。 那些評論者最後的結論就是,DeepSeek如果可以拿到算力不錯的硬體應該可以突破。22
[問卦] deepseek超低成本計算是真的嗎?deepseek賣點就是不堆算力 改進算法用少量算力做出很大的成果 不過有人說是唬爛的 財經網美說deepseek偷偷用了五萬顆H100 光這成本就幾千萬美金了16
[問卦]狂吹DeepSeek結果還是用NV的H100堆出來的?就是阿 版上現在狂吹 DeepSeek 這軟體 結果DeepSeek這軟體 還是用NV輝達的H100晶片堆出來的阿 聽說還用了5萬顆14
Re: [心得] DeepSeek對AI產業鏈影響懶人包先說結論 NV股票還是會漲啦 這十三年來在這大世代裡各個小世代AI進步頂峰幅度對應精確度 總結下來 因為這世代AI是用猜的 如要減少50%的錯誤 就要提升2的20次方算力 也就是Ai要提升一倍精確度 需要100萬倍的算力 這次DeepSeek只是讓這曲線抖動了一下 算是這個小世代AI算力最佳化的巔峰了6
[問卦] 美國AI巨頭的想法哪裡出了問題?大家好 AI需要靠GPU的神經網絡運算 一個GPU裡面有上千個核心 所以CPU要運算好幾天的問題 GPU只要幾個小時就可以算完4
[問卦]DeepSeek是不是台積電的救世主?[問卦] DeepSeek是不是台積電的救世主? 最近看到DeepSeek在那邊吹什麼MLA架構、MoE模型,說什麼訓練效率超高、推理速度超快 ,笑死,還不是靠台積電的5nm、3nm製程在撐?沒了GG的晶片,你這些所謂的「創新」還 能跑得動? DeepSeek這種吃硬體怪獸,光是訓練一個模型就要幾萬顆A100、H100,這些GPU還不都是1
[問卦] 老黃飛去北京 是否就是為了運鈔?DeepSeek爆紅引熱議 傳偷用5萬顆輝達H100晶片 為了規避美國的管制 貨款肯定不能用一般匯款 細思極恐就能聯想到 難怪老黃要專程飛趟北京 是不是就是為了運鈔 畢竟專機可避開海關檢查 只是養虎為患賺短期 長期被撮破AI高價的泡沫1
Re: [新聞] DeepSeek爆紅引AI「股瘟」!ASML歐股開盤DeepSeek 終歸是個軟體... 硬體標竿還是硬體標竿阿 DeepSeek 這軟體用中低階硬體來算出 其他軟體用高階設備的算力