Re: [新聞] DeepSeek爆紅引熱議 傳偷用5萬顆輝達H10
"世界一開源 中國就領先"
這是一句最近流傳的諺語~~~
之前中國嘴砲7奈米量產 結果一開蓋 發現是TSMC like的製程 多重曝光
現在要驗證 deepseek是否真的是便宜成本就可以訓練好
只要請deepseek 公佈模型架構 不要提供完整訓練好的模型
然後用2000顆 GPU 使用 o4的資料去訓練看看
大概估計一下 就知道嘴不嘴砲
※ 引述《boards (GOLD)》之銘言:
: DeepSeek爆紅引熱議 傳偷用5萬顆輝達H100晶片
: ETtoday新聞雲
: 2025-01-27 15:28
: ▲▼NVIDIA創辦人兼執行長黃仁勳。(圖/記者高兆麟攝)
: 記者廖婕妤/台北報導
: 中國AI大模型深度求索「DeepSeek」近期先後推出DeepSeek-V3、DeepSeek-R1兩款開源大: 型語言模型(LLM),據說性能與OpenAI的o1相當,引發科技圈熱議及恐慌;但知情人士: 透露,DeepSeek偷用輝達5萬顆H100晶片,疑似是透過走私的方式非法取得。
: 根據外媒報導,美國AI新創公司Scale AI創辦人Alexandr Wang透露,DeepSeek偷用5萬顆: 輝達H100晶片,但這些晶片早在拜登執政時就被管制,根本無法出口給中國的公司。
: 輝達的GPU是世界上最受歡迎的產品之一,由於其潛力無窮,因此相關產品出口也受到美: 國政府監管;輝達的Hopper GPU系列包括H100和H200,都是世界上使用最廣泛的GPU之一: 。
: 外媒指出,中國實驗室擁有的H100比人們想像的還要多,且據悉DeepSeek 擁有大約5萬台: H100;但這顯然不能公開談論,因為這違反美國實施的出口管制,不過中國人可能會發現: 很難採購額外的晶片,但從長遠來看,他們也將受到現有的晶片管制和出口管制的限制。: https://reurl.cc/ge3Q4R
--
嘉摳憐 自己打啥大概也不知道
阿真的就七奈米啊 用它們的DUV啊
你不懂就不懂 千萬別裝懂
你是不是文科生
你不懂真的就閉嘴吧
台派智商?
網軍現在統一口徑是一碰質疑就是:
你是不是文科生? 真可笑 搞不好
網軍本人也是文科生呢
臺灣好像比較常用文組 理組耶
哇 祖克柏都比你還害怕耶
五毛過年都不用休息喔??? 可愛
二樓啊 是TSMC的7奈米 還是牠們?
看一下Reddit跟X別活在自己的世界
跟綠友友談邏輯? 我看你是醉了
Reddit 上已經有人用AMD 的mi300來
跑了
黨叫你don’t look up 嗎?
台灣產業真的會被無腦反中的意識形
態搞爛…
這版被無腦反美搞爛
感覺是塔綠班的智商
無腦反中舔美 意識形態 台積電的最
愛 可以去了
我自己也是傾向讓子彈飛一會兒,畢
竟中國的Credits 有點低XD
文組?
dont look up, 這些台派智障比大陸
人還可憐,人家大陸被管控網路媒體
無法選擇,我們可以自由選擇,而這
些台派智障選擇被黨洗腦,真的是下
夕下井,腦殘無藥醫
這版從來沒有反美喔 只是政黑柵欄
仔看到客觀評論中國表現 沒有無腦
反中就崩潰 抹人搬去對岸
天天都在疑中卻認為不能疑美? 國
際政治面前人人為己還自創疑美論貼
國人標籤 真是讓人直搖頭 美國公民
都還知道監督政府 台灣一堆人去當
神在拜
加油啦 支那
井蛙真的可悲;)
跪舔仔加油好嗎
爆
Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預teamblind 匿名的可能有人不信 與其聽匿名、鄉民互吹/貶 不如來聽聽 Meta 現任 CEO Mark Zuckerberg 本人對於 Deepseek AI 模型的看法 2025/01/11 Mark Zuckerberg 接受美國知名喜劇演員 Joe Rogan 專訪 截至今日有 840 萬人看過這個影片爆
[情報] AMD 興奮宣布 Instinct MI300X GPUs 支援 DeepSeek-V3標題: AMD Instinct GPUs Power DeepSeek-V3: Revolutionizing AI Development with SGLang 來源: AMD's X (Twitter) 網址:6
[爆卦] 尷尬 支那大模型Deepseek v3自稱chatgpt支那AI公司DeepSeek三天前推出DeepSeek-V3 該公司公布的性能可匹敵GPT-4o以及Claude-3.5-Sonnet DeepSeek-V3用2個月訓練2048個GPU只花588萬美元 遠低於GPT-4o約1億美元 粉紅五毛藉此嘲諷美帝封鎖高階晶片也無法阻止支那AI6
Re: [請益] Deepseek v3 對台積電有影響嗎我覺得評比指標什麼都是後話 使用體驗太差 你看看這樣怎麼稱霸世界呢? 你的進線參數與資料量就比別人少了,6
Re: [問卦] Deepseek到底好不好用?財經知識美少女Emmy在她的粉專說 deepseek一定是造假 中國人喜歡說謊 不可能用這麼低的成本跟算力來訓練模型 真是天資聰穎又美麗的知識少女4
[問卦]DeepSeek是不是台積電的救世主?[問卦] DeepSeek是不是台積電的救世主? 最近看到DeepSeek在那邊吹什麼MLA架構、MoE模型,說什麼訓練效率超高、推理速度超快 ,笑死,還不是靠台積電的5nm、3nm製程在撐?沒了GG的晶片,你這些所謂的「創新」還 能跑得動? DeepSeek這種吃硬體怪獸,光是訓練一個模型就要幾萬顆A100、H100,這些GPU還不都是1
[問卦] 老黃飛去北京 是否就是為了運鈔?DeepSeek爆紅引熱議 傳偷用5萬顆輝達H100晶片 為了規避美國的管制 貨款肯定不能用一般匯款 細思極恐就能聯想到 難怪老黃要專程飛趟北京 是不是就是為了運鈔 畢竟專機可避開海關檢查 只是養虎為患賺短期 長期被撮破AI高價的泡沫1
Re: [問卦] deepseek會刺破ai泡沫嗎?不會 其實在美國 大家還巴不得有這種突破出現 2024年的AI還是在同一個transformer架構下堆料 拿更多東西訓練 真實世界沒有的拿合成的資料練 如果有一個更有效率的架構/模型 假設你拿五千張H100就能做出Deepseek R1 那些有十萬張的公司就能搞出更屌的東西1
Re: [新聞] 成本低廉 中國AI初創DeepSeek震撼矽谷前文恕刪 : 據報導,DeepSeek僅用2048片H800顯示卡 (GPU)、耗時兩個月,就訓練出了一個6710億參 : 數的DeepSeek-V3。相較於Meta訓練參數量4050億的Llama 3,用了1萬6384片更強的H100 : 顯示卡,花了54天。DeepSeek的訓練效率提升了11倍。 這比法很不公平- 各位科技業的專家們 Deepseek 目前是不是在當機? 無法使用了? 重裝 更新都無法登入 請問這是硬體問體嗎? 官方剛剛說太多人使用伺服器爆了