[討論] chatgpt被deepseek幹掉了?
連這個領域,中國人都要染指霸佔了?
是不是要重新思考晶片出貨的對象了?越是抑止中國,中國越是勃發是怎樣?
塔綠班也開始使用deepseek了嗎?
※ 每日發文數上限為5篇,自刪與板主刪除,同樣計入額度 ※
※ 發文 內文請滿40字 ※
------以上看完可使用 Ctrl+y 刪除------
--
※ PTT留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 119.234.16.199 (新加坡)
※ PTT 網址
噓
就以目前中國的實力, 制裁當然會痛
→
但是本來就會走向優化模型訓練所需資源
→
你lag了...
→
本來是要等模型到頂的時候再肝, 現在提早
→
肝出來了, 因為 GPU 不夠
→
不過嘛, 模型本來就會到頂, overfit 暫時
→
也解不掉, 現在還有LLM耍智障的問題
→
低成本弄出堪用的模型比弄個超大的還有利
→
一般企業 70~140B 也就很夠用了
→
真有特殊需求從這個基礎煉一下也還可以
→
再有大量再用商用大模型就好了
→
deepseek好像還是開源的?
→
對, 像 llama grok 不過叫開源怪怪的
→
應該叫開放授權 (有些開放授權仍不能商用
→
中國 AI 公司 DeepSeek 的新 AI 模
→
型自稱為 GPT-4,是抄襲還是幻想?
→
省省吧
41
[請益] Deepseek v3 對台積電有影響嗎om 中國展示了他們的新模型 重點在它極低的成本 好奇這樣是不是代表科技巨頭們不需要這麼多晶片?2X
Re: [請益] Deepseek v3 對台積電有影響嗎2024是韓國經濟20年最差的時間點 但很快人們發現,2024也會是台灣半導體的頂點 成熟製程的後路已經斷了,中國機器狗落地上的的優異表現和deepseek的出現,都是對OPENAI-NV-TSM的重擊 應用優勢不在美方,新的算法改進造成算力需求驟降的風險隨時發生,舊的算法如果固定化NV通用GPU又要受asic的衝擊 sora恬不知恥的商用化,但是顯然沒有任何實質進展,細部動作仍然很難看,但是爲了撐股價也匆匆丟出來15
[問卦] 大陸AI天才少女羅福莉有多強的卦現在中國大陸AI最強的是一位叫羅福莉的少女 29歲 北京大學計算機碩士 中國大陸最新大語言模型DeepSeek研發人員之一就是羅福莉 剛被小米雷軍以千萬挖角9
Re: [請益] Deepseek v3 對台積電有影響嗎沒想到吹沒多久 當問DeepSeek-V3:"你是什麼模型" DeepSeek-V3竟然回答:"我是chatgpt"6
[爆卦] 尷尬 支那大模型Deepseek v3自稱chatgpt支那AI公司DeepSeek三天前推出DeepSeek-V3 該公司公布的性能可匹敵GPT-4o以及Claude-3.5-Sonnet DeepSeek-V3用2個月訓練2048個GPU只花588萬美元 遠低於GPT-4o約1億美元 粉紅五毛藉此嘲諷美帝封鎖高階晶片也無法阻止支那AI6
Re: [請益] Deepseek v3 對台積電有影響嗎我覺得評比指標什麼都是後話 使用體驗太差 你看看這樣怎麼稱霸世界呢? 你的進線參數與資料量就比別人少了,5
[問卦] 有無AI軟體DeepSeek完全開源免費的八卦?剛剛看到五毛在吹最新的OpenAI軟體DeepSeek V3 完全開源免費 訓練成本就可以壓到600萬美元以下 節省成本將超過90% 小米雷軍花千萬RMB挖角過來的北大AI天才少女羅福莉 做為DeepSeek關鍵開發者之一 是不是很膩害? 有無八卦? --1X
Re: [請益] Deepseek v3 對台積電有影響嗎deepseek在多語言編程指標中有自己的優異表現,很多指標優於chatgpt,最好是偷偷調用別人的API啦 Codeforce領先所有模型,思維鏈的應用上,諸如數學能力的 AIME 2024 CNMO 2024測試也是領先全球的 而且已經可以本地部署測試,成本降低是可見的,原理也是業界認可的 你以爲這兩個小例子能推翻什麽嗎XD 由於低成本和硬件限制,有缺陷是非常有可能的,但是只要原理通,未來非常可期。3
Re: [請益] Deepseek v3 對台積電有影響嗎的確會讓人好奇DeepSeek-V3的訓練方式, 但成本降低如此之多,另外一個思考點,是不是除了科技巨頭外, 更多公司願意投入資本支出來建立自己的模型? 而且隨著技術發展,模型建立的成本一定會快速下降。 DeepSeek-V3比較的 Claude.ai/Qwen2.5/LLaMA3.1- 聽說deepseek v3這東西比別人開發的成本低很多 1.2000 顯示卡訓練 2.成本比他牌低數百倍 完全開源 但我不太明白於是想找看看相關影片說說