Re: [請益] Deepseek v3 對台積電有影響嗎
deepseek在多語言編程指標中有自己的優異表現,很多指標優於chatgpt,最好是偷偷調用別人的API啦
Codeforce領先所有模型,思維鏈的應用上,諸如數學能力的 AIME 2024 CNMO 2024測試也是領先全球的
而且已經可以本地部署測試,成本降低是可見的,原理也是業界認可的
你以爲這兩個小例子能推翻什麽嗎XD
由於低成本和硬件限制,有缺陷是非常有可能的,但是只要原理通,未來非常可期。
※ 引述《jackliao1990 (j)》之銘言:
: 沒想到吹沒多久
: 當問DeepSeek-V3:"你是什麼模型"
: DeepSeek-V3竟然回答:"我是chatgpt"
: https://imgur.com/wcgo1TC
: 叫它講個笑話
: 它講的笑話也跟ChatGPT一樣:
: https://imgur.com/Zo1PKXw
: 難道DeepSeek-V3訓練成本這麼低是因為用chatgpt訓練的??
: Sam altman迅速發推嘲諷:
: https://x.com/sama/status/1872664379608727589
: "複製你知道有效的東西是(相對)容易的。"
--
這種自慰文確定還要再翻牆出來發嗎...
你們這些質疑者,甚至不會去查它在編碼和數學推理能力上的表現成績,偷調別人的API能做到嗎XD
※ 編輯: icrose (171.14.60.110 中國), 12/29/2024 22:27:16算了吧 連中國碼農都不一定會用的垃圾就別吹了
Deepseek 數學能力被 OpenAI o3 碾壓好嗎
說得真好!明天一鍵出清 反手做空 財富自由就看這波
這玩意就是規模越大越強 另外吹再多 小心老美連幻方
程式設計能力也是被 OpenAI o3 碾壓
也制裁讓你連A100都不用買
堪用 能用 跟好用 這是完全不同級數的比較
我説了那幾項評比指標了,你又不去查,只會講這種空話XD
※ 編輯: icrose (171.14.60.110 中國), 12/29/2024 22:30:21真要說AI 中國裡面現在大概未來能打的只有一家字節
但應該也離被打壓也不遠了
繼續瞎扯!現在數學和程式設計能力最強的就是 OpenA
I o3
一天發兩篇笑話 這麼幸福是可以的嗎
目前o3的指標是最強的,這點根本不用懷疑
這樣不行,回去重練
想太多 deepseek v3就是分數落後 但是成本低廉
A股不香還是百度貼吧不香,整天來這湊熱鬧
可惜未來已經結束了,只剩下唏噓
我一直都很懷疑板上那些中吹帳號根本沒在買賣股票,
來股板發文、推文都是在執行任務
貴國用MoE當模型先天比人稀疏了 有什麼好比的
就好像禿頭的人跟正常髮量的人說:我們都有頭髮
整篇廢話 你也解釋一下原理是什麼
也太牢了吧 連他們自己都只吹到比4o強 OAI上面還要o
1/o1 pro/o3呢
呵呵
這ID太優秀 引眾人嫉妒 先幫補血
不知道這貨是不是在對岸的某台青基地發文
好棒。每年都有公司彎道超車。怎還不allin
抄
遙遙領先
最擅長彎道翻車
41
首Poom 中國展示了他們的新模型 重點在它極低的成本 好奇這樣是不是代表科技巨頭們不需要這麼多晶片?2X
2024是韓國經濟20年最差的時間點 但很快人們發現,2024也會是台灣半導體的頂點 成熟製程的後路已經斷了,中國機器狗落地上的的優異表現和deepseek的出現,都是對OPENAI-NV-TSM的重擊 應用優勢不在美方,新的算法改進造成算力需求驟降的風險隨時發生,舊的算法如果固定化NV通用GPU又要受asic的衝擊 sora恬不知恥的商用化,但是顯然沒有任何實質進展,細部動作仍然很難看,但是爲了撐股價也匆匆丟出來3
的確會讓人好奇DeepSeek-V3的訓練方式, 但成本降低如此之多,另外一個思考點,是不是除了科技巨頭外, 更多公司願意投入資本支出來建立自己的模型? 而且隨著技術發展,模型建立的成本一定會快速下降。 DeepSeek-V3比較的 Claude.ai/Qwen2.5/LLaMA3.19
沒想到吹沒多久 當問DeepSeek-V3:"你是什麼模型" DeepSeek-V3竟然回答:"我是chatgpt"6
我覺得評比指標什麼都是後話 使用體驗太差 你看看這樣怎麼稱霸世界呢? 你的進線參數與資料量就比別人少了,
59
[閒聊] 桃機T2地下室新指標安安 文山長跑王 前幾題進出 T2 地下室捷運站出口 發現了不但東側的手扶梯被圍起來之外 似乎是在測試新的標示系統11
Re: [其他] 淺談新藥這要看原paper他有沒有把醫材也包括進去,不過至少還有植物新藥。 : Vaccine是疫苗 : : → khps20145 : 還沒說上市以後市場買不買單呢...呵呵 07/11 14: 337
[爆卦] 尷尬 支那大模型Deepseek v3自稱chatgpt支那AI公司DeepSeek三天前推出DeepSeek-V3 該公司公布的性能可匹敵GPT-4o以及Claude-3.5-Sonnet DeepSeek-V3用2個月訓練2048個GPU只花588萬美元 遠低於GPT-4o約1億美元 粉紅五毛藉此嘲諷美帝封鎖高階晶片也無法阻止支那AIX
[問卦] 有糞code哥的八卦嗎?yoyo~ 我高雄城鵡啦 各位宅宅工程師 大家有沒有遇過奇杷糞code哥阿 本肥舉真實遇到的例子:3
Re: [新聞] ChatGPT會衝擊人類文明!金管會示警 金阿肥外商碼農阿肥啦!看到有人說chatGPT理財我覺得可能有用的應該是財務報表生成跟 整理,預測股市這種目前transformers based的模型在一些新的研究可能沒啥用,主因就 是語言其實某種程度是樹狀時序可以不敏感的,但時序訊號其實不是,所以AI做長序列預 測當前還有進步的空間。 還有一點就是股市其實某種程度是一種複雜賽局系統,要做長序列預測若是沒有額外更準2
[問卦] 人人都說指標屌,為啥新語言都拋棄指標每個程序員 各個都說C語言指標(pointer)很屌 結果一看他們編程在用全都是拋棄指標的程式語言 這麼屌的東西怎麼新語言都拋棄掉呢 我很好奇
54
[心得] 大學生奈米資定期定額年報37
Re: [請益] 台股高點是不是到了30
[心得] 台股前七大權值與大盤年度漲幅16
Re: [新聞] 林毅夫:陸2025年跨進高收入門檻12
[心得] 2003~2024台股大盤報酬率9
Re: [新聞] 台積電售價過高 傳輝達、高通轉向三星2奈8
[心得]「小散戶年報心得(檢討)文」33
[心得] 2024年報10
[心得] 房蟲2024年報6
[情報] 00881配息公告0.75元16
[標的] 1216統一12
Re: [新聞] 2024最悲情! 台塑四寶今年股價重摔逾552
[心得] 債蛙轉股蛙2024財報2
[心得] 2024小資年報