Re: [新聞] 陸企DeepSeek接連推出大模型 陸媒:引發
南無阿彌陀佛
敝島上所有做AI的專家學者全部綁在一塊不知道有沒有這家小公司的成就
還不就還好之前有組刻薄的llama救了多少人的論文
讓多少教授只要在那邊跑一跑人家的模型就可以坐穩那個學者的名份
現在又有一個deepseek開源可以伸手直接拿來用
學術補助可以全砍了
然後還可以拿人家的模型finetune然後在那邊演講甚麼台灣AI世界第一
甚麼建構可信賴的AI甚麼韌性
連自己的模型都做不出來
怎麼好意思在那邊嫌
= =
南無阿彌陀佛
※ 引述《doig (山川壯麗 物產豐隆)》之銘言:
: 1.媒體來源:
: 聯合新聞網 2025-01-26 13:18
: 2.記者署名:
: 聯合報/記者 潘維庭/即時報導
: 3.完整新聞標題:
: 陸企DeepSeek接連推出大模型 陸媒:引發Meta內部焦慮
: 4.完整新聞內文:
: https://i.imgur.com/cuek5sy.jpeg

: 總部位於杭州的大陸AI新創公司「深度求索」(DeepSeek),去年底、1月20日先後發布: 了「DeepSeek-V3」和「DeepSeek-R1」兩款大模型,由於成本低廉,性能與OpenAI相當,: 陸媒指此舉引發矽谷震驚,甚至引發Meta內部焦慮,工程師開始連夜嘗試複製DeepSeek的: 成果。
: 陸媒「每日經濟新聞」26日報導,在美國總統川普宣布5000億美元的「星際之門」(
: Stargate)發展人工智慧基礎建設計畫之際,DeepSeek以極低的價格建立了突破性的AI模: 型,且未使用尖端晶片,讓人們質疑,AI行業數千億美元資本的巨額投入,是否真為最有: 效的方法?
: 報導回顧,去年12月27日,DeepSeek推出開源模型「DeepSeek-V3」。AI系統排名網站「: 聊天機器人競技場」(Chatbot Arena)顯示,「DeepSeek-V3」在所有模型中排名第7,: 在開源模型排第1。且「DeepSeek-V3」是全球前十中,性價比最高的模型。
: 不到1個月,今年1月20日,DeepSeek再推出「DeepSeek-R1」,24日,「DeepSeek-R1」在: 聊天機器人競技場綜合榜單上排名第3,與頂尖推理模型、OpenAI推出的o1並列。同時,: 測評機構「Artificial-Analysis」對「DeepSeek-R1」的初始基準測試結果也顯示,「: DeepSeek-R1」在AI分析質量指數中取得第2高分,價格則是o1的約30之1。
: 「每日經濟新聞」稱,24日,一篇發布在匿名平台teamblind上的文章瘋傳,一位自稱是: Meta員工稱,Meta內部因為DeepSeek模型進入恐慌模式,該文員工寫道,「DeepSeek-V3: 」在基準測試中,已經讓(Meta推出的)Llama 4相形見絀,而更讓人難堪的是,一家「: 僅用550萬美元訓練預算的中國公司」就做到了這一點。
: 該匿名文指,工程師正爭分奪秒分析DeepSeek,試圖複製其中的一切可能技術。另外,「: DeepSeek-R1」的出現,也讓情況更加嚴峻。
: 《金融時報》25日稱,中國的小型AI新創公司DeepSeek震驚矽谷,加州大學柏克萊分校AI: 政策研究員古普塔(Ritwik Gupta)表示,DeepSeek最近發布的模型,表明「AI能力沒有: 護城河」。古普塔也提到,中國的系統工程師人才庫比美國大得多,懂得如何充分利用計: 算資源,來更便宜地訓練、運行模型。
: 5.完整新聞連結:
: https://reurl.cc/Kd5xKp
--
推 ROCSimonLiu:博士虐貓,碩士約砲,學士射精在飲料,校友正在蹲苦窯05/30 00:43
→ ROCSimonLiu:教授作帳假發票,職業學生看報紙才知道。05/30 00:43
--
※ PTT留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 123.194.162.12 (臺灣)
※ PTT 網址
→
台灣有PTT創世神AI
噓
創世政治垃圾 只會搞政治而已 難怪離職
噓
世界跟不上台灣啦 AI國家隊很快就出來了
→
會組成AI盾 抗中保台 AI黑熊AI脆
推
之前拿對岸的語言模型騙預算
→
才會出台灣領導人是習近平
→
我們要尊爵不凡的taide 誰要中國貨
推
預算被刪的後果
推
台灣有假AI之名帶風向還能領補助的AI實驗室
推
AI國家隊準備好了,敏感性問題都會記得
→
修正,不會再出包
推
你建議國昌把國立大學經費都砍了
推
台灣也都套模仔啦
推
你少講了mistral
推
看不懂冒險推
15
[爆卦] 全球最強中國 AI 模型被爆是套用 Meta 的李開復 所創立零一萬物 推出全球強中國 AI 模型 包括 Yi-6B 和 Yi-34B 兩個版本 取得了多項 SOTA 國際最佳性能指標認可 成為全球開源大模型的雙料冠軍 擊敗了 LLaMA2 和 Falcon 現在被爆是套用 Meta 的 LLaMa 模型架構![[爆卦] 全球最強中國 AI 模型被爆是套用 Meta 的 [爆卦] 全球最強中國 AI 模型被爆是套用 Meta 的](https://user-assets.sxlcdn.com/images/987821/FrlX5hBJzYiI62PNP5FUKt8y5n4Y.png?imageMogr2/strip/auto-orient/thumbnail/1200x630>/format/png)
X
Re: [爆卦] 中央研究院詞庫小組大型語言模型對於LLM只有這一點認知程度的話,最好不要就這樣出來帶風向會比較好,不然先去 跟陽明交大校長先去旁邊先學習一下什麼叫做LLM,不同LLM之間又有什麼差異。 第一個錯誤的認知是認為LLM就應該要提供正確的答案,事實上LLM是一個機率模型, 它所做的事情是基於模型的權重預測下一個token(詞塊)最高的機率是那個,它不是資 料庫,所以你不能因為它答的一個答案不是你所想的就是說這個模型如何如何。![Re: [爆卦] 中央研究院詞庫小組大型語言模型 Re: [爆卦] 中央研究院詞庫小組大型語言模型](https://llama-chat-4fcmny015-replicate.vercel.app/opengraph-image.png?0806238e04f3e3af)
9
[問卦] 中國deepseek是不是大贏chatgpt?最近有中國AI公司宣稱,用550萬美元成本 訓練大模型語言,效能贏很多美國大廠 台灣有沒辦法達到? 中國人的智慧是不是比美國人還厲害啊?6
[爆卦] 尷尬 支那大模型Deepseek v3自稱chatgpt支那AI公司DeepSeek三天前推出DeepSeek-V3 該公司公布的性能可匹敵GPT-4o以及Claude-3.5-Sonnet DeepSeek-V3用2個月訓練2048個GPU只花588萬美元 遠低於GPT-4o約1億美元 粉紅五毛藉此嘲諷美帝封鎖高階晶片也無法阻止支那AI![[爆卦] 尷尬 支那大模型Deepseek v3自稱chatgpt [爆卦] 尷尬 支那大模型Deepseek v3自稱chatgpt](https://i.imgur.com/Zo1PKXwb.jpg)
6
[情報] 微軟, META合作 Llama2上 Azure1. 標題: 微軟與META擴大他們的AI合作關係,讓Llama 2上Azure以及 windows 2. 來源: 微軟公司 3. 網址:![[情報] 微軟, META合作 Llama2上 Azure [情報] 微軟, META合作 Llama2上 Azure](https://blogs.microsoft.com/wp-content/uploads/prod/2023/07/1920x1080-META-OMB-Llama-2-Image-002-1024x576.png)
5
Re: [新聞] Google與Hugging Face合作宣布推動開放結果Google竟然釋出了開源大模型Gemma,超出預期! Google 2 款新開源模型「Gemma」來了!直接挑戰 Meta Llama 2 7B 2024/02/22 Sisley 聊天機器人 、 生成式 AI 、 摘要 、 輕量級語言模型 、 負責 任生成式 AI![Re: [新聞] Google與Hugging Face合作宣布推動開放 Re: [新聞] Google與Hugging Face合作宣布推動開放](https://bucket-img.tnlmedia.com/cabinet/2024/02/30fbd444-75f7-43da-9eaf-5b1383f3e73a.jpg?w=1200&h=630&fit=crop&auto=compress)
X
Re: [問卦] 中研院自己做的大型語言模型怎麼了?這語言模型基礎是建構於Llama 2,meta提供的開源模型 另外Atom 7b則是中文社群跟一間中國公司在Llama 2之上訓練成中文使用者適合的模型, 也是開源且開放商用 技術上也不用解釋太多,反正開源模型他本來就不會像GPT或百度的文心一言那樣限制某 些爭議性回答![Re: [問卦] 中研院自己做的大型語言模型怎麼了? Re: [問卦] 中研院自己做的大型語言模型怎麼了?](https://i.imgur.com/GQlNhZjb.jpg)
4
Re: [新聞] 下半年將引爆「換機潮」? AI PC元年來臨阿肥外商碼農阿肥啦! 這邊很多人沒說到點上,當前的AI PC概念根據微軟的定義是搭載微軟Copilot的PC就可以 叫AI PC,然後Intel定義的是有NPU(GPU的開放架構特化加速DL運算版本)。 不過當前如果你去看所有開源的LLM(大語言模型)都只能說是勉強堪用,以Intel號稱可 以搭載llama2 70B(當前開源模型中前幾大的)的Core Ultra AI筆電,造價至少4、5萬X
[討論] 兩岸聯手制覇ai科技,不錯吧?對岸的ai技術俗擱大碗。像deepseek就不輸chatgpt 如果兩岸合作,台灣專心硬體,對岸專攻模型。兩岸制覇世界ai科技的利潤。是很有可能 的吧? 美國反對,是有甚麼依據嗎? ※ 每日發文數上限為5篇,自刪與板主刪除,同樣計入額度 ※
[黑特] 台灣本土的AI大模型快問世惹!中共國發表Deepseek R1 效能比肩ChatGPT o1 重點是完全開源 而且訓練只用兩個月,花了一億多台幣 這代表台灣只要拿這個來重新訓練一下![[黑特] 台灣本土的AI大模型快問世惹! [黑特] 台灣本土的AI大模型快問世惹!](https://i.imgur.com/lynsGueb.jpeg)
爆
[問卦] 去銀行一次提領一百![[問卦] 去銀行一次提領一百 [問卦] 去銀行一次提領一百](https://i.imgur.com/eiBR27jb.jpeg)
爆
[問卦] 現在的HR都愛問一些奇怪問題嗎![[問卦] 現在的HR都愛問一些奇怪問題嗎 [問卦] 現在的HR都愛問一些奇怪問題嗎](https://i.urusai.cc/QtYfe.png)
94
[問卦] 霸凌同學 有好聽說法嗎爆
Re: [問卦] 11/4離職 11/26出包,公司叫離職的負責?![Re: [問卦] 11/4離職 11/26出包,公司叫離職的負責? Re: [問卦] 11/4離職 11/26出包,公司叫離職的負責?](https://i.imgur.com/AN84rLmb.jpeg)
75
[問卦] 台女脆文:瑞幸咖啡穩死的!![[問卦] 台女脆文:瑞幸咖啡穩死的! [問卦] 台女脆文:瑞幸咖啡穩死的!](https://i.mopix.cc/NRU3Hs.jpg)
68
[問卦] 八歲就開扁同學以後能成大事嗎63
[問卦] CloudFlare又掛了?41
[問卦] 全聯鯛魚搞到要國賠了![[問卦] 全聯鯛魚搞到要國賠了 [問卦] 全聯鯛魚搞到要國賠了](https://i.imgur.com/flM1A6bb.png)
爆
[問卦] 11/4離職 11/26出包,公司叫離職的負責?![[問卦] 11/4離職 11/26出包,公司叫離職的負責? [問卦] 11/4離職 11/26出包,公司叫離職的負責?](https://img.youtube.com/vi/uGOWqxN_avw/mqdefault.jpg)
爆
[問卦] 真的有記者去含檢察官的屌換情報?![[問卦] 真的有記者去含檢察官的屌換情報? [問卦] 真的有記者去含檢察官的屌換情報?](https://i.imgur.com/osUmcCvb.jpeg)
86
[問卦] 脆女:第一胎沒300萬 別生小孩了!![[問卦] 脆女:第一胎沒300萬 別生小孩了! [問卦] 脆女:第一胎沒300萬 別生小孩了!](https://i.mopix.cc/NRU3Hs.jpg)
85
[問卦] 吳郭魚片寫台灣鯛魚片484詐騙?![[問卦] 吳郭魚片寫台灣鯛魚片484詐騙? [問卦] 吳郭魚片寫台灣鯛魚片484詐騙?](https://img.youtube.com/vi/dtuSqd-TcxU/mqdefault.jpg)
45
[問卦] 8歲就嗆要打死人,長大能做什麼?![[問卦] 8歲就嗆要打死人,長大能做什麼? [問卦] 8歲就嗆要打死人,長大能做什麼?](https://i.imgur.com/eVKUCT4b.jpeg)
44
[問卦] 驚!9年來 年輕人自殺成長三倍 代表什麼![[問卦] 驚!9年來 年輕人自殺成長三倍 代表什麼 [問卦] 驚!9年來 年輕人自殺成長三倍 代表什麼](https://i.imgur.com/I9muINnb.jpeg)
39
[問卦] 燒臘便當這樣多少合理?![[問卦] 燒臘便當這樣多少合理? [問卦] 燒臘便當這樣多少合理?](https://i.imgur.com/FLuRAsfb.jpeg)
37
[問卦] 台女:性騷擾本來就是我來定義![[問卦] 台女:性騷擾本來就是我來定義 [問卦] 台女:性騷擾本來就是我來定義](https://i.mopix.cc/NRU3Hs.jpg)
36
[問卦] 經過鯛魚事件後 你還相信檢驗數據嗎?![[問卦] 經過鯛魚事件後 你還相信檢驗數據嗎? [問卦] 經過鯛魚事件後 你還相信檢驗數據嗎?](https://i.mopix.cc/wyBvTF.jpg)
42
[問卦] 為何08年大家22k時沒人躺平 現在卻一堆?![[問卦] 為何08年大家22k時沒人躺平 現在卻一堆? [問卦] 為何08年大家22k時沒人躺平 現在卻一堆?](https://i.mopix.cc/P0cKXZ.jpg)
27
[問卦] 沒人發現今日小紅書,明日就是PTT??![[問卦] 沒人發現今日小紅書,明日就是PTT?? [問卦] 沒人發現今日小紅書,明日就是PTT??](https://i.imgur.com/Oh5UTjvb.jpeg)
84
[問卦] 美財長貝森特:美是中國盟友也是台灣盟友![[問卦] 美財長貝森特:美是中國盟友也是台灣盟友 [問卦] 美財長貝森特:美是中國盟友也是台灣盟友](https://i.imgur.com/W29EoF5b.png)
34
[問卦] 為什麼女生興趣都寫旅遊跟美食30
[問卦] Telegram才更該禁吧49
[問卦] 蝙蝠俠幹嘛不把小丑做掉![[問卦] 蝙蝠俠幹嘛不把小丑做掉 [問卦] 蝙蝠俠幹嘛不把小丑做掉](https://img.youtube.com/vi/cm3Chp2u7HY/mqdefault.jpg)
30
[問卦] 2025年底了今年的代表字是? 好的部分29
[問卦] 8歲打人是「小朋友之間的摩擦」那18歲?![[問卦] 8歲打人是「小朋友之間的摩擦」那18歲? [問卦] 8歲打人是「小朋友之間的摩擦」那18歲?](https://i.meee.com.tw/QWoHrWC.jpg)
30
[問卦] 檢驗結果為什麼是助理扛?![[問卦] 檢驗結果為什麼是助理扛? [問卦] 檢驗結果為什麼是助理扛?](https://img.youtube.com/vi/ftuuVwvhvKM/mqdefault.jpg)
27
[問卦] 8歲小朋友霸凌案,教會了我們什麼?0.025
[問卦] 男女去泡溫泉,啪啪機率多高?28
[問卦] 炒麵 要怎麼做 才能做出最好吃的炒麵?![[問卦] 炒麵 要怎麼做 才能做出最好吃的炒麵? [問卦] 炒麵 要怎麼做 才能做出最好吃的炒麵?](https://i.ytimg.com/vi/zU_l0NR7HFE/maxresdefault.jpg)
27
[問卦] 王子甩掉粿粿的機率多高