Re: [新聞] 陸企DeepSeek接連推出大模型 陸媒:引發
南無阿彌陀佛
敝島上所有做AI的專家學者全部綁在一塊不知道有沒有這家小公司的成就
還不就還好之前有組刻薄的llama救了多少人的論文
讓多少教授只要在那邊跑一跑人家的模型就可以坐穩那個學者的名份
現在又有一個deepseek開源可以伸手直接拿來用
學術補助可以全砍了
然後還可以拿人家的模型finetune然後在那邊演講甚麼台灣AI世界第一
甚麼建構可信賴的AI甚麼韌性
連自己的模型都做不出來
怎麼好意思在那邊嫌
= =
南無阿彌陀佛
※ 引述《doig (山川壯麗 物產豐隆)》之銘言:
: 1.媒體來源:
: 聯合新聞網 2025-01-26 13:18
: 2.記者署名:
: 聯合報/記者 潘維庭/即時報導
: 3.完整新聞標題:
: 陸企DeepSeek接連推出大模型 陸媒:引發Meta內部焦慮
: 4.完整新聞內文:
: https://i.imgur.com/cuek5sy.jpeg
![圖 陸企DeepSeek接連推出大模型 陸媒:引發](https://i.imgur.com/cuek5sy.jpeg?e=1738240076&s=0M9z1s1ut15UzTxYs5WCSw)
: 總部位於杭州的大陸AI新創公司「深度求索」(DeepSeek),去年底、1月20日先後發布: 了「DeepSeek-V3」和「DeepSeek-R1」兩款大模型,由於成本低廉,性能與OpenAI相當,: 陸媒指此舉引發矽谷震驚,甚至引發Meta內部焦慮,工程師開始連夜嘗試複製DeepSeek的: 成果。
: 陸媒「每日經濟新聞」26日報導,在美國總統川普宣布5000億美元的「星際之門」(
: Stargate)發展人工智慧基礎建設計畫之際,DeepSeek以極低的價格建立了突破性的AI模: 型,且未使用尖端晶片,讓人們質疑,AI行業數千億美元資本的巨額投入,是否真為最有: 效的方法?
: 報導回顧,去年12月27日,DeepSeek推出開源模型「DeepSeek-V3」。AI系統排名網站「: 聊天機器人競技場」(Chatbot Arena)顯示,「DeepSeek-V3」在所有模型中排名第7,: 在開源模型排第1。且「DeepSeek-V3」是全球前十中,性價比最高的模型。
: 不到1個月,今年1月20日,DeepSeek再推出「DeepSeek-R1」,24日,「DeepSeek-R1」在: 聊天機器人競技場綜合榜單上排名第3,與頂尖推理模型、OpenAI推出的o1並列。同時,: 測評機構「Artificial-Analysis」對「DeepSeek-R1」的初始基準測試結果也顯示,「: DeepSeek-R1」在AI分析質量指數中取得第2高分,價格則是o1的約30之1。
: 「每日經濟新聞」稱,24日,一篇發布在匿名平台teamblind上的文章瘋傳,一位自稱是: Meta員工稱,Meta內部因為DeepSeek模型進入恐慌模式,該文員工寫道,「DeepSeek-V3: 」在基準測試中,已經讓(Meta推出的)Llama 4相形見絀,而更讓人難堪的是,一家「: 僅用550萬美元訓練預算的中國公司」就做到了這一點。
: 該匿名文指,工程師正爭分奪秒分析DeepSeek,試圖複製其中的一切可能技術。另外,「: DeepSeek-R1」的出現,也讓情況更加嚴峻。
: 《金融時報》25日稱,中國的小型AI新創公司DeepSeek震驚矽谷,加州大學柏克萊分校AI: 政策研究員古普塔(Ritwik Gupta)表示,DeepSeek最近發布的模型,表明「AI能力沒有: 護城河」。古普塔也提到,中國的系統工程師人才庫比美國大得多,懂得如何充分利用計: 算資源,來更便宜地訓練、運行模型。
: 5.完整新聞連結:
: https://reurl.cc/Kd5xKp
--
推 ROCSimonLiu:博士虐貓,碩士約砲,學士射精在飲料,校友正在蹲苦窯05/30 00:43
→ ROCSimonLiu:教授作帳假發票,職業學生看報紙才知道。05/30 00:43
--
※ PTT留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 123.194.162.12 (臺灣)
※ PTT 網址
→
台灣有PTT創世神AI
噓
創世政治垃圾 只會搞政治而已 難怪離職
噓
世界跟不上台灣啦 AI國家隊很快就出來了
→
會組成AI盾 抗中保台 AI黑熊AI脆
推
之前拿對岸的語言模型騙預算
→
才會出台灣領導人是習近平
→
我們要尊爵不凡的taide 誰要中國貨
推
預算被刪的後果
推
台灣有假AI之名帶風向還能領補助的AI實驗室
推
AI國家隊準備好了,敏感性問題都會記得
→
修正,不會再出包
推
你建議國昌把國立大學經費都砍了
推
台灣也都套模仔啦
推
你少講了mistral
推
看不懂冒險推
15
[爆卦] 全球最強中國 AI 模型被爆是套用 Meta 的李開復 所創立零一萬物 推出全球強中國 AI 模型 包括 Yi-6B 和 Yi-34B 兩個版本 取得了多項 SOTA 國際最佳性能指標認可 成為全球開源大模型的雙料冠軍 擊敗了 LLaMA2 和 Falcon 現在被爆是套用 Meta 的 LLaMa 模型架構X
Re: [爆卦] 中央研究院詞庫小組大型語言模型對於LLM只有這一點認知程度的話,最好不要就這樣出來帶風向會比較好,不然先去 跟陽明交大校長先去旁邊先學習一下什麼叫做LLM,不同LLM之間又有什麼差異。 第一個錯誤的認知是認為LLM就應該要提供正確的答案,事實上LLM是一個機率模型, 它所做的事情是基於模型的權重預測下一個token(詞塊)最高的機率是那個,它不是資 料庫,所以你不能因為它答的一個答案不是你所想的就是說這個模型如何如何。9
[問卦] 中國deepseek是不是大贏chatgpt?最近有中國AI公司宣稱,用550萬美元成本 訓練大模型語言,效能贏很多美國大廠 台灣有沒辦法達到? 中國人的智慧是不是比美國人還厲害啊?6
[爆卦] 尷尬 支那大模型Deepseek v3自稱chatgpt支那AI公司DeepSeek三天前推出DeepSeek-V3 該公司公布的性能可匹敵GPT-4o以及Claude-3.5-Sonnet DeepSeek-V3用2個月訓練2048個GPU只花588萬美元 遠低於GPT-4o約1億美元 粉紅五毛藉此嘲諷美帝封鎖高階晶片也無法阻止支那AI6
[情報] 微軟, META合作 Llama2上 Azure1. 標題: 微軟與META擴大他們的AI合作關係,讓Llama 2上Azure以及 windows 2. 來源: 微軟公司 3. 網址:5
Re: [新聞] Google與Hugging Face合作宣布推動開放結果Google竟然釋出了開源大模型Gemma,超出預期! Google 2 款新開源模型「Gemma」來了!直接挑戰 Meta Llama 2 7B 2024/02/22 Sisley 聊天機器人 、 生成式 AI 、 摘要 、 輕量級語言模型 、 負責 任生成式 AIX
Re: [問卦] 中研院自己做的大型語言模型怎麼了?這語言模型基礎是建構於Llama 2,meta提供的開源模型 另外Atom 7b則是中文社群跟一間中國公司在Llama 2之上訓練成中文使用者適合的模型, 也是開源且開放商用 技術上也不用解釋太多,反正開源模型他本來就不會像GPT或百度的文心一言那樣限制某 些爭議性回答4
Re: [新聞] 下半年將引爆「換機潮」? AI PC元年來臨阿肥外商碼農阿肥啦! 這邊很多人沒說到點上,當前的AI PC概念根據微軟的定義是搭載微軟Copilot的PC就可以 叫AI PC,然後Intel定義的是有NPU(GPU的開放架構特化加速DL運算版本)。 不過當前如果你去看所有開源的LLM(大語言模型)都只能說是勉強堪用,以Intel號稱可 以搭載llama2 70B(當前開源模型中前幾大的)的Core Ultra AI筆電,造價至少4、5萬X
[討論] 兩岸聯手制覇ai科技,不錯吧?對岸的ai技術俗擱大碗。像deepseek就不輸chatgpt 如果兩岸合作,台灣專心硬體,對岸專攻模型。兩岸制覇世界ai科技的利潤。是很有可能 的吧? 美國反對,是有甚麼依據嗎? ※ 每日發文數上限為5篇,自刪與板主刪除,同樣計入額度 ※- 中共國發表Deepseek R1 效能比肩ChatGPT o1 重點是完全開源 而且訓練只用兩個月,花了一億多台幣 這代表台灣只要拿這個來重新訓練一下
爆
[問卦] 笑死XD 閩南螂跟季囧被電爆了XDD爆
Re: [爆卦] NCC新聞稿:750元規費 調整前暫緩收取爆
Re: [新聞] 「750元之亂」有解?NCC遭罵翻後政策大轉68
[問卦] 志祺七七新影片:臺積電被美國員工告!23
[問卦] 我對新竹很熟 有問題都可以問44
[問卦] 帶什麼早餐去公司吃最爽?42
[問卦] 李宗瑞出獄第一件事要幹嘛40
[爆卦] 台中LaLaport蔦屋書店倒了!57
[問卦] 39歲存款300萬算多嗎爆
[問卦] NCC縮了:考慮暫緩 三件可只收600元29
[問卦] 韓國爆乳小白兔爆
[問卦] 什麼人會不喜歡多放七天假?21
[問卦] 香港旅遊怎麼那麼熱門?爆
[問卦] 胰臟癌病程大約多久70
[問卦] 小米家電好用嗎?爆
Re: [爆卦] 電詢NCC得到的輕佻回應25
Re: [爆卦] NCC新聞稿:750元規費 調整前暫緩收取爆
[問卦] 為什麼日本出生率比台灣高?20
Re: [新聞] 大S樹葬…業者稱骨灰不溶土恐挖丟焚化爐18
[問卦] 只有我覺得電子書定價太貴嗎??盤子才買吧50
[問卦] 認真文 原來高雄殺人犯是被放出來的12
[問卦] 三星S25U也太強了吧?還需要背相機出門?80
[爆卦] 唐鳳近況曝光 # USAID # 絲襪辣妹19
[問卦] 台大教授:台大報告水準只有NYU的30%23
[爆卦] X (Twitter) 開始賺錢了21
[問卦] 月經為什麼是藍色的?70
[問卦] 200作家挺大罷免 你看過誰的書?17
[問卦] 現在看來 香港比烏克蘭好多了 對吧?19
[問卦] 社區合法A錢都怎麼A?8
[問卦] 沒人發現信用卡感應才是最快的支付方式!