Re: [新聞] 快訊/輝達宣布:DeepSeek-R1可在NV
早就說了
DeepSeek的完全開源
讓很多公司可以直接修改拿去用
誰還要去租openAI?
這些科技公司不是白癡
一套現成的語言模型和訓練方法通通給你
啊你還不用?
便宜治百病
----
Sent from BePTT on my iPhone 12 Pro
--
※ PTT留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 42.79.179.28 (臺灣)

※ PTT 網址
噓
「誰還要去租openAI」
→
之後就要出o3了餒
噓
財經亡霉:幹又翻
推
OpenAI一個月200鎂的東西都有人訂,那些掏
→
錢的企業不是傻子
推
我們都只相信財經網美 輝達是啥狗屎啊?

推
青鳥:會用的都是中共同路人
推
公家機關準備使用
推
o3是今天出吧還是明天? 不過也不錯啦
→
有人訂跟會賺錢是兩碼子事 有人訂但
→
賠一堆錢有用嗎==?
→
挖ㄚㄚ 禁止禁止
44
Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據比較好奇這段: 儘管蒸餾是AI業界常見做法,但DeepSeek若利用蒸餾技術來打造自家模型,並與OpenAI競 爭,將違反OpenAI服務條款,因此產生疑慮。 OpenAI婉拒進一步說明或提供證據細節。根據該公司的服務條款,用戶不得「複製」任何 OpenAI的服務,或是「利用輸出結果,來開發與OpenAI競爭的模型」。 各個ai 大語言模型不是都會互相參照比較和訓練嗎? 我以為這是業界常識…12
Re: [討論] 其實Deepseek真的很厲害了DeepSeek可以下載到自己電腦跑、ChatGPT不行, 這在商業使用的場景上就有蠻大的差異 昨天很多人在傳說用(線上版)的DeepSeek會把資料傳給中國,這當然是對的, 但過去一兩年我們幫客戶評估AI專案時, 在串GPT-API上常常會碰到我們或我們的客戶其實也不想把資料傳給OpenAI,8
[問卦] 如何利用deepseek開源模型 建構台灣AI聽說 deepseek-R1 是目前開源AI模型第一名 我有一個大膽的想法 既然這個模型是開源的 我們可以使用這個模型來建構台灣的 openAI 擺脫對美國AI大廠的依賴 是不是很聰明啊?8
Re: [新聞] DeepSeek暴紅不單純?OpenAI質疑中國對openai只有開源好幾年前的模型 現在meta google m$ 的開源模型都屌打好幾條街了 用過deepseek的人都知道,deepseek是蒸餾上面那幾個開源模型 況且deepseek也有把自己的模型和程式碼都公布出來 開源的精神不就是這樣嗎?1
[問卦] DeepSeek 就只是仿造ChatGPT 還吹成這樣剛看了DeepSeek R1原始文件 Guo, D., Yang, D., Zhang, H., Song, J., Zhang, R., Xu, R., ... & He, Y. (2025). DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning. arXiv preprint arXiv:2501.12948. 看完結論就是4
Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據這裡的說法如果是正確的話,那DeepSeek就不是只靠蒸餾來達成的. Scale AI’s 28-Year-Old Billionaire CEO Warns About This Scarily Good Chinese Startup 這個CEO就是指控DeepSeek事實上擁有並使用50000個H100 GPU的人.3
Re: [黑特] 民進黨支持者思想真的很幼稚青鳥跟塔綠班們 都不知道DeepSeek是開源的 所以才有那些奇怪自卑推論 這次中國產生DS 其實對全世界都是一個正面的發展 也就是 花小成本也可以 作出 大成本模型效能的AI語言模型 重點是這個模型的程式碼跟架構 還跟全世界分享 也就是 台灣人照抄 也可以作出自己想要內容的 DeepSeek3
Re: [問卦] deepseek 到底是不是抄的 風向好亂Deepseek AI的訓練過程確實有用到蒸餾技術 蒸餾技術,就是在前人製造AI(例如chatgpt)的基礎上, 拿別人AI的回答當作訓練自己AI的材料 這種作法雖然有點像抄襲他人AI的能力,但在學術界已經是行之有年的做法 各國很多頂尖實驗室都用過這種方法訓練自己的AI- 我幫大家採訪了一下Deepseek 1.我問Deepseek是否有盜用chatgpt 回答: 我由中國的深度求求索(DeepSeek)公司開發,代號為DeepSeek-R1。我的訓練數據和技 術架構均為自主研發,嚴格遵守數據合規與倫理規範。雖然與ChatGPT同屬大語言模型技
- Deepseek目前是有同時釋出開源模型(權重、Code、訓練模型的方法報告都開源)的,走跟 llama一樣的路線,所以理論上只要GPU卡夠你就可以建一個完全一樣的環境包含重新微調模 型讓DeepSeek 做瑟瑟的事情跟串接對話還有Agent去執行任務。 目前初步測試繁中能力真的屌打一堆拿喇嘛微調的台灣llama模型,重點是MoE的架構可以很 省GPU(如果是llama同精度需要32張H100卡才能佈起來)。其實這次比較新釋出的是他的R1
85
[討論] 清大:顏晃徹紀念講座財源並非曹興誠53
[討論]聯合報前總編輯見證曹捐1500萬51
[討論] 盧媽媽有政績嗎?42
[討論] 震傳媒最新民調32
[討論] 賴清德當面要求林岱樺公開道歉51
Re: [討論] 陳力俊校長:我當時未查證,不能當成證明27
[黑特] 750決定不收啦24
[討論] 清大會不會哪天改口庚子賠款沒拿到錢?27
Re: [討論] 清大對中央社的說明25
[討論] 曹老闆根本來亂的吧,怎麼變成新聞主角22
[討論] 馬克宏當眾洗臉川普的影片在歐美社群瘋傳22
[討論] 清大對中央社的說明18
[討論] 陳力俊:前幾年有人去查證就知道曹沒捐錢16
[黑特] 為什麼要一直打曹興誠呀?20
[黑特] 衛福部對急診壅塞對策超爛 有等於沒有15
[黑特] 兩年條款?黃國昌:黨有黨的規劃。19
[討論] 陳力俊是不是受到什麼壓力才這樣改口14
[討論] 推測清大小沈1500的真相5
[討論] 為什麼青鳥不想要七天假??18
[黑特] 1500萬最傷的是清大11
[黑特] 林靜儀從頭到尾沒道歉啊,誰說她道歉了?8
[討論] 藍罷綠委造假8人 公民罷藍委造假010
Re: [新聞] 陳佩琪爆已付豪宅「斡旋金」 陳智菡回擊9
[討論] 聯合報當年為啥要做假新聞說曹有捐款9
[討論] 大巨蛋也應該要開挖!8
Re: [討論] 清大對中央社的說明8
[討論] 清大是不是很想被老曹告啊?8
[討論] 為何棒球場 地基不能用廢土填? 不都是土17
[討論] 1500萬到底誰說謊9
Re: [新聞] 陳佩琪爆已付豪宅「斡旋金」 陳智菡回擊