Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高
剛剛看FB,發現有個中國的作家對於Deepseek的作文水平感到驚訝,用了相同問題,以王家衛的電影風格去撰寫標題為人生何處不相逢的散文,來分別問CHATGPT-O1跟Deepseek-R1ChatGPT-O1:
https://i.imgur.com/T2jN9hZ.jpeg

Deepseek-R1:
https://i.imgur.com/IitIbR0.jpeg

我是覺得Deepseek的回答好像有點純堆砌王家衛的電影名台詞的感覺,通篇王家衛感,但是不知道在說甚麼
ChatGPT 在最後有點出散文標題,內容也比較有切合標題
這應該可以當作兩者的能力小比拼吧?
--------
補:
我也有用4O用相同問題問過,我覺得寫得比O1跟R1還好
https://i.imgur.com/7DN4Dz9.jpeg

這滿神奇的,O1應該是ChatGPT 最強的模型,但是寫散文我覺得沒有4O寫得好
--
重點是Deepseek背後的成本只有ChatGPT的20分之1
確實,訓練成本這件事情蠻令人訝異的,OpenAi也宣
布O3-mini將免費了
如果不知道是台詞 R1有故事感但無邏輯 結尾有蛇年感
只代表對於演算法大科技也要花大錢挖人
來搞了,算力的投資不會減少,不然等你
演算法追上,算力又落後了怎辦?
r1實際用遠不如抬面上的啦 只有評測嚇人 無庸質疑
O1比較像沒有人生經驗學生寫 可以再tune一段小故事
但deepseek重點在它開源 還公開論文 好耶 作功德 誰
不愛?載回來用免錢 改免錢的 中國人要作功德當然好
R1就每段都小故事 恐怕就是直接從劇本拼湊出來的
pretrain的成本占總成本7-9成,R1是只管posttrain
,R1高成本會嚇死人。
然後是DeepSeek-V3宣稱557萬,但strawberry幾個r也
會錯的跟其他一模一樣, 如果pretrain全部自己的資
料怎麼會錯

簡單說,成本漂亮那就不要有那麼多別的模型的影子
。
其實樓上有點出問題,pretrain的預標數據集才是最
貴的,這些可能都是美國公司花大錢去做的
pretrain資料集需要人工介入標記,這個東西貴鬆鬆
我沒有說不能吹能力,但成本就誇張了,我想看的是D
eepSeek從pretrain就是土法煉鋼,那才叫真的沒花這
麼多成本。
我沒看那麼多文章,如果有人找到paper解釋DeepSeek
v3為什麼strawberry的r幾個錯的跟其他模型一模一
樣是理所當然,而且預訓練是很純的資料(這家公司
自己收集的資料、沒有借助其他LLM產生好資料 =》
準備好資料是預訓練之常識)
從Transformer到GPT到ChatGPT等LLM,不都是一直堆疊
在前人的成果? 現在DS發表用RL訓練不就只是換一種疊
法? 自己要發布論文發布技術本來就是願意給別人用讓
產業一起推進,在那邊吵什麼別人在哪個階段沒花到錢
不公平有啥意義?
做到上述兩項,那我就真的給這家鼓掌
中國出產品走向是中低成本市場。沒有一定要當頂尖
但cp值可能不錯
deepseek的回答真的好王家衛XD
V3的排名還是差4o(11月版)較遠 跟4o(五月版)較近
沒說他們沒花錢,重點前人pretrain花多少,嘲笑前
人砸大錢,DeepSeek應該pretrain的資料總該是全部
都自己的、沒有用其他LLM生成的,有人要背書嗎?
中低成本4o再開放一點權限給免費版就有了
有人要幫DeepSeek背書pretrain的資料準備嗎
所以是DS的工程師還是老闆自己出來"嘲笑"嗎? 現實就
是如果別人能重現 DS R1,在算力巨大差異下可以直接
加碼做到 R10、R100、R1000,到時DS花的500萬也是一
樣丟到水裡
我們看的是總成本,只要找到證明背書pretrain,雖
然正確率差一點,這成本就真的是今年最神的,很簡
單。
https://tinyurl.com/3dfs2j8k 楊立昆都說話了 這就
站在前人肩膀上發展 但也開源沒有藏 所以很棒 稱讚
成本怎麼樣無所謂啦 他都要作功德了 一塊成本都是賺
阿祖就是號召大家AI都來作功德 變成今天這樣很合理
是啊 我對於佛心沒意見 XD
DS的預訓練要用上微信用戶聊天訊息 可能會比較霸氣
誰不曉得中國最厲害的就是魔改別人的東西?
但deepseek算有良心了公開魔改方法 過去一堆垃圾 偷
學術界是齊心討論,可沒酸前人
人家的 營利就算了 還反告別人 嘻嘻
我都直接拿strawberry看是不是資料同源 XDDD
老實講 你有GPU有伺服 抓r1下來自己調一調開API 它
也不能拿你怎樣 這樣還不好?
好啦 1/20 1/20 阿就比較爛啊 阿就買不到算力啊
API就可以串接了 繼續拿資料才是目的
開源的原因很好懂 我之前整合資料庫 免費的最popul
ar的Postgres會支援 其他免費的就再說
所以知道為什麼要開源碼 市占是真的很重要
因為公司可以決定支援的順序
站在巨人肩膀上 科技正常現象
看完覺得Deepseek比較懂得王家衛XD
但是文章內容跟標題完全沒關系XDD
講這麼多 美股續漲
DeepSeek寫得比較好

股癌的台股美股電報群已經有很多大神分析過了
去那邊看就好了
或是Miula的臉書也有討論
中國公司很多的低成本都是假象,要不就是用品質實
際上無法穩定達標的產品充數,要不就是政府補貼導
致的低成本,歐美無法學後者,而前者更是一條死路
請問樓上怎麼加電報群
tradent大,因為我是限定用O1跟R1這兩個來進行,如
果用4O跟V3,也會有不一樣結果,這蠻特別的,我也
覺得4O寫的比O1好
以下是4O寫的,我反而覺得寫得比O1還好

最後那句「真好,人生何處不相逢」有震驚到我,這
個還是在O1之前我先用4O寫的
但因為我想說要比較兩個最強的,就以O1比R1,但是
我覺得寫散文反而4O好於O1
o1是推理型,以r1為例,我問r1不清楚的先問v3、再
啟動r1,r1就突然知道了
得到結論,王家衛的文字用理論是不行的XD要用感情
如果是AGI,就不會有能力差異,表現如何是穩定的,
雖然還沒有AGI。 現在看到LLM會出並存的系列,就當
做遊戲角色各種族差異,要想好先用誰再用誰,AI的
思考跟記憶是仿人腦(非電腦),所以可以交錯問。
像r1就是一定要推理,關掉才能切到V3
怎麼辦,我只覺得是王家衛寫的好不好的差別,而且
散文本來就很吃共鳴XD
之前看過中國豆包跟gpt辯論,再來比一次阿
寫文章的話,4O的能力好很多
這邊高手好多
可以多生成幾篇試試嗎?感覺每次生成的結果應該會有
程度上的差異,但deep seek成本相對chatGPT系列真的
滿低的@@
這邊對作家最有用的是R1,對學生有用的是4O
O1只是通順,沒有特色
再次證明站在巨人肩膀是最划算策略
做功德的話 api的token應該要免費才是
O1 4O 嚴謹程度設定應該不一樣
對作家最有用的不是R1吧,他就只是把王家衛的台詞
搬過來,作家這樣寫會被告抄襲吧
你用九把刀的品味去評鑑4o比較好的嗎?
我是比較喜歡01的版本 每一句都讓我想多停留幾秒去
思考它的意涵意境 也讓我又一次驚訝Chatgpt 的能力
4O有呈現回憶細節感,相比起O1來說我覺得較容易閱
讀阿
很明顯R1寫得最爛
很明顯DeepSeek寫的最有感
數學、程式、科學那種需要推理的才會用到o1
沒有按Deep think其實是走V3, 按了才是R1(或者R1-
preview ? ) ˊ_>ˋ
你散文用o1寫反而讓CoT毀了原本流暢的寫作脈絡
4o才是符合寫作直覺的產生方式
OpenAI又不是傻了,o1最強為什麼還要留個4o
我自己再問那些篇直覺的問題也是只問4o
用o1還占我使用的額度
樓上那些詩句看起來沒有走推理系,有的話問題下方
會看到跑一堆邏輯推理
而且有些問題需要網路最新資料,也只能用4o網路搜尋
DeepSeek明顯被gpt資料模板牽著走,連search的那條
entry也長一樣
DeepSeek卻無法整合V3跟Search,真的超奇怪的,理
論上Search的資料跟GPT無關,他們可以輕鬆突破才對
。
你去看o1出來時跟4o的對比 會發現作文那邊沒增強
因為o1就是邏輯能力
作家用R1改寫後會最有特色,其他沒有改寫空間
R1少了很多邏輯上的連接詞,但是這對作家又不難
R1引導的是一些無法使用大膽文字的作家做出改變
其實這題很怪,我自己測試r1也出現午夜三點十七分
,我用o1開頭也不會這樣 XD
不換個時間? https://imgur.com/9M2I5y1
有03了喔
有人問Deepseek大躍進 給出答案後過兩秒撤回答案
改回答這個違法不能問 這樣你覺得可以?
我們使用AI的目的是要測他夠不夠聰明,能否被人類
接受,這三篇拿去秘密給國文老師修改R1那篇一定第
一個被打不及格阿,因為根本文不對題
你是永遠沒辦法看到GPT模型會有文筆或真的理解你的
問題
因為從底層他就不是那樣子運作的 再怎麼調整都只是
學人講話
舉例來說:你去跟他詢問某一個字的甲骨文源頭 金文
發展 為什麼要用這個 包含裡面字為什麼擺下面他也
不會知道 但他會想辦法掰給你
明明就寫反了他還是一本正經的跟你胡說八道
他不是不差 他只能這樣 如果要給他一個程度的話
他就像Yahoo知識+上的那些「專家」國小、國中生看
到就很熱情的幫你Google出答案 只求最佳解答 而且
就算他真的不知道也要湊答案掰給你看
但GPT模型有個好處 就是你想問很冷門的東西他也能
回你一二句
以前用OpenAI去生圖 就叫他不要再給我裡面的某一個
物件了 他還是硬要給我
為什麼 阿就這些東西都從擴散模型生出來的他怎麼會
做減法
認真說一下繪圖AI是發散->收斂,負向提示詞或二次抹
除還是能做減法。 但LLM就真的是在算計機率。
所以哪個比較像王家衛?
以問題的內容來說,我希望生成一篇有王家衛風格的
標題為人生何處不相逢的散文,R1當然最像王家衛風
格,但是內容狗屁不通阿,就是照搬動王家衛的電影
台詞,你是希望AI生成屎味的巧克力還是巧克力味的
屎,這不是很明白嗎?
Deepseek可能是學中文的比較懂亞洲的東西
deepseek版才是王家衛
29
目前就在旁邊吃瓜觀望@@ 成本這種本就是用開源後的可以拿已有的模型去當輔助下降成本 最常見作法就是拿gpt-4o當judge或者當數據產生器 去精煉數據集 如果再沒有gpt-4o 情況下 很多高質量資料去產生就花很錢 最經點例子就是LLaVa 一個博士班學生 用gpt-4o 去產生高質量多模態數158k 極小量數據集 用8xA100 1天時間 就幹爆之前所有 多模態大模型 能打贏saleforce的一間大公司堆出來的多模態BLIP-2模型![Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高 Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高](https://i.imgur.com/vA7ifFRb.jpeg)
17
不用恐慌,Meta繼Stargate之後,也宣稱要投65B計畫搞大基建。 現在是有AGI了嗎?最快也要看今年底 假設Deepseek R1相當於OpenAI O1好了 成本只有1/20 那為何不出一個成本1/2![Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高 Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高](https://img.youtube.com/vi/_4wVzDlc7cI/mqdefault.jpg)
4
OpenAI又推出了最新的O3-mini跟O3-mini-high可以使用,原本的這個問題我又來問了一遍 ,想說也貼上來給大家品鑑一下O3-mini 究竟有沒有比Deepseek-R1強 ChatGPT-O3-mini![Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高 Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高](https://i.imgur.com/QSFVbo4b.jpeg)
29
不知道有沒有鄉民試過 Deepseek R1 單機版 其實過程很簡單,安裝 LM studio 就可以去撈 model 來測了。 甚至也有些標榜已經除去審查的 model 先講結論,我覺得單機 LLM 可能會更多人有興趣能做到怎樣。 雖然功能不如訂閱聊天/API,
爆
[心得] DeepSeek對AI產業鏈影響懶人包最這幾天股板跟 X 上的AI金融圈吵的火爆 DeepSeek 對全球 AI 技術發展影響 吵的火爆示意圖 金融人士擔憂影響![[心得] DeepSeek對AI產業鏈影響懶人包 [心得] DeepSeek對AI產業鏈影響懶人包](https://i.imgur.com/WiusWatb.jpg)
爆
Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預teamblind 匿名的可能有人不信 與其聽匿名、鄉民互吹/貶 不如來聽聽 Meta 現任 CEO Mark Zuckerberg 本人對於 Deepseek AI 模型的看法 2025/01/11 Mark Zuckerberg 接受美國知名喜劇演員 Joe Rogan 專訪 截至今日有 840 萬人看過這個影片![Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預 Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預](https://i.imgur.com/HlQlJzkb.png)
爆
[問卦] 祖克柏承認DeepSeek超強了祖克柏針對DeepSeek發表感想了 祖克柏說DeepSeek很先進 美國AI很可能會落後中國 這代表中國的AI元年來臨了![[問卦] 祖克柏承認DeepSeek超強了 [問卦] 祖克柏承認DeepSeek超強了](https://i.ytimg.com/vi/hG4tGl0s7XU/oardefault.jpg?sqp=-oaymwEkCJUDENAFSFqQAgHyq4qpAxMIARUAAAAAJQAAyEI9AICiQ3gB&rs=AOn4CLB0VEhX4AS_n6zjEwVG_IcTgg354Q)
57
[情報] Perplexity CEO:實驗性整合DeepSeek R1模標題: Perplexity CEO:實驗性整合DeepSeek R1模型 來源: Perplexity CEO Aravind Srinivas 網址:![[情報] Perplexity CEO:實驗性整合DeepSeek R1模 [情報] Perplexity CEO:實驗性整合DeepSeek R1模](https://i.imgur.com/qRQi9ZVb.png)
29
Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預會恐慌是美國那些公司的心態有問題,他 們幻想的是自己能獨佔AI領域,幻想他們 燒大錢最後生出來的大模型可以抬價收費 meta的模型號稱開源講白了就只是因為差 openai太遠所以把資源丟出來靠龐大共享![Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預 Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預](https://i.imgur.com/1EERwjXb.jpg)
21
Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分看到沒幾個人在討論,跟大家分享Gemini最近新推出的Gemini 2.0 Flash thinking experi mental 01-21(其實去年年底就有一個版本,可以用的token數量小很多),同樣有CoT,同 樣看得到思考過程,而且也免費,不確定之後會不會收費 1.先到這裡![Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分 Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分](https://i.imgur.com/N9FCwqmb.png)
9
Re: [請益] Deepseek v3 對台積電有影響嗎沒想到吹沒多久 當問DeepSeek-V3:"你是什麼模型" DeepSeek-V3竟然回答:"我是chatgpt"![Re: [請益] Deepseek v3 對台積電有影響嗎 Re: [請益] Deepseek v3 對台積電有影響嗎](https://i.imgur.com/wcgo1TCb.jpg)
6
[爆卦] 尷尬 支那大模型Deepseek v3自稱chatgpt支那AI公司DeepSeek三天前推出DeepSeek-V3 該公司公布的性能可匹敵GPT-4o以及Claude-3.5-Sonnet DeepSeek-V3用2個月訓練2048個GPU只花588萬美元 遠低於GPT-4o約1億美元 粉紅五毛藉此嘲諷美帝封鎖高階晶片也無法阻止支那AI![[爆卦] 尷尬 支那大模型Deepseek v3自稱chatgpt [爆卦] 尷尬 支那大模型Deepseek v3自稱chatgpt](https://i.imgur.com/Zo1PKXwb.jpg)
6
[問卦] 驚! 一句話把deepseek問倒安 最近爆紅的deepseek 號稱把chatgpt按在地板摩擦 剛剛只要一個數字 卻無法運用其深度參考的優勢![[問卦] 驚! 一句話把deepseek問倒 [問卦] 驚! 一句話把deepseek問倒](https://i.imgur.com/1dgTGipb.png)
X
[討論] chatgpt被deepseek幹掉了?連這個領域,中國人都要染指霸佔了? 是不是要重新思考晶片出貨的對象了?越是抑止中國,中國越是勃發是怎樣? 塔綠班也開始使用deepseek了嗎? ※ 每日發文數上限為5篇,自刪與板主刪除,同樣計入額度 ※ ※ 發文 內文請滿40字 ※
爆
Re: [心得] 山椒魚盤勢觀察![Re: [心得] 山椒魚盤勢觀察 Re: [心得] 山椒魚盤勢觀察](https://i.mopix.cc/LLOj00.jpg)
爆
[請益] 0056可以這樣操作嗎![[請益] 0056可以這樣操作嗎 [請益] 0056可以這樣操作嗎](https://i.imgur.com/z8X13Bfb.jpg)
68
[情報] 台灣2025年11月份CPI 1.23%![[情報] 台灣2025年11月份CPI 1.23% [情報] 台灣2025年11月份CPI 1.23%](https://i.imgur.com/pLLp0M0b.jpeg)
96
[情報] 114年12月05日 三大法人買賣金額統計表![[情報] 114年12月05日 三大法人買賣金額統計表 [情報] 114年12月05日 三大法人買賣金額統計表](https://i.imgur.com/roBWXt2b.png)
91
[情報] 2317 鴻海 2025年11月營收75
[情報] 2344 華邦電 114年11月營收![[情報] 2344 華邦電 114年11月營收 [情報] 2344 華邦電 114年11月營收](https://i.mopix.cc/JF4BB2.jpg)
63
[情報] 00631L 預估分割17倍決議表決![[情報] 00631L 預估分割17倍決議表決 [情報] 00631L 預估分割17倍決議表決](https://imgpoi.com/i/6GBH1D.jpg)
48
[請益] 說AI會跟.com一樣泡沫化是假議題吧?![[請益] 說AI會跟.com一樣泡沫化是假議題吧? [請益] 說AI會跟.com一樣泡沫化是假議題吧?](https://img.youtube.com/vi/e0CJBzGa0hQ/mqdefault.jpg)
55
[情報] 1205 上市外資買賣超排行![[情報] 1205 上市外資買賣超排行 [情報] 1205 上市外資買賣超排行](https://i.imgur.com/cvoXoMub.jpeg)
38
[情報] 0050、0056等成分股調整56
Re: [新聞] OpenAI危險了!DeepSeek正式發佈V3.2 性![Re: [新聞] OpenAI危險了!DeepSeek正式發佈V3.2 性 Re: [新聞] OpenAI危險了!DeepSeek正式發佈V3.2 性](https://img.youtube.com/vi/H_suOWdYLq0/mqdefault.jpg)
33
Re: [心得] 周冠男:珍愛生命,遠離高股息![Re: [心得] 周冠男:珍愛生命,遠離高股息 Re: [心得] 周冠男:珍愛生命,遠離高股息](https://i.imgur.com/QUlaRGZb.jpg)
31
Re: [請益] 0056可以這樣操作嗎![Re: [請益] 0056可以這樣操作嗎 Re: [請益] 0056可以這樣操作嗎](https://i.imgur.com/QUlaRGZb.jpg)
31
[情報] 3443 創意 11月營收22
Re: [心得] 周冠男:珍愛生命,遠離高股息![Re: [心得] 周冠男:珍愛生命,遠離高股息 Re: [心得] 周冠男:珍愛生命,遠離高股息](https://i.imgur.com/5f96blgb.gif)
18
[請益] 第一金最近有什麼大事要發生嗎?![[請益] 第一金最近有什麼大事要發生嗎? [請益] 第一金最近有什麼大事要發生嗎?](https://i.mopix.cc/vMDTOu.jpg)
16
Re: [新聞] Fed主席大熱門哈塞特表態:下周應降息 預15
[情報] 2383 台光電 11月營收14
[情報] 2891 中信金 11月自結 0.36 累計 3.7615
Re: [標的] 記憶體族群回檔 彎腰撿鑽石多![Re: [標的] 記憶體族群回檔 彎腰撿鑽石多 Re: [標的] 記憶體族群回檔 彎腰撿鑽石多](https://i.imgur.com/MO9jzZjb.gif)
14
[情報] 日本兩年期公債收益率升至1.03%11
[情報] 1205 上市投信買賣超排行9
Re: [情報] 2317 鴻海 2025年11月營收9
Re: [請益] 說AI會跟.com一樣泡沫化是假議題吧?![Re: [請益] 說AI會跟.com一樣泡沫化是假議題吧? Re: [請益] 說AI會跟.com一樣泡沫化是假議題吧?](https://img.youtube.com/vi/XwG3w4jL0wM/mqdefault.jpg)
8
[情報] 2885 元大金 11月自結 0.24 累計 2.508
[情報] 2498 宏達電 114年11月營收6
[情報] 2545 皇翔 買台積電 210張,均價:1469.417
[情報] 3167 大量 114年11月營收12
Re: [新聞] OpenAI危險了!DeepSeek正式發佈V3.2 性5
Re: [心得] 周冠男:珍愛生命,遠離高股息