Re: [新聞] 敏感詞達35萬 DeepSeek使用率從50%跌至3%
※ 引述 《sunbysea》 之銘言:
: 敏感詞達35萬 DeepSeek使用率從50%跌至3%
: https://i.ntdtv.com/assets/uploads/2025/07/id104002656-GettyImages-2200111369-: 868x488.jpg
: 2025年2月21日,上海人工智慧產業協會在上海舉辦的全球開發者大會上展示了Deepseek: 的標誌。(Photo by Hector RETAMAL / AFP)
其實用戶下降要從好幾個層面來看啦!
以To C來說,想衝高流量其實DeepSeek大可以分成海內版跟海外版,海外版不設置使用限制,海內版設置敏感詞做Guardrails。
當前很多Agentic的方法是確實有辦法依據各國法律來制定服務政策的,不過我想關鍵原因可能還是DeepSeek手上握有的卡效能跟算力都存在瓶頸,尤其是美國從年初對高階顯卡的管制是真的有掐住大部分中國AI公司短期的痛點。DeepSeek當前的內部研究可能是急缺顯卡的狀態的,這種狀態要在提供To C用戶其實負荷是蠻高的。
我看媒體上說是缺乏數據我反而感覺是有點問題的,主因就是如果真的缺乏數據那V3、R1的更新理論上也會有問題才是,但是開源版R1、V3確是有更新而且performance 是可以直追OpenAI o3系列的,我自己體感拿一些新的benchmark測試也是跟o3不分上下,有些題目表現反而反超o3。
我自己感覺R2沒有發佈除了研究本來就不是線性發展外,更大可能是算力缺乏。以過往
梁文峰的一些採訪片段,如果只是單純的數據或是模型大小提升可能不是他要的,R2感覺更多會是架構或是訓練範式的改進,但純無模型的RL訓練其實是不太好做的而且算力需求可能會不小,我更傾向讓子彈飛一會。
我感覺很多媒體把很多研究型公司強硬要對標服務型公司其實是不太好的,研究型公司其實產品週期會比很多人想像的長投入更高,服務型公司就是單純建構在既有技術上為用戶服務迭代的。關鍵還是DeepSeek對自己公司的定位,反而需要去關注創始人的看法跟營運目標了。
--
※ 編輯: sxy67230 (101.10.216.21 臺灣), 07/14/2025 19:36:14
ds有點像專長是奇門遁甲、五鬼搬運述
然後幫人辦事收費又便宜.
把一堆人引來了之後,讓一堆徒弟去接案
你聘他的徒弟在你館裡等客人上門,
他收費很低,但你開個館場地人事費很高
ds審查是model內建的,你從 抱臉下載的也有
審查,哪有分什麼海內海外
你說的部分是模型本身價值對齊的部分,但是DeepSeek Web服務是還有另外一套檢測的機制 避免模型被jailbreak。幾乎所有有做成服務的LLM都有做兩套檢測機制,像OpenAI其實背後 也有另一個模型偵測黃賭毒的回應直接蓋掉LLM的回答,這邊新聞說的35萬的敏感詞審查就 是外 部系統。
結果你看來生意很好但月結發現虧很大.
最後是他賺到名氣,但你的加盟店倒了
※ 編輯: sxy67230 (36.228.2.95 臺灣), 07/14/2025 20:12:13
現在最新的已經是kimi k2了
慢跟難用就是事實!沒人用的Ai要幹
嘛?養金魚嘛…
雞同鴨講,都花了30%的精力再處理關鍵
字,當然慢
跟算力關係比較大,OpenAI也有類似的系統做偵測屏蔽敏感內容生成但是人家在足夠算力下 還是有辦法維持服務。依照現代的Similarly DB 35萬個詞根本構不成問題,工程上都可以 做到的事情你卻相信沒有工程背景加上署名爆料的媒體? 附註一下,比起這些不知道哪裡來的新聞,我更相信專業機構的報導
https://semianalysis.com/2025/07/03/deepseek-debrief-128-days-later/※ 編輯: sxy67230 (36.228.2.95 臺灣), 07/15/2025 06:50:16
※ 編輯: sxy67230 (101.10.216.21 臺灣), 07/15/2025 07:32:49
※ 編輯: sxy67230 (101.10.216.21 臺灣), 07/15/2025 07:45:03
推
大部分的人搞不懂DS最重要的影響是Open
Source
爆
[爆卦] 數發部次長造謠Deepseek成本不只550萬鎂補充:數發部次長刪留言了 懶人包: 某位財經網美發文說deepseek 就是騙局,而且根本是抄襲的次等chatGPT 底下數發部次長(林X敬)留言表示他們2048片H800根本不只這個錢,但是被打臉了(已刪 留言)47
[討論] Deepseek就之前吹過頭了呀 XD來看看DEEPSEEK之前怎麼吹的 「DeepSeek R1的問世,宣告AI訓練與推理成本大幅縮減,在不到600萬美元的極低投入成本 和2048塊性能遠低於H100與Blackwell的H800芯片條件下,DeepSeek團隊打造出性能堪比Ope nAI o1的開源AI模型,相比之下Anthropic與OpenAI訓練成本高達10億美元。該模型每百萬 個token的查詢成本僅爲0.14美元,而OpenAI的成本爲7.50美元,成本降幅高達驚人的98%。44
Re: [新聞] OpenAI執行長:DeepSeek令人驚豔 但關鍵就是算力才是絕對 (新聞用運算這詞可能不太好懂) 吃瓜可以看下面翻譯 無窮算力->無窮智能 這就是OpenAI和Andrej Karpathy, Jim Fan甚至認為20
Re: [問卦] 為什麼deepseek會影響台積電 不懂?DeepSeek厲害的地方不是他便宜,不是他厲害,最重要的地方是他開源。 他的原始碼開源,權重開源(資料沒有開源),而且開放商業授權,他的 原始碼是MIT授權,權重則是基於OpenRail的特殊開源架構,也就是只有 一些特別場合他沒有授權,例如製造有害軟體,製造毒品等等 簡單來說你現在馬上就可以在你的電腦,你的公司使用了,你只要用很普12
Re: [情報] 中國5090 DeepSeek 大模型一體機需求爆發沒辦法,算是錯誤的供需市場吧 應該是Deepseek運用高效算力提供便宜的API給民用商用需求 結果API也不便宜,網頁版本還時常不可用跟言論審查 大幅加速中國本地推理需求,畢竟這是目前開源的推理模型 而且對中文圈華語使用者有很道地的中文訓練資料9
[問卦] OpenAI推出O3多久會被中國破解OpenAI表示已經拿到輝達最新顯卡Blackwell 以及要推出O3模型了 O3效能遠遠大於O1跟DeepSeek 感覺美國已經沒救了 做多少都沒用 中國都會以10分之1的成本復現7
Re: [問卦] Deepseek為什麼光速過氣?因為沒有足夠的H100來燒 請參照我一月底的文章 "如果有一個更有效率的架構/模型 假設你拿五千張H100就能做出Deepseek R1" "那些有十萬張的公司就能搞出更屌的東西"3
Re: [黑特] 民進黨支持者思想真的很幼稚青鳥跟塔綠班們 都不知道DeepSeek是開源的 所以才有那些奇怪自卑推論 這次中國產生DS 其實對全世界都是一個正面的發展 也就是 花小成本也可以 作出 大成本模型效能的AI語言模型 重點是這個模型的程式碼跟架構 還跟全世界分享 也就是 台灣人照抄 也可以作出自己想要內容的 DeepSeek- 我幫大家採訪了一下Deepseek 1.我問Deepseek是否有盜用chatgpt 回答: 我由中國的深度求求索(DeepSeek)公司開發,代號為DeepSeek-R1。我的訓練數據和技 術架構均為自主研發,嚴格遵守數據合規與倫理規範。雖然與ChatGPT同屬大語言模型技
X
[討論] DeepSeek遭德州封殺,AI戰爭升級?德州州長格雷格艾波特(Greg Abbott)下令禁止政府設備使用DeepSeek,這個決定背後 有著一連串的原因與考量。DeepSeek是一家中國的人工智慧(AI)初創公司,最近迅速崛 起,並且引起了許多美國用戶的關注與使用。艾波特的禁令不僅針對這款AI聊天機器人, 還涉及到了中國擁有的社交媒體應用小紅書和Lemon8。這些舉措反映了美國對中國科技企