Re: [請益] LLM模型廠商沒辦法反制?
※ 引述《harry8123 (白蛇)》之銘言:
: 這次訓練出Deepseek一個技術就是利用大模型來對答案訓練多專家模型
: 那這樣的話大模型廠商沒辦法建立一個收費機制讓透過AI feedback的成本變高或是需要: 被審核嗎?
: 想問業內有沒有高手可以分享一下
: 不然這樣砸錢當領先者的都被別人便宜槓桿當然資本支出都不會想花了
你的標題是問LLM模型廠商
但裡面又在講CSP採購
你是不是搞錯了些什麼= =
的確CloseAI或是anthropic這種公司會希望阻止外人偷我
問題CSP業者不在乎你有沒有被偷阿
甚至對他們來說越多人偷越好,因為成本越來越低
人家在乎的是你使用者會不會來用我的伺服器
微軟會在乎你是來我的伺服器用GPT還是DS嗎?
阿馬宗會在乎你是來我伺服器用claude還是DS嗎?
甚至微軟為什麼馬上要導入DS
免錢,又能牽制自家CloseAI團隊
以前你是家裡獨生女,微軟老爸把你捧在手上
現在外面來一個更乖又不用錢的乾女兒
你最好罩子放亮點,現在老爸手上可是有新選項了
成本越來越低 = 越多人能投入 = 伺服器越多人用
CSP業者腦袋撞到才會去對LLM設護城河好嗎= =
--
符合邏輯!
有了免費Linux,誰架server還用貴森森Windows 2003
開源也沒有完全取代閉源 windiw不活好好 重點
是找到閉源的特殊性
難怪微軟昨天大跌
99 MSFT
正確
確實我發問錯誤 因為很多模型廠商背後是CSP在扶植才
會這樣問
因為一開始有進入門檻大部分的人都不知道實際開發
情況,而且大型模型的輿論也都是掌握在那些廠商手上
,他們要宣傳說需要多少錢才能做出一個模型,大家
都買單認為ai模型未來需要投入的成本就是那麼高,在
DS問世前有人質疑嗎?DS的價值就是他們戳破訓練一
個大型模型需要的經費根本不需要一開始宣傳的這麼多
。
但你這麼說不就缺乏民主價值了?
對CSP而言,靠一個DS打破模型商寡占市場跟打壓NV算
力供應價格超划算
演算法改進早就可以預料得到而且必定會有的 但LLM
只是AI AGI的起點不是終點
勿跟柵欄仔認真 跟豬打架沒兩樣
原本AI創業被算力壁壘掐的死死的 做出全球爆紅的應
用 反而收益被硬體廠吸乾
22
[情報] AMD 2023年x86伺服器CPU市占可望破22%英特爾新品量產延後,AMD 受惠 2023 年 x86 伺服器 CPU 比重可望突破 22% TrendForce 最新研究,受 Intel 7 良率欠佳影響,新品 Sapphire Rapids 量產時程延後,估計 Sapphire Rapids 生產良率僅 50%~60%,衝擊主力產品 Sapphire Rapids MCC,量產計畫從今年第四季延後至 2023 上半年。量產時程延後不僅影響 ODM 備料週期,也大幅降低 OEM 與 CSP 今年導入 Sapphire Rapids 的比重。AMD(超微)將成為最大受惠者,預估今年 AMD x86 伺服器 CPU 出貨市占率約 15%,2023 年有望突破 22%。 AMD自2021下半年至今大幅提高ABF載板產能,同時越來越多終端客戶增加降低能耗要求,考量伺服器整機成本(TCO)前提下,傾向使用單插槽伺服器。TrendForce認為,客戶需求轉變使AMD擺脫以往2-socket架構下難以突破的困境,更有利衝刺出貨量。 除了大環境需求疲弱,英特爾的挑戰還有低階FPGA缺料頻傳,影響雙插槽CPU訂單及政府標案需求轉弱、OEM業者調降庫存水位等壓力。近期美商務部新禁令使高階運算晶片市場首當其衝,英特爾及AMD客製化晶片出貨確實承壓,但超算機種占伺服器市場總量不大,影響程度尚低。若後續美中摩擦加劇,英特爾伺服器CPU領域霸主的地位恐是雙面刃,衝擊更甚AMD。12
Re: [討論] 其實Deepseek真的很厲害了DeepSeek可以下載到自己電腦跑、ChatGPT不行, 這在商業使用的場景上就有蠻大的差異 昨天很多人在傳說用(線上版)的DeepSeek會把資料傳給中國,這當然是對的, 但過去一兩年我們幫客戶評估AI專案時, 在串GPT-API上常常會碰到我們或我們的客戶其實也不想把資料傳給OpenAI,6
Re: [問卦] DeepSeek怎麼一天就走下神壇?專業一句話就是 R1是一個"方法論"而不是模型 v3是新模型範式的概念驗證 建議先去看 LATS 或 ANPL 比較好理解什麼叫"方法論" 先講v3價值:打破了以往單一模型走scaling law 成本是近似指數或n^2誇張上升 原本AI能力要變強 原本是要暴脹式的砸錢 軍備競賽般的資本競賽 v3 open的paper說明了 用成千上百個小model集合也能做出類似效果 不用被大n懲罰- 請容我搬運一篇對岸知乎的文章, 這是一篇非常長的文章,其中大部分片段與本文無直接關聯,而且是2023/02寫的. 我只搬運本串相關的記憶體的部分,還有尾部的結論.且未修飾原文用字 詳細的有興趣請直接去原網址看吧. ChatGPT背後的經濟賬
爆
[情報] 114年02月25日 三大法人買賣金額統計表54
[標的] NVDA.US 沒救了,今年美股買哪支能漲20%56
[情報] 6488環球晶 Q4 0.8747
[標的] 微型台指期 空32
[創作] 失超半(詩超絆)25
[情報] 中租2024 Q4延滯率25
富果要公布和那個券商合作了沒?16
[情報] 0225 上市投信買賣超排行15
[標的] 00955日本大漲的原因15
[情報] 台光電113年財報 EPS:27.8113
Re: [新聞]讀者來電:自從家人沾上郭哲榮 我賠3200萬11
Re: [新聞]讀者來電:自從家人沾上郭哲榮 我賠326
Re: [新聞]讀者來電:自從家人沾上郭哲榮 我賠3200萬26
[標的] 大盤 農曆二月 漲9
Re: [新聞] 微軟突取消資料中心租約 揭示AI需求過剩8
[創作]吉伊多蛙詩(改木蘭詩)7
[請益] 這樣配置能有效避險嗎?19
Re: [新聞] 微軟突取消資料中心租約 揭示AI需求過剩36
[請益] 驚!每降息1%美債ETF會漲16.5% ?34
Re: [新聞] 微軟突取消資料中心租約 揭示AI需求過剩27
[標的] 1459.TW聯發 關廠多4
Re: [新聞] 微軟突取消資料中心租約 揭示AI需求過剩10
Re: [新聞] 微軟針對TD Cowen報告澄清:不會取消美