[請益] LLM模型廠商沒辦法反制?
這次訓練出Deepseek一個技術就是利用大模型來對答案訓練多專家模型
那這樣的話大模型廠商沒辦法建立一個收費機制讓透過AI feedback的成本變高或是需要被審核嗎?
想問業內有沒有高手可以分享一下
不然這樣砸錢當領先者的都被別人便宜槓桿當然資本支出都不會想花了
--
關股版屁事?你又沒closeAI股票 關你屁事擔心那麼多
CSP資本支出和台股關聯那麼大 哪裡不相干
※ 編輯: harry8123 (112.78.93.15 臺灣), 01/31/2025 10:05:42一種模型吃天下 應該不存在
我的想法至少要讓別人槓桿自己的成本變高吧 不然怎麼有護城河可言
※ 編輯: harry8123 (112.78.93.15 臺灣), 01/31/2025 10:08:45孩子僅發表但不公開被嫖不就好了 想要的廠商或個人
付費購買
針對場合優化惹
呃,為什麼錢砸的多就可以全拿?
錢砸的多也是資本護城河呀 被別人便宜槓桿那誰要戴鋼盔往前衝
※ 編輯: harry8123 (112.78.93.15 臺灣), 01/31/2025 10:11:04透過ai 把變現領域擴大 例如meta 吃電信業
會覺得不行才詭異 大團隊花些時間拆解馬上就跟上了
反而算力才是其他廠商無法跟上的關鍵
你別花啊 人家手上有算力你沒有你就吃屎啊
長期來看LLM不會變成AGI
砸錢當第一個的很多也是靠專利保護 否則大家都可以
用偷的誰還要用微軟的作業系統 直接複製一個山寨的
免費爽用就好了
大模型有商業模式可以像專家模型開發商收取費用了XD
問題那個大池子裡面的東西也是偷來的啊 現在變成不
管雜七雜八都往池子丟再想辦法distill成ro水 顧那
個池子的最倒霉 應該各國要想辦法一起成立一個開源
的天池才會進步
我覺得算力反而才是重點
傻鳥還是回去巢穴吧
大池子 你說偷 撈也要花錢啊 你rs直接撈別人釣
上來的還好意思
直接拿別人撈到的資料 再來吹自己有多省錢
好了啦 微軟老爸都把DS放進口袋了 這樣怎麼解釋
微軟老爸難道是在賣小偷偷自己家的產品是嗎?
事實是 LLM 沒有技術護城河 跟台積電輝達的狀況完
全不一樣
只有我能偷 你們都不能偷
好了拉 有偷就去告 真以為這麼好偷 又套瘋了一個
closeAI到處偷被告就不說 雙標
沒辦法,它就是接你的api 也有付錢 只是用途不同
擋不了
反制甚麼??..受害者只有Open AI or Claude這種單一
模型的廠商
其他應用面的 就是多一個選擇...
最後沒AGI 一樣要跌落神壇
人家開源推動技術為什麼要反制?
那你選股看別人分析都有付錢嗎? 免錢的拒看嗎?
除了模型商受傷外其他都是長期利多
文組
好幾個文組推文真的該先去多唸書 靠梗圖學LLM會笑
死人
https://reurl.cc/b3gavv 老美急了 嘻嘻
Google表示:Attention is all you need?
唯一字面上的反制只能立法 當作盜版軟體一樣
線上服務把它當作侵權網站抄掉,
離線版則聯合各大防毒廠商鎖起來,
但這樣做沒有任何意義
發現有些智障在幫可以省錢的大局操窮人的心
你怎麼會覺得資本支出會下降=.=
不懂就去問AI不必硬要想
爆
Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預teamblind 匿名的可能有人不信 與其聽匿名、鄉民互吹/貶 不如來聽聽 Meta 現任 CEO Mark Zuckerberg 本人對於 Deepseek AI 模型的看法 2025/01/11 Mark Zuckerberg 接受美國知名喜劇演員 Joe Rogan 專訪 截至今日有 840 萬人看過這個影片57
Re: [討論] 其實Deepseek真的很厲害了OpenAI:已掌握DeepSeek盜用模型證據 (中央社倫敦29日綜合外電報導)中國新創公司「深度求索」(DeepSeek)引發的疑慮日 增。OpenAI今天表示已掌握證據,顯示DeepSeek盜用其模型進行開發;業界也指DeepSeek 握有大量輝達H100高階晶片,形同直接挑戰美國出口管制規定。44
Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據比較好奇這段: 儘管蒸餾是AI業界常見做法,但DeepSeek若利用蒸餾技術來打造自家模型,並與OpenAI競 爭,將違反OpenAI服務條款,因此產生疑慮。 OpenAI婉拒進一步說明或提供證據細節。根據該公司的服務條款,用戶不得「複製」任何 OpenAI的服務,或是「利用輸出結果,來開發與OpenAI競爭的模型」。 各個ai 大語言模型不是都會互相參照比較和訓練嗎? 我以為這是業界常識…52
Re: [討論] 中研院繁中LLM被爆直接拿對岸的來套小弟待的公司,非學術單位, 可能是台灣硬體計算資源稍微豐富的公司。 公司投入在買GPU 應該近億了。 自己也研究了幾個月 fine-tune 方法。 不過,還是沒足夠能力與資源訓練正常的LLM。29
Re: [討論] OpenAI GPT o1模型OpenAI 最近推出了 GPT-o1,但很多人可能還沒意識到這件事的嚴重性。事實上,OpenAI 已經找到了一條通往 AGI(通用人工智慧)的階梯!這個新模型的關鍵在於,它已經整合了 ToT(思維樹)和 RL(強化學習),在大型語言模型(LLM)領域達到了類似 AlphaGo Zer o 的水準。 很多人以為 LLM 就是個「刷題機器」,記住了大量的資料,所以我們在人類記憶力上輸了23
Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據各家互相參考, 指的是訓練方法還有訓練的文本挑選, 蒸餾不太一樣 AI = 模型的程式碼+訓練 能開源的部分只有程式碼, 訓練是看各自調教 模型的能力夠, 差不多的調教方式就會得到差不多的結果 訓練方法更好, 或是文本品質越高、越多樣、量越多, 模型就越強18
Re: [新聞] DeepSeek 遇大規模網路攻擊,暫時只支援Musk贊同投資公司Atreides Management合夥人兼資訊長貝克(Gavin Baker)在X提到 DeepSeek的R1低成本來自在訓練和推理效率上,取得了真正的算法突破 例如 FP8 訓練、MLA(機器學習加速)和多 token 預測。 訓練過程中涉及大量的知識蒸餾(distillation) 這意味著在沒有無限制存取 GPT-4o 和 o1 的情況下,這項訓練幾乎不可能完成。9
[問卦] 中國deepseek是不是大贏chatgpt?最近有中國AI公司宣稱,用550萬美元成本 訓練大模型語言,效能贏很多美國大廠 台灣有沒辦法達到? 中國人的智慧是不是比美國人還厲害啊?3
Re: [請益] Deepseek v3 對台積電有影響嗎的確會讓人好奇DeepSeek-V3的訓練方式, 但成本降低如此之多,另外一個思考點,是不是除了科技巨頭外, 更多公司願意投入資本支出來建立自己的模型? 而且隨著技術發展,模型建立的成本一定會快速下降。 DeepSeek-V3比較的 Claude.ai/Qwen2.5/LLaMA3.13
Re: [討論] Deepseek就之前吹過頭了呀 XD主要是他們故意少說了 預訓練那些專家模型的成本 只說訓練後的成本 不過還是比Open AI的GPT便宜就是 因為他們是特化型訓練,跑分仔。
爆
[情報] 114年02月25日 三大法人買賣金額統計表54
[標的] NVDA.US 沒救了,今年美股買哪支能漲20%56
[情報] 6488環球晶 Q4 0.8747
[標的] 微型台指期 空32
[創作] 失超半(詩超絆)25
富果要公布和那個券商合作了沒?25
[情報] 中租2024 Q4延滯率19
Re: [標的] NVDA.US 沒救了,今年美股買哪支能漲20%16
[情報] 0225 上市投信買賣超排行15
[標的] 00955日本大漲的原因15
[情報] 台光電113年財報 EPS:27.8113
Re: [新聞]讀者來電:自從家人沾上郭哲榮 我賠3200萬11
Re: [新聞]讀者來電:自從家人沾上郭哲榮 我賠326
Re: [新聞]讀者來電:自從家人沾上郭哲榮 我賠3200萬26
[標的] 大盤 農曆二月 漲9
Re: [新聞] 微軟突取消資料中心租約 揭示AI需求過剩8
[創作]吉伊多蛙詩(改木蘭詩)7
[請益] 這樣配置能有效避險嗎?19
Re: [新聞] 微軟突取消資料中心租約 揭示AI需求過剩36
[請益] 驚!每降息1%美債ETF會漲16.5% ?34
Re: [新聞] 微軟突取消資料中心租約 揭示AI需求過剩4
Re: [新聞] 學者分析財報…台電大虧 因高價買電27
[標的] 1459.TW聯發 關廠多4
Re: [新聞] 微軟突取消資料中心租約 揭示AI需求過剩10
Re: [新聞] 微軟針對TD Cowen報告澄清:不會取消美