Re: [討論] 台派財經網美:Deepseek不可能那麼省錢
這幾天R1版橫空出世之前,網上本來就告訴你了。在拜登禁令之前
幻方量化就已經囤了大量GPU。
庫存和投入研發的數量是兩回事
研發成本和復現成本也是兩回事啊
開發和維護windows,幾百億美元成本,但是妳買一張WINDOWS光盤成本幾毛。售價幾百而已網絡下載更是零成本,只需要付出license的價格
簡單的道理。不知道那些愚蠢的哥布林,尤其是文組網紅在亂什麼
美國和香港的大學團隊,已經復現模型訓練結果
而早就有很多人在低價GPU甚至手機上部署成功了蒸餾模型
※ 引述《Manzini (Manzini)》之銘言:
: 台派青鳥黑熊lgbt聽團仔
: 心中唯一的財經導師
: 台派網美反指標 開示:Deepseek 不可能那麼省錢
: 果然一群文組集中起來信仰是真的很強大
: 怎麼跟矽谷的大佬?還有川普講的都相反呢?
: 果然去年會在特斯拉160的時候唱衰
: 鴻海唱衰在108
: 港股唱衰在15,000
: 台派財經導師
: 青鳥的最愛
--
https://www.bilibili.com/video/BV11a411y7we
蘇貞昌說進核食跨越了進入cptpp的最重大障礙
--
※ PTT留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 223.89.14.114 (中國)
※ PTT 網址
噓
blablablabla
噓
之前不是說AI是泡沫嗎ww
→
怎麼又現在開始自慰呢
推
要是聽他的買長榮還套著呢
爆
Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預teamblind 匿名的可能有人不信 與其聽匿名、鄉民互吹/貶 不如來聽聽 Meta 現任 CEO Mark Zuckerberg 本人對於 Deepseek AI 模型的看法 2025/01/11 Mark Zuckerberg 接受美國知名喜劇演員 Joe Rogan 專訪 截至今日有 840 萬人看過這個影片爆
[情報] AMD 興奮宣布 Instinct MI300X GPUs 支援 DeepSeek-V3標題: AMD Instinct GPUs Power DeepSeek-V3: Revolutionizing AI Development with SGLang 來源: AMD's X (Twitter) 網址:38
[問卦] 財經網美說Deepseek開發成本謊報中國AI公司DeepSeek(深度求索)以低晶片數開發出與OpenAI O1相當的新模型,經過查 詢成本降低98%引外界矚目,對此財經網美胡采蘋認為,DeepSeek的母公司「幻方量化」 聲稱,他們是用A800、降速晶片開發,這根本是無從驗證的說法,且Deepseek沒有報上背 後語言模型的成本,開發成本必然是謊報的。 但deepseek成本降98%指的根本不是開發成本47
[討論] Deepseek就之前吹過頭了呀 XD來看看DEEPSEEK之前怎麼吹的 「DeepSeek R1的問世,宣告AI訓練與推理成本大幅縮減,在不到600萬美元的極低投入成本 和2048塊性能遠低於H100與Blackwell的H800芯片條件下,DeepSeek團隊打造出性能堪比Ope nAI o1的開源AI模型,相比之下Anthropic與OpenAI訓練成本高達10億美元。該模型每百萬 個token的查詢成本僅爲0.14美元,而OpenAI的成本爲7.50美元,成本降幅高達驚人的98%。8
Re: [新聞] 市值蒸發19.7兆!輝達聲明:DeepSeek未簡單說明一下為什麼NVDA暴跌 很多人一定覺得很奇怪,然後各種文組出來表演秀下限 簡單說NVDA能在40系GPU出來的時候打爛AMD , 就是因為他們的AI級伺服器GPU , 例如A100 還有H100 然後Deepseek現在告訴你 , 這些為了AI打造的GPU都是垃圾 接下來我舉個簡單的例子,Intel曾經想推動WiMAX 來一統高速無線網路11
Re: [心得] DeepSeek將是刺破本輪泡沫的那根釘子DeepSeek其實真正的創新在model的高效設計,其真正的關鍵在efficient MOE還有MLA設計 這其實是2024年初DeepSeek V2就發表的東西 R1是把這個高效model設計+O1推理模型的LLM+RL合併出來的效應 我覺得歐美廠商因為本錢大所以忽略了降本增效的飛輪效應,所以第二個推理模型反而是中 國公司出圈了,推理模型的Test Time Compute對模型效率的敏感性就非常強烈了,訓練中3X
[討論] DeepSeek與超導技術,誰能笑到最後?目前,關於中國研究團隊聲稱開發出「DeepSeek」技術,以及南韓所謂的「常溫常壓超導 體(如LK-99)」的真實性,都存在廣泛的爭議。 1. 中國的DeepSeek 這項技術據說是一種具有革命性的量子計算與通訊技術,但相關細節尚未公開,且缺乏經 過國際認證的第三方評估或審查。對於如此重大的科學突破,如果缺乏透明性或無法經得X
Re: [新聞] DeepSeek爆紅引熱議 傳偷用5萬顆輝達H10"世界一開源 中國就領先" 這是一句最近流傳的諺語~~~ 之前中國嘴砲7奈米量產 結果一開蓋 發現是TSMC like的製程 多重曝光 現在要驗證 deepseek是否真的是便宜成本就可以訓練好 只要請deepseek 公佈模型架構 不要提供完整訓練好的模型3
Re: [問卦] ChatGpt為什麼開始變笨了?正好半夜看到這篇無聊來回一下 GPT4能力下降大概5月多開始就有人注意到了 但你要怎麼定義能力衰退這件事而且量化他? 於是七月就有一篇論文在討論這件事1
Re: [新聞] 成本低廉 中國AI初創DeepSeek震撼矽谷前文恕刪 : 據報導,DeepSeek僅用2048片H800顯示卡 (GPU)、耗時兩個月,就訓練出了一個6710億參 : 數的DeepSeek-V3。相較於Meta訓練參數量4050億的Llama 3,用了1萬6384片更強的H100 : 顯示卡,花了54天。DeepSeek的訓練效率提升了11倍。 這比法很不公平
爆
[轉錄] 林俊憲threads73
[討論] 慟!張啟楷居然大義滅親貼文酸吳春城!66
[討論] 牛煦庭:市政府將全力協助46
[討論] 美國宣布即刻起拒收中國跟香港包裹51
[轉錄] 黃益中FB-路易莎不借他廁所27
[討論] 路易莎老闆的真實心態就是討厭罷免吧?40
[討論] 國民黨被罷免 黃國昌:民眾黨不會當沙包35
[討論] 蔣萬安把「蛇」字寫成虫宅35
[討論] 中常會開完了 賴清德沒理黃國昌27
[轉錄] 徐巧芯FB:路易莎喝起來!19
[討論] 今日綠電: 28~25%75
[黑特] 驚!鍾年晃:藍營連署出現于北辰的學長26
[討論] 林俊憲「賴總統完全不理黃國昌」27
[黑特] 牛煦庭真的是老實人27
Re: [新聞] 中部11藍委害的?中部人恐到台北辦護照23
[討論] 藍尾李彥秀是逃漏稅還是雙重國籍?17
[討論] 柯建銘:什麼叫路易莎?17
[黑特] 路易莎不就證明罷團沒資源17
[轉錄] 蔡壁如FB:2026 智取荊州!20
[討論] 有沒有侯冠群不是中華民國籍的八卦?18
[討論] 柯文哲在獄中提告鍾小平誹謗23
[討論] 狂賀!!! 柯文哲終於發現是國民黨舉發他!!10
[黑特] 路易莎被抵制才知道這家店6
[討論] 路易莎是怎麼被藍白破腦網軍操作起來的?15
[討論] 壯世代網軍是不是變種了?3
[黑特] 再問一次,所以我的七天假呢11
[黑特] 到底干你黃國昌啥事21
[討論] 各總統政績...13
[討論] 公費流感疫苗剩9萬劑57
[討論] 高嘉瑜這局贏了,台派團結