Re: R: [請益] 為什麼中國越來越強?
給一些覺得中國很爛的人看看市場現在在擔心些什麼
艦長J快訊 重要的突破要多寫一次
2025/1/31
總之,這幾天是一次很燒腦的過年假期,感覺比平常還要認真研讀資料,甚至大年初一晚上還有大陸券商辦專家論壇..... 這個市場實在太捲。
當然,花了這些精神做功課,就是要研究一下開年後的投資動作,究竟是新春大特賣趕快撿便宜、還是苗頭不太對腳底要抹油?很遺憾的,這幾天研究下來,個人目前對硬體的看法越來越偏向後者,但相關的AI應用卻可能加速發展。
DS的論文重點以及它在演算法上的突破,網路上已經有很多人分享,我就不再贅述;直接講幾個觀察到的重點吧~
1. 還記得Apple為了推銷Apple Intelligence,將iPhone 全面升級到8GB以上嗎?這僅僅是為了跑一個3B 參數的小模型而已。 現在,有人成功用一張 Nvidia RTX 6000 (48GB VRAM) 就可以跑動 DS 671bn 參數的大模型,而且這個模型還開源可以直接下載。
這代表什麼意思?以後企業或個人要佈建AI,可能買一台具有高階顯卡的電腦就做的到。 不用每個月花200USD訂閱OpenAI、不用CSP租賃昂貴的AI server & 網路..... 在地端佈署AI 變得簡單&便宜許多。這兩天已經有看到朋友的公司開始研究把AI模型的佈建轉為在地端執行的可能性。
2 各大廠紛紛投入:短短幾天,可以看到微軟、AWS、NVIDIA 都開始提供DS R1 模型的服務。由於對硬體的要求的確不高,百萬token 輸出的價格只要2.19美元(作為對比: OpenAI的輸出價格爲60美元/百萬Token),價差接近30倍。
NVIDIA 官方也有描述:在單個NVIDIA HGX H200系統上,完整版DeepSeek-R1 671B的處理速度可達3,872 Token/秒。僅需一個系統就可以完整運作DS R1 大模型。就算企業依然需要利用雲端來佈建AI,需要的系統&價格也比之前簡化許多。
3 NV關鍵優勢不再? 這兩年來,我們持續提到NV產品在大模型與高運算力方面的優勢,包括記憶體的使用、NVlink多卡串聯、Scale-up/out 的領先等等;在探討下一代Rubin或更後面的產品,討論的是一個機櫃做到NVL 144/288 、如何處理這麼大功耗的產品、系統架構該如何演進等等;重點不僅僅是“教主產品做的比別人好”,而是“不用教主的產品
就根本無法訓練&使用這些大的模型”。
忽然間,這個必要性被打了一個大問號。
進而延伸的問題:HBM、CoWoS等等原本為了在空間體積功耗等等限制下塞進最多算力的技術,是不是仍然必要?還是有許多便宜的替代品可以用?
BTW,很多人喜歡把政治問題扯進來。對我來說,探討DS本身到底用了多少卡有意義嗎?沒有,重點是現在實際佈署R1的硬體需求就是極低;其次,它有沒有抄OpenAI? 應該有吧~ 不過OpenAI 的 GPTBoT 在網路上不顧版權的到處亂抓資料也不是一兩天的事情了~
抓完還不開源勒。對投資而言,整個市場結構的變化,比這些枝微末節的小事重要多了。
投資總有風險,本人過去績效不做未來獲利之保證。最近詐騙猖獗,本人不收會員、不用追蹤、不騙流量、不需粉絲、更不必按讚分享開啟小鈴鐺。快訊僅供好友交流之用,如果你與我看法不同,你肯定是對的千萬不要被我影響。
--
大陸愈來愈強 研發能量世界頂尖
台灣愈來愈爛 錢拿去點麵線
上層領導決定基礎 台灣真的愈來愈慘
這麼強,中國股市的怎麼爛成這樣?
這模式是偷用別人95%算力成果,自己只出5%算力,真
的是無本買賣
中國一家公司強,不等於中國整個股市強啊
靠call ChatGPT api distillation 在強也幹不過GPT
老師跟學生的關係,學生的極限就頂多跟老師一樣
幹不幹得過其實不太重要
中芯也幹不過台積電
但能把聯電世界力積電捲死就夠了
能卷的都是相對成熟的產業
你就期待DS用中芯製GPU研發出AGI 還是NV+TSM
你可能看不太懂這篇文章擔心的點?
DS不用幹過NV+TSM啊
市場只擔心硬體需求減少,營收獲利就……
你比較看不懂吧... 未來的AI不會只有Chat bot
AI又不是只有LLM,我覺得現在擔心算力過剩還太早
會有更多應用需要更多算力 老黃都吹過了
沒關係,看不看得懂不重要
重要的是市場跌給你看了
市場很多都是反應短線情緒的,長期投資的就不用在意
一時震盪
也許你是對的市場是錯的
但這就是市場上目前多數參與者反應的想法
老黃慘了
結果就如我講的 大廠都拆解Deepseek模型跟上後 又
是算力對決
跟改進蒸汽機效率反而帶動整體煤炭需求一樣
我只知道網咖最後大多倒了
先別管這麼多 你的對帳單在哪
所以你買a股跟上海滬深沒? 沒買閉嘴
所以跟中國爛有什麼關係
大家看一堆人吹噓中國好才進大陸股市,結果跌到一
塌糊塗
deepseek 救中國 遙遙領先
唱雖台灣,結果漲翻天
![圖 R: [請益] 為什麼中國越來越強?](https://i.imgur.com/OBKfmcl.jpeg?e=1738749105&s=z9xdW-C7kldhi-3lIPfbIA)
多讓
怎麼總有人喜歡問A答B…笑死
別生氣,股版大家都只是在猜未來而已,中國股市不好
人盡皆知,要超越美國也不可能。重點是如果能持續產
出所有能低成本取代美國的產品,那的確是大部分的國
家就越來越不需要被美國綁架了
關稅戰也是每個人都說跌啊 導致通膨啊 結果川普上
一任期通膨沒超過3% 整天聽左媒找專家唱衰 投資準
備賠錢
糾正你兩點671B完整載入還是需要1.5T以上的RAM
那些能單卡跑起來的都是人工智障版本
不然我llama3.2跑個1B也用不到8GvRAM
分析DS對硬體需求的影響需要買鹿港股?奇怪的連結
其實中國越來越強無庸置疑的吧,不然美國幹嘛搞一
堆政策制裁中國?
對了,我這幾天有加碼NV
學生比老師強的比比皆是吧! 例如台積電
AI落地已經好幾年了你這兩天才聽到你也太IE
好了啦 強爆了 然後你投資中國股市了沒?
NV基本面就發生微妙的變化惹阿= =
網路上有人用兩台192GB的M2跑671B
M2 Ultra
AI落地哪來好幾年,你PC本地的檔案都訓練完了?
以後要的是PC本地照片掃到媒體庫建縮圖同時也訓練完
DS也是依賴PTX運算紮紮實實的賴在N卡身上
ai不是只有llm
你就能在本地AI打個"海邊"找出所有目錄內有海的 jpg
DS會影響最大的是服務多人時可以減少記憶體使用
這個意味著也有機會用組合語言運作在其他的顯卡上
而不用依賴CUDA
根據reddit的測試, 336G ram可以跑671B
也就是滿血載入1.5T後續服務每個人最低16G
不用 1.5T
所以你看hynix股價也遭殃就是這回事
多菜才在糾結DS 能否幹掉GPT,看文章都看不到重點,
希望這種人永遠留在股市
然後還有可以導出DS不錯就要人買鹿港的奇葩,DS不
幹不掉就會越來越虛弱阿,星門功能越來越多,網
咖跟不上就只能越來越便宜最後倒閉,大概4這樣
錯這篇的重點是de-rating硬體,但可能可以做多軟體
吧,關鹿港屁事
一堆人腦中沒有政治就當機,摳連
還在星門..
不要忘記三十年前要做伺服器都要買大型 UNIX 主機
現在大家討論的是怎麼把可用的版本裝到家用電腦上
Linux 出來後一般 x86 微電腦個人PC都可以架站了
說別人偷,你連偷的本事都沒
我完全沒有獨顯的NB, 可跑7B, 35B龜速
地端跑滿血671B的我目前看到的都是用NVMe
目前當然都是NV
留在鹿港的真的不適合投資
但未來有機會不是NV了
大家看到的是新方向 笨蛋才會糾結在 現在
也有機會不是台g了
更不要說資訊根本不對
隕石還掉下來了美債違約了呢
你是不是不知道NVMe是指SSD 不是顯卡vRAM
說實在我還真不知道
每天看這些中國自慰寶 上來耍寶就覺得好笑
不過 原本的意思一樣 根本不用糾結在現在
甚至不一定是 DS, DS只是走出了新方向
reddit那些人是拿SSD壽命當記憶體來跑著玩的
我聽說柏克萊重現了DS, 只花了30美元
大廠資本支出明年增幅減少,H20可能被禁
技術板是能改善就改善,投資板才會覺得不能賠錢
然後現在還有吵很久的硬體取代話題 = =
母體最後能生成的是一個世界
一樓不要再繼續造謠麵線,除非你就是網軍小粉紅
你真的要服務多人是要安排人手在那邊抽換壽終的SSD
你繼續便宜
反過來說這是沒上車的人新希望,你可以找新標的了
沒有人要服務多人
現在的重點是要安裝在邊緣
NV本益比感覺就要下修R 市場最怕不確定性惹
不能服務多人那威脅個鳥蛋
只有套住的才會覺得要打壓到底不能讓自己賠錢
笑死
個人PC都有一套 怎麼會沒威脅 笑XD
中吹是吹,NV股價一樣是吹未來只能靠堆硬體的本夢比
現在其實35B版本完全可以在個人電腦上跑了
所以你打算用你的SSD去跑DS然後一個禮拜買一顆2TSSD
現在就是證明有另外一條比較不燒錢的路而已
不用打算 我已經在跑了
SSD掛掉再跟你說
我連獨顯都沒有
你的資料不用上雲就能在本地訓練,會開啟一個新時代
35B只吃到16G多有啥好炫耀的
我應該是除夕還是初一開始的目前是還沒掛掉的跡象啦
沒人在炫耀啊
就像網路泡沫前每個人的PC都可以自己架站連網一樣
只是告訴你大家在幹嘛而已
現在大家就是想把堪用的版本裝到最簡單的電腦上而已
當年想要踏入網路的不用租買貴貴機房用自家電腦就行
大舉普及並降低門檻而後應用端才百花齊放
因為很多人可以在自己電腦玩,玩出很多新花樣
地端是如此 雲端的話, 這篇文章也說了 一張H200可
以提供 3872 tokes/s
哥也只是說最後母體會贏而已
費用低到2.19usd/百萬tokens
這個都是巨大的改變
但這都還不是終點
抵制DS其實跟抵制Linux維護大型UNIX主機利益一樣
來股版說不談股票講硬體 這種人才該滾出股版不是?
市場最後會改變的,你只能在趨勢上找新機會
羨慕中國技術強大 反觀
以前壓NV+GG是獨門生意,現在該做的是去應用端找標的
因為市場門檻降低的變化是應用端將會百花齊放
這個是在網路泡沫前一樣的過程,你起碼能賺一個波段
等到門檻降低阿貓阿狗都能本地AI的時候才是AI泡沫
說到AI不講硬體不就是跳過基本面了?
不改變思維,那就跟古代重壓 IBM 商用市場沒兩樣
一堆政治文 哈哈 這篇講硬體的反而在股版是清流討論
一堆人還在看不起大陸,人家至少弄出個DS震驚世界
,台灣的麵線app做的到嗎?不管怎樣,使用成本大降
對消費市場一定有影響,便宜治百病,又不是人人住
的起帝堡、開的起藍寶堅尼…
你要為了 IBM 的股價去打壓 Linux + x86 嗎?
這根本無關政治,而是普及下放後對市場的改變
AI不會就停在R1吧
公正評價中國當然可以 但板上太多中吹很噁心
就算不是 DS 而是其他國家開發的一樣會改變市場
還在瞎吹 嘻嘻
所以我前面有說影響最大的是記憶體廠商w
整天吹的天花亂墜 根本就像抖音小紅書跑來的一樣
NV吹也差不多啦,怎麼會覺得科技有永遠是直線發展的
不是說NV不好,而是市場本就不可能一直重複同樣路線
今天的x86_64 還是 AMD 發明的不是 Intel 發明的
但後來Intel 轉回來做 x86 64 當年支持者也是被背叛
AMD64問市前一堆投資者也以為IA64才是PC未來
技術跟市場自己會找到出路,你該做的是尋找新標的
而不是一直意識型態式的擁抱某個技術
買人家的卡,偷別人的一部分資料,然後吹中或贏?中
吹才是要不要聽聽自己在說什麼
NV至少還能爽個3年左右拉ASIC上來還要一點時間
四年內星門計畫不會停,因為我川在推
NV能爽多久其實可以參考BTC挖礦ASIC問市取代的時間
但DS的問市跟ASIC關聯不大是跟自家主機應用關聯大
連第一年都還沒開始就中或贏?先蓋四年後再看看吧
AI訓練跟挖礦完全是兩回事,不能類比
這是市場的兩端,一邊是特化效率,一邊是普及門檻
大廠看的是training 不是布署 佈署是inference先去
搞懂 training跟inference差異再來說吧 大模型本來
就可以在顯卡上跑了 差別是顯卡的VRAM做得不夠大
早就有人用MAC mini 的UMA (DRAM可當VRAM)跑大模型
了
星門五千億,網咖最後倒了
NV不會沒用,因為高端的AI依舊是軍備競賽
現在是市場出現低階AI可以普及到本地的應用
印象中ASIC開挖好像也是四五年左右?
就像你不需要軍規無人機,但大眾用無人機市場打開了
inference推論本來需要的算力就沒很高 不然自駕 機
器人怎麼做? 輝達不推出大VRAM的顯卡而已 之後就是
看AGX Thor或project digit 來填補這塊
project digit應該就是瞄準AI落地的產品
NV至少再爽20年啦 人類對算力需求根本無止境 它沒
被超越就能一直吃到紅利
一堆寫手,沒貼投資紀錄的都不要信
使用效率變高、應用更普遍,結論怎麼會是硬體需求
變低
還是有個隱憂在那邊拉量子位元量產算力就爆炸提升了
但是我老死之前能不能看到就不知道了
現在NV+GG也是獨門生意好嗎? 百花齊放的軟體不是硬
體
NV GG這種就是寡頭獨佔 總投資資本幾千億幾兆的怎
麼取代?連全中國都造不出台GG
笑死 中吹都不敢貼持股
不是覺得中國爛,是中國本來就爛,習大大上次去美國
跪著求饒,看看下次哪時候會再去跪
說不定印度今年也有個超級模型
ai入場券從幾百億變幾百萬美金 有點錢的不會想入
場玩嗎 只能說繼續看下去
中國真的很爛,機器人.電動車.電池.5G-A.量子晶片
都超爛
反正你看MOE架構始祖法國人快溺死了
接下來中國人會不會被印度人屌打我們拉板凳看
會不會大部分人其實根本用不到AI
大概學生或上班族比較用的到AI吧
不會,AI在生活應用上的普及預期是不下於網路
20世紀還在撥接時也很多人覺得一般人用不到Internet
因為當時連網速度慢,所以生活應用受限
AI真的有用 重點是在本地端運作時 根本不用關言論
審查 爽爆了
就算在生活上應用應該也不是自己刻意去跟AI對話
而是廠商已經在產品內建AI功能 使用者根本不會察覺
自己看不懂文章的重點沒關係,
用DS幫你總結一下可以吧?
現在的AI要高昂硬體就像當年要快要拉專線的時代一樣
我正在玩14B 結果令我很滿意 太棒了
後來ADSL之類問市,網速大幅提升,世界就不一樣了
就跟手機融入每個人的生活中 沒人在乎網路怎麼運作
ADSL也是硬體依舊用電話線這種低配靠演算法改變的
AI低成本化確實可以加速普及,
至於主流的承載硬體是否仍然
會是當前強勢廠商?
這就是問題。
目前生成式AI感覺就只對學生或上班族比較有用
要繼續壓AI概念股,正確無誤,
但是不是壓特定公司?不見得,
最好要分散風險了。
遙遙領先
市場有疑慮就是有機遇,不要放棄機會好好判斷才是
‘’只對‘’學生或上班族有用?
所以‘’不是學生且不是上班族‘’的人有多少?
上班族也要看哪種上班族 大部份上班族應該也用不到
為何要死抱NV死抱GG,騙別人可以別連自己都信了
就真的很爛,不然你去買a股
看起來,高端硬體的需求會降低,但是企業自行架構
AI會增加,SSD業者會是很大的受益產業
家庭主婦也能用生成AI啊,拍下房間問收納建議都可
畢竟要跟AI對話並且獲得有用的回答也是很燒腦的
跟AI對話的時間 我可能已經自己搞定了 不需要AI
未來只會分為不會用AI跟會用AI的人
紅明顯,AI才剛開始,各巨頭習得新算法後,由原始
時代剛上封建時代,各國還是要比快看誰先到帝王時
代呀,所以最終還是要比算力
這兩天朋友公司?不是都在過年 唬爛也要有限度
閣下怎麼會覺得企業內部使用的AI會用SSD來坦XD
跟AI對話獲得有用回答很燒腦就說明還有很大進步空間
就跟現在還是一樣有不會用智慧型手機的老人
不會用手機是不會怎樣啦 只是比較不方便而已
你覺得AI現在不夠好用 不代表未來也是
中國強台灣很久了吧 火箭都去火星了 台灣的火箭還
飛不出大氣層 =_=
不會用最新科技不會怎樣啊,
就生產力降低被時代淘汰而已。
因為會更多企業可以自行架構AI sever,成本不用到
這麼高,但是儲存需求更多了
你也可以繼續電話或是現場買股啊
AGI要打入生活低廉設備是必要的 現在中國開創低耗能
高性能的路 大家都高興 要不然你要付200鎂嗎ww
看操作效率or時間成本差多少。
獨立思考。這個文也只是推測,沒有未來數據的根據
。
這些短線投機客用幾天幾周的時間來去定義未來幾年
的發展,你不覺得好笑嗎?對啦!它們就是要你僵持
廝殺一買一賣,到時候低接回來又是換一套說法。
現在一樣有人用手寫記帳不用Excel 進銷存軟體
最大輸家Clos(ing)AI
明明就快崩了哪有越來越強
銀行有AI客服理論上功能很強大 但我一點都不想用
感覺還是直接打電話問真人客服比較快
看這種文組文章?
不喜歡跟AI客服制式回答鬼打牆的感覺
ontrols
在選擇要不要用AI前,不如說自己目前生活有沒有權
利讓自己做這樣的選擇
為何不看Dario Amodei怎麼講?
啊對對對,DS有突破了,所以之後大家都不要買更多
算力了,AI現在這樣的算力已經夠了,不須要繼續研
究了,對對對
我再說一次,一堆人一直說AI目前對普通人而言已經
夠用,但AI一直在研究的主要目的根本就不是給普通
人用的,OK?
AI在各個專業技術領域的表現才是重點,不然你覺得
為什麼模型的重點指標一直都是數理邏輯?
因為那是最容易知道性能的指標啊 之後的AGI可是也要
會自然語言和邏輯思考和自我學習呢
後面的指標就困難多了
中國的玩法就是等市場成熟再大量傾倒然後搞爛市場
你說到重點了啊,AGI,現在做出來了嗎,還沒呀,所
以算力需求現在還是未知數的
辱台可是會讓玻璃心崩潰的
nv變得不是必要,但維持目前毛利下,仍然是性價比最
高的,那就沒必要降價
性價比最高那是對大型企業而言,中小型企業重點是
能拿到能跑的硬體
有便宜的硬體能配合開發,之後工廠端應用多得是
把美國巨頭的算力壁壘拉下來才有利AI新創阿 雖然台
灣AI硬體的重要性也會降低就是
教育丶制度
nv變得不是必要 請問你現在是用AMD還是中國顯卡?
AI硬體需求降低對台灣中小企業是好事啊 根本不用為
了符合特定大企業的標準而做不出東西來
…是你最近才在關注本地部署,而不是最近才開始研
究啊
拉瑪去年,水管上就一堆人教你裝了,後來新mac min
i 出世更把設備費用跟功耗壓到很低
想想看遊戲優化的好 硬體需求降低 所以你就不會想
買新顯卡特效全開 2080用到老?
有便宜的硬體能開發,那你們去用看看非n家的玩玩看
,支援度跟可靠度都差上一節
不用溢價去買頂規的晶片就可以省很多了
昨天就用deepseek算一下目前用的模型,專門只做cod
er的模型,都是評估6 token/每秒計算能力,每天使
用1小時,自建主機跟目前最便宜雲端運算,大概2年
內回本。如果小企業4~6人使用,成本拉高改用通用大
型模型,自建主機含電費也拉到10萬~20萬,自建跟雲
端目前最便宜方案相比,更可以到1年左右回本。
如果降到3 token/每秒,更便宜就是了。
最近幻想垃圾文真多
對有些人來說,他就是用2080覺得夠了所以默認全世
界都應該只用2080
所以3060是溢出是沒必要,客群都在2080就夠用了誰
跟你3060,現在在唱衰晶片需求的大概就是這個邏輯
deepseek配備需求很低,如果是聊天用,大概30-40 t
oken每秒,寫程式6~10秒token,翻譯大概1~6token就
夠了。使用專門模型,大概5萬內就可以到15 token。
![圖 R: [請益] 為什麼中國越來越強?](https://i.imgur.com/z2SEV4f.jpeg?e=1738788113&s=mT-tWf6R5sxojoKr-EFvug)
![圖 R: [請益] 為什麼中國越來越強?](https://i.imgur.com/uHBIlxy.jpeg?e=1738737040&s=01ejZP0rbuyNxb_MWRxc1A)
台積電產品的應用不是只有AI
滿血版也不一定要用A100,已經有人用6,000美元自組
一般程式開發,5萬內就可以了
艦長J lol
Cpo 完了…
販毒到美國的拿下半個歐洲跟巴拿馬加拿大
歐對了這群小人最近在聯合國說日本皇室重男輕女 懷
疑跟暗殺安倍有關
26
首Po不知道大家是否記得「十萬青年十萬肝,GG輪班救台灣」,常常有人笑話台積電致勝的秘 密就是這句話。 本魯姨是純軟產業研發社畜,曾經在中國軟體公司工作,只能說他們真的「卷」到讓人哭 爹喊娘,最後狼狽逃回舒適圈。 當時面試五輪進入了曾經幻想美好的公司,一天工作10小時起跳是常態,實際的工作量大79
中國的內卷,那股狠勁,有點像台灣30-40年前那樣子 有一次週五半夜突然想到一個問題,想知道在中國做細胞治療的行業領先者,就我們手上查到的資料是否正確與完整 想到兩年前認識的一個百靈佳殷格翰中國創投部門的BD窗口,是一個年輕的小姐姐,畢業於南加大博士,或許她可以提供一些意見 於是翻開微信帳號傳訊息問她一些問題,原本不期待她馬上會回答,畢竟都已經半夜一點了,我是預期她早上看到再回覆。沒想到五分鐘後她傳訊回答問題,還說的非常有條有理很清楚,看似還在工作狀態,於是寒暄起來,得知她已離開BI創投部門,轉去中國賽諾菲投資管理部門,目前擔任投資項目總監。 她那拚勁確實令人難忘,而且短短兩年就這樣快速往上爬升。79
怎抹這邊突然變AI版 =_= DeepSeek 有件事情幹得比矽谷好 就是AI Backend 優化(這玩意就是需要懂架構 和軟體 就是一個苦力枯燥活) 大體而言 在A100架構以前 大部分訓練都還是用fp32 少數模型對精度不敏感會用到fp16 (浮點16進位)主因是用16進位去訓練 精度不夠 容易模型崩潰 尤其用P100的fp166
佈 : 署AI 變得簡單&便宜許多。這兩天已經有看到朋友的公司開始研究把AI模型的佈建轉 為 : 在地端執行的可能性。 : 2 各大廠紛紛投入:短短幾天,可以看到微軟、AWS、NVIDIA 都開始提供DS R1 模型的服
爆
[心得] DeepSeek對AI產業鏈影響懶人包最這幾天股板跟 X 上的AI金融圈吵的火爆 DeepSeek 對全球 AI 技術發展影響 吵的火爆示意圖 金融人士擔憂影響47
[討論] Deepseek就之前吹過頭了呀 XD來看看DEEPSEEK之前怎麼吹的 「DeepSeek R1的問世,宣告AI訓練與推理成本大幅縮減,在不到600萬美元的極低投入成本 和2048塊性能遠低於H100與Blackwell的H800芯片條件下,DeepSeek團隊打造出性能堪比Ope nAI o1的開源AI模型,相比之下Anthropic與OpenAI訓練成本高達10億美元。該模型每百萬 個token的查詢成本僅爲0.14美元,而OpenAI的成本爲7.50美元,成本降幅高達驚人的98%。46
[情報] 隨著蘋果發布新AI模型,這表示iPhone 16隨著蘋果發布新AI模型,這表示iPhone 16將成為軟硬體都具AI支援的首個產品 【情報來源】 原網址: 短網址: 【情報/優惠內容】24
Re: [新聞] AI晶片競爭開跑,谷歌公布第四代TPU,宣周末下班閒聊, 發現tech版沒有這篇文章, 那就在這裡討論好了, 其實我說的東西都是網路 google+wiki 就有的東西, 先簡單說明一下現代化的ML DeepLearning的基本概念,21
[閒聊] 串連數千個 Nvidia GPU,微軟打造 Chattechnews 串連數千個 Nvidia GPU,微軟打造 ChatGPT 的超級電腦 March 14, 2023 by 陳 冠榮 微軟斥資數億美元打造一台大型超級電腦,串連數千個 Nvidia GPU,為 OpenAI 的聊天機18
Re: [新聞] DeepSeek 遇大規模網路攻擊,暫時只支援Musk贊同投資公司Atreides Management合夥人兼資訊長貝克(Gavin Baker)在X提到 DeepSeek的R1低成本來自在訓練和推理效率上,取得了真正的算法突破 例如 FP8 訓練、MLA(機器學習加速)和多 token 預測。 訓練過程中涉及大量的知識蒸餾(distillation) 這意味著在沒有無限制存取 GPT-4o 和 o1 的情況下,這項訓練幾乎不可能完成。8
[爆卦] Mistral Small 3模型發布比OpenAI更快更好Mistral Small 3模型發布 比OpenAI和Google類似產品更快更好 歐洲領先的 人工智慧公司之一 Mistral AI 推出了一款名為 Mistral Small 3 的新模型 。這是一個包含 240 億參數的模型,但與 Llama 3.3 70B 和 Qwen 32B 等大型模型相當 (至少在 MMLU-Pro 基準測試中)。它不僅運行速度與 Llama 3.3 70B 不相上下,而且 速度更快。4
Re: [新聞] DeepSeek爆紅引AI「股瘟」!ASML歐股開盤算力愈強,模型愈強~ 就算deepseek 真的不用高階晶片就能訓練出說不弱於openAI o1 的模型, 那未來新的模型在有高階晶片的加持下, AI 不是會發展的更快、更難以想像嗎? AI 發展的更快,商用、消費用的領域愈多,對半導體的需求愈大,3
Re: [問卦] deepseek 到底是不是抄的 風向好亂Deepseek AI的訓練過程確實有用到蒸餾技術 蒸餾技術,就是在前人製造AI(例如chatgpt)的基礎上, 拿別人AI的回答當作訓練自己AI的材料 這種作法雖然有點像抄襲他人AI的能力,但在學術界已經是行之有年的做法 各國很多頂尖實驗室都用過這種方法訓練自己的AI- 我先講我非AI專業 但這件事情基本就是鬼扯 甚麼叫做利用O1蒸餾出R1 你要用API抓多少資訊量跟TOKEN才做得出來 然後這件事情OPENAI還會不知道?
64
[請益] 請問現在改當空軍還來的及嗎?64
Re: [標的] 大盤 空48
[情報] 外資賣超歷史前十五名(今日第十二)37
[請益] 單日外資空單口數+9836 是史上最大嗎?25
[請益] 台股會步上日股的後塵嗎56
[情報] 00937B 三月份分配收益 0.0837
[情報] 2727 王品 113年EPS 15.66 股利約14.5984
[情報] 0303 上市外資買賣超排行29
[標的] 日股五大商社及Appier建倉27
情報00687配息0.3521
Re: [情報] 00937B 三月份分配收益 0.0883
[情報] 114年03月02日 三大法人買賣金額統計表16
[標的] 定期定額的幾個問題請益41
[情報] 台積電調整113年第三季現金股利84
Re: [標的] 00687B~國泰美債20年12
[情報] 00934 114/03/18預計除息0.026元17
[心得] 台積電現在是甜甜價趕快撿9
[情報] 8046 南電 114年2月營收47
[情報] 6770 力積電 113年下半年股利:013
[標的] 映泰2399 魔物獵人多15
[情報] 6257 矽格 股利4元7
[請益] 高股息為什麼成分股有台指期2
[請益] 現金增資原股東繳款問題(代po)9
[情報] 9940 信義 股利 1.816
[情報] 巧新113年財報 EPS:3.320
[情報] 5508 永信建114年2月營收8
[情報] 00918 配息0.74
Re: [新聞] 雞蛋產量略減 本周起蛋價再漲2元2
[情報] 6805 富世達 113年EPS 17.9元1
[情報] 6805 富世達 114年2月營收