[情報] Alder Lake沒有AVX512，於是Linus又開嘴惹

a58524andy 發表於 2020/7/14 上午1:16:06

看板PC_Shopping標題[情報] Alder Lake沒有AVX512，於是Linus又開嘴惹作者

(a58524andy)時間Jul 14 01:16:06 2020推噓37 推:38 噓:1 →:141

不過嘴的不太是針對「啊你怎麼拔了AVX512」這部分
而是針對AVX512本身這部分

背景:
phoronix發現Intel最近替GCC 11新增自家Sapphire Rapids、Alder Lake系列CPU
支援的程式碼中，並沒有AVX512相關的部分
也就是Intel新的大小核Alder Lake架構不會支援Intel常常拿來廣告的AVX512指令集擴充然後創世神Linus Torvalds又双叒開始嘴砲了

source: https://www.realworldtech.com/forum/?threadid=193189&curpostid=193190 https://reurl.cc/exN7Q7

個人渣翻：

------------------------------------------------------------------------------

我希望AVX512會一敗塗地，而Intel會開始做些比較實際的工作
而不是多塞些奇怪的指令
然後替那些指令量身訂做些跑分。

我希望Intel能夠腳踏實地些：繼續推進製程節點，並且不要整天只是想在
高效能運算或是其他冷門領域耍些花招
而是把這些心思放在該如何讓一般的程式都能跑得更快上

我之前就提過了，這次我再重申一次：
就算是在x86架構最輝煌的那個年代
那個Intel錢淹腳目、除了Intel沒一個能打的年代
Intel的浮點運算其實是弄得最爛的那家
單論浮點運算的相對效能，根本是Intel反過來被各家壓著打的
不過這根本無足輕重

因為除開跑分的時候根本沒人在乎

目前AVX512的處境基本上是一樣的，而我會說未來也會是這樣。
對啦，你要找的話當然可以找到一些應用非常倚賴AVX512的支援
不過宏觀來說根本沒幾隻貓會專門為了這類應用而真的掏錢添購機器。

並且AVX512是有其負面影響的。
我反而更希望Intel把那些電晶體花在其他真正緊要的刀口上。
例如拿去加速GPU的浮點效能啦
甚至單純只是給我更多的實體核心，單線程性能強大、而沒有AVX512這種垃圾的核心基本上就是AMD目前弄的這樣。

我希望我的CPU頂到功耗上限的原因是真的在跑日常的整數運算
而不是其他AVX512之類燙到爆炸、只會讓處理器降頻
──畢竟，多數人會用AVX512的理由是拿來memcpy (*1)──
以及浪費矽晶圓面積，導致塞不下更多實體核心的指令。

是的，我有些偏見。
我恨透了浮點數跑分這檔事，但我也知道的確有些人很看重這部分的效能。
不過我還是認為AVX512本身就是個餿主意，怎麼想也不該用它做為解決方案。
可能我有些反應過度，不過我就是這樣認為的。
Intel有過一些錯誤決定，而AVX512本身絕對是其中最經典的那幾個
部分原因也是因為它助長了x86市場的碎片化。

不要再弄這類專門加速冷門應用的玩意了
你該做的是盡心盡力地去讓那些最常見、多數人真正在意的場景跑得更快些。
隨便弄個不要太鳥的浮點運算，單單這樣人們就會買單了
我會說AVX2就已經非常足夠了。

對，我很容易被戳到。

------------------------------------------------------------------------------

(*1)
以C的語法來說，要快速初始化/複製一段記憶體區塊
你需要的是<string.h>裡面的memset啦memcpy之類的東西
前者把一塊MEMory都SET成某個預設值
後者幫你把一塊MEMory CoPY到其他地方
(對，部分人士真的很懶得打字)

而一般x86-64來說，這部分可能是以64-bit為單位去操作的
而處理器如果額外有avx512擴充的話
裡面的其中幾個指令可以達成一樣的效果，而且是用512-bit為單位去操作
想當然爾能夠快上許多──AVX512指令CPI跟普通指令一樣、並且不要降頻的話

小結：

浮點數運算不是所有應用都用得到的
而專注於浮點數的指令層平行化的AVX512更然
kernel就是一個用不太多的例子 嗯雖然我根本不懂，暫且這樣說吧
而AVX512又耗電又佔面積
會被Linus嘴也是合理

歷史上有過不少CPU附了專用的指令
基本上也是當時有需求才會有這樣的設計
不過這需求是否真的是需求則見仁見智
以前甚至有單個指令完成某段記憶體區段的傅立葉變換的
然後就沒有然後了

TL;DR

Intel自己搞出來AVX512，結果也不是普及到自家所有產品
用途又相對稀少
Linus認為Intel不該費心在這類冷門應用上
那些電晶體拿來改進IPC啦或是單純多塞核心啦有用多了

喔對這邊有另一個觀點，這篇洪教授的文算平衡打擊
https://www.facebook.com/shihhaohung/posts/4148325648543225
沒問就轉貼的關係，就不講內容了
有興趣自己點個

※ PTT留言評論

※ PTT 網址

推

AreLies 07/14 01:25這樣粉粉怎麼吹AVX512

推

yymeow 07/14 01:27推個

推

WARgame723 07/14 01:27難怪被說不懂裝懂的科技頻道

→

yymeow 07/14 01:28我只知道只要測試軟體一操AVX512，大概就等同後燃器

→

WARgame723 07/14 01:28連Avx512都能噴，你怎麼不去噴zen2加了完整的256

→

yymeow 07/14 01:28全開。溫度跟功耗都衝到頂點

推

AreLies 07/14 01:28此Linus非Linus

推

ceming 07/14 01:31723你真的丟臉到家哪個Linus你也不知道

→

ceming 07/14 01:31不懂就滾回去躲棉被哭比較不會被人笑你

推

Oxyuranus 07/14 01:34某樓看一下是哪個Linus再說話好嗎...

推

AreLies 07/14 01:34有一個Linus是Linux核心的首要架構師

→

AreLies 07/14 01:34另一個Linus是Linus Media Group創辦人

推

k2450 07/14 01:36Linus Torvalds有兩個?

推

AreLies 07/14 01:36723是在嘴哪個Linus

→

AreLies 07/14 01:38Linus Torvalds跟LINUS SEBASTIAN啊

推

WARgame723 07/14 01:38看錯，原來是那老人那不意外阿，仇i都仇多久了

推

isaac42 07/14 01:39#浪費社會晶圓

推

AreLies 07/14 01:43其實Linus Torvalds也有嘴過其他團隊跟公司比較有

→

AreLies 07/14 01:43名的Nvidia, fuck you!

→

AreLies 07/14 01:43還有說OpenBSD的團隊是一群

→

AreLies 07/14 01:43“Masturbating Monkeys”

推

birdy590 07/14 01:44這次嘴的有道理啊根本走火入魔了到底誰定的方向

→

AreLies 07/14 01:44還有Linus今年才從intel換AMD 要仇Intel也想太多

→

birdy590 07/14 01:45Intel 會一路下坡跟這種迷航絕對脫不了關係

推

asiakid 07/14 01:45靠北我原本想護航723只是反串而已XD

推

MK47 07/14 01:56AVX512你不如用顯卡去算

----------------------幫你highlight-------------------------------------------

推

Bencrie 07/14 02:00去翻 glibc 的 source 你就知道 memcpy 一堆版本

→

Bencrie 07/14 02:01各種 SIMD 實作。因為要滿足特定條件的長度才能用

------------------------------------------------------------------------------

推

miname 07/14 02:08版上不少跑深度學習的就因為MKL買intel啊，MKL就靠A

→

miname 07/14 02:08VX撐啊，所以就取向的不同啦，Linus講的是PC，洪教

→

miname 07/14 02:08授講資料中心，至於intel PC產品線明明就是分開的還

→

miname 07/14 02:08有AVX就...

推

miname 07/14 02:16那個洪教授也是個嘴砲仔就是了，Linux kernel 要是

→

miname 07/14 02:16真如他所說要用AVX就變成要多一個intel64的branch了

感覺他觀點不太像這樣(?

https://reurl.cc/kdz3Yd

推

miname 07/14 02:29所以我說他是以資料中心觀點出發啊

→

miname 07/14 02:29然而你要是裝一張NV顯卡，深度學習還是只會跑在顯卡

→

miname 07/14 02:29上面,AVX還是無用

我是指洪有說他不是硬要kernel去應用AVX512的部分誠然不同專業的人會有不同觀點除了推文提到的MKL之外可能做多媒體的人也真的覺得AVX512不錯快、Linus只顧kernel之類(? 不過我也沒寫過就是(逃

→

dieorrun 07/14 02:30723要嘴LTT都還不夠格了更何況創世神

推

miname 07/14 02:34說他嘴砲就是明明這件事情扯不上kernel要不要用浮點

→

miname 07/14 02:34數，他硬要扯遠說他們抗拒浮點數

原來XD

推

Shauter 07/14 02:38沒讀過白算盤的c52又要咬人了

→

friedpig 07/14 02:38居然拔掉了這樣怎麼讓溫度突破天際

→

aegis43210 07/14 02:41HSA才是最終解決方案

推

jacky841224j07/14 02:41浮點運算Intel有輸過AMD嗎？我怎麼記得是I的強項

→

friedpig 07/14 02:43不過牙膏王特規的還不只這個勒未來ml還多做一堆in

→

friedpig 07/14 02:43t4 int8的運算指令集也是各種搞事的兇手

→

AreLies 07/14 02:44AVX512跑分好看實際應用又是另一回事

→

friedpig 07/14 02:46其實兩邊就在意的東西不同而已做kernel的喜歡乾乾

→

friedpig 07/14 02:46淨淨越不特規越好最好都堆滿電晶體衝傳統效能

→

friedpig 07/14 02:46做AI的當然有方便的ASIC幫忙加速屌打通用電路

推

miname 07/14 02:47然後洪教授最後一句我有些意見，要單一核心又快是可

→

miname 07/14 02:47以從架構上改善的，最無腦就把AVX的空間拿去塞cache

→

miname 07/14 02:47啊，你教計算機結構那麼久了不知道嗎？

→

friedpig 07/14 02:48牙膏廠是商業取向的同樣面積去換一點點效能差異的

→

friedpig 07/14 02:48通用效能還是有商業市場的AI特規效能哪種好賣錢

→

friedpig 07/14 02:48就不好說了

→

friedpig 07/14 02:50cache也不是無腦塞永遠都有用整體設計都要對著調啊

→

friedpig 07/14 02:50 重點是cp值不夠的問題吧同樣面積換到可能5%不到

→

friedpig 07/14 02:50的進步拿去換成ASIC可能幾倍在算的差距

→

friedpig 07/14 02:52牙膏王之前更極端還有考慮塞FPGA進去也有prototyp

→

friedpig 07/14 02:52e出來不過好像有點沒搞頭

推

labbat 07/14 02:52原來linux 核心會用浮點指令浮點暫存器（惶恐）

現在才發現這樣寫怪怪的XD 改了

推

miname 07/14 02:53但是作ML的人隨便一張顯卡就屌打你的AVX了，所以純C

→

miname 07/14 02:53PU跑分很讚，但是用不到

→

karta189783007/14 02:54jacky大 AMD一直以來路線都是把浮點運算放在顯卡，C

→

karta189783007/14 02:54PU是直接放生，沒記錯是這樣

→

friedpig 07/14 02:54牙膏王現在在推的是混合的拉 cpu前處理加減扣點時

→

friedpig 07/14 02:54間還是多少有幫助

推

wres666 07/14 02:55avx512實際上是有用的吧，我的1035g1跑matlab比同學

→

wres666 07/14 02:55的10210u快超多的，那個時候用cpuz看就是多了avx512

→

friedpig 07/14 02:56接下來大概是想推深度跟自家顯卡結合的cpu+gpu方案

→

friedpig 07/14 02:56看能不能勉強幹過純nv gpu方案吧

→

jior 07/14 03:00自己搞AVX512然後又要做大小核，結果小核不能跑AV

→

jior 07/14 03:00X512又把他拔掉，以後難道只有XEON能跑？

→

friedpig 07/14 03:03不過我記得之前爆料好像只有小核阿痛不支援512吧

→

friedpig 07/14 03:03大核有不支援嗎有點忘了

→

yymeow 07/14 03:08沒有也好，會涼一點

推

hsparrot 07/14 03:24需要AVX512的去買I，不需要的去買A，問題解決

推

potatososo 07/14 03:25avx!

推

DoBahaha 07/14 03:39反正就是嘴Intel不要只會先射箭再畫靶

→

DoBahaha 07/14 03:39實際一點整天打高空

推

BFer 07/14 05:51723不意外

推

brovet 07/14 05:51洪講的Linus Torvards 是哪位？？有這個人嗎有夠

→

brovet 07/14 05:51不專業

推

will3509111 07/14 05:56而且AVX-512本身也很雜....

→

will3509111 07/14 05:56Xeon和Xeon Phi跟Desktop用的AVX-512也有各種微妙

→

will3509111 07/14 05:56的差異

推

tyl510288 07/14 07:13 https://i.imgur.com/nOo3xwm.jpg

推

AJizzInPants07/14 07:21反正怎樣723都要嘴哪個人有723了解指令集？

推

AKSN74 07/14 07:28他早就放棄I皇了XD

推

miname 07/14 07:35洪教授的專業可多了，一下資安專家，一下硬體專業，

→

miname 07/14 07:35一下OS大師，一下深度學習，還有啥不是他專業的？

推

tonyian 07/14 07:38要浮點加速丟給gpu好嗎，不要拿核心運算來浪費，分

→

tonyian 07/14 07:38工，比起洪我更相信Linux

推

basacola 07/14 07:51沒有讀過白算盤的C52 XDDDDDDDDDDDDDD

推

felaray 07/14 08:15記憶體區塊的fft轉換...聽起來好雞肋但又好酷XD

推

goldie 07/14 08:15推白算盤XDDD

→

felaray 07/14 08:16723正常發揮

推

wenli978 07/14 08:28創世神的觀點很白算盤啊，就是加速日常最多用到的

→

wenli978 07/14 08:29指令集，而不是浪費電路去做其他奇怪的東西

推

kira925 07/14 08:53Linus說的很理想也很直觀就是最精簡做最集中的事情

→

kira925 07/14 08:54是說也不是第一次噴牙膏王前兩年的Meltdown超噴

※ 編輯: a58524andy (140.112.244.224 臺灣), 07/14/2020 09:00:12

推

kira925 07/14 09:03另外他其實是絕對精簡派他也噴了AVX2 甚至MMX(笑

→

kira925 07/14 09:04不過相對於碎片化的AVX512 他能忍受就是XDD

推

birdy590 07/14 09:10這意思就是消費者導向的產品裡不要浪費空間塞這個

→

birdy590 07/14 09:10硬塞進去也不會有人感謝你更不會因此增加競爭力

推

kira925 07/14 09:12他是徹底反對碎片化阿不是消費市場而已

→

kira925 07/14 09:12他甚至嘴了ARM的SVE會在HPC幹掉Intel的AVX512

→

birdy590 07/14 09:12放在 Xeon Phi 這種產品或是 GPU 裡不算碎片化啊

→

birdy590 07/14 09:13所以我第一句用的形容詞就是"走火入魔"

→

birdy590 07/14 09:15到 AVX2 為止付出的代價都還可以接受之後就入魔了

推

goldie 07/14 09:15碎破化很像是叫使用者不要用它；有礙推廣

→

friedpig 07/14 09:37User其實還好啦大部分髒活都底層的人處理的

→

friedpig 07/14 09:37Complier也是牙膏廠自己花心力弄得弄好有支援就跑

→

friedpig 07/14 09:38不支援就傳統方法而已對特定用途就是有幫助

→

friedpig 07/14 09:38這種東西就一翻兩瞪眼如果真的沒需求或效益太差

推

kira925 07/14 09:38但Linus就是那個幹髒活的人...

→

friedpig 07/14 09:39自然會被淘汰不過AI正在風頭上應該難喔

→

friedpig 07/14 09:39kenral跟Complier還是不太一樣的東西跟他沒啥關係

推

Windcws9Z 07/14 09:48浪費矽晶圓面積笑死

→

friedpig 07/14 09:50最明顯差異大概 MKL Intel優化越來越極端吧

→

friedpig 07/14 10:06不過牙膏這樣也是劍走偏鋒做軟體的越來越不可能特

→

friedpig 07/14 10:06地為了他們優化等於牙膏廠要自己砸越來越多成本壓

→

friedpig 07/14 10:07在底層lib跟complier優化還要一堆Support的人去幫

→

friedpig 07/14 10:07忙解奇怪的問題是越走越極端了

推

wahaha99 07/14 10:15啊還要考慮linux又不是只支援你i家一家cpu

→

wahaha99 07/14 10:15多少狗屎爛蛋都支援前陣子才從清單刷掉一大波

→

wahaha99 07/14 10:15你i皇整天搞我一下支援一下又不支援是要操蛋誰

→

wahaha99 07/14 10:16光這層面linus就有資格嘴爆i皇

推

kira925 07/14 10:21Kernel裡面一堆奇奇怪怪的東西怎麼會跟他無關

→

kira925 07/14 10:21別忘了牙膏王的Meltdown/Spectre 還是要Kernel配合

推

kngs555 07/14 10:24不過牙膏現在除了砸錢外，目前還是無法突破困境

推

Nexus5X 07/14 10:36啊不是說AVX512是微軟叫i皇做的嗎XD

→

commandoEX 07/14 10:47照著Linux說法，推土機不就是他要的理想CPU XD

→

commandoEX 07/14 10:48除了沒用的SSE4a指令集

→

commandoEX 07/14 10:51*LINUS

推

robin80829 07/14 10:59723尷尬癌末期了

→

kira925 07/14 11:09但推土機單核不行啊XD

→

AppleWine 07/14 11:12硬體部門遇到莫名障礙可4我們軟體部門正常發展

推

kobelake 07/14 11:19linus有我們A黑大將懂CPU嗎==

推

cancelpc 07/14 11:26其實可以像以前把特殊領域需要的部分切出去。

→

cancelpc 07/14 11:26如早期的 FPU 是另外一顆 IC 處理地，不須包在通用

→

cancelpc 07/14 11:26功能的 CPU 裡。避免增加成本，以及開發生產的困難

→

cancelpc 07/14 11:26度。可視需要選購。

→

friedpig 07/14 11:29那東西又沒需求高到值得額外開一顆而且連接速度也

→

friedpig 07/14 11:29是問題雖然牙膏王最終藍圖的確有打算要拆一拆

推

cancelpc 07/14 11:32若 AVX 對 AI 等領域有特殊幫助，並不需要讓每個客

→

cancelpc 07/14 11:32戶都得負擔這個成本。

→

cancelpc 07/14 11:32就跟 Intel 現行分出無內顯的 ....F （雖然還是做在

→

cancelpc 07/14 11:32裏頭，並沒真正移除電路）

→

friedpig 07/14 11:36別想了就是那小眾頂不住才會這樣強渡關山不然就

→

friedpig 07/14 11:36會乖乖做ASIC了

推

guezt 07/14 11:36推土機確實在linux上某些測試效能可和i對抗

推

sharkbay 07/14 11:37https://i.imgur.com/vzvbhVM.jpg 真熱鬧~

推

niverse 07/14 11:37不知道就說不知道，在那邊牽拖看錯，要不要再牽拖

→

niverse 07/14 11:37你媽把你生出來？

→

guezt 07/14 11:38但當時(現在也是)很多程式還是單核至上尤其windows

→

friedpig 07/14 11:39所以的確是阿痛不支援大核還是正常?

→

friedpig 07/14 11:40TSX不是完全放棄了喔所以新架構修好又在出發?

推

sharkbay 07/14 11:40 https://reurl.cc/0orbm6 product-briefs

→

friedpig 07/14 11:44不過話說牙膏王也投蠻多人在做DPC++這種跨所有平台

→

friedpig 07/14 11:44的complier 這種也應該能發揮硬體優勢就是

推

sharkbay 07/14 11:45Lakefield 1+4, Alder Lake-S 8+8, 應該可直接類推

→

friedpig 07/14 11:45ADL的core不是更新的嗎?

推

Bencrie 07/14 11:57規模不夠大的話 GPU 浮點會算輸 CPU SIMD

→

flylee 07/14 12:51一個task從CPU丟到GPU，就要浪費一段時間

→

flylee 07/14 12:52GPU API又分AMD, nvidia, intel

推

arrenwu 07/14 12:52現在 GPU encoding 跟 CPU 相比差距有多大啊

→

flylee 07/14 12:54一些高計算量的工作，如果 CPU能做完

→

flylee 07/14 12:55其實大家也懶得去呼叫 GPU來幫忙

噓

bubunana 07/14 12:56avx ai什的好複雜書讀的不多請問跟av 或avi有關嗎

→

bubunana 07/14 12:56？

→

flylee 07/14 12:57只是有沒有必要去搞 AVX512的確是個問題

推

arrenwu 07/14 12:58我覺得一般的數值分析行為，大多也不會用GPU

→

friedpig 07/14 12:59圖靈encode已經到可以用程度拉接下來再多塞硬體

→

friedpig 07/14 12:59只會更好而已

→

flylee 07/14 12:59AMD的R9 3950x(avx2) 就把 10980XE打好玩的

→

friedpig 07/14 12:59反正老黃很精傳統遊戲性能的提升一直在控都先做

→

friedpig 07/14 12:59邊邊角角的東西

→

friedpig 07/14 13:0012->7 這代密度提升快三倍老黃又屌炸天 die size

→

friedpig 07/14 13:01看起來大概不會變小多少了多快三倍電晶體想幹嘛

→

friedpig 07/14 13:01就幹嘛

→

friedpig 07/14 13:02不過說真的 AI雖然這麼熱但是真的有商業價值的東西

→

friedpig 07/14 13:02好像也還好不知道什麼時候又要循環了 CS每幾年就換

→

friedpig 07/14 13:02個東西炒

推

Bencrie 07/14 13:09不炒經濟會停滯 (x

→

dxzy 07/14 13:28WARgame723真的丟人現眼無知就算了文章也不會讀

推

kira925 07/14 13:45其實想一想也滿奇怪的明明AI都是只算模型用戶端

→

kira925 07/14 13:45只管用不管算結果塞了一堆訓練用的電路要幹嘛...

推

winiel559 07/14 13:50某些應用需要能在Local算，例如臉部辨識解鎖

推

Fezico 07/14 13:56AI能綁的的東西太多，搞不好這十年CS都吃這碗飯

→

birdy590 07/14 13:59這跟技能樹一樣點數有限低效益技能分配太多會掛

推

iWRZ 07/14 14:04這個Linus等級比另外一個Linus高到銀河系遠好嗎？

→

iWRZ 07/14 14:04全世界大部分伺服器和超級電腦的作業系統核心都是

→

iWRZ 07/14 14:04他寫的

推

arrenwu 07/14 14:10沒那麼誇張吧XD 後來各自有社群在修改和維護啊XD

→

AmibaGelos 07/14 14:16i皇就萬惡之源啊 mmx砍stack卻動到x87 x64 sse2好

→

AmibaGelos 07/14 14:16不容易淘汰x87統一天下又來avx avx 號稱encode清乾

→

AmibaGelos 07/14 14:16淨又冒出avx512 套用水球大的話i真的是奇謀而短orz

→

dxzy 07/14 14:17他有不可動搖的貢獻跟最終裁量權? 但不會去寫了

推

iWRZ 07/14 14:17支持這個理論 Pytorch和tensorflow明明有顯卡可吃

→

iWRZ 07/14 14:17偏要AVX2 CPU才能跑要不然source抓回來自己編

→

iWRZ 07/14 14:18浮點數計算顯卡海放CPU不知道幾條街了

→

iWRZ 07/14 14:19要不然超級電腦狂插Tesla卡插得比礦機多是要幹嘛

推

arrenwu 07/14 14:21他沒有裁量權吧？不然這東西怎麼open？

→

arrenwu 07/14 14:22不過 PyTorch或Tensorflow有一定要支援AVX2的CPU喔?

推

kira925 07/14 14:29他有 Linux Kernel的Merge Window與版本確定

→

kira925 07/14 14:29都是他在發的他也臭幹過很多次各家公司發垃圾

→

kira925 07/14 14:29要放進Kernel

→

friedpig 07/14 14:41現在都強調edge了拉 local要有簡單訓練能力local最

→

friedpig 07/14 14:41佳化模型

推

kimisawa 07/14 15:10等一下723你說Linus 仇i搞錯什麼了嗎

→

kimisawa 07/14 15:11他撐著用i多久了是幾個月前才受不了

→

AreLies 07/14 15:45兩個Linus其實都是今年才把自己的主機換成AMD

推

AJizzInPants07/14 16:14自己搞不清楚狀況被笑還要嘴硬講年紀

→

AJizzInPants07/14 16:14可憐哪.jpg

→

AJizzInPants07/14 16:15不管是反串還是真的fanboy都是可憐

→

egnaro123 07/14 19:48ai需求超級假,幾個政府扶植的新創都不了了之

→

egnaro123 07/14 19:48更不用說財團法人"們"為買而買的ai gpu卡了

→

egnaro123 07/14 19:49這幾年真實有用的就是VM/data center/高速網路

→

egnaro123 07/14 19:49多核心等,linus說的沒錯,教授待的地太"特殊"

→

egnaro123 07/14 19:50amd也會往data center走,不過amd還缺好的網路晶片

→

egnaro123 07/14 19:57可以查查交大智慧視覺相關就知了

→

egnaro123 07/14 19:58所以教授看的點和真實應用差異,新創都養不起

→

egnaro123 07/14 19:59未來?未來搞不好政府又另一套口號,業面也有新技術了

推

birdy590 07/14 20:28網路晶片是沒救了看看能不能直接用買的

→

bubunana 07/14 21:11哈！看完都不知道自己眼睛跳躍到那條世界線 MS FB A

→

bubunana 07/14 21:11Z G 開的規格跟世界頂尖實驗室正在做的都是假的只

→

bubunana 07/14 21:11有台灣業界學界需求才是真的

→

egnaro123 07/14 21:12可是那些全叫做data center大哥,你要去查下使用率

→

egnaro123 07/14 21:13這些cloud用最多的是什麼?這是全世界,你只看到想看

→

egnaro123 07/14 21:14就如同台灣財團法人和學界了

→

AKSN74 07/14 21:28網路晶片我看要買也難，老黃才剛把Mellanox買下

→

egnaro123 07/14 21:33intel在這dc的網路技術超級多,amd很難超車

→

egnaro123 07/14 21:34我是不懂國外/台灣財團法人花的錢gpu的錢何時回本

→

AKSN74 07/14 21:38國外我覺得很難說，台灣的話確實就有點在跟風

→

AKSN74 07/14 21:40最近公司也是接到不少有類似需求的客戶

→

AKSN74 07/14 21:41但只有少數才很明確提出他們的需求目的

→

AKSN74 07/14 21:42就跟前幾年的雲端一樣，台灣一堆公司推出所謂的雲端

→

AKSN74 07/14 21:42產品，但實際去看很多都只是主從式運算概念的東西

推

miname 07/14 22:01我覺得不會回本吧，據消息指出租金比自建營運的成本

→

miname 07/14 22:01還要低

→

friedpig 07/14 22:08主要就那幾家巨獸有真的資料跟人能玩啊剩下的瞎搞

→

friedpig 07/14 22:08居多不過那幾家如果扣掉租借式部分純靠自己AI商業

→

friedpig 07/14 22:08模式部分不知道到底賺了多少

→

egnaro123 07/14 22:29原po好像少po了其他重點,另回

→

kuma660224 07/14 23:19應該不是説浮點少用而是超寬SIMD

→

kuma660224 07/14 23:19的浮點（或整數）很少使用價值

→

kuma660224 07/14 23:20絕大多數程式是需要scalar浮點

→

kuma660224 07/14 23:21你AVX512可同時跑16個32bit浮點

→

kuma660224 07/14 23:21Who cares? 我們需要是1次1個

→

kuma660224 07/14 23:22但是跑很快很快的

→

kuma660224 07/14 23:22同時16加法或16乘法對正常軟體無用

→

kuma660224 07/14 23:25一般是需if (A+B>CxD) { (A+X)/Yx4 }

→

kuma660224 07/14 23:25這類邏輯流程運算

→

kuma660224 07/14 23:26超寬SIMD完全不適合做這類運算

→

kuma660224 07/14 23:27而且比超寬SIMD的平行吞吐量？

→

kuma660224 07/14 23:27適合那種的工作我為啥不用GPGPU?

→

kuma660224 07/14 23:28GPU有幾千個平行的超寬向量單位

→

kuma660224 07/14 23:29還可多插幾張卡擠爆炸性浮點量

→

kuma660224 07/14 23:29導致AVX512不是暫時雞肋更可能永遠...

→

kuma660224 07/14 23:30其實連AVX256都沒有很常用

→

kuma660224 07/14 23:30只是AVX256至少不會降頻

→

kuma660224 07/14 23:31所以還能説起碼有做就有一點加分

→

labbat 07/14 23:45AVX256不常用？

→

labbat 07/14 23:45餵狗查array_multiply_prf.asm 怎麼運作的唄

→

kuma660224 07/15 03:47現在3A遊戲更吃ComputerShader

→

kuma660224 07/15 03:48用GPU去滿足大吞吐量平行浮點運算

→

kuma660224 07/15 03:49AVX512當初是Larrabee提出的

→

kuma660224 07/15 03:50希望用X86 眾核CPU去取代GPU

→

kuma660224 07/15 03:50弄到最後還沒上市就被打趴在地

→

kuma660224 07/15 03:51為資源再利用，把AVX512往其他領域塞

→

kuma660224 07/15 03:52包括伺服器，超算，AI, 繼續跟

→

kuma660224 07/15 03:52超平行大顆GPU對抗，但還是慘敗

→

kuma660224 07/15 03:53最後想再挪到消費級當成賣點

→

labbat 07/15 10:45居然還記得intel的X計畫(名字隨意取的)

→

labbat 07/15 10:45可是人類還無法寫出超平行化程式碼 GPGPU overhead

→

labbat 07/15 10:46註定無法跟cpu比另一個極端就是APU的gpgpu囉

推

birdy590 07/15 10:58平行度輸太多了, overhead 從來沒那麼重要吧

→

birdy590 07/15 10:58不能派一小群葉問去對抗幾萬大軍也打不贏啊

推

Windcws9Z 07/17 13:27推kuma

推

stja 11/08 10:28

同系列文章

Re: [情報] Alder Lake沒有AVX512，於是Linus又開嘴惹

```
10 
```
egnaro123：Linux之父怒罵Intel AVX-512：「我希望它死得痛苦點．．．」 ............ Intel在Skylake -Server架構中首次引入了AVX-512特性，但它並沒有像之前引入AVX和

其他人也閱讀了

PTT 熱門相關