PTT推薦

[情報] Zen5 AVX512 分析

看板PC_Shopping標題[情報] Zen5 AVX512 分析作者
SkyPlus
(Sky)
時間推噓41 推:42 噓:1 →:75

http://www.numberworld.org/blogs/2024_8_7_zen5_avx512_teardown/

雖然 Zen5 初期測試報告有點不盡人意
不過剛剛看到這篇文章大力讚揚 Zen5 AVX512 設計,
和 Zen4 AVX512 相比, Zen5 IPC成長幾乎快了 100%

這是因為 Zen4 用 4 x 256-bit 的通道組合出來
連 Intel 只有 server 等級的 Sapphire Rapids 才給的起 2 x 512-bit
但這次 zen5 桌面版大核就很大方的給了 4 x 512-bit
因此反映在效能上就直接爆漲了

另外 Intel 常被詬病 AVX512 需要先花一些時間(約50000 cycle)低速跑,
等電上去,CPU降速才能全速跑。但 Zen5 可能靠設計和製程完全解決這問題,
不需降速也不用等,下指令後幾乎立即全速運作。

此外 Intel 在 Tiger Lake 加了 AVX512-VP2INTERSECT 指令,
但速度超級慢 (25 cycle),大家都用別的指令去模擬還比較快,
因此 Intel 在往後的 CPU 也移除他。
這次 Zen5 實作了這個指令,而且只花 1 cycle 就完成。

綜合這些分析,他認為Zen5可以說第一次讓大家看到完整版的 AVX-512。
反觀 Intel 設計了卻四處限制...

他還有提到 Cinebench, CPU-Z 都沒有很認真測試 AVX-512,
因此看不出Zen5在這方面的優勢。

不過有些 Zen4 可以在 1 cycle 做完的非 AVX-512 SIMD,
在 Zen5 反而不明原因退步到 2 cycle,
另外混合 AVX-256,512 指令的順序不對也會變慢

--

--

※ PTT留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.113.235.116 (臺灣)
PTT 網址

smallreader 08/08 09:42重返榮耀!

ltytw 08/08 09:45i粉正在嘗試關心 : 既然以前i被說avx512

ltytw 08/08 09:46超熱超耗電又要讓U降頻跑 那這次的zen5呢

Fortis931 08/08 09:58i吹討厭

Fortis931 08/08 09:59這篇 並試著無視

orze04 08/08 10:01不知道Linus 大神如何看待…

johnson0319 08/08 10:05新一代RPCS3神器

mayolane 08/08 10:19之前用7950X的AVX-512挖礦的還在嗎

qwe753951 08/08 10:33超缺頻寬

qwe753951 08/08 10:34X3D快來

seiya2000 08/08 10:36AVX-512做什麼用?

Gwaewluin 08/08 10:44這個之前好像看到能挖礦的樣子

arnold3 08/08 10:46遊戲好像用不到?

arrenwu 08/08 10:47AVX2應用比較廣泛 AVX512不知道那些軟體

arrenwu 08/08 10:47現在有在用

mayolane 08/08 10:47So sorry to disappoint the RPCS3 com

mayolane 08/08 10:47munity here. As much as they love AV

mayolane 08/08 10:47X512, they primarily only use 128-bi

mayolane 08/08 10:47t AVX512 - which does not significan

mayolane 08/08 10:47tly benefit from Zen5's improvements

mayolane 08/08 10:47 to the vector unit.

mayolane 08/08 10:47RPCS3沒什麼用

DrGun 08/08 10:538要再反觀惹!收盤只剩18.99 天下苦皇久矣

DrGun 08/08 10:53!!

chiahong1227 08/08 11:12AVX-512 普通消費者用不到也是事實

leviva 08/08 11:14普通遊戲用不到,PS3模擬器有用到的樣子

qwe753951 08/08 11:19一般人用不到是事實

yankeefat 08/08 11:28i皇今年已經跌掉60%了

kamichu 08/08 11:45等X3D應該猛猛的

amos30627 08/08 11:50G叔吹18A股價18塊 等他吹14A的時候會剩

amos30627 08/08 11:5014塊

amos30627 08/08 11:51看他是製程吹的快還是股價跌的快

wantsu 08/08 12:12PS2模擬器好像會用到

mayolane 08/08 12:17PS3模擬器有用

Arbin 08/08 12:21那PS3模擬器應該會跑更快了吧xd

mayolane 08/08 12:24PS3模擬器就上面說的RPCS3,看起來Zen5

mayolane 08/08 12:24不會比較快

easyman 08/08 12:24X3d加上avx512 ,跑llama小model,應該個

easyman 08/08 12:24人使用也不錯

tim108108 08/08 12:27cpu跑大語言模型可以用avx512加速

Lansbury 08/08 12:36沒想到自己搞得專用指令 AMD才能好好發

Lansbury 08/08 12:36揮 可悲

wahaha99 08/08 12:43可是這超級耗電晶體耶 能照顧到的

wahaha99 08/08 12:43應用有限說...

ybite 08/08 12:45指令集的改善我覺得要等程式編譯執行時最佳

ybite 08/08 12:45化才能展現

wahaha99 08/08 12:48主要是應用太少 當年推出時幾乎沒什麼

wahaha99 08/08 12:48地方用的上 到現在有AI可以用上

wahaha99 08/08 12:49但GPU跟NPU他不香嗎... 為什麼要用CPU

mayolane 08/08 12:53但Zen5塞了AVX-512還沒有比Zen4核心大

mayolane 08/08 12:53

mayolane 08/08 12:54製程也沒用進步很多

ltytw 08/08 13:00cpu還是比較通用

alvistan 08/08 13:31重點是這次看起來不佔空間

b325019 08/08 13:39原本以為塞avx512會很肥,結果塞了4路進

b325019 08/08 13:39去整體面積跟上代差不多真猛

mtc5566 08/08 13:46我猜AMD先上 過幾年Intel又會出來AXV51W

mtc5566 08/08 13:46無用論

kaj1983 08/08 13:48台積電就是猛

SHR4587 08/08 14:12伺服器資料中心那邊avx512有甚麼用嗎?

SHR4587 08/08 14:13畢竟AMD EPYC跟Ryzen用的料幾乎是一樣的

EXTECH 08/08 14:14RPCS3全順砲

ltytw 08/08 14:21我很像有看過11代要跨12代那時候

ltytw 08/08 14:21不知道哪個I吹說512沒用了

aegis43210 08/08 14:39轉檔很有用

as920909 08/08 14:42NPU跟GPU不就是為了算浮點數的嗎

jhjhs33504 08/08 14:50跑大語言模型的回答比較不會出現幻覺

tonyian 08/08 15:54到底誰在用avx512?有這需求的不是都拿GP

tonyian 08/08 15:54U或是TPU加速了?

b325019 08/08 16:02你問那些雲端吧,蘇媽會放這個東西進來大

b325019 08/08 16:02概是按DC客戶的回饋加的

aegis43210 08/08 16:21i皇的server都有AVX512呀,蘇嬤在DT端

aegis43210 08/08 16:21這樣純粹是debug加上佛心來著沒閹割

enonrick 08/08 17:02intel 市場行銷的東西先做出來再說,只

enonrick 08/08 17:02是要降頻降溫,code 都要重寫, port難

enonrick 08/08 17:02度高 伺服器端用在加密/hash 加速 ,一

enonrick 08/08 17:02般使用者不需要靠 gpu 做inference ,

enonrick 08/08 17:02多媒體之類的何不用gpu 就好, 猜是想要

enonrick 08/08 17:02吹上面的 NVVI 吧,有實驗宣稱比 gpu

enonrick 08/08 17:02快好幾倍,總之~~讓子彈飛一會~

enonrick 08/08 17:02啊對了 zluda 被 amd 正式發公文下架了

friedpig 08/08 17:28兩邊DT都馬是Server的白老鼠 需求都是

friedpig 08/08 17:28Server來的 只是牙膏DT大小核稿到AVX512

friedpig 08/08 17:28不好Debug關掉而已

friedpig 08/08 17:30AMD不知道是比較保守還是客戶壓力沒那麼

friedpig 08/08 17:31大 可以比較晚等AVX512成熟一點在實作優

friedpig 08/08 17:31秀的硬體 牙膏就比較早硬上慢慢優化

friedpig 08/08 17:39牙膏最新的E核看起來還是沒AVX512 DT應

friedpig 08/08 17:39該87%又是閹割掉了

yymeow 08/08 17:40建議i社把那些面積拿去做L3還比較實際一點

yymeow 08/08 17:40整天搞一些有的沒有的

friedpig 08/08 17:45做硬體的別想太多 食物鏈的下游 很多

friedpig 08/08 17:45時候你以為是牙膏想做 客戶說了算

friedpig 08/08 17:48不過我到蠻想看牙膏現在高階封裝也是有

friedpig 08/08 17:49再碰 能乖乖拉下臉弄個X3D來看看嗎

yymeow 08/08 18:07i社現在NEX事業群倒是出了一些怪機絲

yymeow 08/08 18:08比如說1851腳位的[真。14代]

leung3740250 08/08 18:09MSDT改用NINE L3第4年了還在堆L3,

leung3740250 08/08 18:09能不能先查一下牙膏L3到底是怎麼運

leung3740250 08/08 18:09作的?

yymeow 08/08 18:09core ultra 7 165HL之類的

yymeow 08/08 18:10還有什麼i7-14701e的怪東東

birdy590 08/08 21:11我覺得Linus的看法是對的 桌面/一般用途

birdy590 08/08 21:12根本用不上 佔用的空間可以有更好的利用

birdy590 08/08 21:12伺服器之類特殊用途如果需要可以另外出

mayolane 08/08 21:32另外出怎麼玩蘇媽最愛的膠水大法

kamichu 08/08 23:06這次avx512進步那麼多

kamichu 08/08 23:08zen5這次可能真的卡在那顆舊的iod

pig 08/09 11:01不會影響到其他東西的avx512其實就沒啥好抱怨

pig 08/09 11:01的,用不到的指令集多的是當初就這個被罵翻

pig 08/09 11:09主要還是那時候avx512跑起來又熱又慢

lwei781 08/09 17:24LLM 用CPU 跑有用

lwei781 08/09 17:26這比 NPU 好啊,尤其需要精度的 Mo

lwei781 08/09 17:26del

lwei781 08/09 17:27NPU 幾乎都 Int, 頂多 BF16

lwei781 08/09 17:27Xeon 5代,六代 都有 啊

Litfal 08/09 19:06有沒有一個可能是以前不好用所以沒人用,

Litfal 08/09 19:06不過512需求大多被GPU吃了就是