Re: [情報] 7900XTX 的L3快取竟然比7600還慢58%!?

oopFoo 發表於 2023/6/8 上午7:53:52

看板PC_Shopping標題Re: [情報] 7900XTX 的L3快取竟然比7600還慢58%!?作者

(3d)時間Jun 8 07:53:52 2023推噓12 推:12 噓:0 →:34

※ 引述《luvstarrysky ()》之銘言：
: 心得：黏膠水的架構似乎生出了快取延遲的問題，這點在Ryzen CPU靠堆疊3D快取的方式: 來解決，但AMD為了賺錢是絕對不會在Radeon GPU上複製這種方式的，畢竟現在都: 只能靠吃NV吃剩的大餅碎屑來充飢，不需要搞得多好也有粉絲買單，財報好看，: AMD笑哈哈，消費者苦哈哈。
這樣的心得真的只是來挑釁的。引述的url也內容空洞。來看最原始的文章吧

先講L3的latency並不是很重要，GPU的設計本來就是吃bandwidth犧牲latency。
L3在chiplet，latency增加並不是大問題，大問題是data從mcd到gcd需要很大的能耗，所以這是Navi31異常耗能的原因之一。L3真的不應該在chiplet上，N/I擴張L2棄L3是有原因的。

https://chipsandcheese.com/2023/06/04/amds-rx-7600-small-rdna-3-appears/

這篇其實主要是講VOPD(dual issues)的問題，rdna3在wave32本來就不容易dual issues，舊的wave64模式反而容易dual issues，這是compiler的問題。
rx7600還有另一個大問題，因為用6n而不是5n空間不夠，犧牲掉vector registers，這造成dual issues更困難，因為vector registers的不足。
本來rdna的設計就是wave32雖然效能比wave64差但比較容易達到好性能，但現在VOPD的情況下就反過來了。令人感嘆wave32真是白忙一場的設計。

https://i.imgur.com/wsGh4b3.png

可以看到，如果能夠dual issues，rx7600幾乎可以追上rx6900xt。

這篇其實蠻有趣的，如果你想粗淺了解rdna3的架構與問題。

-------------------------------------
如果你想黑A，找一下geohot最近兩天的言論，真是把AMD黑死了，雖然geohot自己的問題也很大，但他黑之有物

※ PTT留言評論

※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 219.70.128.119 (臺灣)

※ PTT 網址

※ 編輯: oopFoo (219.70.128.119 臺灣), 06/08/2023 07:55:59

推

qwe753951 06/08 07:58rdna3真的是大大大失敗

推

E6300 06/08 08:53所以蘇媽該降價了

推

wardraw 06/08 09:09黑A真的要言之有物相比前篇心得跟坨一樣

→

Ekmund 06/08 09:35the tiny corp 才沒多久他又轉向了..XD

推

Tsukasayeo 06/08 09:56他只是想黑，才不管內容怎樣

推

SHR4587 06/08 10:15MCM第一代問題多，等下一代

推

ideo 06/08 10:24這篇程度和原PO天差地遠

→

friedpig 06/08 11:42MCD能耗是都花在傳輸上嗎？這代都2.5D

→

friedpig 06/08 11:43了感覺是L3太大本來就吃電應該不是

→

friedpig 06/08 11:43傳輸的問題

→

friedpig 06/08 11:46AMD架構本來就贏不過NV也是問題天生就

→

friedpig 06/08 11:47吃電了 MCM的確還有在傷一點最後就QQ

推

smallreader 06/08 11:49架構還好，看了geohot黑的點應該驅動

推

ltytw 06/08 11:57只不過最近我們也是在嘲諷nv功耗換效能?

→

oopFoo 06/08 12:33L3的頻寬用mcm，耗電量大增，SPR也有同樣

→

oopFoo 06/08 12:33問題。驅動就是硬體的延伸，好硬體好驅動

推

BlackCoal 06/08 12:34先推再說，雖然我真的看不懂

→

friedpig 06/08 12:37傳輸耗能沒那麼多拉功耗差的量級不是

→

friedpig 06/08 12:37傳輸的問題

→

friedpig 06/08 12:452.5D的傳輸功耗應該是1pJ/bit以內

→

friedpig 06/08 12:46inifite fanout link峰值頻寬是5.3TB/s

→

friedpig 06/08 12:47全頻寬吃下去40~50W吧不過怎麼可能沒事

→

friedpig 06/08 12:47一直保持那麼大的數據交換多少有影響但

→

friedpig 06/08 12:47應該不是主因

→

friedpig 06/08 12:52https://tinyurl.com/23pjrefr

→

friedpig 06/08 12:52這邊提到CoWoS 0.5pJ/bit而已 InFO到底

→

friedpig 06/08 12:55多少還要查一下

→

friedpig 06/08 13:00https://tinyurl.com/4v2snb2x InFO參考

→

friedpig 06/08 13:00這邊可能才0.2~0.3pJ/Bit而已傳輸功耗

→

friedpig 06/08 13:00有可能才20W不到問題不該是這個

→

dildoe 06/08 13:54比較好奇高速io在不傳輸時是不是很省電?XD

→

leung3740250 06/08 14:24spr的問題不在於emib，而是電壓過

→

leung3740250 06/08 14:24高加上全吞吐avx512和amx

→

leung3740250 06/08 14:25CML-S之後的任何一代電壓都是比正

→

leung3740250 06/08 14:25常需求多出0.1v起跳，SPR都快比電

→

leung3740250 06/08 14:25壓表標的多了0.15v了

推

aegis43210 06/08 16:17server就是穩定性和安全性最重要，SPR

→

aegis43210 06/08 16:17已經延遲了一年，為了盡快出貨，電壓

→

aegis43210 06/08 16:17也只能設定的高一些

→

aegis43210 06/08 16:19EMR會改善的

→

oopFoo 06/08 17:25高頻高效能的die2die功耗那有辦法這麼低

→

oopFoo 06/08 17:26只跑低頻什麼低功率都有可能。spr的問題真

→

oopFoo 06/08 17:27在emib。高功耗i皇還可以解決，emib的效率

→

oopFoo 06/08 17:27還需要時間

推

phoenixcx 06/08 19:47講太深…

推

kenuser 06/10 11:27你太認真了，但是有料給推

同系列文章

[情報] 7900XTX 的L3快取竟然比7600還慢58%!?

```
4X 
```
首Poluvstarrysky： Radeon RX 7600是AMD第一款衝擊DIY市場的Monolithic RDNA3 GPU，跟先前推出的 RDNA3產品不同，RX 7600核心結合了L3快取和記憶體控制器，為單一6nm GCD結構。相比之下，Radeon RX 7900採用了分離的多MCD結構來放記憶體控制器與L3快取。根據物理定律，分離的結構會使其出現延遲，就跟早期Ryzen處理器所看到的情況相同。近期Chips and Cheese比較了Navi31(RX7900)與Navi33(RX7600)的L3快取延遲和頻寬

其他人也閱讀了

PTT 熱門相關