[閒聊] CPU 跨 Core 延遲測試

SkyPlus 發表於 2022/9/19 上午11:37:42

看板PC_Shopping標題[閒聊] CPU 跨 Core 延遲測試作者

SkyPlus

(Sky)時間Sep 19 11:37:42 2022推噓13 推:13 噓:0 →:22

https://news.ycombinator.com/item?id=32889337

在 Hacker news 看到 CPU 跨 Core 延遲測試工具。
Github 上可以看到結果，基本上和設計上的限制一樣

Intel 12th 有趣的是 CPU 8 (P-core?) 到任一個 Core 都很快
E-Core 之間傳輸比 P-core 相對慢一點

AMD EPYC 7R13 是8個 core 一組再連接起來，
因此跨 group 的延遲從 23ns 變成 110ns

而 AWS Graviton2 是一個大 Arm 晶片，
64 Core 之間延遲都差不多

Hacker News 上有 Apple M1 Pro 的結果：
https://news.ycombinator.com/item?id=32892164

同樣可以看出是分成 4+4+2 三組
但跨 group 延遲比 AMD 高

0 59 231 205 206 206 208 219 210 210

59 0 205 215 207 207 209 209 210 210

231 205 0 40 42 43 180 222 224 213

205 215 40 0 43 43 212 222 213 213

206 207 42 43 0 44 182 227 217 217

206 207 43 43 44 0 215 215 217 217

208 209 180 212 182 215 0 40 43 45

219 209 222 222 227 215 40 0 43 43

210 210 224 213 217 217 43 43 0 44

210 210 213 213 217 217 45 43 44 0

※ PTT留言評論

※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.113.235.116 (臺灣)

※ PTT 網址

※ 編輯: SkyPlus (140.113.235.116 臺灣), 09/19/2022 11:45:19

推

ltytw09/19 12:14好的英特爾又贏了一次

推

tingstart09/19 12:14記憶體控制器也會有延遲

推

fmp123409/19 12:21細膩

→

wonder00709/19 12:33膠水延遲

推

jeff4010809/19 12:46intel延遲贏這在zen剛出的時候就知道了

→

jeff4010809/19 12:47後來蘇媽有改一版infinity fabric但還是輸一點

→

jeff4010809/19 12:48但intel付出的代價也不小，server晶片的die size跟

→

jeff4010809/19 12:48價格都壓不下

→

jeff4010809/19 12:48來

推

Transposon09/19 12:56良率跟成本還是蘇媽贏啊

推

iq1000x09/19 12:57使用者不太需要去考慮這麼細的事情吧

→

iq1000x09/19 12:57最後整體跑出來多快才是使用者要的

→

friedpig09/19 12:58牙膏13還是14gen P跟E溝通也有改進

推

mrme94509/19 12:59https://i.imgur.com/rJmL8hz.png Zen3八核內看起來延遲

圖https://i.imgur.com/rJmL8hz.png?e=1667523893&s=8fcDgilwf9kQ3vejcTxJOQ, CPU 跨 Core 延遲測試

→

mrme94509/19 12:59不錯，但超過就暴增了

→

friedpig09/19 13:01就有沒有跨CCX的差別阿只是單純的MCM要多快也難拉

→

leung374025009/19 13:06牙膏big.LITTLE還有很大的優化空間，big.LITTLE會

→

leung374025009/19 13:06拖累大核的latency，但不至於會高14ns

→

friedpig09/19 13:1213Gen好像有正常了但是E core內部的交換反而慢

→

friedpig09/19 13:14https://bit.ly/3ScstRz 小核叢集內慢是本來就有 13Gen

→

friedpig09/19 13:14沒改善但大到小看起來沒啥問題了

推

saimeitetsu09/19 13:28小笨賢：貼核，卡卡，numa

→

leung374025009/19 13:40因為小核內沒snoop filter

→

leung374025009/19 13:42因為10ff GMT妥協了不少東西

→

friedpig09/19 13:58可憐那

推

sdbb09/19 15:33優文

推

E630009/19 17:21牙膏那個能算是big little嗎？

推

aegis4321009/19 17:52算呀，都特地設計了一個MCU來分配執行緒了

→

kuma66022409/19 18:10英特爾的小核是中核

推

SHR458709/19 18:35那叫Big Midium好了，簡稱BM

推

Beyondlife09/20 09:30從延遲看起來還是主要侷限在物理結構層面，如果amd

→

Beyondlife09/20 09:30跨ccx延遲能壓到跟intel 12代水準，或是intel 的整體

→

Beyondlife09/20 09:30延遲能跟amd 單ccx延遲一樣那才是有趣

→

friedpig09/20 09:37AMD要壓也不難 2.5D下去就好了牙膏14 Gen就不鳥成本直

→

friedpig09/20 09:38接2.5D AMD大概還要等GG封裝有CP值才會大量用2.5D吧

其他人也閱讀了

PTT 熱門相關