[測試] I家E core在Ansys Fluent中的效能表現
懶人包:沒有用
部落格好讀版:
https://soulattic.blogspot.com/2024/06/intel-13th-cpuansys-fluent.html
1. 前言
由於工作上時常需要使用CFD(計算流體力學)軟體來模擬,加上對電腦硬體有些認識,成了成了本次做這一些小測試的契機。
念研究所的時候12代剛上,當時有時間可以進行測試,實驗室的設備費卻已經乾了,因此一直沒能買有大小核設計的CPU來進行一些CFD運算的測試。我看到的大多說法都說大小核
設計有助於計算密集型的生產力應用,例如渲染、剪片轉檔等等,也確實在Cinebench之類的跑分軟體中有十分強悍的表現。
網路上國內外的評測都鮮少提到CFD軟體的測試成績,只有少數評測網站會測試開源的CFD軟體OpenFOAM,但測出來的結果卻差異甚大。
在AnandTech的測試中intel 13/14th 全面領先Ryzen 7000系
在Phoronix的測試中7950x3d卻反將一軍
目前工作上使用的軟體是ANSYS Fluent,因此本文將會以這個軟體做為測試主軸。但合法的ANSYS軟體一套要價數百萬,只好跟公司借用借用,嘿嘿。
利用了下班時間跑了ANSYS Fluent的Benchmark Case做了一些測試,留個紀錄想要拋磚引玉
2. 測試環境
A. 軟體版本: ANSYS Fluent 23R2
B. Benchmark Case: ANSYS Fluent, External Flow Over an Aircraft Wing
(aircraft_2m)
C. 網格數量: 2m(200萬)
D. 網格類型: Hexa(六面體)
E. 紊流模型: realizable k-eps turbulence
F. 求解器類型: Pressure based coupled solver, Green Gauss Node based, steady
G. 電腦配備:
CPU: Intel i7 13700 nonK
Cooler: Thermalright BA120
MB: ASUS B760-A WiFi D4
RAM: Kingston Fury DDR4-3200 32GBx2 @3466
SSD: ADATA S70 pro 2TB
Case: CM TD500 MESH V2
H. 環境溫度24度C,觀測HWinfo軟體全測試無出現撞溫度牆的狀況。
I. 電源計畫: 高效能
合法的ANSYS Fluent一次最多只能使用4核心運算,想另外加核心數上去就必須購買HPC(High Performance Computing)。
而這個HPC也是動輒百來萬的東西,因此在這邊只使用1個軟體本體+1個HPC的License,總共總共12核心下去做運算,我想在有限的核心數量下找出最佳的組合也比較符合預算有限的且只能使用合法軟體的單位。
3. 測試結果
必須要先做說明,我有找到原廠的電腦設定建議,裏頭是建議關掉超執行緒(Hyper-Thread,因此剛開始測試都是關閉HT的狀況,後來才想說要把HT打開測試看看。
以下是測試結果,橘框是P core:
A. 6P6E (no HT)
Simulation wall-clock time for 1800 iterations 4085 sec
6P6E是將HT關掉後,在Windows 11下的自動核心調度結果
進工作管理員看是有指定CPU親和性在每個運作的核心上的
https://i.imgur.com/GadJ4lb.png
B. 8P4E (no HT)
Simulation wall-clock time for 1800 iterations 3920 sec
8P4E是我在工作管理員中手動將CPU親和性調度到8個P核上的結果
https://i.imgur.com/3XH3Yia.png
C. 全預設 (自由調度)
Simulation wall-clock time for 1800 iterations 3630 sec
全預設狀況下把HT重新打開,這時進工作管理員查看會發現CPU親和性沒有被指定
但從工作管理員上可以推斷出應該是跑在12個P核的執行緒上
https://i.imgur.com/uVanIiv.png
D. 8P0E (no HT)
SSimulation wall-clock time for 1800 iterations 3683 sec
把小核跟HT都關了,軟體設定8核心運算,只用8C8T下去跑,這個就沒有特別截圖了
E. 8P0E(有開HT,用12個執行緒在跑)
Simulation wall-clock time for 1800 iterations 3578 sec
關小核但開HT,看工作管理員,也有指定CPU親和性在前12個執行緒上
https://i.imgur.com/65t7BYt.png
4. 總結
基本上可以將結果分為兩群:
i. 有E核參加運算(A、B)
ii. 無E核參加運算(C、D、E)
https://i.imgur.com/5eo1FTG.png
其中i群內8P4E相較於6P6E快了4.2%,好像有些差別
ii群內8P0E無HT比預設慢了1.4%,8P0E有HT比預設快了1.5%,這應該可以被認為是誤差
i群平均(4002.5s)相較於ii群平均(3630.3s)慢了10.3%
甚至可以從B跟D的比較中發現8P4E比8P0E還慢!!
我認為這可以歸因於CFD的特性,CFD是一種吃重記憶體頻寬的應用。
在消費級平台上只有雙通道的記憶體頻寬被P核和E核共享,結果就是沒有讓速度較快的P核發揮全部的算力,進而導致整體計算時間拉長。
因為還沒測試過AMD平台,所以不能說全大核的AMD平台就比較好。但可以得到的結論是:算CFD完全沒有買13900/K的必要,因為P核數量並沒有增加。
以上結果供各位參考,如有關於購買CFD模擬用硬體設備也歡迎留下建議。
--
有數據有推
謝謝推
每個小核簇(每4個小核)共用一個記憶
體節點,在memory intensive的程式表現
會很差
感謝說明~
推測試,我以為我在看小論文
其實只是廢話比較多的簡易測試而已
記憶體頻寬 那L3快取大小會不會也有
我印象中看別人測的數據是有差
https://reurl.cc/4r76R2https://i.imgur.com/P69E3N7.png
原po有沒有考慮7000系也測一篇來比較
沒...沒有多餘的預算了
推測試,太詳細了吧,我還是買AMD好了
謝謝推
喔~沒事 x3d提到評測已經講完了
Intel什麼時候放棄大小核架構
推分享
是說這台電腦是你自己的還是實驗室的
是...是公司的
吃重記憶體頻寬? 所以用D4跑跟D5理論上來說
應該會有差距?
理論上是這樣,因為同樣D4-3200,跑雙通道、四通道、八通道的求解速度天差地遠
懶人包簡單暴力,害我笑出來
實驗室的SSD拿S70 Pro我有點擔心
*公司
資料碟而已,系統碟是SN770...XD 不是我配的,不要看我
感謝
有撞功耗牆嗎?
看起來都沒有撞功耗牆喔 有確認過主板內PL1/2都設定在253W 各項測試跑起來最多到160w左右而已
最快的居然是把小核關了w
多核圍觀
我喜歡你這麼粗暴
推 懶人包 XD
簡單粗暴的結論
我怕我廢話太多沒人看QQ
這應該還蠻有參考價值的吧 這種商業軟體很少
人能測 而且原PO也滿詳細的
推 這個軟體使用者普遍太專業XDDD
有拖後腿效用啊 怎麼能說沒有用= =
X3D對這些EDA應用是超強的...
大小核還要賭軟體設計/OS調度 真的不如直
接AMD 大小核比較像Intel的遮羞布 功耗狂
拉 跑分才會好看
推
清楚有料的實測 推推
同跑CFD 幫推推
謝謝推
感謝測試,這結論有釐清一些我操作上的
疑問,連原廠工程師都沒解釋清楚
謝謝推,我有請代理商去問原廠,也是給罐頭回覆而已~ 只好自己測試看看
推 關小核派不推不行
SN770就另一種賣牌子的
WD的nvme根本就是SN580綠標 SN770藍標
但改個標色很有幫助
小核日常使用還不錯,就不適合這種記憶體密集的應用
intel 大小核吹上天 實際應用一跑笑死人
這個測試結論簡單粗暴 我喜歡
小核跑分用的 玩遊戲也用不到
推測試
多補一些數據就論文了 而且結論有趣
結果傳統的加強記憶體階層還是比較受用。
推測試!雖然不會用到Fluent了
祝你未來一切順利~
從i7-12700的8P4E、i9-12900的8P8E
往上一代都是在增加E核而已
好直接的結論xd
推
只差全小核了,這有辦法測嗎
應該是沒有要測全E核啦...畢竟License數量限制在那,當然是用快的下去跑啊!
推 不知道static structural 或Ansys
lsdyna是不是一樣結果
謝謝推,也希望有人可以跑跑Benchmark case囉~
有數據給推
謝謝
優文
推
E核到底有沒有用我覺得不好下定論,像是20
77我關HT開E核,FPS有比較高一些
但原PO環境下,開E核看起來就是悲劇
大小核主要還是調度問題
有料,推個
謝謝懶人包
推
推測試
推
全大核沒有問題
之前測試過公司用的Flotherm
跟樓主的結論差不多
關掉HT,關掉E核會比較快
另外記憶體頻寬大速度明顯有差
謝謝回報,其實我也測過FloTHERM,但我忘記留數據就沒有寫成文章了 但有發現沒有改高效能電源計畫的話會全跑在E核上 XD FloTHERM還有N卡會閃退的問題...
看不懂QQ 為什麼有E反而比沒E慢
白話一點就是,E核加入運算之後,P核需要等E核算完才能算下一步~
推測試,不過買的起這軟體,至少要上64核
心吧,不會用家用型
64核要用3個HPC,請問軟體要花多少錢呢(X 這類軟體一個很大的問題就是用越多核心數的機器運算也代表要花越多錢買軟體 哈哈
哪有差不多,樓主不關HT比較快吧
開HT就該比較快 關HT是考量增幅太小
(這裡增幅小因為被記憶體頻寬限制住)
如果沒有記憶體瓶頸 例如測cb 那HT分
數還是有顯著差異 (耗電也UP就是了)
我印象中有同事跟我說他開/關HT測另一款CFD軟體 Star-CCM+,會快一點點點 就真的一點點
有數據有推
大推~剛使用12700H關E核跑PICS3D也快17%
謝謝測試
※ 編輯: xiaotee (1.173.25.76 臺灣), 06/23/2024 01:08:06推
期待A家測試
爆
[情報] i皇瘋狂交叉測試證明實際全部不輸RyzenIntel 花了大量時間交叉評測,只想證實無論筆記型或桌上型 Core i 對上 Ryzen (在實際 使用)並沒有輸 —69
[情報] 傳第12代最頂規CPU擊敗 AMD 32核CPUIntel 強勢發威?傳第 12 代最頂規 CPU 擊敗 AMD 32 核處理器 關於 Intel(英特爾)第 12 代 Alder Lake 處理器的規格已於週一(9/20)曝光,根據 外媒《Wccftech》的報導,其第 12 代頂規的 Core i9-12900K 處理器又有最新跑分曝光 。50
[情報] Mercedes-AMG F1車隊採用蘇媽EPYC算力學AMD EPYC 處理器為 Mercedes-AMG Petronas 一級方程式 F1 車隊帶來卓越運算效能 -- Mercedes-AMG Petronas一級方程式(F1)車隊採用 AMD EPYC 處理器,來模擬賽車的空34
[情報] Geekbench曝光i7 12700沒K也能挑戰5800XGeekbench剛剛曝光了疑似Intel 12代Core i7-12700桌上型處理器的測試成績,讓人意外 的是儘管型號中不帶“K” 它的性能表現還是與AMD Ryzen R7-5800X競品打平。VideoCardz指出軟體無法讀取主機板 資訊 但CPUID字串(Family 6 Model 151)還是曝光了它屬於Alder Lake家族成員的身份。28
[情報] i皇i9-12900K小核效能功耗=一顆3300XTPU測試了i9-12900K只有小核的效能 詳細測試很多 可以自己點進去看詳細效能 綜合程式效能比較下14
[請益] AMD 的SMT跟Intel的HT差異在哪網路上找了許多文章,還是不太了解HT跟SMT的實際差異 HT我知道是英特爾用虛擬化的方式將CPU模擬多線程 SMT看起來也是差不多 那實際差異是如何阿? 好像SMT對於多核的遊戲最佳化好像比較好,HT對於多核遊戲好像沒那麼好6
[情報] 3DMark推出CPU基準測試工具3DMark的描述是會採用物理運算和自定義的模擬進行測試,而為了避免測試受限渲染效能 會採用每幀平均模擬時間而不是幀率 會依序測試最大執行緒>16個執行緒>8個執行緒>4個執行緒>2個執行緒>單一執行緒- 作者: cloudleaf (葉子) 看板: Mechanical 標題: [情報]9/23 Ansys 結構振動應用技術研討會 時間: Wed Sep 16 16:41:26 2020 ★ Ansys 結構振動應用技術研討會 ★ 活動介紹
- 作者: cloudleaf (葉子) 看板: Mechanical 標題: [情報]9/23 Ansys 結構振動應用技術研討會 時間: Wed Sep 16 16:41:26 2020 ★ Ansys 結構振動應用技術研討會 ★ 活動介紹
- 作者: cloudleaf (葉子) 看板: Electronics 標題: [情報] 12/9 Ansys電子產業散熱解決方案研討會 時間: Tue Nov 24 19:57:35 2020 ★ Ansys 電子產業散熱解決方案研討會 ★ 活動介紹