PTT推薦

[開箱] 入門顯示卡 AI 應用性能對決!

看板PC_Shopping標題[開箱] 入門顯示卡 AI 應用性能對決!作者
AreLies
(AreL1e5)
時間推噓10 推:10 噓:0 →:13

CUDA 護城河現階段很深很廣

原文轉自 UNIKO's Hardware
網頁好讀版:https://reurl.cc/RWb8eg

https://i.imgur.com/usggQmS.jpg


AI 這個名詞絕對是今年與未來最火熱的議題之一,目前出現各類生成式 AI 應用,例如 ChatGPT 和 Stable Diffusion,為產業帶來全新的發展路線。
為了讓生成式 AI 應用有更高效的產出,AMD、Intel 與 NVIDIA 等晶片廠商皆不斷研發新的軟硬體,以期在這塊市場上取得更多收益。這次筆者就利用目前持有的三張入門顯示卡 (ARC A380、GTX 1650 和 RX 6400),來讓讀者了解三家晶片廠商的入門產品能提供多少運算效能。



GUNNIR ARC A380 Photon 6G OC 外觀

筆者這張 ARC A380 品牌是 GUNNIR,是一張需要外接電源的版本,目前台灣電商平台有銷售的 SPARKLE ARC A380 ELF 則無需外接電源。兩者主要差別是 GPU 加速頻率。
據 TechPowerUp 資料庫顯示,ARC A380 Photon 6G OC 加速頻率是 2450 MHz,ARC A380ELF 加速頻率是 2050 MHz,差了 400 MHz。

ARC A380 Photon 6G OC 外盒正面印有產品外觀彩圖,散熱器跟外接電源的設計,讓它看起來不像入門級顯示卡。右上角標示該卡為 Intel ARC 3 系列成員,支援 XeSS 超採樣技術和 DirectX 12 Ultimate API。

背面標示該卡需要的環境配備,例如 350W 以上並且有 8 Pin PCIe 電源接頭的電源供應器、建議 8GB 以上系統記憶體、AMD Ryzen 3000 系列及更新的處理器並能開啟 ResizableBAR 功能的平台,以及 Windows 10 或 Windows 11 64 位元系統。

https://i.imgur.com/mxcUogL.jpg

https://i.imgur.com/XPjzpaP.jpg

正面可以看到整體採黑色雙風扇散熱器,背面也有一塊黑色的金屬強化背板,已經是接近中階顯示卡才有的待遇,整體尺寸不含擋板為 222 x 114 x 42 mm。

https://i.imgur.com/IBg77zj.jpg

https://i.imgur.com/ftMSDXH.jpg

內部可以看到有一塊不小的鋁擠散熱片,還有一根導熱管。
上方印有 Intel ARC 字樣,8 Pin 電源插座旁還有一塊 GUNNIR Logo 的發光區域,正常開機時會發藍光。

https://i.imgur.com/3bHdodZ.jpg

https://i.imgur.com/G2AvEDq.jpg

在影像輸出方面,具備 1 個 HDMI 2.0 跟 3 個 DisplayPort 2.0 輸出接頭,是新台幣 4000 左右顯示卡中輸出接頭最多的。

https://i.imgur.com/pmjdbng.jpg




硬體規格

處理器:AMD Ryzen 5 5600X (關閉 PBO)
主機板:ASUS PRIME B550M-K/CSM
記憶體:XPG SPECTRIX D60G DDR4 RGB 3000 8GB x2 (OC 3200)
顯示卡:
1.ASUS Dual Radeon RX 6400
2.GUNNIR ARC A380 Photon 6G OC
3.ZOTAC GAMING GeForce GTX 1650 Low Profile儲存:ADATA Legend 710
螢幕TUF Gaming VG27AQL1A ZAKU II EDITION

驅動版本:

ASUS Dual Radeon RX 6400 - AMD Software : Adrenalin Edition 23.11.1

GUNNIR ARC A380 Photon 6G OC - Intel Arc & Iris Xe Graphics 31.0.101.4972

ZOTAC GAMING GeForce GTX 1650 Low Profile - GeForce Game Ready 546.17

作業系統:Windows 11 23H2 (關閉防毒)

電源設定:平衡模式



性能與遊戲測試

3DMark

不免俗的還是要跑一下 Benchmark,首先是 3DMark,Time Spy 中 ARC A380 分數最高,Fire Strike Extreme 中則是 RX 6400 表現最佳。

https://i.imgur.com/QGgqja4.png

https://i.imgur.com/AzV85eD.png

Geekbench

再來是 Geekbench,OpenCL 性能 GTX 1650 具備優勢,Vulkan 則是 RX 6400 領先,而 ARC A380 在這兩項測試中性能皆居次。

https://i.imgur.com/Pli4iaj.png

https://i.imgur.com/Wa5EqHB.png

GravityMark Vulkan

GravityMark Vulkan 的顯示卡性能排名與 Geekbench Vulkan 相同,表示 RX 6400 在 Vulkan API 的效能表現是三者中最強的,只是大家性能差距也不大。

https://i.imgur.com/UKJVTYP.png


Counter-Strike 2

簡單試個遊戲,首先是 Counter-Strike 2,由於是入門顯示卡,所以筆者統一使用 1080P120Hz 低特效全螢幕設定,地圖選 Dust 2 進行 AI 對戰,結果 RX 6400 出現畫面異常不能玩,只有在未設定全螢幕前的視窗化狀態下正常,因此 RX 6400 在這項沒有成績。GTX 1650 在 CS2 遊戲測試中 AVG FPS 最高。

https://i.imgur.com/i9dhqCL.png


Overwatch 2

接著測 Overwatch 2,一樣是 1080P 120Hz 低特效全螢幕,關閉動態渲染比率,遊戲解析度設定 100%,最大幀率 300,地圖 66 號公路,AVG FPS 由 RX 6400 勝出。

https://i.imgur.com/yEqZ53l.png




AI 相關應用測試

Stable Diffusion WebUI

現在進入重頭戲,先來試個最常用的本地 AI 應用 Stable Diffusion WebUI,模型使用 Stable Diffusion V1.5,GTX 1650 用的是AUTOMATIC1111 的 Stable Diffusion web UI,版本 1.6.0;ARC A380 用的是 openvinotoolkit 的 Stable Diffusion web UI,版本 1.6.0;RX 6400 使用 Nod.AI 專為 AMD RDNA 顯示卡最佳化的 Shark (Vulkan API),版本 20231009.984。測試使用的設定和 Prompt 跟「Stable Diffusion AI 生圖加速新利器!透過 LCM LoRA 大幅提升生圖速度」這篇*註1 相同,測試結果顯示 Intel 的 OpenVINO加速相當出色,速度讓對手看不到車尾燈。

註1:https://reurl.cc/E4ZWYK

https://i.imgur.com/ea2bs1W.png


本地 LLM 大型語言模型運作效能測試

筆者使用 KoboldCpp V1.5 載入 Taiwan-LLM-7B-v2.1-chat-Q4_K_S.gguf 模型進行測
試,設定只更改 Presets,GTX 1650 選擇 cuBLAS,ARC A380 和 RX 6400 選擇 CLBlast,詢問的問題是「什麼是LLM」,連續三次。圖片排序左至右依序是 GTX 1650、ARC A380、RX 6400,測試結果顯示 GTX 1650 效率最高,RX 6400 次之。

https://i.imgur.com/kkTADmY.jpg

https://i.imgur.com/9UBUEYp.jpg
https://i.imgur.com/Y38feG5.jpg

AI 影片放大補幀效能測試

測試工具使用 Waifu2x-Extension-GUI 版本 3.108.01, 放大工具選擇 Real-CUGAN ncnn Vulkan,放大倍率為預設的 2X,補幀工具選擇 RIFE ncnn Vulkan,針對各顯示卡開啟硬體加速選項,圖片儲存格式用 WebP,圖片品質設 80,測試的影片來源 (360P) 可按此下載*註2。
此項測試由 GTX 1650 拿下冠軍,RX 6400 獲得亞軍。

註2:https://reurl.cc/mrv77A

https://i.imgur.com/My89rrL.png




結論

以一般娛樂用途而言,在新台幣 4000 這個價位上,三款顯示卡的效能其實差不多,要是真的想跑 AI 應用,那麼 NVIDIA 的顯示卡絕對是目前最穩的選擇,AI 相關應用軟體基本上都支援 CUDA,可以讓你獲得下載即可用的體驗。

在本次測試結果中,AMD 顯示卡雖然性能表現不如 NVIDIA (這邊僅考慮 Windows 平台) ,透過 OpenCL 或 Vulkan API 還是可以獲得一定程度的效果。另外,AMD 的 ROCm 雖然說已登陸 Windows 平台,但筆者使用 KoboldCpp 的 ROCm 版本只能正常開啟程式,載入模型後就自己關閉了,而 Shark 從 Vulkan 改為 ROCm 會顯示錯誤出不了圖,因筆者手上沒 AMD 更高階的顯示卡 (本身偏好用無須外接電源的顯示卡),不曉得是不是 VRAM 不夠所以跑不了,或是有其他原因,也希望能在 Windows 系統上看到更多最佳化解決方案出現。

至於 Intel ARC 顯示卡在 AI 的發展,只要 Intel 持續積極對社群 / 開發者進行資源投入,以本次 Stable Diffusion WebUI 測出來的效率來看,在 Windows 系統的未來令人期待。

筆者並非 AI 相關產業人員,對這方面並不熟悉,若是大家有更準確且方便比較性能的測試方法 / 工具歡迎提出,希望是以簡單安裝、容易使用且免費或開放原始碼,能夠在 Windows 系統正常運作為主。關於 AI 應用測試結果僅供參考,測試期間為 11 月底至 12 月初,有機會且剛好有硬體的話會繼續測試一些東西給大家看。


喜歡我們的文章歡迎分享原文
也可以UNIKO's Hardware 粉絲專頁並設為最愛,或是到 UNIKO's Hardware 官方網頁逛逛,觀看各種開箱及測試!



--
Sent from my Nothing A065

PiTT // PHJCI

--

※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.238.40.102 (臺灣)

※ 文章網址:
https://www.ptt.cc/PC_Shopping/E.EFV9vdhhDmbg

※ 編輯: AreLies (36.238.40.102 臺灣), 01/02/2024 00:17:17

abc21086999 01/02 00:17破產版AI

Koogeal 01/02 00:33雜魚們等級對決是嗎?

tint 01/02 01:075000價位的話 2月會出3050 6GB版 免外接電卡

tint 01/02 01:073050 6GB對比這幾張多了Tensor Core

tint 01/02 01:08相對比較的話 3050 6GB好像也還行XD

其實現行的3050 8G會更好用 只是價格太貴 捏上3060 12G還比較有CP值

※ 編輯: AreLies (36.238.40.102 臺灣), 01/02/2024 01:44:46

jaffson8909 01/02 02:09

smallreader 01/02 02:13想知道入門顯卡跟SoC的NPU能比嗎

wsdykssj 01/02 02:27APU(780M)呢? 完全不能打?

oopFoo 01/02 06:55Arc a380也有xmx(tensor core)。

oopFoo 01/02 06:57intel/amd的igpu/dgpu跑LLM選擇MLC會快很

oopFoo 01/02 07:00多。OpenCL基本上優化的不夠。MLC用vulkan

oopFoo 01/02 07:02效果更好。vLLM看起來也蠻有潛力的。

oopFoo 01/02 07:03koboldcpp/llamacpp主要是普及,易入門,

oopFoo 01/02 07:04cpu/gpu自動幫你配好,N家優化極好。

oopFoo 01/02 07:05LLM現在的發展極快,變化也很快,希望明年

oopFoo 01/02 07:06不對,今年上半年有比較明顯的結果出來,

oopFoo 01/02 07:07NPU目前支援都不好。AMD的NPU鎖在onnx後面

oopFoo 01/02 07:08支援可能更難.

guezt 01/02 07:36顏色選擇好怪啊 一般是用i藍 n綠 A紅吧

yenchieh1102 01/02 07:50推比較

IKnowWhy 01/02 07:56與其買入門卡,不是用內顯就好?

Sartanis 01/02 09:59VRAM入門感覺要12GB吧?

iorittn 01/02 13:49訓練模型要12g,畫圖不用