Re: [閒聊]AMD顯卡可以跑CUDA程式,那就不必特地買N
各位早安,
這裡是禮拜六早上的 R&D。
※ 引述 《amduser (重返榮耀)》 之銘言:
:
: 之前新聞
: https://news.mydrivers.com/1/963/963717.htm
:
: NVIDIA CUDA通過多年耕耘,鑄就了牢不可破的生態壁壘,外人各種嘗試都無法進入,包: 括AMD ROCm開發平台,但其實也不是沒有辦法。
: 開發者Andrzej Janik就憑借一己之力,借助Intel oneAPI,開發了CUDA兼容方案“ZLUDA: ”,能夠在Intel硬件上原生運行CUDA應用,后來就被停了
: 之后在AMD的支持下,ZLUDA重啟了該項目,能夠讓AMD顯卡原生運行CUDA應用,不需要任: 何轉移,也不需要調整代碼。
: 唯一要做的,就是用ZLUDA庫替代CUDA。
: 雖然它不能保證每一款CUDA應用都跑起來,但已經是以一個巨大的突破。
: 非常可惜,AMD支持這一項目做了兩年,也給停了——不知道是不是受到了NVIDIA的壓力: 。
: 幸運的是,ZLUDA項目并未徹底消散,已經免費開源,感興趣有能力的開發者都可以使用: ,而且確認可以在AMD ROCm平台上無縫運行CUDA應用。
: 比如說,可以將CUDA作為Blender 4.0或者V-Ray的渲染API,尤其是Blender本來就有
: Radeon HIP計算渲染器,如今跑在ZLUDA上速度還會更快。
: Andrzej Janik也在繼續研究ZLUDA,其中一個目標就是要讓AMD顯卡運行NVIDIA DLSS。: 內部測試表明,對比OpenCL方案,其性能大部分時候都更好,最多可以領先超過75%,但: 因為還在開發之中,部分時候效率反而更低。
:
: 大家都知道NVIDIA最喜歡搞特規G-SYNC、DLSS、CUDA、閉源軟體一大堆不開放給其他家用: ,現在ZLUDA可以讓AMD顯卡跑CUDA程式,那以後就不必特地買N卡了,應該以後會有人拿: AMD顯卡來搞AI了吧!
:
: https://github.com/vosen/ZLUDA
:
ZLUDA 這東西我研究過一陣子,
當然不是現在這個 Fork,
而是三年前那個版本。
平台使用 Ubuntu 22.04 64bit
我研究後發現 ZLUDA 的運作原理是這樣:
ZLUDA 會去模擬一套 CUDA API,
然後內部再自己實現功能。
這代表什麼呢?
假設你有一套程式支援 CUDA 8 好了,
現在 CUDA 要更新變成 CUDA 9 囉!
N 家能在歷史版本裡面找到 舊版CUDA來套,
那你程式就能順利跑了。
如果你用 ZLUDA ,
之前的問題就是他只支援某特定版本 CUDA,
還沒有 Released 他是 depend 哪一版?
ZLUDA 是照某板的 API 下去寫的!
所以你想支援機器學習框架?
(e.g. TensorFlow, PyTorch)
那要先找到這個是用哪版 CUDA,
找到後還要確定這版的框架你裝得起來。
個人是認為這難度:
https://i.imgur.com/OBzSNCH.gif
除去框架,
實測能夠用 ZLUDA 跑起來的 CUDA 程式:
Geekbench 5
也嘗試過從底層像是 Numba 重寫演算法
拿去 Benchmark performance 。
一樣遇到 Numba 卡版本問題。
退一萬步說 ZLUDA 可能有用,
但是老黃一版更他就會死翹翹,
而且死很久。
開源的東西都這樣,蘇媽也不是做慈善的。
既然主流的框架(e.g. PyTorch)
都有支援 ROCm,幹嘛出大錢搞 ZLUDA?
結論:
ZLUDA 要真正可以商用,
就是要有人花錢去幫每一版 CUDA 寫 API,
然後拿出一張表對標版本支援才有用。
現在商用想逃離 NV 還是推 OpenCL 解決方案,
以上。
--
作者 villagermess (我是女生) 看板 Tech_Job 標題 [討論] 為什麼不開基本薪資 然後分紅給50萬 時間 Fri May 14 10:21:35 2021 ───────────────────────────────────────
--
跟wine概念差不多?
應該就是 然後這部分除非CUDA的API公開
不然很難跟得到
你也不是有個Valve 盡量幫你通通接好
就好像買mac裝windows 一樣, 不用人家
的生態還要裝, 要泡cuda 買nv 就好 ,
qemu 比較貼切
或是 Windows 內的 WSL 跟真 linux
不只是版本問題,ZLUDA三年後還是Alpha版
相容性很差,除了一些Benchmark,正常程式
幾乎沒一個可用。最重要的Pytorch支援也完
全不行。Intel跟AMD都相繼放棄不是沒原因
對AMD on Windows來說,
就像是效率比較好的DirectML.
借問Rocm目前支援度如何
推薦買嗎
pytorch
linux系統的話
Pytorch支援ROCM,但要有能力debug,
最好用docker,常常需要重新設定。最重要
的事,選有支援GPU,現在要7900xtx/xt/gre
推
牙膏one API 有一部分是在做類似的事情
啊 不過人家是商業團隊一堆人在寫 都問
題不少了
推實測說明
7系列都能跑rocm啊至少我畫圖沒問題,
誰說要7900的
你先看那是什麼ID
人家在問linux跑pytorch rocm結果你在說
畫圖 更好笑的是有人要洗別人粉絲意向單
官方就真的寫只支援那三張(遊戲卡)
沒有裝過的別裝懂好嗎
官方只有保證那三張可以穩跑 其他出
錯要自己debug
SD在linux上是用ROCm的torch框架
對公司這等級的就花錢了事買Nvidia工程繪
圖卡,在誰在跟你搞土炮在那搞來搞去的
這種api串接有沒有專門的名詞啊,常常聽
到執行編譯需要軟體A特定版本B配C平台
開發者本來在I家上班的 初始是I家的專案
後來弄一弄I家覺得沒搞頭 換AMD贊助這個
專案 但是AMD後來也覺得沒搞頭 所以依照
跟AMD的合約才開源
畢竟我自家也有,為什麼要跑你的CUDA
AMD還有hipify能轉換CUDA原始碼
給AI寫不就好了
A卡乖乖玩遊戲就好了 別搞這些有的沒的
比windows arm跑x86程式還沒意義
ROCm官網保證特定消費顯卡,但其他卡
其實也有機會跑。我這邊Linux+ROCm 6
+RX6600可以跑Pytorch。雖然我也是玩S
D畫圖。
身為非開發者的我,遇到的問題是要特
定的Pytorch版本才能跑(我沒在Docker
上跑)
不支援的GPU其實大部分可跑,但問題會更多
而且不能file bug report。換句話說,真有
問題,AMD不會處理。現在ROCM的AI相容性
越來越好,花點錢買有在支援名單上的划算
所以rocm其實可以嘗試的意思吧,nv的
卡又貴又難買,有事沒事還缺貨
我看7900xtx fp32比4080s還高
可以嘗試,但4080s的ai會比較強,n家有
tensor core。但7900xtx有24GB,大記憶體
比效能要重要。
但這建立在你能處理問題上。n家的ai是沒
煩惱,支援完整。
AMD這點沒辦法.但時間可以解決就是
AI方面A卡支援度會越來越好就是.
不考慮生產力7900XTX就是比4080S強的
nvidia f u
tensor core要L40s才完全解放性能
畢竟大家都要Second Source
牙膏看起來就是沒有方案 Altera 都拆分了
81
[情報] RTX 4080 Geekbench跑分比3080強30~37%VideoCardz報導 (google機翻+微修改) 距離 RTX 4080 顯卡正式發布僅剩 9 天,評測人員現在應該可以拿到他們的顯卡了。這 顯然會導致在禁運之前出現第一次性能洩漏。 根據新出現的 Geekbench 數據,即將推出的 GeForce RTX 4080 已經使用三種不同的圖19
[情報] 3070Ti 約=6800XT 贏3070 7%輸3080 29%Geekbench上出現了3070 Ti的OpenCL跟CUDA的跑分了 我們之前也發現過3080 Ti的CUDA跑分幾乎追平3090 在正式發表後遊戲表現也確實如此 幾乎差不多 所以以下分數對比N卡的話參考CUDA會比較準確一點 吧15
Re: [新聞] 中國AI晶片業陷困境 兩大關鍵廠商消沉AI GPU 這塊未來十年內肯定還是 Nvidia 獨大,就跟 台 gg 一樣,整個生態早就建立起來了,要幹翻他光有錢是不夠的 皮衣刀客在十幾年前就佈局 cuda,只要有用 Nvidia gpu 做加速的軟體通通都要綁 cuda,目前開源做深度學習跟推論的,也都是綁 cuda , 然後 cuda 並不是開源的,所以如果不是 Nvidia 的晶片,根本不能用 cuda 所以你看 meta 買 nv 的卡,openai 也買 nv 的卡,AMD 雖然也有自己的運算軟體,但生態系沒建立起來,在 AI 這塊終究看不到 nv 的車尾燈,你有看過有哪家大廠買 AMD 的卡做訓練嗎? 所以搞 gpu 晶片這塊就跟牙膏在 gg 面前說要做先進半導體製程一樣,只是純燒錢而已,什麼都不會有的 -----2
[請益] Intel A770適合深度學習嗎?爬了不少文章,好像有些說適合,有些說不適合 當然方便性沒有CUDA來得好用,只是深度學習其實不單只有吃Cuda 也會吃VRAM,像是3060雖然有12G版本的,但深度學習至少要16G才比較充裕 蠻多文章說intel 是支援Tensorflow的 Intel官方也說支援7
Re: [情報] 3060將改用3070ti 核心使用GA104晶片的RTX3060顯示卡 核心為GA104-150-A1 TechPowerUP GPU資料庫6
[情報] i皇6代以上內顯開CUDA加速 最高buff 52%本來想轉xf的 但我真的看不懂他真的在寫三小(抑或是說源頭cnbeta真的不知道寫什麼) 英文原文: 原作者Github:6
[請益] 求推薦SATA硬碟電源控制器因為電蝦版有限制反人類的登入次數,所以來這裡問問看,不知道可不可以QQ 工作上有時會需要跑開源或是來路不明的程式,但因為需要用到比較完整的硬體效能所以虛擬機目前不考慮 為了避免哪天跑到有惡意程式的玩意,想說直接把硬碟分成「生活/遊戲用」以及「工作用」,然後看情況切換 目前是每次要切換就手動拔SATA和電源線,但SATA線超級不耐拔,大概拔個幾次就接觸不良了 所以在想乾脆直接找個類似風扇控制器的那種,能夠插在主機前面板的硬碟控制器6
情報] 砍一刀至2304 CUDA OEM 版RTX 3050現身GA106 再砍一刀,可以把價格稍微降低讓 OEM 廠商使用。 大家都說老黃刀法一流,這樣的形容一點都不誇張 因為現在連 Ampere 架構的 GeForce RTX 3050 也被發現 讓老黃動手砍了一刀,但這款被砍一刀的 GeForce RTX 3050 目前屬於 OEM 版。 從 NVIDIA 官網可以得知,GeForce RTX 3050 零售版與 OEM 版本的 GeForce RTX 30502
Re: [情報] adobe發佈gpu加速更新,nv限定??剛剛試了一下,本來低版本用cuda輸出就會有機會死當或是破圖,所以一直以來用opencl 升級14.2後使用cuda加速變成只要3x秒, 同樣配置在黑蘋果是1分多 而且打開軟體本來都要跑很久,現在跑很快!! 補上配置供參考
23
[請益] 螢幕支架選擇困難13
[閒聊] 9800X3D無限伍壓的住嗎35
[情報] 中國製DDR4將價格砍一半 同業拉警報12
[開箱] 極光之美 T-FORCE XTREEM ARGB DDR53
[開箱] 君主MONTECH PLA 1200W16
[情報] 君主第一款無線鍵盤MKey Pro2
Re: [情報] 中國製DDR4將價格砍一半 同業拉警報3
[菜單] 32k影音遊戲機1
[菜單] 30K-40K 升級影音遊戲機X
[情報] 微軟推出Windows 365 Link