[心得] 從0開始養ROCM深度學習機
趁熱鬧來發廢文
大約ROCM 3的時候就有這個想法可惜一直買不到便宜的Vega來玩,
之前有幸收到版主的二手Vega56終於可以來實做
養機用品:
1. i7 6700K @4.5G + Z170 + 32GB RAM
2. 系統碟建議>128GB SSD不然裝完就沒空間
3. Ubuntu 22.04.3 LTS 安裝隨身碟用rufus做好
4. Vega56不能亡
5. 650W以上電源供應器 + 堪用機殼
全部裝好然後灌系統應該很簡單直接跳過
選擇要裝的ROCM版本,上面只有VII不過都是GCN不要分那麼細應該還是可以用
https://rocm.docs.amd.com/en/docs-5.7.1/release/gpu_os_support.html
最後是裝5.7.1但是懶得重截圖
https://rocm.docs.amd.com/en/docs-5.7.1/deploy/linux/index.html
https://i.imgur.com/LaDETe3.png
eader還要加入兩個群組
https://i.imgur.com/hLmBCR4.png
雖然教學這樣寫在後續測試過後還是退render群組,
深度學習用不到gpu render就不增加顯卡負擔,還是其實可以指定intel內顯我不會而已?
有兩種安裝方法用amdgpu-install安裝看起來好像比較簡單,我偏好是載deb檔案手動安裝https://rocm.docs.amd.com/en/docs-5.7.1/deploy/linux/installer/install.html
https://i.imgur.com/BbdB0Ur.png
安裝ROCM
sudo amdgpu-install --usecase=rocm
要確定安裝成功就輸入rocm-smi應該會出現基本資訊
https://i.imgur.com/TyX6Btf.png
到這邊已經把ROCM搞定,後續用docker環境需要注意啟動指令跟N卡不一樣
docker run -it --device=/dev/kfd --device=/dev/dri --group-add video <container>
不喜歡docker也可以直接找到喜歡的深度學習工具像是最近都在用pytorch就在這邊
https://pytorch.org/get-started/locally/
https://i.imgur.com/ucjBF6D.png
加碼做一下性能比較
雖然測試電腦的配備都不一樣,有確認過CPU瓶頸跟GPU瓶頸在哪裡還是可以加減參考
測試用程式就是最近在處理的東西只跑預測,除了有關GPU的套件之外都相同
資料都已經讀進RAM不會讓硬碟速度拖累
本機 Vega56
理論FP32 10.54 TFLOPS
測試速度 2.85 iter/s
https://i.imgur.com/8B4jGbN.png
第一台win10 22H2 i7 7700K @4.6G + 1080Ti
理論FP32 11.34 TFLOPS
測試速度 3.11 iter/s
https://i.imgur.com/Rn5DJZV.png
第二台Ubuntu 20.04.6 LTS 9700K @4.8G + RTX Titan
理論FP32 16.31 TFLOPS
測試速度 3.81 iter/s
頂到CPU瓶頸所以都是雙開,效率還要乘以1.5 = 5.71
https://i.imgur.com/melAvlp.png
第三台win10 22H2 i7 6700 + 1060 6GB
理論FP32 4.375TFLOPS
測試速度 1.83 iter/s
https://i.imgur.com/aZvIAv2.png
版上還沒看到有相關的文章應該發這邊會有人看吧…
--
最後一張圖是什麼 top 啊
nvtop
htop 詳細版的 top
欸仔細看是gpu的 不是htop
※ 編輯: remia81 (39.9.128.50 臺灣), 01/17/2024 11:27:11
MIOpen已經支援windows
期待新版ROCm
推
養這要幹嘛?
GPUTach很炫炮
https://i.imgur.com/0aTSDkS.gif
rocm到底消費級顯示卡那些有支援啊?
Rocm 有支援apu 嗎?
消費級目前為止沒有正式支援,哪些架構可
以硬上請自己翻code裡的架構code name
1714#issuecomment-1128327143
RX6600我有依樣畫葫蘆硬上ROCm跑過sta
ble diffusion
35
Re: [問題] 老Win10平板適合裝ChromeOS嗎?感謝大家的意見 這篇來跟大家分享心得跟順便紀錄安裝時遇到的問題 一、說一下現狀的前言 這幾天成功安裝Chromme OS在Asus T100ha(intel Atom Z8500、2GB Ram、64GB), 採用的是Brunch Chrome OS 83(samus),14
[測試] 不同RAM差異 ft. CORSAIR VENGEANCE DDR5狼窩2.0無廣告好讀版: 狼窩1.0好讀版: 同平台下不同DDR5的差異 ft. CORSAIR VENGEANCE DDR5-5600 32GB(2x16G)10
[心得] Synology DSM 7.0 + transmission最近滿多人遇到升級 DSM 7.0 之後造成 transmission 無法使用的問題 當然我也是受害者之一,因為走了滿多條路也都有測試過,所以有些心得分享 目前有兩條路可以選 1. Docker 2. 套件10
Re: [請益] AMD GPU 跑 tensorflow 順暢嗎?更新: 這幾天用plaidml+ngraph+tensorflow的方式 效能慘不忍睹 後來又回去試rocm 認真看了一遍官網的教學 才發現要用docker的環境@@10
[開箱] 入門顯示卡 AI 應用性能對決!CUDA 護城河現階段很深很廣 原文轉自 UNIKO's Hardware 網頁好讀版: AI 這個名詞絕對是今年與未來最火熱的議題之一,目前出現各類生成式 AI 應用,例如 Ch4
Fw: [心得] 12 代 i9 安裝 HQPlayer "Embedded" 教學作者: elguapo (HPHT Synthesized) 看板: Headphone 標題: [心得] 12 代 i9 安裝 HQPlayer "Embedded" 教學 時間: Mon Dec 13 17:12:16 2021 Intel 12 代 Alder Lake CPU 性能理想,可以不用 GPU 做 offload 就能用 ASDM7ECv2 調變到 DSD512。不過 Alder Lake 因為新增了 e-core 這個東西,使得4
Re: [討論] TrueNAS SCALE + Nextcloud是的,又有人要來挑戰 TrueNAS 和 Nextcloud 了。 架設好 Nextcloud 可以存取檔案之後,可以再多安裝 onlyoffice 套件, 這樣在 Nextcloud 裡面就可以線上開啟 word、excel、power point檔案, 在輕量使用的環境下,其餘電腦都不需要安裝 office 了。 參考2
Re: [閒聊] AMD便宜apu跑stable diffusion,MiniGPT4等作者放出教學文了 要開二個BIOS選項,above 4G encoding & resize-bar 1. 裝ROCm 2. pytorch1
[情報] 華擎推出Linux 版本 AI QuickSet軟體華擎不久前剛發表微軟 Windows 10/11 64-bit 版本的 AI QuickSet 軟體工具,能協助使用者快速下載 安裝和設定人工智慧 AI 應用程式。這次則帶來 Linux 版本 AI QuickSet 軟體工具,讓 Linux 平台用戶 也能快速體驗更多樣化的人工智慧 AI 應用程式帶來的樂趣!