Re: [請益] 機器學習 Nvidia Tesla T4 or Quadro RTX
目前確實打算等GTC 2020後再打算,因為只有一個月左右時間可能還能等
說一下目前做的功課
1. 參考 fo40225 大的文章決定除GPU部分的配置
2. Nvidia vGPU認證資料
要挑機器直接從當中挑就好了
https://www.nvidia.com/en-us/data-center/resources/vgpu-certified-servers/
Asus 不知道臺灣本部的情況如何,國外事業部的服務水準很鳥,客服根本聽不懂我們在說什麼
Cisco 價格太貴了,而且服務支援太麻煩了
Dell EMC 不理會我們,似乎是之前被放鳥太多次了,可以NVLink的只有1U機型
Huawei 不能出貨了
HPE 4U外的機器估價很慢,出貨太少的緣故吧。GPU一定要裝4塊才能出貨
Lenovo 機器是很便宜,但是全部都只能上Tesal T4也沒有NVLink
Supermicro 可以凸一下只安裝2 GPUs出貨
3. 數個效能評估文章
https://blog.exxactcorp.com/whats-the-best-gpu-for-deep-learning-rtx-2080-ti-vs-titan-rtx-vs-rtx-8000-vs-rtx-6000/
https://lambdalabs.com/blog/choosing-a-gpu-for-deep-learning/
得出來的結論就是,論單一GPU,不考慮double precision(因為很少有用)
GPU Memory > Tensor core
4. NVLink
目前只有SXM form fator(板卡尺寸)才支援NVLink Hybrid Cube Mesh
也就是單個CPU上的GPUs之間都是用NVLink互相連接的,兩個CPUs上的GPUs是可以通過
有限通路的NVLink相互連接
而普通的NVLink只能兩個GPUs之間互相連接
至於能否變成Memory Pool或者利用複數GPUs的tensor core進行運算,我不確定效果
因為之前的機器配置的連接模式有問題
根據nVidia方面的說明,nccl能幫你完成這方面的工作,OpenMP也已經提供了相應的支援不過具體使用方式,取決於你的training framework,例如Horovod 表示是可以支援多GPUs分發,但是我還是不確定這部分的效果
5. Tesla VS Quadro VS Titan
其實沒有什麼可選的,只有那幾款Tesla才有採用SXM form factor
Titan系列的都不支援SR-IOV,如果想要VMware 下無修正使用(會損失效能),只能考慮
Tesla或Quadro
價格上來講,Tesla會比Quadro較優,Titan是CP值最高
: → hizuki : 但是Titan要三槽位很難插,只能找美超微定機器了? 04/18 14:36: 推 atrix : Titan rtx 只占用雙槽,不會卡到第三槽。 04/19 00:20: 散熱器會突來一點
: → atrix : 我晚點裝看看,我記得是不會卡到阿? 04/21 10:20: → atrix : 是裝的下拉,不過多卡時,散熱就很緊 04/21 10:45: → atrix : http://i.imgur.com/SY1vtWZ.jpg 04/21 10:45
然後沒有地方給你安裝NVLink bridge
6. 結論
目前 US$ 20,000的預算是沒有辦法選支援NVLink hybrid cube mesh的機型的,
托架式的可能無法安裝NVLink bridge
--
你比較喜歡哪一個?
當年不是黨國大老但是被江浙財團捧紅的中國帥哥
跟同樣擁兵一方的諸侯約會裁軍結果半途諸侯們爽約,平常有在寫日記的莊嚴男人開始發飆在旁邊讀著荒漠甘泉冷眼旁觀看著薔薇戰爭的人,為了中國的事情爭吵
別國調侃是不是中國總統,義正詞嚴的說著我是民族的燈塔的威嚴老先生
--
現在用雲端運算服務會不會比較便宜啊?
training中有大量資料搬運(model input調整),雲端的速度受不了 而且不我不確認雲端是否可以調整driver,因為上層framework限制經常要守著老的driver 理論上SR-IOV是可以解決這個問題
※ 編輯: hizuki (38.106.22.59 美國), 04/26/2020 15:43:28雲端如果沒敏感資料的話 應該可行 只是熟悉要花點
前置工夫
如果是突然的一次性預算核銷問題就比較麻煩
55
[情報] 消息稱NVIDIA RTX 4090缺貨、漲價到明年NVIDIA前幾天正式開賣了RTX 4090顯卡 這是新一代核彈/卡皇,售價台幣$56990元 雖然上市之前被人吐槽價格貴,甚至有破發的跡象 然而上市之後情況完全不一樣,不僅沒破發,價格也漲起來了。 不止是漲價,首批發售之後RTX 4090顯卡的供應情況顯然也不樂觀32
[情報] NVIDIA正在準備頂級GeForce RTX3090顯卡根據網路上的消息是NVIDIA正在準備一款RTX 3090顯示卡。該洩漏來自Igor(通過 Videocardz) 根據Igor的說法NVIDIA目前正在計劃其RTX 3000系列的至少有三個版本 有RTX 3080,RTX 3080(Ti / Super)和RTX 3090(Ti / Super) 所有這三種版本都採用PG132 PCB,並且都將採用GA102晶片。所有三個GPU都將配備26
[情報] 技嘉 RTX 4090顯示卡擁有隱藏的NVLink連超頻者Der8auer的一個有趣發現。他測試並隨後拆解採用RTX 4090系列的AORUS Master GPU。 事實證明RTX 4090(AD102 GPU)可能支援NVLink連接器。因為GIGABYTE的PCB設計清楚地顯示了連接器並隱藏起來,但它從未變成真正的NVLink。眾所周知NVIDIA放棄了為其旗艦遊戲GPU添加多GPU連接器的想法,而且目前似乎沒有一款RTX 40顯示卡可以使用。 如圖所示GIGABYTE團隊顯然在為NVLink設計他們的卡,這適用於AORUS Master或Gaming OC版本。從TechPowerUp RTX 4090拍攝了的PCB照片,並將它們合二為一 這表明GIGABYTE是唯一一家 將NVLink納入其卡的公司。10
[情報] NVIDIA 發布 RTX A6000 48GB工作站顯示卡NVIDIA剛剛發布了其旗艦工作站顯示卡RTX A6000。該顯示卡採用完全版GA102 Ampere GPU,並擁有適用於內容打造和AI應用的強大功能。 根據規格RTX A6000由擁有84個SM或10752 CUDA核心的完整GA102 GPU提供支援。NVIDIA證 實該卡擁有FP32性能的38.7 TFLOP 性能等級使該卡比RTX 3090快8.7%,後者的FP32總功率為35.58 TFLOP。RTX A6000的其7
[情報] NV下代GeForce Quadro Tesla全採用AmpereNVIDIA Ampere GPU架構即將問世,這家顯示晶片龍頭似乎計劃在其所有產品系列 (包括GeForce,Quadro和Tesla系列顯示卡)中採用其最新設計。 在接受Market Watch採訪時NVIDIA首席執行官黃仁勳(Jensen Huang)確認 將在其整個下一代產品組合(包括GeForce,Quadro消費者和Tesla專業顯示卡) 中簡化Ampere GPU架構。這個消息很有趣,因為以前NVIDIA選擇發布兩種不同架構的專業8
[情報] 戴爾新款NVLink GPU伺服器登場 搭配AMD戴爾新款NVLink GPU伺服器登場,搭配最新AMD處理器 適逢AMD發表第三代EPYC處理器,Dell EMC發表新款4U尺寸的GPU伺服器,當中採用4個SXM 4形式的Nvidia A100 GPU 文/李宗翰 2021-04-01 伺服器處理器大廠AMD在3月15日發表第三代EPYC 7003系列,許多伺服器廠商紛紛宣布既7
[情報] GTC 2022 : NVIDIA Grace CPU 再揭更多消息NVIDIA 在先前宣布首款基於 Arm Neoverse 架構的自主研發超算等級 CPU 產品 Grace ,此次 GTC 大會也公布 Grace CPU 即將在 2023 年第一季推出 的消息,同時還公布屆時 Grace CPU 的兩種小晶片架構延伸產品 Grace CPU Superchip 與 Grace Hopper Superchip 。4
[情報] Ampere 架構的NVIDIA A100晶片4.0 AIC版NVIDIA在5月中旬推出了A100晶片,這是第一款採用Ampere架構的GPU加速器 此處使用的GA100-GPU擁有826mm2 和540億個電晶體管。 到目前為止,A100加速器僅以SXM4模組的形式提供。NVIDIA今天宣布它希望透過用A100 PCIe卡的形式出售GA100 GPU 在PCI Express卡上以相同的配置使用相同的GA100 GPU。我們現在正在談論的是6,912個1
[情報] RTX 4090 PCB與RTX 3090Ti相比有細微變化AD102 Founder Edition PCB最多可以添加28相,但RTX 4090顯示卡上只安裝了23相 這意味著NVIDIA仍然可以將這種PCB用於更強大的 GPU,例如傳聞中的 GeForce RTX 4090 Ti。 總體而言PG136D(板號4090 PCB)的設計與RTX 3090 Ti Founders Edition(PG136)幾