Re: [閒聊] 爆VRAM的迷思 (分析分享加實測)
※ 引述《Ning01 (美式低能卡通 讚)》之銘言:
: 大家好,我原本也是認為3080的10G顯示記憶體(以下簡稱VRAM)會有不夠
: 的那一派人,,最後捏爆蛋蛋上3090...
: 這幾天上班摸魚,在網路上搜尋這方面的討論與測試,發現
: 其實國外很多人在討論這方面,也有不少兩派人馬在無建設性的筆戰XD
: 最後發現一些比較有結果的文章分析與實測結果,分享下。我後面也會分享
: 我自己實測幾款遊戲的結果。
: https://reurl.cc/Q7Ydbo (分析)
: https://reurl.cc/9ZDEp8 (網友分享各遊戲的實測結果)
寫pc遊戲一個最重要的功課是如何在低階機器跑得順,高階機器效果好。
管理顯示記憶體就時其中一門功課。當你主流vga有3g到12g,你要如何處理?
還好,這簡單。貼圖的mipmap降解析度,少一層(貼圖記憶體需求減約70%),這樣還不夠?降Model的LOD。然後現在有sparse texture可以用,貼圖可以stream來來去去,這也減低vram的要求。所以你要找爆10g的遊戲會很難。
現在電腦gpu效能驚人,vram的size真的不太重要,夠用就好。現在選gpu,記憶體頻寬>gpu compute>vram size。
--
DDR4 3200雙通有近50GB/s的頻寬, 就算爆VRAM。 遊
戲也不會大降FPS。 因為市面上很多採用64Bit GDDR
5 亮機卡也是這個頻寬。
如果在乎4K VRAM會小爆, 那請你把DRAM加到64GB以上
等進入DDR5時代, DDR5 6400的4通的近100G的頻寬,
跟早期 7Gbps 128Bit GDDR5接近, 到那時爆VRAM只會
更無感。
bandwidth > compute?挖ETH?
VII既視感 HBM2 XDDD
bandwidth提昇沒有compute多,所以瓶頸在bandwidth
現在遊戲引擎的課題就是減少頻寬使用。
VII不知是哪裡瓶頸,不然看spec應該是很棒,也許只
是driver team的鍋,沒資源優化
問題是顯卡到CPU的RAM要經過PCIE 速度瓶頸是在PCIE
上面啊
VII看挖礦整個就是爆走 但可能真的驅動...ww
回一樓,ram 64G後真的有感 本來CODMW+2060跑4k
畫質調整過後還是只能跑40-50 (32G 2666)
後來換64G 3600之後 就能跑50-60了 提升有感
樓上那是2666->3600的效果吧,跟64G應該關係不大
動用降解析度 對遊戲已經是下下策了
會去講爆VRAM當然都是貼圖全開
現在引擎主要是靠Streaming方式
用視點的空間位置不斷分析
離太遠用不到的貼圖搬出VRAM
中距離貼圖 先搬進VRAM待命
近距離貼圖要100%在VRAM
但視點移動太快,有可能來不及stream
就像家機的硬碟太慢 主記憶體太少
資料無法先在主記憶體牛棚區熱身
要搭低速巴士從硬碟選手宿舍來
然後2077家機版就大爆炸了
PC也是可能發生 只是沒這麼容易
你講的就是sparse texture。2077的問題主要不在這裡
2077用的是deferred renderer,需要的頻寬和shading
能力都要很高,他們沒時間調整來降到ps4的等級
VII一個雷點是VRAM溫度太高
然後VRAM就開始錯誤 就開始BSOD或是直接關機
沒有非公版 原散熱器散熱能力就不太好
搭配石墨烯導熱貼的扣具壓力不足
溫度大爆死=整張卡都很不穩
加上原本就Radeon Pro打下來的東西
整張卡生命週期又短 驅動就普普通通而已
就生命短,又不是rdna的架構,就沒在優化
2K解析度以下 VRAM頻寬有達標 GPU核心效能是更重要
顯卡發展一般情況下還是優先堆核心效能
剛好看到raja的tweet,CrystalWell就是128mb edram,大幅提昇頻寬(iris pro 沒有tiled所以cache有差)。新gpu有20x iris pro的性能,但頻寬不到5x吧。 不過現在主要問題在手機上,gpu不行,只有幾watt可用,再強的gpu也發揮不出來。
所以爆vram時4通道會大幅領先雙通道嗎
4個32Bit=2個64Bit 結果一樣
Sparse textures跟texture streaming
是兩種不同技術,不要搞混了
sparse texture是很晚期才出現的
硬體功能,有相容性問題且
不支援壓縮技術,常被稱TileTexture
他是把超超大貼圖變成虛擬大量小Tile
仍不是目前主流遊戲貼圖管理技術
texture streaming才是主流技術
SparseTexture是把一張超超大圖
虛擬化,分區塊Tile,各自獨立存取
texture stream是較傳統技法 有超大量
的獨立貼圖,比如上千甚至上萬張圖
依據需求選擇要讀取哪些到VRAM
每一張貼圖都是獨立不相干的
所以老遊戲與老顯卡也能streaming
但會有每張貼圖的解析度上限
比如2K/4K/8K
但它可完美支援材質壓縮技術
兩者雖都牽涉VRAM/主記憶體調度
其實是兩種不同東西
SparseTile是硬體虛擬化記憶體的概念
Stream是軟體對實體記憶體資源管理
SparseTex或稱 TileTex或稱MegaTex
太特殊,還牽涉美術素材製作流程
所以用途或普及性蠻受限
爆
[情報] Apple發表新款SoC新的SoC名稱為M1 Pro和M1 Max,看起來是以現有的M1強化 裸晶概念圖43
Re: [情報] AMD:顯卡有更多的VRAM很重要該 : 是不用擔心太多, : 畢竟N卡在pc市場市占率接近9成, : 尤其是筆電的4070 也只給8g,之下的甚至只給6g 拿筆電來講也不太公平41
[情報] NVIDIA解釋為什麼RTX3060記憶體會有12GB上週的CES展會上NVIDIA推出了RTX 3060顯示卡,這是RTX 30系列第六款成員,配備了 12GB GDDR6 在顯示記憶體容量上RTX 3060這次的配置確實罕見了,甚至比旗艦的RTX 3080顯示卡的 10GB還要多 後者經常被玩家糾結不夠用,4K遊戲容易爆記憶體等等。22
[情報] RTX2060 12GB版 核心會升級至2176個CUDA情報來源: Videocardz網站 根據Videocardz網站獲得的資訊 NV即將於12月7日發布的RTX 2060 12GB版14
Re: [開箱] Ryzen 5600G 硬解簡測話說為啥最近都只能半夜 在打這些有的沒的呢? (思 ※ 引述《clovermars (ccmail)》之銘言: : 看到別人的5600g可以補偵好羨慕阿 : 當初也是想一補偵應用一把抓9
[情報] AMD下一代RDNA能採用3D Infinity CacheAMD正在為其下一代CPU和GPU設計大力投資的堆棧快取和小晶片技術 根據Greymon55的新傳聞,看起來在EPYC和Ryzen之後 AMD將以3D Infinity Cache的形式將堆疊式3D Cache設計導入RDNA。 RDNA2 中,AMD推出了第一代Infinity Cache架構,這是一種GPU可以快速訪問的快速 高頻寬的Die Cache。現有Cache設計可擴展至128MB容量和2TB/s頻寬。有傳言稱借助下一6
[情報] AMD RX Big Nav i顯卡據傳擁有16GB VRAMChiphell論壇洩密者wjm47196發表了有關AMD Big Navi GPU的大量訊息,這款GPU將為其 下一代Radeon RX發燒級顯示卡提供動力 有洩漏歷史的洩漏者被證明是合法的,他談到了旗艦RDNA 2顯示卡的發展是如何形成的, 以及在規格和整體性能方面我們可以期望的。 第一部分涵蓋了規格,在這方面Big Navi顯示卡據稱擁有16GB的VRAM容量。這是採用4
Re: [請益] 1660S x2 or 3070 組DL server最近版上出現一些深度學習配單,覺得有一些心得可以分享,省的走冤枉路 就來回一下舊文,我最後拿3070喇 先說結論,3060 cp值最高唯一推薦,再上去建議直接攻頂3090 大部分人買顯卡都很關心效能,所以我看到有些人會拿3070, 3060ti上來問 但是跑深度學習除了效能以外,VRAM大小以及資料讀取的IO時間都會影響training效率2
Re: [情報] 蘇媽Radeon Pro W6800曝光:Navi21 32GAMD公布的數據 Radeon PRO W6800 GPU架構:AMD RDNA2 SP數量:3840