[情報] GTC 2022 : NVIDIA Grace CPU 再揭更多消息
https://www.cool3c.com/article/174662
NVIDIA 在先前宣布首款基於 Arm Neoverse 架構的自主研發超算等級 CPU
產品 Grace ,此次 GTC 大會也公布 Grace CPU 即將在 2023 年第一季推出
的消息,同時還公布屆時 Grace CPU 的兩種小晶片架構延伸產品 Grace
CPU Superchip 與 Grace Hopper Superchip 。
在介紹 Grace CPU Superchip 與 Grace Hopper Superchip ,就得先提到作
為 NVIDIA 小晶片架構策略的橋樑技術 NVLink-C2C , C2C 指的是晶粒對晶
粒層級連接,而 NVLink-C2C 即是將頻寬高達 900GB/s 等級的第 4 代
NVLink 導入晶片對晶片的相互連接,未來將廣泛應用在 NVIDIA 的 CPU 、
GPU 、 DPU 、 SoC 晶片之間的相互連接,同時 NVIDIA 將提供基於
NVLink 的半客製化晶片,使客戶能夠依據應用類型自 NVIDIA 的 CPU 、
GPU 、 DPU 、 SoC 架構選擇合適的組合,並透過 NVLink 方式構成各式的
Superchip 。
Grace CPU Superchip 是將兩個 Grace CPU 晶粒以 NVLink-C2C 連接,達到
144 個基於 Armv9 指令級的 CPU 核心,包含 Armv9 指令集所具備的新一
代安全與加密功能,同時支援新一代向量擴充指令級。Grace CPU
Superchip 配有具 1TB/s 頻寬的 LPDDR5X with ECC 記憶體,與
[email protected]_int_base est 基準測試預計達 740 分的性能,強調相較現
行 DGX A100 所搭配的雙 x86 CPU 處理器具備 1.5 倍的功耗效能比。
放眼未來,在 NVIDIA 與 Arm 持續合作下, Grace CPU Superchip 不僅可
執行 NVIDIA 包括 NVIDIA RTX 、 NVIDIA HPC 、 NVIDIA AI 、
Omniverse 等所有運算軟體堆疊,屆時搭配 NVIDIA ConnectX-7 NIC ,能夠
彈性在伺服器進行配置,可作為獨立純 CPU 系統或搭配 1 、 2 、 4 或 8
個 Hopper 架構 GPU 構成加速伺服器系統。
至於去年發表 Grace CPU 所公布的超級晶片真面目在今日正式曝光,以
Grace Hopper Superchip 做為產品名稱,是將 Grace CPU 與 NVIDIA
Hopper GPU 以 NVLink-C2C 連接,採用達 600GB 統一記憶體架構的 HBM3
記憶體,並借助 NVLil-C2C 實現晶片對晶片的 900GB/s 內部溝通頻寬,使
單一晶片具備高效能運算與 AI 加速架構。
--
沒有說是哪家代工,不過看之前 M1 Max 的 UltraFusion 與 TSMC 的關係
搞不好 NV 不是因為良率,而是 TSMC CoWoS 封裝才跳過來?
但是 UltraFusion 號稱 2.5T, NVLink-C2C 900G,
也不確定是不是類似技術
M1 Ultra 的記憶體頻寬是 800G, Grace 1T 還有 ECC。
從這些參數看起來, Grace 或許是一個蠻有料的高性能 arm CPU
--
--
Grace Hopper 跳起來!
Grace CPU Superchip 的Render看起
來比較像是跨Package的interconnect
而不是Apple/Intel EMIB那種
應該就一般2d而已
Grace不就TSMC 5nm嗎
那個 hopper 是 grace hopper
一般公認高階語言的先行者
cowos 不是很久了,怎麼現在大家才
搶著用?錢太多嗎
cowos又不是沒再改 新版有類似EMIB
的方案 不用弄到整塊interposer了阿
看來NV想打趴高通成為公版ARM的王者
?
老黃的interconnect是從mellanox得
來的,NIC也是
因為現在先進製程太貴,用來做大晶
片不划算,像InFO這類才引起ic設計
業者重視
這類互連架構都有加入GG本身的ip,
只有在GG下單才能用
不然就只能用i皇提供的UCIe這個比較
基礎的互連架構
沒有算力無法評估其運用
爆
[討論] 3/9 春季發表會節錄先說,這場發佈會時長精準控制在一小時內,發表的重點主要是SE(第三代)、iPad Air 5 、以及Mac Studio和Studio DisPlay(顯示器)。 開場白後直接切入主題,貌似是一點時間都不能浪費,節奏緊湊。 1.Apple TV+:82
[情報] Apple發表Apple M1 Ultra現在發表會發布的新型號 看起來是兩顆M1(型號未知)組合的SoC。兩顆之間採用匯流排連接 看圖感覺是兩顆M1 Max41
[情報] NVIDIA新技術,讓顯卡直連SSD顯存容量及位寬對GPU顯卡非常重要,完全依賴DRAM芯片的話成本很高,NVIDIA跟IBM聯合開發了BaM(Big accelerator Memory,大型加速器內存)技術,可以讓GPU直接繞過CPU限制,直連SSD硬盤,如果你有2TB的SSD,那麼就是2TB的“顯存”了。 現在的SSD硬盤主要是通過PCIe連接CPU的,GPU不能直接訪問硬盤數據,BaM技術就是繞過這個限制的,類似技術理念早已有之,NVIDIA及IBM聯合開發的BaM技術也是其中的一種。 按照他們公佈的論文信息,BaM技術不依賴傳統的虛擬地址轉換,不再以CPU為中心,直接讓GPU從內存及存儲中獲得數據並進行處理,無需CPU內核進行任務分配。 BaM技術的目標是擴展GPU內存容量,並提高有效的訪問帶寬,同時為GPU提供高級抽象,以便GPU可以按需、細粒度訪問擴展內存中的海量數據。 這個BaM技術很容易讓人聯想到微軟最近發布的DirectStorage及NVIDIA的RTX IO技術,二者本質上差不多,也是讓GPU繞過CPU限制直接訪問SSD上的數據,遊戲中的加載時間大幅縮短,甚至可以秒進遊戲。28
[情報] 小晶片終於迎來統一標準 UCle 1.0UCle1.0 : 小晶片終於迎來統一標準:英特爾、台積電等巨頭共同坐鎮 (本文來自對岸 用語已經盡量修正 不習慣者請見諒) 3月3日,全球知名晶片製造商英特爾、台積電、三星聯手晶片封測龍頭日月光,攜AMD、 Arm、高通、谷歌、微軟、Meta等科技行業巨頭推出了一個全新的通用晶片互連標準:通22
[情報] AMD談Zen5架構:核心越多,記憶體將成瓶頸~AMD的CPU路線圖已經發展到了5nm Zen4這一代,今年底就會推出,CPU核心數將從目前最 多64核提升到96核 128核,再往後的Zen5預計也是這些核心數,但性能更強 不過AMD高管認為隨著CPU核心數的增加,記憶體的瓶頸問題會越來越嚴重。 日前AMD高級副總裁及服務器部門總經理Dan McNamara在一次金融大會上談到了AMD的新動16
Re: [問卦] 為何軍事不用高階晶片?軍用晶片與製程不用先進製程有很大的原因與熱膨脹係數有關 而熱膨脹係數又與軍用場景有關,特別是天上飛的,水下潛的 在飛機上升下降的過程中,溫差會高達 40 度以上 這樣上上下下的溫度變化,我們叫熱衝擊 而晶片本身是無法獨立工作的,還要搭配 IO(錫球、金線等)14
[討論] 三星A53與A73的CPU規格洩漏表明A53的Exynos 1280 芯片組可能具有兩個主頻為 2.4GHz 的 ARM Cortex-A78 CPU 內核和六個主頻為 2GHz 的 ARM Cortex-A55 CPU 內核。 並具有四個時鐘頻率為 1,000MHz 的內核的 ARM Mali-G68 GPU ,並為三星 5nm 的製程 。 如果這些規格相符,那麼Exynos 1280 的規格與聯發科天璣 900非常相似。該芯片組的 GX
[問卦]PC CPU為什麼不塞幾個ARM核心來跑 Android模擬?大家都知道 目前CPU核心數量越來越多 10核以上也不少見 只是平時電腦執行軟體 很少需要用到這麼多核心7
[情報] NV暗示會在GTC2022間發布Hopper GPU架構Hopper顯示架構很可能會在下週的NVIDIA CEO主題演講中公佈 這是人們期待已久且傳聞不斷的專用於數據中心和高性能計算的產品系列。 NVIDIA Hopper被認為是該公司的第一個多晶片模組設計,擁有兩個小晶片 此外據傳它是NVIDIA有史以來製造的最大顯示處理器之一,單個晶片尺寸超過了853 mm2