PTT推薦

[情報] Alder Lake沒有AVX512,於是Linus又開嘴惹

看板PC_Shopping標題[情報] Alder Lake沒有AVX512,於是Linus又開嘴惹作者
a58524andy
(a58524andy)
時間推噓37 推:38 噓:1 →:141

不過嘴的不太是針對「啊你怎麼拔了AVX512」這部分
而是針對AVX512本身這部分




背景:
phoronix發現Intel最近替GCC 11新增自家Sapphire Rapids、Alder Lake系列CPU
支援的程式碼中,並沒有AVX512相關的部分
也就是Intel新的大小核Alder Lake架構不會支援Intel常常拿來廣告的AVX512指令集擴充然後創世神Linus Torvalds又双叒開始嘴砲了

source: https://www.realworldtech.com/forum/?threadid=193189&curpostid=193190 https://reurl.cc/exN7Q7




個人渣翻:

------------------------------------------------------------------------------

我希望AVX512會一敗塗地,而Intel會開始做些比較實際的工作
而不是多塞些奇怪的指令
然後替那些指令量身訂做些跑分。

我希望Intel能夠腳踏實地些:繼續推進製程節點,並且不要整天只是想在
高效能運算或是其他冷門領域耍些花招
而是把這些心思放在該如何讓一般的程式都能跑得更快上

我之前就提過了,這次我再重申一次:
就算是在x86架構最輝煌的那個年代
那個Intel錢淹腳目、除了Intel沒一個能打的年代
Intel的浮點運算其實是弄得最爛的那家
單論浮點運算的相對效能,根本是Intel反過來被各家壓著打的
不過這根本無足輕重

因為除開跑分的時候根本沒人在乎

目前AVX512的處境基本上是一樣的,而我會說未來也會是這樣。
對啦,你要找的話當然可以找到一些應用非常倚賴AVX512的支援
不過宏觀來說根本沒幾隻貓會專門為了這類應用而真的掏錢添購機器。

並且AVX512是有其負面影響的。
我反而更希望Intel把那些電晶體花在其他真正緊要的刀口上。
例如拿去加速GPU的浮點效能啦
甚至單純只是給我更多的實體核心,單線程性能強大、而沒有AVX512這種垃圾的核心 基本上就是AMD目前弄的這樣。

我希望我的CPU頂到功耗上限的原因是真的在跑日常的整數運算
而不是其他AVX512之類燙到爆炸、只會讓處理器降頻
──畢竟,多數人會用AVX512的理由是拿來memcpy (*1)──
以及浪費矽晶圓面積,導致塞不下更多實體核心的指令。

是的,我有些偏見。
我恨透了浮點數跑分這檔事,但我也知道的確有些人很看重這部分的效能。
不過我還是認為AVX512本身就是個餿主意,怎麼想也不該用它做為解決方案。
可能我有些反應過度,不過我就是這樣認為的。
Intel有過一些錯誤決定,而AVX512本身絕對是其中最經典的那幾個
部分原因也是因為它助長了x86市場的碎片化。

不要再弄這類專門加速冷門應用的玩意了
你該做的是盡心盡力地去讓那些最常見、多數人真正在意的場景跑得更快些。
隨便弄個不要太鳥的浮點運算,單單這樣人們就會買單了
我會說AVX2就已經非常足夠了。

對,我很容易被戳到。

------------------------------------------------------------------------------

(*1)
以C的語法來說,要快速初始化/複製一段記憶體區塊
你需要的是<string.h>裡面的memset啦memcpy之類的東西
前者把一塊MEMory都SET成某個預設值
後者幫你把一塊MEMory CoPY到其他地方
(對,部分人士真的很懶得打字)

而一般x86-64來說,這部分可能是以64-bit為單位去操作的
而處理器如果額外有avx512擴充的話
裡面的其中幾個指令可以達成一樣的效果,而且是用512-bit為單位去操作
想當然爾能夠快上許多──AVX512指令CPI跟普通指令一樣、並且不要降頻的話




小結:

浮點數運算不是所有應用都用得到的
而專注於浮點數的指令層平行化的AVX512更然
kernel就是一個用不太多的例子 嗯雖然我根本不懂,暫且這樣說吧
而AVX512又耗電又佔面積
會被Linus嘴也是合理

歷史上有過不少CPU附了專用的指令
基本上也是當時有需求才會有這樣的設計
不過這需求是否真的是需求則見仁見智
以前甚至有單個指令完成某段記憶體區段的傅立葉變換的
然後就沒有然後了








TL;DR

Intel自己搞出來AVX512,結果也不是普及到自家所有產品
用途又相對稀少
Linus認為Intel不該費心在這類冷門應用
那些電晶體拿來改進IPC啦或是單純多塞核心啦有用多了



喔對這邊有另一個觀點,這篇洪教授的文算平衡打擊
https://www.facebook.com/shihhaohung/posts/4148325648543225
沒問就轉貼的關係,就不講內容了
有興趣自己點個

--

※ PTT留言評論
PTT 網址

AreLies 07/14 01:25這樣粉粉怎麼吹AVX512

yymeow 07/14 01:27推個

WARgame723 07/14 01:27難怪被說不懂裝懂的科技頻道

yymeow 07/14 01:28我只知道只要測試軟體一操AVX512,大概就等同後燃器

WARgame723 07/14 01:28連Avx512都能噴,你怎麼不去噴zen2加了完整的256

yymeow 07/14 01:28全開。溫度跟功耗都衝到頂點

AreLies 07/14 01:28此Linus非Linus

ceming 07/14 01:31723你真的丟臉到家 哪個Linus你也不知道

ceming 07/14 01:31不懂就滾回去躲棉被哭比較不會被人笑你

Oxyuranus 07/14 01:34某樓看一下是哪個Linus再說話好嗎...

AreLies 07/14 01:34有一個Linus是Linux核心的首要架構師

AreLies 07/14 01:34另一個Linus是Linus Media Group創辦人

k2450 07/14 01:36Linus Torvalds有兩個?

AreLies 07/14 01:36723是在嘴哪個Linus

AreLies 07/14 01:38Linus Torvalds跟LINUS SEBASTIAN啊

WARgame723 07/14 01:38看錯,原來是那老人那不意外阿,仇i都仇多久了

isaac42 07/14 01:39#浪費社會晶圓

AreLies 07/14 01:43其實Linus Torvalds也有嘴過其他團隊跟公司 比較有

AreLies 07/14 01:43名的Nvidia, fuck you!

AreLies 07/14 01:43還有說OpenBSD的團隊是一群

AreLies 07/14 01:43“Masturbating Monkeys”

birdy590 07/14 01:44這次嘴的有道理啊 根本走火入魔了 到底誰定的方向

AreLies 07/14 01:44還有Linus今年才從intel換AMD 要仇Intel也想太多

birdy590 07/14 01:45Intel 會一路下坡 跟這種迷航絕對脫不了關係

asiakid 07/14 01:45靠北 我原本想護航723只是反串而已XD

MK47 07/14 01:56AVX512你不如用顯卡去算

----------------------幫你highlight-------------------------------------------

Bencrie 07/14 02:00去翻 glibc 的 source 你就知道 memcpy 一堆版本

Bencrie 07/14 02:01各種 SIMD 實作。因為要滿足特定條件的長度才能用

------------------------------------------------------------------------------

miname 07/14 02:08版上不少跑深度學習的就因為MKL買intel啊,MKL就靠A

miname 07/14 02:08VX撐啊,所以就取向的不同啦,Linus講的是PC,洪教

miname 07/14 02:08授講資料中心,至於intel PC產品線明明就是分開的還

miname 07/14 02:08有AVX就...

miname 07/14 02:16那個洪教授也是個嘴砲仔就是了,Linux kernel 要是

miname 07/14 02:16真如他所說要用AVX就變成要多一個intel64的branch了

感覺他觀點不太像這樣(?

https://reurl.cc/kdz3Yd

miname 07/14 02:29所以我說他是以資料中心觀點出發啊

miname 07/14 02:29然而你要是裝一張NV顯卡,深度學習還是只會跑在顯卡

miname 07/14 02:29上面,AVX還是無用

我是指洪有說他不是硬要kernel去應用AVX512的部分 誠然不同專業的人會有不同觀點 除了推文提到的MKL之外 可能做多媒體的人也真的覺得AVX512不錯快、Linus只顧kernel之類(? 不過我也沒寫過就是(逃

dieorrun 07/14 02:30723要嘴LTT都還不夠格了 更何況創世神

miname 07/14 02:34說他嘴砲就是明明這件事情扯不上kernel要不要用浮點

miname 07/14 02:34數,他硬要扯遠說他們抗拒浮點數

原來XD

Shauter 07/14 02:38沒讀過白算盤的c52又要咬人了

friedpig 07/14 02:38居然拔掉了 這樣怎麼讓溫度突破天際

aegis43210 07/14 02:41HSA才是最終解決方案

jacky841224j07/14 02:41浮點運算Intel有輸過AMD嗎?我怎麼記得是I的強項

friedpig 07/14 02:43不過牙膏王特規的還不只這個勒 未來ml還多做一堆in

friedpig 07/14 02:43t4 int8的運算指令集 也是各種搞事的兇手

AreLies 07/14 02:44AVX512跑分好看 實際應用又是另一回事

friedpig 07/14 02:46其實兩邊就在意的東西不同而已 做kernel的喜歡乾乾

friedpig 07/14 02:46淨淨 越不特規越好 最好都堆滿電晶體衝傳統效能

friedpig 07/14 02:46做AI的當然有方便的ASIC幫忙加速屌打通用電路

miname 07/14 02:47然後洪教授最後一句我有些意見,要單一核心又快是可

miname 07/14 02:47以從架構上改善的,最無腦就把AVX的空間拿去塞cache

miname 07/14 02:47啊,你教計算機結構那麼久了不知道嗎?

friedpig 07/14 02:48牙膏廠是商業取向的 同樣面積去換一點點效能差異的

friedpig 07/14 02:48通用效能 還是有商業市場的AI特規效能 哪種好賣錢

friedpig 07/14 02:48就不好說了

friedpig 07/14 02:50cache也不是無腦塞永遠都有用 整體設計都要對著調啊

friedpig 07/14 02:50 重點是cp值不夠的問題吧 同樣面積換到可能5%不到

friedpig 07/14 02:50的進步 拿去換成ASIC可能幾倍在算的差距

friedpig 07/14 02:52牙膏王之前更極端還有考慮塞FPGA進去 也有prototyp

friedpig 07/14 02:52e出來 不過好像有點沒搞頭

labbat 07/14 02:52原來linux 核心會用浮點指令浮點暫存器(惶恐)

現在才發現這樣寫怪怪的XD 改了

miname 07/14 02:53但是作ML的人隨便一張顯卡就屌打你的AVX了,所以純C

miname 07/14 02:53PU跑分很讚,但是用不到

karta189783007/14 02:54jacky大 AMD一直以來路線都是把浮點運算放在顯卡,C

karta189783007/14 02:54PU是直接放生,沒記錯是這樣

friedpig 07/14 02:54牙膏王現在在推的是混合的拉 cpu前處理加減扣點時

friedpig 07/14 02:54間 還是多少有幫助

wres666 07/14 02:55avx512實際上是有用的吧,我的1035g1跑matlab比同學

wres666 07/14 02:55的10210u快超多的,那個時候用cpuz看就是多了avx512

friedpig 07/14 02:56接下來大概是想推深度跟自家顯卡結合的cpu+gpu方案

friedpig 07/14 02:56看能不能勉強幹過純nv gpu方案吧

jior 07/14 03:00自己搞AVX512然後又要做大小核,結果小核不能跑AV

jior 07/14 03:00X512又把他拔掉,以後難道只有XEON能跑?

friedpig 07/14 03:03不過我記得之前爆料好像只有小核阿痛不支援512吧

friedpig 07/14 03:03大核有不支援嗎 有點忘了

yymeow 07/14 03:08沒有也好,會涼一點

hsparrot 07/14 03:24需要AVX512的去買I,不需要的去買A,問題解決

potatososo 07/14 03:25avx!

DoBahaha 07/14 03:39反正就是嘴Intel不要只會先射箭再畫靶

DoBahaha 07/14 03:39實際一點整天打高空

BFer 07/14 05:51723不意外

brovet 07/14 05:51洪講的Linus Torvards 是哪位??有這個人嗎 有夠

brovet 07/14 05:51不專業

will3509111 07/14 05:56而且AVX-512本身也很雜....

will3509111 07/14 05:56Xeon和Xeon Phi跟Desktop用的AVX-512也有各種微妙

will3509111 07/14 05:56的差異

tyl510288 07/14 07:13 https://i.imgur.com/nOo3xwm.jpg

圖 Alder Lake沒有AVX512,於是Linus又開嘴惹

AJizzInPants07/14 07:21反正怎樣723都要嘴 哪個人有723了解指令集?

AKSN74 07/14 07:28他早就放棄I皇了XD

miname 07/14 07:35洪教授的專業可多了,一下資安專家,一下硬體專業,

miname 07/14 07:35一下OS大師,一下深度學習,還有啥不是他專業的?

tonyian 07/14 07:38要浮點加速丟給gpu好嗎,不要拿核心運算來浪費,分

tonyian 07/14 07:38工,比起洪我更相信Linux

basacola 07/14 07:51沒有讀過白算盤的C52 XDDDDDDDDDDDDDD

felaray 07/14 08:15記憶體區塊的fft轉換...聽起來好雞肋但又好酷XD

goldie 07/14 08:15推白算盤XDDD

felaray 07/14 08:16723正常發揮

wenli978 07/14 08:28創世神的觀點很白算盤啊,就是加速日常最多用到的

wenli978 07/14 08:29指令集,而不是浪費電路去做其他奇怪的東西

kira925 07/14 08:53Linus說的很理想也很直觀 就是最精簡做最集中的事情

kira925 07/14 08:54是說也不是第一次噴牙膏王 前兩年的Meltdown超噴

※ 編輯: a58524andy (140.112.244.224 臺灣), 07/14/2020 09:00:12

kira925 07/14 09:03另外他其實是絕對精簡派 他也噴了AVX2 甚至MMX(笑

kira925 07/14 09:04不過相對於碎片化的AVX512 他能忍受就是XDD

birdy590 07/14 09:10這意思就是 消費者導向的產品裡不要浪費空間塞這個

birdy590 07/14 09:10硬塞進去也不會有人感謝你 更不會因此增加競爭力

kira925 07/14 09:12他是徹底反對碎片化阿 不是消費市場而已

kira925 07/14 09:12他甚至嘴了ARM的SVE會在HPC幹掉Intel的AVX512

birdy590 07/14 09:12放在 Xeon Phi 這種產品或是 GPU 裡不算碎片化啊

birdy590 07/14 09:13所以我第一句用的形容詞就是"走火入魔"

birdy590 07/14 09:15到 AVX2 為止付出的代價都還可以接受 之後就入魔了

goldie 07/14 09:15碎破化很像是叫使用者不要用它;有礙推廣

friedpig 07/14 09:37User其實還好啦 大部分髒活都底層的人處理的

friedpig 07/14 09:37Complier也是牙膏廠自己花心力弄得 弄好有支援就跑

friedpig 07/14 09:38不支援就傳統方法而已 對特定用途就是有幫助

friedpig 07/14 09:38這種東西就一翻兩瞪眼 如果真的沒需求或效益太差

kira925 07/14 09:38但Linus就是那個幹髒活的人...

friedpig 07/14 09:39自然會被淘汰 不過AI正在風頭上 應該難喔

friedpig 07/14 09:39kenral跟Complier還是不太一樣的東西 跟他沒啥關係

Windcws9Z 07/14 09:48浪費矽晶圓面積笑死

friedpig 07/14 09:50最明顯差異大概 MKL Intel優化越來越極端吧

friedpig 07/14 10:06不過牙膏這樣也是劍走偏鋒 做軟體的越來越不可能特

friedpig 07/14 10:06地為了他們優化 等於牙膏廠要自己砸越來越多成本壓

friedpig 07/14 10:07在底層lib跟complier優化 還要一堆Support的人去幫

friedpig 07/14 10:07忙解奇怪的問題 是越走越極端了

wahaha99 07/14 10:15啊還要考慮linux又不是只支援你i家一家cpu

wahaha99 07/14 10:15多少狗屎爛蛋都支援 前陣子才從清單刷掉一大波

wahaha99 07/14 10:15你i皇整天搞我一下支援一下又不支援 是要操蛋誰

wahaha99 07/14 10:16光這層面linus就有資格嘴爆i皇

kira925 07/14 10:21Kernel裡面一堆奇奇怪怪的東西 怎麼會跟他無關

kira925 07/14 10:21別忘了牙膏王的Meltdown/Spectre 還是要Kernel配合

kngs555 07/14 10:24不過牙膏現在除了砸錢外,目前還是無法突破困境

Nexus5X 07/14 10:36啊不是說AVX512是微軟叫i皇做的嗎XD

commandoEX 07/14 10:47照著Linux說法,推土機不就是他要的理想CPU XD

commandoEX 07/14 10:48除了沒用的SSE4a指令集

commandoEX 07/14 10:51*LINUS

robin80829 07/14 10:59723尷尬癌末期了

kira925 07/14 11:09但推土機單核不行啊XD

AppleWine 07/14 11:12硬體部門遇到莫名障礙 可4我們軟體部門正常發展

kobelake 07/14 11:19linus有我們A黑大將懂CPU嗎==

cancelpc 07/14 11:26其實可以像以前把特殊領域需要的部分切出去。

cancelpc 07/14 11:26如早期的 FPU 是另外一顆 IC 處理地,不須包在通用

cancelpc 07/14 11:26功能的 CPU 裡。避免增加成本,以及開發生產的困難

cancelpc 07/14 11:26度。可視需要選購。

friedpig 07/14 11:29那東西又沒需求高到值得額外開一顆 而且連接速度也

friedpig 07/14 11:29是問題 雖然牙膏王最終藍圖的確有打算要拆一拆

cancelpc 07/14 11:32若 AVX 對 AI 等領域有特殊幫助,並不需要讓每個客

cancelpc 07/14 11:32戶都得負擔這個成本。

cancelpc 07/14 11:32就跟 Intel 現行分出無內顯的 ....F (雖然還是做在

cancelpc 07/14 11:32裏頭,並沒真正移除電路)

friedpig 07/14 11:36別想了 就是那小眾頂不住才會這樣強渡關山 不然就

friedpig 07/14 11:36會乖乖做ASIC了

guezt 07/14 11:36推土機確實在linux上某些測試效能可和i對抗

sharkbay 07/14 11:37https://i.imgur.com/vzvbhVM.jpg 真熱鬧~

圖 Alder Lake沒有AVX512,於是Linus又開嘴惹

niverse 07/14 11:37不知道就說不知道,在那邊牽拖看錯,要不要再牽拖

niverse 07/14 11:37你媽把你生出來?

guezt 07/14 11:38但當時(現在也是)很多程式還是單核至上 尤其windows

friedpig 07/14 11:39所以的確是阿痛不支援 大核還是正常?

friedpig 07/14 11:40TSX不是完全放棄了喔 所以新架構修好又在出發?

sharkbay 07/14 11:40 https://reurl.cc/0orbm6 product-briefs

friedpig 07/14 11:44不過話說牙膏王也投蠻多人在做DPC++這種跨所有平台

friedpig 07/14 11:44的complier 這種也應該能發揮硬體優勢就是

sharkbay 07/14 11:45Lakefield 1+4, Alder Lake-S 8+8, 應該可直接類推

friedpig 07/14 11:45ADL的core不是更新的嗎?

Bencrie 07/14 11:57規模不夠大的話 GPU 浮點會算輸 CPU SIMD

flylee 07/14 12:51一個task從CPU丟到GPU,就要浪費一段時間

flylee 07/14 12:52GPU API又分AMD, nvidia, intel

arrenwu 07/14 12:52現在 GPU encoding 跟 CPU 相比差距有多大啊

flylee 07/14 12:54一些高計算量的工作,如果 CPU能做完

flylee 07/14 12:55其實大家也懶得去呼叫 GPU來幫忙

bubunana 07/14 12:56avx ai什的好複雜 書讀的不多 請問跟av 或avi有關嗎

bubunana 07/14 12:56

flylee 07/14 12:57只是有沒有必要去搞 AVX512的確是個問題

arrenwu 07/14 12:58我覺得一般的數值分析行為,大多也不會用GPU

friedpig 07/14 12:59圖靈encode已經到可以用程度拉 接下來再多塞硬體

friedpig 07/14 12:59只會更好而已

flylee 07/14 12:59AMD的R9 3950x(avx2) 就把 10980XE打好玩的

friedpig 07/14 12:59反正老黃很精 傳統遊戲性能的提升一直在控 都先做

friedpig 07/14 12:59邊邊角角的東西

friedpig 07/14 13:0012->7 這代密度提升快三倍 老黃又屌炸天 die size

friedpig 07/14 13:01看起來大概不會變小多少了 多快三倍電晶體 想幹嘛

friedpig 07/14 13:01就幹嘛

friedpig 07/14 13:02不過說真的 AI雖然這麼熱 但是真的有商業價值的東西

friedpig 07/14 13:02好像也還好 不知道什麼時候又要循環了 CS每幾年就換

friedpig 07/14 13:02個東西炒

Bencrie 07/14 13:09不炒經濟會停滯 (x

dxzy 07/14 13:28WARgame723真的丟人現眼 無知就算了文章也不會讀

kira925 07/14 13:45其實想一想也滿奇怪的 明明AI都是只算模型 用戶端

kira925 07/14 13:45只管用不管算 結果塞了一堆訓練用的電路要幹嘛...

winiel559 07/14 13:50某些應用需要能在Local算,例如臉部辨識解鎖

Fezico 07/14 13:56AI能綁的的東西太多,搞不好這十年CS都吃這碗飯

birdy590 07/14 13:59這跟技能樹一樣 點數有限 低效益技能分配太多會掛

iWRZ 07/14 14:04這個Linus等級比另外一個Linus高到銀河系遠好嗎?

iWRZ 07/14 14:04全世界大部分伺服器和超級電腦的作業系統核心都是

iWRZ 07/14 14:04他寫的

arrenwu 07/14 14:10沒那麼誇張吧XD 後來各自有社群在修改和維護啊XD

AmibaGelos 07/14 14:16i皇就萬惡之源啊 mmx砍stack卻動到x87 x64 sse2好

AmibaGelos 07/14 14:16不容易淘汰x87統一天下又來avx avx 號稱encode清乾

AmibaGelos 07/14 14:16淨又冒出avx512 套用水球大的話i真的是奇謀而短orz

dxzy 07/14 14:17他有不可動搖的貢獻跟最終裁量權? 但不會去寫了

iWRZ 07/14 14:17支持這個理論 Pytorch和tensorflow明明有顯卡可吃

iWRZ 07/14 14:17偏要AVX2 CPU才能跑 要不然source抓回來自己編

iWRZ 07/14 14:18浮點數計算顯卡海放CPU不知道幾條街了

iWRZ 07/14 14:19要不然超級電腦狂插Tesla卡插得比礦機多是要幹嘛

arrenwu 07/14 14:21他沒有裁量權吧?不然這東西怎麼open?

arrenwu 07/14 14:22不過 PyTorch或Tensorflow有一定要支援AVX2的CPU喔?

kira925 07/14 14:29他有 Linux Kernel的Merge Window與版本確定

kira925 07/14 14:29都是他在發的 他也臭幹過很多次各家公司發垃圾

kira925 07/14 14:29要放進Kernel

friedpig 07/14 14:41現在都強調edge了拉 local要有簡單訓練能力local最

friedpig 07/14 14:41佳化模型

kimisawa 07/14 15:10等一下723你說Linus 仇i搞錯什麼了嗎

kimisawa 07/14 15:11他撐著用i多久了 是幾個月前才受不了

AreLies 07/14 15:45兩個Linus其實都是今年才把自己的主機換成AMD

AJizzInPants07/14 16:14自己搞不清楚狀況被笑還要嘴硬講年紀

AJizzInPants07/14 16:14可憐哪.jpg

AJizzInPants07/14 16:15不管是反串還是真的fanboy都是可憐

egnaro123 07/14 19:48ai需求超級假,幾個政府扶植的新創都不了了之

egnaro123 07/14 19:48更不用說財團法人"們"為買而買的ai gpu卡了

egnaro123 07/14 19:49這幾年真實有用的就是VM/data center/高速網路

egnaro123 07/14 19:49多核心等,linus說的沒錯,教授待的地太"特殊"

egnaro123 07/14 19:50amd也會往data center走,不過amd還缺好的網路晶片

egnaro123 07/14 19:57可以查查交大智慧視覺相關就知了

egnaro123 07/14 19:58所以教授看的點和真實應用差異,新創都養不起

egnaro123 07/14 19:59未來?未來搞不好政府又另一套口號,業面也有新技術了

birdy590 07/14 20:28網路晶片是沒救了 看看能不能直接用買的

bubunana 07/14 21:11哈!看完都不知道自己眼睛跳躍到那條世界線 MS FB A

bubunana 07/14 21:11Z G 開的規格 跟世界頂尖實驗室正在做的都是假的 只

bubunana 07/14 21:11有台灣業界 學界需求才是真的

egnaro123 07/14 21:12可是那些全叫做data center大哥,你要去查下使用率

egnaro123 07/14 21:13這些cloud用最多的是什麼?這是全世界,你只看到想看

egnaro123 07/14 21:14就如同台灣財團法人和學界了

AKSN74 07/14 21:28網路晶片我看要買也難,老黃才剛把Mellanox買下

egnaro123 07/14 21:33intel在這dc的網路技術超級多,amd很難超車

egnaro123 07/14 21:34我是不懂國外/台灣財團法人花的錢gpu的錢何時回本

AKSN74 07/14 21:38國外我覺得很難說,台灣的話確實就有點在跟風

AKSN74 07/14 21:40最近公司也是接到不少有類似需求的客戶

AKSN74 07/14 21:41但只有少數才很明確提出他們的需求目的

AKSN74 07/14 21:42就跟前幾年的雲端一樣,台灣一堆公司推出所謂的雲端

AKSN74 07/14 21:42產品,但實際去看很多都只是主從式運算概念的東西

miname 07/14 22:01我覺得不會回本吧,據消息指出租金比自建營運的成本

miname 07/14 22:01還要低

friedpig 07/14 22:08主要就那幾家巨獸有真的資料跟人能玩啊 剩下的瞎搞

friedpig 07/14 22:08居多 不過那幾家如果扣掉租借式部分 純靠自己AI商業

friedpig 07/14 22:08模式部分不知道到底賺了多少

egnaro123 07/14 22:29原po好像少po了其他重點,另回

kuma660224 07/14 23:19應該不是説浮點少用 而是超寬SIMD

kuma660224 07/14 23:19的浮點(或整數)很少使用價值

kuma660224 07/14 23:20絕大多數程式是需要scalar浮點

kuma660224 07/14 23:21你AVX512可同時跑16個32bit浮點

kuma660224 07/14 23:21Who cares? 我們需要是1次1個

kuma660224 07/14 23:22但是跑很快很快的

kuma660224 07/14 23:22同時16加法或16乘法對正常軟體無用

kuma660224 07/14 23:25一般是需if (A+B>CxD) { (A+X)/Yx4 }

kuma660224 07/14 23:25這類邏輯流程運算

kuma660224 07/14 23:26超寬SIMD完全不適合做這類運算

kuma660224 07/14 23:27而且比超寬SIMD的平行吞吐量?

kuma660224 07/14 23:27適合那種的工作我為啥不用GPGPU?

kuma660224 07/14 23:28GPU有幾千個平行的超寬向量單位

kuma660224 07/14 23:29還可多插幾張卡 擠爆炸性浮點量

kuma660224 07/14 23:29導致AVX512不是暫時雞肋 更可能永遠...

kuma660224 07/14 23:30其實連AVX256都沒有很常用

kuma660224 07/14 23:30只是AVX256至少不會降頻

kuma660224 07/14 23:31所以還能説起碼有做就有一點加分

labbat 07/14 23:45AVX256不常用?

labbat 07/14 23:45餵狗查array_multiply_prf.asm 怎麼運作的唄

kuma660224 07/15 03:47現在3A遊戲更吃ComputerShader

kuma660224 07/15 03:48用GPU去滿足大吞吐量平行浮點運算

kuma660224 07/15 03:49AVX512當初是Larrabee提出的

kuma660224 07/15 03:50希望用X86 眾核CPU去取代GPU

kuma660224 07/15 03:50弄到最後還沒上市就被打趴在地

kuma660224 07/15 03:51為資源再利用,把AVX512往其他領域塞

kuma660224 07/15 03:52包括伺服器,超算,AI, 繼續跟

kuma660224 07/15 03:52超平行大顆GPU對抗,但還是慘敗

kuma660224 07/15 03:53最後想再挪到消費級當成賣點

labbat 07/15 10:45居然還記得intel的X計畫(名字隨意取的)

labbat 07/15 10:45可是人類還無法寫出超平行化程式碼 GPGPU overhead

labbat 07/15 10:46註定無法跟cpu比 另一個極端就是APU的gpgpu囉

birdy590 07/15 10:58平行度輸太多了, overhead 從來沒那麼重要吧

birdy590 07/15 10:58不能派一小群葉問去對抗幾萬大軍也打不贏啊

Windcws9Z 07/17 13:27推kuma

stja 11/08 10:28