PTT推薦

Re: [閒聊] 為何GPU比CPU貴那麼多?

看板PC_Shopping標題Re: [閒聊] 為何GPU比CPU貴那麼多?作者
karta1897830
(冰嵐)
時間推噓 8 推:11 噓:3 →:41

根據之前高人指教跟個人見解,有誤請指正

CPU應該早就要被GPU取代了
假如同時要做四個算式ABCD
CPU的作法是先算A,然後算B,然後算C,最後算D
也可以說CPU的計算是有序的
而GPU則是直接同時跑ABCD,也就是平行化計算
而CPU為了彌補這部分的差距,發展出了分支預測的技術
也就是猜答案,例如A必須等待B的答案,但A跑完時B還沒答案
CPU就會猜一個答案去解A,等到B跑完有解之後再檢查A
而分支預測越準確,相對的CPU的IPC就越高,執行效率也會跟著提高
但也說明了CPU的執行效率取決於分支預測的準確度
而GPU的平行運算性能則取決於可程式化核心,
在NV上叫做CUDA,最多可同時處理的運算正比於核心
也是為什麼GPU的性能可以直接從核心數看出來的原因
所以在發展上,CPU提升性能的方式主要取決於分支預測,但GPU只需要堆核心即可
因此GPU的性能大幅度跟製程掛鉤,而CPU的架構影響更重
但這也表示,要取得更好的GPU表現,就需要更多的可程式化核心
這點直接就反應在材料價格上,所以終端產品就一直變貴
但CPU則不是靠堆核心的方式,因此漲幅也就較為可控
未來的發展性上,GPU必然會更加吃重,但取代不了CPU的原因還是在x86
CPU的單一核心必須要可以計算從過去以來所有的x86運算
所以CPU也很難像GPU一樣堆核心,轉而向提高頻率的方式來進步
但也不可能放棄x86,這已經是歷史共業了,放棄後整個科技業都是大洗牌,
尤其是舊有程式幾乎無法繼續使用這點就不可能
除非像蘋果那樣才有可能直接拋棄x86開始堆核心
說來好笑,限制CPU發展的是x86,但把CPU命吊著的也是x86
大概4John

--

※ PTT留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 61.223.59.68 (臺灣)
PTT 網址

ltytw 04/03 19:28我看GPU以後也不方便堆核心了吧

ltytw 04/03 19:28不然就是往上疊

ltytw 04/03 19:30現在就看有誰還能像GK 》GM那樣來

ltytw 04/03 19:30個架構大改進

karta1897830 04/03 19:30這就要看製程發展如何了,還沒到材

karta1897830 04/03 19:30質極限之前應該都會是這樣發展

karta1897830 04/03 19:30就算到極限了,也可以再提高DIE的大

karta1897830 04/03 19:30小來提升

smallreader 04/03 19:37作文比賽

a1234567289 04/03 19:42你忽略了一個程式同時有平行部分和

a1234567289 04/03 19:42不可被平行部分,GPU是在可平行度高

a1234567289 04/03 19:42的程式比較快、比方說算圖。在不可

a1234567289 04/03 19:42平行的部分CPU會遠快得多

a1234567289 04/03 19:43此外,你對分支預測的描述是正確的

enthos 04/03 19:43FORTH發明人的GA144(144核心CPU)

a1234567289 04/03 19:43,但場景跟平不平行沒有關係。GPU也

a1234567289 04/03 19:43有分支預測

a1234567289 04/03 19:45此外CPU雖然平行能力比GPU弱,但你

a1234567289 04/03 19:45不要懷疑CPU的併發能力,他在只有沒

a1234567289 04/03 19:45幾顆核心的情況之下實際上跑得可以

a1234567289 04/03 19:45比10倍規模的GPU要快

a1234567289 04/03 19:47CPU和GPU完全在天秤的兩端,沒有所

a1234567289 04/03 19:47謂誰能取代誰的問題

arrenwu 04/03 19:50你講的那個"同時要做四個算式ABCD"

arrenwu 04/03 19:50是"同一個算是用在四個不同資料"的

arrenwu 04/03 19:51情況。但這種情況並沒那麼常發生

arrenwu 04/03 19:52GPU會快是因為交給GPU做的工作本來

arrenwu 04/03 19:52就是特別適合GPU做的工作

arrenwu 04/03 19:52你隨便亂寫個GPGPU的工作給GPU做是

arrenwu 04/03 19:52不會比CPU快的

JKGOOD 04/03 19:53目前NVENC的效果還沒辦法取代二壓

JKGOOD 04/03 19:53的H264、H265,現階段說完全捨棄CPU

JKGOOD 04/03 19:53我個人認為還是太樂觀了點

JKGOOD 04/03 19:57現在會組高端PC的,除了玩家之外,

JKGOOD 04/03 19:57很大一部分是影視工作者,看YT逐年

JKGOOD 04/03 19:57吃掉第四台的受眾就知道,不能以遊

JKGOOD 04/03 19:57戲用途看世界

Jokering5566 04/03 19:57再疊上去是會真的一張顯卡1200w

aegis43210 04/03 20:01不趕時間都是用2pass壓,品質最好

caramel623 04/03 20:01影視製作現在有M1來瓜分市場就是 靠

caramel623 04/03 20:01一堆定制單元硬上 沒財力很難做到

abccbaandy 04/03 20:02不玩遊戲,但也覺得i5 2400有點弱了

ksng1092 04/03 20:03最大的障礙就是OSX不行XD

abccbaandy 04/03 20:03一些高畫質的影片都會卡頓

ehai0725 04/03 20:04說得好像全部運算都能平行運算一樣

karta1897830 04/03 20:05感謝兩位a大的提點,當初誤解這些部

karta1897830 04/03 20:05分了

HamalAri 04/03 20:09頻率單純是製程紅利, 而且它會邊際

HamalAri 04/03 20:09效用遞減, 實際上 cpu 也是堆核,

HamalAri 04/03 20:09只是在堆特異的核(simd)和通用的核

HamalAri 04/03 20:09中取捨而已

HamalAri 04/03 20:17而且 gpu 的核還愈來愈不通用, 現

HamalAri 04/03 20:17在都拿去給搞 ml 的人用了, 如果你

HamalAri 04/03 20:17需要雙精度的話可能舊卡還比較好

aegis43210 04/03 20:23一些小規模模型,未來用CPU算會更快