近年來(lái),傳統(tǒng)用于圖像處理的GPU逐漸被發(fā)掘用來(lái)進(jìn)行高性能計(jì)算,并且達(dá)到了相當(dāng)好的效果,在單精度浮點(diǎn)運(yùn)算中的速度達(dá)到5TFLOPs,在雙精度浮點(diǎn)運(yùn)算中的速度可以達(dá)到1TFLOPs。如今性能最好的GPU處理器(比如NVidea的Tesla K20和K40)與一些其他的多核處理器(比如Intel Xeon Phi處理器以及IBM和Inter的一些處理器)相比表現(xiàn)出了非常好的計(jì)算性能。
創(chuàng)新互聯(lián)從2013年創(chuàng)立,先為云浮等服務(wù)建站,云浮等地企業(yè),進(jìn)行企業(yè)商務(wù)咨詢服務(wù)。為云浮企業(yè)網(wǎng)站制作PC+手機(jī)+微官網(wǎng)三網(wǎng)同步一站式服務(wù)解決您的所有建站問(wèn)題。FPGA傳統(tǒng)上是應(yīng)用于單精度的定點(diǎn)運(yùn)算,不過(guò)現(xiàn)在也可以浮點(diǎn)數(shù)進(jìn)行高性能的計(jì)算,單精度浮點(diǎn)數(shù)的運(yùn)算峰值已經(jīng)超過(guò)1TFLOPs。但是運(yùn)算的峰值并不能代表在特定環(huán)境下器件的持續(xù)工作性能,比如在計(jì)算2級(jí)的FFT時(shí),Inter的80-teraflop持續(xù)工作性能只能達(dá)到其峰值性能的2.73%(20GFLOPs)。FPGA工作在一個(gè)較低的頻率下,運(yùn)算峰值較低,但是可以通過(guò)硬件優(yōu)化來(lái)實(shí)現(xiàn)對(duì)特定應(yīng)用的更好的運(yùn)行效率,即持續(xù)性能能達(dá)到更接近峰值運(yùn)算性能的值,同時(shí)與GPU和CPU相比FPGA的功率效率更高。
一個(gè)特定的應(yīng)用在不同的平臺(tái)上運(yùn)算是不一樣的,對(duì)于運(yùn)算結(jié)果的評(píng)估可以基于以下幾點(diǎn):性能、功耗、功率效率、運(yùn)行效率、成本以及其他。在本文中,我們分析每個(gè)期間在峰值性能以及能耗方面的發(fā)展趨勢(shì),并對(duì)三者在一些科學(xué)應(yīng)用的持續(xù)性能進(jìn)行對(duì)比,找出對(duì)于某一特定應(yīng)用的最佳運(yùn)算平臺(tái)。
GPU最初被設(shè)計(jì)用來(lái)進(jìn)行圖像處理并在該方面顯示出了強(qiáng)大的優(yōu)勢(shì),近10年來(lái)GPU逐漸被應(yīng)用到通用計(jì)算領(lǐng)域,一般稱為GPGPU。基于其強(qiáng)大的并行計(jì)算能力,在一些其他的計(jì)算分析方面其性能早已可與多核CPU相媲美。
觀察多代GPU的發(fā)展,我們發(fā)現(xiàn)其峰值性能并不是簡(jiǎn)單的線性增長(zhǎng),單精度浮點(diǎn)運(yùn)算和雙精度浮點(diǎn)運(yùn)算都是這樣。我們沒(méi)有辦法去簡(jiǎn)單的描述GPU的全面的發(fā)展,因?yàn)楦鞣NGPU的結(jié)構(gòu)非常多,所以在此只挑出在某個(gè)年份的最佳性能的一些GPU進(jìn)行分析。
每一代GPU之間的性能提升超過(guò)1TFLOP,同時(shí)右圖中可知在某些年份工藝技術(shù)沒(méi)有提升,但是性能提升了,說(shuō)明性能的增長(zhǎng)不僅與新的制造工藝有關(guān)也與結(jié)構(gòu)的優(yōu)化有關(guān)。單精度和雙精度的性能差距由最初的相差10倍降到了最新一代的只差4倍左右。
關(guān)于能耗方面,GPU的功率效率(峰值性能與熱設(shè)計(jì)功耗(TDP)的比值)也是在穩(wěn)定則增長(zhǎng),單精度的功率效率由最初的0.5GFLOPs/W增加到了GFLOPs/W,雙精度的功率效率由0.5GFLOPs/W增加到了6GFLOPs/W。這意味著GPU以一個(gè)增長(zhǎng)的功率效率提供著一個(gè)驚人的運(yùn)算性能。
GPU的外部存儲(chǔ)帶寬也非常高,Geforce 6800的帶寬為35 GBytes/s,K20, K20X 和 K40的帶寬分別為208,250和288 GBytes/s。.
通用CPU的峰值運(yùn)算性能在近年來(lái)也獲得了顯著提升,圖2中顯示了部分Intel的著名CPU的峰值運(yùn)算性能。
Intel最近推出的Xeon PHI 7120P處理器的峰值運(yùn)算性能可以達(dá)到單精度2416GFLOPs,雙精度1208GFLOPs,Intel處理器計(jì)算性能的提升靠的是增加CPU的核數(shù),這些處理器的功率效率和GPU相比較低。最初65nm技術(shù)的CPU的功率效率為0.1 GFLOPs/W,目前22nm技術(shù)下的CPU的功率效率已經(jīng)增加到單精度9 GFLOPs/W,雙精度4.5 GFLOPs/W。
在Intel的這些處理器中,2008年出的一款多核處理器在3.16GHz頻率1.07V電壓下,峰值運(yùn)算速度可以達(dá)到單精度1 TFLOP。CPU或者多核CPU的存儲(chǔ)器帶寬也很高。比如Xeon PHI 7120P的帶寬為352GBytes/s,比最近出的GPU稍微高一些。
FPGA的峰值運(yùn)算性能由它所包含的乘法器和LUT的資源決定,觀察Xilinx公司的一些產(chǎn)品發(fā)現(xiàn)乘法器和LUT的資源并不是線性增長(zhǎng)的(如圖3所示)。最新的Virtex7系列FPGA中 XC7VX980T含有3600個(gè)18*18的乘法器和612000個(gè)LUT,XC7V2000T含有2160個(gè)乘法器和1221600個(gè)LUT。
如果要分析FPGA的峰值運(yùn)算性能,我們需要考慮三種情況:只有加法器,只有乘法器,有乘法器和加法器。加法器可以只通過(guò)LUT就可以實(shí)現(xiàn),而乘法器的實(shí)現(xiàn)則需要DSP和LUT的不同組合(組合結(jié)構(gòu)為M0,M1,M2)。乘加運(yùn)算真是這些乘法器和加法器的一一組合。對(duì)于雙精度的峰值運(yùn)算,只含有加法器運(yùn)算的最佳的峰值運(yùn)算性能出現(xiàn)在XC7V2000T FPGA中,為671GFLOPs;只含有乘法器運(yùn)算的最佳峰值運(yùn)算性能降為168GFLOPs;加法器和乘法器的組合運(yùn)算的最佳運(yùn)算性能為302GFLOPs,由XC7VX980T獲得。
FPGA的功率效率超過(guò)10GFLOPs/W,一般來(lái)說(shuō)是比CPU和GPU要高的,而且隨著技術(shù)的發(fā)展FPGA的功率效率也會(huì)繼續(xù)不斷提升。比如Altera的一款能達(dá)到5TFLOPs的高性能FPGA就應(yīng)用了Intel的14nm Tri-Gate,功率效率達(dá)到100GFLOPs。
為了更好的理解GPU,CPU,F(xiàn)PGA的相對(duì)發(fā)展,下面選取他們中在某些年最佳的性能的產(chǎn)品參數(shù)進(jìn)行比較,包含單精度和雙精度的運(yùn)算,結(jié)果如圖6,圖7所示。
在單精度的浮點(diǎn)運(yùn)算中,GPU的性能一直是遙遙領(lǐng)先。在2011年FPGA和CPU的性能都有很大提升,而在2013年CPU的性能仍然在提升,而FPGA相對(duì)于GPU 的性能下降了。在2013年之前,F(xiàn)PGA的性能一直優(yōu)于CPU,但在2013年,出現(xiàn)了多核CPU比如Intel Phi,因此情況改變了。
對(duì)于雙精度浮點(diǎn)運(yùn)算,可以看到GPU的性能除了在前幾年表現(xiàn)的差強(qiáng)人意,在2011年之后則一直領(lǐng)跑后兩者。同時(shí)在2011年之后CPU的性能也超過(guò)了FPGA,而且在2013年CPU和GPU的性能也已經(jīng)很接近了,大概只相差5%。
另外有需要云服務(wù)器可以了解下創(chuàng)新互聯(lián)cdcxhl.cn,海內(nèi)外云服務(wù)器15元起步,三天無(wú)理由+7*72小時(shí)售后在線,公司持有idc許可證,提供“云服務(wù)器、裸金屬服務(wù)器、高防服務(wù)器、香港服務(wù)器、美國(guó)服務(wù)器、虛擬主機(jī)、免備案服務(wù)器”等云主機(jī)租用服務(wù)以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡(jiǎn)單易用、服務(wù)可用性高、性價(jià)比高”等特點(diǎn)與優(yōu)勢(shì),專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應(yīng)用場(chǎng)景需求。
當(dāng)前名稱:高性能計(jì)算系列之四-高性能計(jì)算中FPGA,GPU和CPU-創(chuàng)新互聯(lián)
文章鏈接:http://vcdvsql.cn/article14/cdjgge.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站排名、網(wǎng)站設(shè)計(jì)公司、標(biāo)簽優(yōu)化、微信公眾號(hào)、定制開(kāi)發(fā)、網(wǎng)站設(shè)計(jì)
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容