金山云新一代GPU云服務(wù)器上線基于TeslaT4性能提升350%

2022-10-02 分類：云服務(wù)器

近日，金山云基于Tesla T4的GPU云服務(wù)器正式對(duì)外商用，這也是繼去年國(guó)內(nèi)首家商用Tesla V100之后，金山云在GPU云服務(wù)器領(lǐng)域再一次拔得頭籌，代表金山云在新技術(shù)應(yīng)用上始終處于行業(yè)水平。

作為全面升級(jí)的新一代GPU云服務(wù)器，T4采用了最新的Turing架構(gòu)，單卡提供8.1 TFLOPS的單精浮點(diǎn)計(jì)算能力和65 TFLOPS的混合精度(FP16/FP32)矩陣計(jì)算能力。Tesla T4相比于上一代產(chǎn)品Tesla P4，其整體性能有了較大的提升，在給定場(chǎng)景下，T4的推理性能提升超過350%。

金山云新一代GPU云服務(wù)器上線基于Tesla T4性能提升350%

震撼的多精度推理性能為AI全面加速

Tesla T4基于Turing架構(gòu)，提供了更加強(qiáng)大的訓(xùn)練和推理能力，在原有對(duì)FP32和FP16支持的基礎(chǔ)上，Turing架構(gòu)中的Tensor Core新增了對(duì)INT8和INT4的支持，并探索性地推出了INT1精度模式。通過對(duì)多種精度模式的支持，T4能夠有效縮短在線預(yù)測(cè)和離線訓(xùn)練時(shí)長(zhǎng)。根據(jù)Nvidia公布的測(cè)試數(shù)據(jù)，在語(yǔ)言推理的場(chǎng)景中(NLP: GNMT Model)，T4相對(duì)于P4，其性能提升超過350%。

Tesla T4使用TU104核心，搭載136億個(gè)晶體管，共40個(gè)SM(stream multiprocessor)，每個(gè)SM單元中有64個(gè)CUDA Core和8個(gè)混合精度的矩陣運(yùn)算單元Tensor Core，共2560個(gè)CUDA core和320個(gè)Tensor core，提供8.1 TFLOPS的單精度性能和65 TFLOPS的混合精度(FP16/FP32)性能。此外，T4中還集成了Turing架構(gòu)首次引入的RT Core，可實(shí)現(xiàn)高效的光線追蹤(Ray Tracing)功能，在圖形圖像渲染方面有著廣泛的應(yīng)用。目前，金山云基于T4的GPU加速計(jì)算服務(wù)已全面商用，為諸多客戶提供著高性能的計(jì)算支撐。

優(yōu)異的機(jī)器學(xué)習(xí)能力讓技術(shù)更智能

T4針對(duì)深度學(xué)習(xí)應(yīng)用場(chǎng)景，進(jìn)行了全方位的優(yōu)化。首先，T4卡配備了320個(gè)Tensor Core。Tensor Core作為專門用于執(zhí)行張量/矩陣運(yùn)算的計(jì)算單元，能夠?yàn)橛?xùn)練和推理場(chǎng)景中的矩陣運(yùn)算提供極大的加速，被廣泛用于各種深度學(xué)習(xí)的場(chǎng)景中。Turing Tensor Core相對(duì)于先前的Volta版，強(qiáng)化了推理的功能，支持了INT8和INT4兩種精度模式，算力分別高達(dá)130TOPS和260TOPS。其次，T4繼承了Volta架構(gòu)中首次引入的Multi-Process Service(MPS)功能，優(yōu)化了對(duì)batch較小時(shí)推理的性能，減少啟動(dòng)延遲，從而能夠支持更多的并發(fā)請(qǐng)求。

及時(shí)響應(yīng)是提升用戶參與度的關(guān)鍵，隨著模型準(zhǔn)確性和復(fù)雜性的提高，快速交付正確答案所需的計(jì)算能力也在呈指數(shù)級(jí)提升。T4擁有先進(jìn)的實(shí)時(shí)推理性能，在會(huì)話式人工智能、推薦系統(tǒng)和可視化搜索等場(chǎng)景的處理上，可提供低延時(shí)、高吞吐量的計(jì)算能力，進(jìn)而實(shí)時(shí)滿足更多的處理請(qǐng)求。T4通過優(yōu)異的機(jī)器學(xué)習(xí)推理能力讓技術(shù)應(yīng)用更為智能。除了深度學(xué)習(xí)外，T4在視頻轉(zhuǎn)碼和虛擬桌面等諸多場(chǎng)景中都能夠發(fā)揮重要的作用。

作為中國(guó)的云計(jì)算服務(wù)提供商，金山云始終致力于通過最前沿的技術(shù)、最高效的產(chǎn)品為客戶提供更加安全、穩(wěn)定、便捷的云服務(wù)。目前基于T4的 GPU云服務(wù)器已經(jīng)開放商用，卓越的深度學(xué)習(xí)推理性能，讓用戶能夠更加快速、高效地構(gòu)建AI業(yè)務(wù)，運(yùn)行大規(guī)模模型推理應(yīng)用。同時(shí)，基于Tesla T4的實(shí)例具備易擴(kuò)展和高性價(jià)比的特性，能夠?yàn)橛脩艄?jié)省大量計(jì)算成本，有效提升AI產(chǎn)品迭代的速度，提高企業(yè)AI競(jìng)爭(zhēng)力。

當(dāng)前標(biāo)題：金山云新一代GPU云服務(wù)器上線基于TeslaT4性能提升350%
瀏覽路徑：http://vcdvsql.cn/news29/200729.html

網(wǎng)站建設(shè)、網(wǎng)絡(luò)推廣公司-創(chuàng)新互聯(lián)，是專注品牌與效果的網(wǎng)站制作，網(wǎng)絡(luò)營(yíng)銷seo公司；服務(wù)項(xiàng)目有云服務(wù)器等

聲明：本網(wǎng)站發(fā)布的內(nèi)容（圖片、視頻和文字）以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主，如果涉及侵權(quán)請(qǐng)盡快告知，我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng)，如需處理請(qǐng)聯(lián)系客服。電話：028-86922220；郵箱：631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載，或轉(zhuǎn)載時(shí)需注明來源：創(chuàng)新互聯(lián)

猜你還喜歡下面的內(nèi)容

bl双性强迫侵犯h_国产在线观看人成激情视频_蜜芽188_被诱拐的少孩全彩啪啪漫画

金山云新一代GPU云服務(wù)器上線基于TeslaT4性能提升350%