0 引言
當前,全球數字經濟高速發展,數字化轉型加速推進。在線辦公、智能駕駛等智能化數字應用不斷涌現,極大地推動了生產力向前發展,提升了社會總體生產效率。數字應用場景的落地離不開算力的支撐,數據中心是融合計算、存儲和網絡能力,對外提供高性能算力的核心載體,也是承載各類信息技術應用,推動數字經濟發展的重要底座[1]。美日歐等世界主要國家和地區均在加速推動數據中心建設,通過政策引領、資金扶持等手段促進算力產業發展。如圖1所示,截至2021年年底,全球算力總規模達到521 EFLOPS(FP32),美、中、日、德、英算力規模位居世界前列,分別占比31%、27%、5%、4%、3%[2]。筆者重點對數據中心算力布局、算力類型、算力網絡、算力運維、算力調度、綠色低碳和算力賦能等方面進行分析和研究,以期為算力技術與產業發展提供借鑒。
2021年全球算力規模情況
1 發展現狀
1.1 我國整體情況近年來,我國數據中心機架規模快速增長。中國信息通信研究院統計數據顯示,截至2022年年底,我國在用數據中心機架總規模超過650 萬標準機架,算力總規模為180 EFLOPS(FP32),近五年年均增速超過30%,算力規模排名全球第二。
長期以來,我國數據中心呈現東密西疏、東多西少的布局特點。我國東部地區數字化轉型進程較快,數字經濟發展水平較高;而西部地區數字化轉型進程相對緩慢,算力需求相對較低。從省市數據來看,江蘇、上海、廣東、河北算力規模較高,均超過10 EFLOPS(FP32)。北京、浙江、貴州、山東、內蒙古算力規模處于第二梯隊,均超過5 EFLOPS(FP32)[3]。在數據中心總體規模增長的同時,我國數據中心行業市場收入也在不斷提升。2022年,我國數據中心行業市場收入近2 000 億元,近三年年均復合增長率達到30.69%[4]。未來,隨著我國各地區、各行業數字化轉型的深入推進,數據中心市場有望持續保持增長態勢。
1.2 各樞紐情況“東數西算”工程通過設立八大樞紐節點和十大數據中心集群引導我國數據中心產業均衡布局、協同一體發展。樞紐節點的選取過程充分考察了各地區資源、能源、氣候等地理自然因素以及各地區算力需求狀況,在此基礎上確立了京津冀、長三角、粵港澳大灣區、成渝、貴州、內蒙古、甘肅、寧夏八大樞紐節點。其中,京津冀、長三角、粵港澳大灣區、成渝樞紐節點的數字化轉型程度較高,算力需求旺盛,數據中心可重點支撐工業互聯網、金融證券、災害預警等高頻實時交互的業務需求;貴州、內蒙古、甘肅、寧夏等西部節點自然資源充沛、氣候適宜,適合開展數據中心的綠色低碳化建設,可重點承接全國范圍的渲染加工、離線分析、存儲備份等非實時算力需求。
目前,八大樞紐均在積極推動數據中心相關項目落地,并構建完善的算力產業生態,全面提升本地區算力服務水平。具體來看,長三角樞紐蕪湖集群已簽約投建多個算力項目,如推動中國電信全國一體化算力網絡長三角國家樞紐節點蕪湖數據中心集群建設運營,依托瓏騰數據打造圍繞無人駕駛、人工智能、云計算的高新算力服務產業園,依托安恒信息投資建設“數盾”產線長三角總部基地,保障算力服務可靠安全等;粵港澳大灣區樞紐韶關集群開展《韶關數據中心集群產業發展規劃》等編制工作,積極培育上下游產業;寧夏樞紐重視集群高質量發展,2022年8月,北京市通信管理局、寧夏回族自治區通信管理局、中國信息通信研究院等單位聯合主辦“全國一體化算力網絡國家樞紐節點(北京·寧夏)高質量發展研討會”,研究探討全國一體化算力網絡國家樞紐節點建設的新問題、新趨勢,推動信息通信行業數字化轉型。
1.3 非樞紐情況《全國一體化大數據中心協同創新體系算力樞紐實施方案》對樞紐節點以外地區數據中心建設的發展方向也給出了相應指引:對國家樞紐節點以外地區,要重點建設面向本地區業務需求的數據中心;根據發展需要,適時增加國家樞紐節點。隨著我國數字化轉型的深入推進,越來越多的非樞紐節點地區認識到了發展數字經濟、加強數據中心算力基礎設施建設的重要性,紛紛強化本地區算力產業的政策引領和產業扶持,打造具有地方特色、輻射周邊區域的數據中心產業集群,成為“東數西算”工程下非樞紐節點全國一體化算力網絡建設的重要補充。
2 發展特點與趨勢
2.1 多類算力并駕齊驅2.1.1 通用算力通用算力是以中央處理器(Central Processing Unit,CPU)為基礎構成,以通用數據中心為承載主體,通過CPU提供強大的業務流程邏輯處理能力。同時,通用算力可實現計算、存儲、網絡、安全等功能的高效協同,面向電子商務、即時通信、遠程辦公等互聯網應用提供算力服務,是一種應用最為普遍的算力服務形態。在我國總體算力構成中,通用算力規模占比最高,超過70%。隨著數字化轉型的深入推進和數字經濟的快速發展,通用算力規模總量仍將進一步提升。但通用數據中心增速預期將低于智算算力,整體占比或有所下降。
2.1.2 智算算力智算算力是以圖形處理器(Graphics Processing Unit,GPU)、現場可編程邏輯門陣列(Field Programmable Gate Array,FPGA)、專用集成電路(Application Specific Integrated Circuit,ASIC)等異構計算芯片為基礎構成,以智算中心為承載主體,通過GPU等異構芯片提供高并發、大規模的并行計算和矩陣運算能力,具備渲染、推理和模擬能力,可面向智能駕駛、人臉識別等人工智能應用提供智算服務的一種算力服務形態。我國智算算力發展起步較晚,但隨著人工智能應用的興起,智算算力發展非常迅速。未來,智算算力將成為全球算力競爭的關鍵賽道。相對歐美國家,我國在GPU等異構芯片研發生產方面處于劣勢,智算算力發展存在潛在風險,亟需強化智算算力技術和產業投入,提升智算能力。
2.1.3 邊緣算力邊緣算力是指靠近用戶側,實時性較高的算力服務形態,以邊緣數據中心或邊緣機房為主要承載主體,可部署于工廠廠房、樓頂、車間等位置,由于廠房、樓頂等位置相對狹小,且空間環境相對復雜,因此邊緣服務器規格通常較小[5]。隨著工業互聯網、智慧城市等智能應用場景的不斷擴展,以及智能終端傳感設備、移動通信設備的快速發展,邊緣算力需求也在不斷提升,進一步激發了邊緣算力市場的發展。
盡管邊緣計算具有敏捷性、便捷性等特征,能夠就近提供算力支持,但是其算力規模通常較小,難以滿足算力需求較高的應用,因此在實際的算力應用中通常采用云邊協同的算力供給方案。云邊協同是一種協同利用云端算力和邊緣算力,為用戶提供算力服務的形式,同時兼具云端算力規模大、可靠性強、邊緣算力靠近用戶、敏捷性高等特點,可更好地滿足高實時性、大數據量的算力需求場景。
2.2 算力網絡日漸重要2.2.1 數據中心網絡數據中心網絡(Data Center Networking,DCN)通常是指數據中心內部網絡,主要用于實現數據中心內計算、存儲設備間的數據傳輸,以及數據中心內外部數據交互。隨著計算和存儲資源的池化和虛擬化發展,數據中心承載業務需求快速提升,計算設備、存儲設備間的數據交互變得更加頻繁,東西向流量快速增長,DCN性能要求不斷提升。在網絡架構上,大二層胖樹結構在數據中心內得到了廣泛應用[6],蜻蜓(Gragonfly)、偶圖(BiGraph)等架構也有一些部署。
高性能DCN成為重要研究方向。在傳統DCN網絡中,服務器間主要采用無限帶寬(InfiniBand,IB)網絡連接,服務器與存儲設備間主要采用光纖通道(Fibre Channel,FC)網絡連接,前端網絡則以網際互連協議(Internet Protocol,IP)網絡為主,這種差異化的網絡連接形式不利于提升數據中心內的數據傳輸效率。同時,IB和FC具有較高的網絡建設與運維成本以及受限的供應情況,一定程度上影響了數據中心網絡的高效部署。為了進一步提升計算設備間、算存設備間的數據傳輸和交互能力,中國信息通信研究院、中國電信集團有限公司、中國移動通信集團有限公司、深圳市騰訊計算機系統有限公司(簡稱騰訊)、百度在線網絡技術(北京)有限公司(簡稱百度)和華為技術有限公司(簡稱華為)等單位積極推動數據中心高性能網絡研究,在IEEE 802面向下一個十年工業連接活動的網絡增強(Network Enhancements for the Next Decade Industry Connections Activity,Nendica)工作組發布了《IEEE 802 Nendica報告:數據中心無損網絡》(IEEE 802 Nendica Report: The Lossless Network for Data Centers)和《IEEE 802 Nendica報告:智能無損數據中心網絡》(IEEE 802 Nendica Report: Intelligent Lossless Data Center Networks)兩份白皮書,在國內發布了YD/T 4026-2022《基于遠程直接內存訪問的數據中心網絡技術要求和測試方法》等一系列國家通信行業標準。
2.2.2 數據中心互聯數據中心互聯(Data Center Interconnect,DCI)是指實現數據中心間的網絡互聯互通。DCI的部署主要與用戶訪問需求的高速增長,以及業務連續性需求的提升等因素有關。從業務訪問量角度來看,在不同的時間段,數據中心云資源使用情況存在差異,以電子商務為例,在特定的促銷期間,其用戶訪問需求激增,原有的數據中心云資源無法滿足這種激增的算力需求,就需要通過DCI將本地應用請求傳送到其他數據中心,緩解本地云資源壓力。從業務連續性角度來看,隨著數字化轉型的逐步深化,越來越多的業務向云上遷移,對于一些安全性、連續性要求較高的業務,如金融交易、企業資源計劃(Enterprise Resource Planning,ERP)、移動辦公等,一旦發生信息系統崩潰或數據丟失,將可能對企業造成巨大的損失。為了確保業務的連續性和數據的安全性,往往需要通過異地災備來實現數據級或應用級災備,異地災備的實現同樣離不開數據中心間網絡互聯的支持。隨著各類資源池的增大,DCI必然會發揮更重要的作用。
2.3 算力運維智能發展數據中心是資源密集型、技術密集型產業,隨著數據量的高速增長,新建數據中心以大規模、超大規模為主,在應對物理基礎設施局部故障或突發故障時,因海量“風火水電”設備的技術較為繁雜,需要專業的技術人員進行服務和支持,由此孕育出智能運維的市場機會。開放數據中心委員會調研數據顯示,2022年,我國數據中心基礎設施運維市場超過100 億元,且近5年的市場增長率都超過20%[7]。
2.3.1 智能監控為應對數據中心向綠色化、集約化、智能化建設發展演進過程中的新需求,數據中心運維管理由人力驅動的被動體系逐步向智能化技術驅動的主動體系演進,運維管理生命周期的起點是將監控信息進行標準化收集和管理。早在2015年,百度、騰訊、阿里巴巴集團控股有限公司(簡稱阿里)等互聯網企業已經開始研究“風火水電”設備應向監控系統提供的監控點位信息,完成了點位數量、名稱、精度、單位、取值定義等方面的標準化工作,定義了數據中心配電類、環境類、弱電類基礎設施應滿足的監控指標,在開放數據中心委員會發布了《互聯網數據中心基礎設施監控指標規范》等技術規范,縮短了數字化管理系統的建設工期并且降低了難度,提升了運維工作與管理效率。
2.3.2 智能管理數據中心基礎設施管理等數字化管理系統的建設與應用也經歷了近10年的發展期,早期的信息技術無法滿足數據中心智能化監控與管理的需求,倒逼數據中心企業不斷融合新技術并應用到運維過程中,運維軟件層逐漸走深向實。騰訊、華為等公司探索采用數字孿生技術實現對基礎設施的配電、暖通進行圖形建模,可視化表征實時運行工況。萬國數據通過引入智能技術、可編程邏輯控制器自動控制技術進行設施層的智能化建設,可實現電氣、暖通、安防等設施的自動化預測性排障和應急處置。數據中心智能化運維是一項系統性工程,需要打通從建造到運營、硬件到軟件各個環節,除了培養觀念與習慣之外,還需要結合業務需求,搭建精細化運維體系。
2.4 算力調度研發深入2.4.1 算力對接我國算力基礎設施建設規模不斷加快,初步形成了多樣異構算力協同發展的局面。但是,我國算力供需矛盾依然存在。從地域上來看,我國東部地區算力需求旺盛,算力供不應求;西部地區算力需求相對較低,算力供過于求。東西部算力資源難以實現有效對接,西部地區的部分算力資源無法得到有效利用。從企業角度來看,隨著算力需求的不斷提升,傳統單一、孤立的算力資源在服務過程中的瓶頸逐漸顯現出來。因此,需要實現多種算力資源的連接,實現算力需求的遷移,更好地應對用戶算力需求的增長。我國算力資源在區域上以及企業內部均需要進行有效的對接。通過跨地域、跨主體的算力資源的統一接入,打造更加泛在的算力資源互聯環境。
2.4.2 算力調度算力調度是實現算力供需高效對接的一種重要技術手段,通過算力調度可以有效地將算力需求調度到合適的算力設施,實現彈性泛在、高效敏捷的算力供給。算力調度的實現離不開算網資源感知、度量、編排和路由等關鍵技術的支撐。
其中,算網資源感知主要對當前全網各節點算力資源、網絡資源的狀態進行感知,明確當前算力資源、網絡資源的空余量;算力度量是指使用統一量綱對計算、存儲、通信和安全等資源進行度量,通過算力度量能夠更加全面客觀地評價算網資源調度和使用的代價;算力編排是指根據用戶算網資源需求快速分配算力和網絡資源,并且在算網資源使用完成后快速收回相應的資源,更新算網資源信息,為下次資源分配做好準備,算力資源分配通常是借助相應的調度策略、算法來完成;算力路由是指對算力資源需求和算力資源部署的實時狀態進行感知,并在此基礎上將算力需求引入到路由域,使應用需求能夠沿著最佳路由路徑到達相應的算力節點。整體來看,算力一體化調度是算力基礎設施發展的大勢所趨,但仍需要時間進行技術的突破與商業的探索。
2.4.3 算力交易算力交易是算力調度進一步市場化、形成成熟的商業模式的階段。在算力交易平臺的支持下,用戶可以將閑置的算力資源接入到交易平臺,進行共享或售賣,使算力資源在市場機制中得到高效的配置,滿足各類用戶的算力使用需求。算力交易的參與方包括運營商、云廠商、行業用戶和個人用戶,其中運營商是算力資源和網絡資源的主要提供者,行業用戶和個人用戶是算力資源的主要消費者。算力交易平臺提供算網資源的一站式交易,行業用戶和個人用戶能夠在算力交易平臺上選擇購買供給方的資源。與此同時,行業用戶和個人用戶也可以作為算力資源的供給方,將自己閑置的算力資源對接到算力交易平臺進行售賣。上海市于2023年2月,基于超算中心發布了人工智能公共算力服務平臺,探索算力調度新模式,以更好地滿足科研機構和廣大中小微企業實際算力需求。
2.5 綠色低碳全面強化2.5.1 概況當前,我國各行業均在大力推進節能減排工作。數據中心作為耗能大戶,其耗電量和碳排量不容忽視。從政策角度來看,近年來,我國持續強化數據中心綠色低碳引領,工業和信息化部發布《新型數據中心發展三年行動計劃(2021—2023年)》,將綠色低碳作為新型數據中心發展的重要目標,并提出通過加快先進綠色技術產品應用、提升能源高效清潔利用水平、優化綠色管理能力等舉措,全面提升數據中心綠色低碳水平。
從產業發展角度來看,提升數據中心能效水平能夠促使數據中心將更多電能供給到互聯網技術(Internet Technology,IT)設備上,以服務更多的算力需求,并產生經濟效益。中國信息通信研究院云計算與大數據研究所數據中心團隊長期致力于數據中心綠色低碳領域研究,并聯合開放數據中心委員會推出了數據中心綠色等級測試、數據中心低碳等級測試,通過測試評估手段促進數據中心綠色低碳水平提升[8]。
2.5.2 ICT產品數據中心能耗主要由服務器、存儲、網絡等信息與通信技術(Information and Communications Technology,ICT)設備能耗及供配電、制冷等配套設施能耗共同構成。在數據中心發展早期,數據中心ICT設備耐熱、散熱能力較差,需要依靠大量制冷保障ICT設備正常運行。近年來,數據中心ICT設備電能利用效率不斷提升,在相同能耗下可以提供更多計算、存儲和數據傳輸服務。與此同時,ICT設備耐熱、散熱能力也得到進一步改善。由于ICT設備耐熱、散熱性能得到提升,數據中心ICT設備的能效優化空間更大。
從數據中心整體的碳排放深入到IT設備的碳效指標,2022年底,開放數據中心委員會發布的《數據中心算力碳效白皮書》提出了一種服務器的算力碳效模型,定義如下:CEPS=C/S,其中C是碳排放量;S是服務器算力性能[9]。由于IT設備特別是服務器在數據中心能耗中占比極大,數據中心的碳排放將在很大程度上取決于服務器和芯片,這逐漸成為數據中心綠色低碳發展的關鍵。
2.5.3 供配電、制冷產品供配電和制冷產品是保障數據中心內ICT設備穩定運行的輔助性基礎設施,降低供配電、制冷環節能耗有助于提升數據中心能效水平。隨著數據中心綠色低碳發展要求的不斷強化,數據中心供配電、制冷環節的綠色低碳技術也日益活躍。在供配電方面,高效率、低損耗的供配電創新技術不斷涌現并逐漸成熟應用,如高壓直流、不間斷電源(Uninterruptible Power Supply,UPS)智能休眠、絕緣柵雙極型晶體管(Insulated Gate Bipolar Transistor,IGBT)整流、3N架構等。與傳統UPS配電相比,高壓直流配電取消了UPS交流逆變環節和服務器電源端的整流環節,極大地提升了電流轉換效率,同時也提升了供電系統的穩定性和可維護性。UPS智能休眠主要是根據IT負載情況進行模塊化智能休眠,當負載量低于某一設定值時,進入休眠模式,降低UPS電能損耗[10]。除了現有供配電設備的創新外,“新能源+儲能”的供電方案也逐步應用于數據中心,“新能源+儲能”的技術方案可有效避免新能源發電穩定性差的問題,通過與儲能技術配合,提升了數據中心對新能源的利用率。
制冷環節的綠色低碳技術創新體現在多個方面:一是空調送風方案逐步優化,部分數據中心機房通過軟件模擬氣流組織制定更加高效的制冷送風方案;二是冷水機組、末端空調等制冷設備的電能利用效率逐步提升,可用更少的電能提供更多制冷;三是液冷技術從技術概念逐步走向落地實施,有效解決了機房高密部署和局部過熱的問題[11]。阿里、OPPO廣東移動通信有限公司等已經規模部署浸沒式液冷技術,獲得了優異的電源使用效率收益。
2.6 算力賦能千行百業2.6.1 產業發展需要算力支撐在數字經濟時代,算力已經成為推動經濟發展的重要生產力,廣泛服務于各行業的數字化轉型。企業大力推動信息系統建設,并對業務處理環節、生產環節進行信息化改造。其中,通信、互聯網、金融等行業的企業信息化程度較高,初步具備了利用算力全方位服務業務的能力。同時,隨著智能傳感終端的廣泛應用以及云邊端算力服務模式的發展成熟,工業、農業、交通、能源等傳統行業也在加快數字化轉型,通過云邊端協同的算力服務模式實現終端數據的自動采集,并基于云端和邊緣側的算力資源對終端數據進行分析、存儲,通過人工智能、建模分析及控制響應機制對終端設備進行控制,實現各類智能化操作。
2.6.2 算力推動社會智能發展算力應用不僅能夠促進產業數字化發展,為產業轉型升級提供支撐。同時,數字技術的應用,也為人們的日常生活帶來了極大的便利,并進一步在科研、辦公、娛樂等領域發揮重要的輔助作用,全面推動社會智能化發展。在科研方面,研究機構正在積極利用數據中心開展大規模的數據分析計算,為新藥品研發、地質探測、航空航天等研究提供了重要支撐。在辦公方面,視頻會議已經成為人們日常辦公溝通交流的重要形式,極大地提升了遠距離辦公效率。在娛樂方面,虛擬現實、增強現實等技術的應用能夠進一步強化用戶的場景體驗,各類電影也需要大量的算力進行渲染以呈現更加精致的畫面,帶來更好的觀影效果。
3 結束語
近年來,我國數據中心產業面臨全新挑戰。“國家新型數據中心”“東數西算”工程等重要政策的實施落地,通用、智能和超級算力的多樣性算力供給,調度、交易等算力應用全過程的研究和落地,ICT、供配電、制冷設備等全鏈條的綠色低碳發展等共同驅動數據中心創新演進。數據中心已經從簡單的建筑轉變成為復雜的融合了設施、ICT產品、智能運維、數字化應用等要素的綜合性算力基礎設施。未來,隨著數字中國、數字經濟和數字社會規劃和建設的進一步深入,數據中心等算力基礎設施的作用會更強,對產業技術等各方面的要求會更高,迎來的發展機遇也會更大。
作者簡介
郭亮 中國信息通信研究院云計算與大數據研究所副總工程師,正高級工程師,主要負責數據中心等方面的政府支撐、技術研究和標準制定工作。
當前文章:中國信通院郭亮:數據中心發展綜述
網頁鏈接:http://vcdvsql.cn/article20/sdgjjo.html
成都網站建設公司_創新互聯,為您提供網頁設計公司、品牌網站建設、商城網站、手機網站建設、標簽優化、網站設計公司
聲明:本網站發布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創新互聯