国产精品玖玖玖在线观看_久热这里只有精品99国产6_free性欧美媓妇video_久久国产精品一国产精品_Av天堂一区二区三区

全屏背景
自定內(nèi)容
歡迎訪問(wèn)上海速凌信息科技有限公司!
當(dāng)前日期時(shí)間
導(dǎo)航菜單
網(wǎng)站標(biāo)志
自定內(nèi)容

咨詢熱線:400-833-7958   

投訴專(zhuān)線:021-60540035

自定內(nèi)容
自定內(nèi)容
文章分類(lèi)
文章正文
數(shù)據(jù)中心服務(wù)器技術(shù)發(fā)展趨勢(shì)與應(yīng)用
作者:管理員    發(fā)布于:2021-05-15 20:23:52    文字:【】【】【
摘要:當(dāng)前,為推進(jìn)IT支撐系統(tǒng)集約化建設(shè)和運(yùn)營(yíng),進(jìn)一步發(fā)揮集中化能力優(yōu)勢(shì),IT云成為運(yùn)營(yíng)商IT支撐系統(tǒng)建設(shè)的基礎(chǔ)架構(gòu)。但在IT云資源池部署過(guò)程中,服務(wù)器技術(shù)面臨多個(gè)新挑戰(zhàn),主要體現(xiàn)在以下3個(gè)方面。
當(dāng)前,為推進(jìn)IT支撐系統(tǒng)集約化建設(shè)和運(yùn)營(yíng),進(jìn)一步發(fā)揮集中化能力優(yōu)勢(shì),IT云成為運(yùn)營(yíng)商IT支撐系統(tǒng)建設(shè)的基礎(chǔ)架構(gòu)。但在IT云資源池部署過(guò)程中,服務(wù)器技術(shù)面臨多個(gè)新挑戰(zhàn),主要體現(xiàn)在以下3個(gè)方面。


在性能方面,人工智能(AI)應(yīng)用快速擴(kuò)張,要求IT云采用高性能GPU服務(wù)器。AI已在電信業(yè)網(wǎng)絡(luò)覆蓋優(yōu)化、批量投訴定界、異常檢測(cè)/診斷、業(yè)務(wù)識(shí)別、用戶定位等場(chǎng)景規(guī)模化應(yīng)用。AI應(yīng)用需求的大量出現(xiàn),要求數(shù)據(jù)中心部署的服務(wù)器具有更好的計(jì)算效能、吞吐能力和延遲性能,以傳統(tǒng)通用x86服務(wù)器為核心的計(jì)算平臺(tái)顯得力不從心,GPU服務(wù)器因此登上運(yùn)營(yíng)商IT建設(shè)的歷史舞臺(tái)。


在效率成本方面,IT云部署通用服務(wù)器存在弊端,催生定制化整機(jī)柜服務(wù)器應(yīng)用需求。在IT云建設(shè)過(guò)程中,由于業(yè)務(wù)需求增長(zhǎng)快速,IT云資源池?cái)U(kuò)容壓力較大,云資源池中的服務(wù)器數(shù)量快速遞增,上線效率亟需提高。同時(shí),傳統(tǒng)通用服務(wù)器部署模式周期長(zhǎng)、部署密度低的劣勢(shì),給數(shù)據(jù)中心空間、電力、建設(shè)成本和高效維護(hù)管理都帶來(lái)了較大的挑戰(zhàn)。整機(jī)柜服務(wù)器成為IT云建設(shè)的另一可選方案。


在節(jié)能方面,AI等高密度應(yīng)用場(chǎng)景的快速發(fā)展,驅(qū)動(dòng)液冷服務(wù)器成為熱點(diǎn)。隨著AI高密度業(yè)務(wù)應(yīng)用的發(fā)展,未來(lái)數(shù)據(jù)中心服務(wù)器功率將從3kW~5kW向20kW甚至100kW以上規(guī)模發(fā)展,傳統(tǒng)的風(fēng)冷式服務(wù)器制冷系統(tǒng)解決方案已經(jīng)無(wú)法滿足制冷需求,液冷服務(wù)器成為AI應(yīng)用場(chǎng)景下的有效解決方案。


GPU服務(wù)器技術(shù)發(fā)展態(tài)勢(shì)


GPU服務(wù)器是單指令、多數(shù)據(jù)處理架構(gòu),通過(guò)與CPU協(xié)同進(jìn)行工作。從CPU和GPU之間的互聯(lián)架構(gòu)進(jìn)行劃分,GPU服務(wù)器又可分為基于傳統(tǒng)PCIe架構(gòu)的GPU服務(wù)器和基于NVLink架構(gòu)的GPU服務(wù)器兩類(lèi)。GPU服務(wù)器具有通用性強(qiáng)、生態(tài)系統(tǒng)完善的顯著優(yōu)勢(shì),因此牢牢占據(jù)了AI基礎(chǔ)架構(gòu)市場(chǎng)的主導(dǎo)地位,國(guó)內(nèi)外主流廠商均推出不同規(guī)格的GPU服務(wù)器。國(guó)外主流廠商有英偉達(dá)、英特爾、戴爾等,國(guó)內(nèi)主流廠商包括華為、浪潮、新華三、聯(lián)想、曙光等。從GPU服務(wù)器性能來(lái)看,國(guó)內(nèi)外廠商基本處在同一水準(zhǔn)。


GPU服務(wù)器在運(yùn)營(yíng)商IT云建設(shè)中的應(yīng)用


當(dāng)前,電信業(yè)開(kāi)始推動(dòng)GPU服務(wù)器在IT云資源池中的應(yīng)用,省公司現(xiàn)網(wǎng)中已經(jīng)部署了部分GPU服務(wù)器。同時(shí),考慮到GPU成本較高,集團(tuán)公司層面通過(guò)建設(shè)統(tǒng)一AI平臺(tái),集中化部署一批GPU服務(wù)器,形成AI資源優(yōu)化配置。從技術(shù)選型來(lái)看,目前運(yùn)營(yíng)商IT云資源池采用英偉達(dá)、英特爾等廠商相關(guān)產(chǎn)品居多。


GPU服務(wù)器在IT云應(yīng)用中取得了良好的效果。在現(xiàn)網(wǎng)部署的GPU服務(wù)器中,與訓(xùn)練和推理相關(guān)的深度學(xué)習(xí)應(yīng)用占主要部分,占比超過(guò)70%,支撐的業(yè)務(wù)包括網(wǎng)絡(luò)覆蓋智能優(yōu)化、用戶智能定位、智能營(yíng)銷(xiāo)、智能稽核等,這些智能應(yīng)用減少了人工投入成本,提升了工作效率。以智能稽核為例,以往無(wú)紙化業(yè)務(wù)單據(jù)的人工稽核平均耗時(shí)約48秒/單,而AI稽核平均耗時(shí)僅約5秒/單,稽核效率提升達(dá) 90%。同時(shí),無(wú)紙化業(yè)務(wù)單據(jù)人工稽核成本約1.5元/單,采用GPU進(jìn)行AI稽核成本約0.048元/單,稽核成本降低達(dá)96.8%。


整機(jī)柜服務(wù)器技術(shù)發(fā)展態(tài)勢(shì)


整機(jī)柜服務(wù)器是按照模塊化設(shè)計(jì)思路打造的服務(wù)器解決方案,系統(tǒng)架構(gòu)由機(jī)柜、網(wǎng)絡(luò)、供電、服務(wù)器節(jié)點(diǎn)、集中散熱、集中管理6個(gè)子系統(tǒng)組成,是對(duì)數(shù)據(jù)中心服務(wù)器設(shè)計(jì)技術(shù)的一次根本性變革。整機(jī)柜服務(wù)器將供電單元、散熱單元池化,通過(guò)節(jié)約空間來(lái)提高部署密度,其部署密度通常可以翻倍。集中供電和散熱的設(shè)計(jì),使整機(jī)柜服務(wù)器僅需配置傳統(tǒng)機(jī)柜式服務(wù)器10%的電源數(shù)量就可滿足供電需要,電源效率可以提升10%以上,且單臺(tái)服務(wù)器的能耗可降低5%。


整機(jī)柜服務(wù)器在運(yùn)營(yíng)商IT云建設(shè)中的應(yīng)用


國(guó)內(nèi)運(yùn)營(yíng)商在IT云建設(shè)中已經(jīng)推進(jìn)了整機(jī)柜服務(wù)器部署,經(jīng)過(guò)實(shí)際應(yīng)用檢驗(yàn),在如下方面優(yōu)勢(shì)明顯。


一是工廠預(yù)制,交付工時(shí)大幅縮短。傳統(tǒng)服務(wù)器交付效率低,采用整機(jī)柜服務(wù)器將原來(lái)在數(shù)據(jù)中心現(xiàn)場(chǎng)進(jìn)行的服務(wù)器拆包、上架、布線等工作轉(zhuǎn)移到工廠完成,部署的顆粒度從1臺(tái)上升到幾十臺(tái),交付效率大大提升。以一次性交付1500臺(tái)服務(wù)器為例,交付工作量可減少170~210人天,按每天配10人計(jì)算,現(xiàn)場(chǎng)交付時(shí)間可節(jié)省約17~21天。


二是資源池化帶來(lái)部件數(shù)量降低,故障率大幅下降。整機(jī)柜服務(wù)器通過(guò)將供電、制冷等部件資源池化,大幅減少了部件數(shù)量,帶來(lái)故障率的大幅降低。圖1比較了32節(jié)點(diǎn)整機(jī)柜服務(wù)器與傳統(tǒng)1U、2U服務(wù)器機(jī)型各自的電源部件數(shù)量及在一年內(nèi)的月度故障率情況。由于32節(jié)點(diǎn)整機(jī)柜服務(wù)器含10個(gè)電源部件,而32臺(tái)1U通用服務(wù)器的電源部件為64個(gè),相較而言,整機(jī)柜電源部件數(shù)減少84.4%。由于電源部件數(shù)量的降低,32節(jié)點(diǎn)整機(jī)柜服務(wù)器相對(duì)于32臺(tái)1U通用服務(wù)器的月度故障率也大幅縮減。


三是運(yùn)維效率提升60%以上。整機(jī)柜服務(wù)器在工廠預(yù)制機(jī)柜布線,網(wǎng)絡(luò)線纜在工廠經(jīng)過(guò)預(yù)處理,線纜長(zhǎng)度精確匹配,理線簡(jiǎn)潔,接線方式統(tǒng)一規(guī)范,配合運(yùn)維標(biāo)簽,在運(yùn)維中可以更方便簡(jiǎn)潔地對(duì)節(jié)點(diǎn)實(shí)施維護(hù)操作,有效降低運(yùn)維誤操作,提升運(yùn)維效率60%以上,并大幅減少發(fā)生故障后的故障恢復(fù)時(shí)間。


液冷服務(wù)器技術(shù)發(fā)展態(tài)勢(shì)


液冷服務(wù)器技術(shù)也稱為服務(wù)器芯片液體冷卻技術(shù),采用特種或經(jīng)特殊處理的液體,直接或近距離間接換熱冷卻芯片或者IT整體設(shè)備,具體包括冷板式冷卻、浸沒(méi)式冷卻和噴淋式冷卻3種形態(tài)。液冷服務(wù)器可以針對(duì)CPU熱島精確定點(diǎn)冷卻,精確控制制冷分配,能真正將高密度部署帶到前所未有的更高層級(jí)(例如20kW~100kW高密度數(shù)據(jù)中心),是數(shù)據(jù)中心節(jié)能技術(shù)的發(fā)展方向之一,3種液冷技術(shù)對(duì)比如表1所示。


液冷服務(wù)器在運(yùn)營(yíng)商IT建設(shè)中的應(yīng)用


液冷服務(wù)器技術(shù)目前在我國(guó)仍處于應(yīng)用初期,產(chǎn)業(yè)鏈尚不完備、設(shè)備采購(gòu)成本偏高、采購(gòu)渠道少、電子元器件的兼容性低、液冷服務(wù)器專(zhuān)用冷卻液成本高等問(wèn)題是液冷服務(wù)器尚未大規(guī)模推廣的重要原因。從液冷服務(wù)器在運(yùn)營(yíng)商數(shù)據(jù)中心領(lǐng)域的具體應(yīng)用案例來(lái)看,運(yùn)營(yíng)商在IT云資源池規(guī)劃和建設(shè)過(guò)程中,通常會(huì)對(duì)液冷服務(wù)器的發(fā)展現(xiàn)狀、技術(shù)成熟度等進(jìn)行分析論證。


考慮到目前液冷服務(wù)器規(guī)?;瘧?yīng)用尚處于起步階段,需要3~5年的引入期,因此暫時(shí)未在IT云資源池建設(shè)中進(jìn)行大規(guī)模落地部署,但在部分地區(qū)有小規(guī)模應(yīng)用,如中國(guó)移動(dòng)南方基地?cái)?shù)據(jù)中心已經(jīng)開(kāi)展液冷服務(wù)器試點(diǎn)應(yīng)用,中國(guó)聯(lián)通研究院也在開(kāi)展邊緣數(shù)據(jù)中心服務(wù)器噴淋式液冷系統(tǒng)的開(kāi)發(fā)。未來(lái),隨著IT云建設(shè)規(guī)模、建設(shè)密度的繼續(xù)攀升,以及液冷產(chǎn)業(yè)生態(tài)體系的逐步成熟,液冷服務(wù)器在IT云建設(shè)中將有更大的應(yīng)用空間。


總體來(lái)看,運(yùn)營(yíng)商IT云資源池建設(shè)對(duì)服務(wù)器計(jì)算性能、延遲、吞吐、制冷、定制化、分布式部署等方面都提出了更高要求。未來(lái),GPU服務(wù)器、定制化整機(jī)柜服務(wù)器、液冷服務(wù)器等新興服務(wù)器技術(shù)將快速迭代,為運(yùn)營(yíng)商數(shù)據(jù)中心服務(wù)器技術(shù)的發(fā)展和演進(jìn)帶來(lái)新的思路和路徑。