omniture

智算中心快速投產(chǎn)高效運(yùn)營(yíng)?42kW風(fēng)冷算力倉(cāng)來助力

2024-09-25 12:14 1552

北京2024年9月25日  /美通社/ -- 步入AI時(shí)代,AI大模型對(duì)基礎(chǔ)設(shè)施的重構(gòu)超乎想象,一方面要滿足大模型訓(xùn)練和推理對(duì)澎湃算力的要求,另一方面則需化解能源消耗造成的運(yùn)營(yíng)壓力??焖俨渴?、超大規(guī)模、超強(qiáng)算力、超低能耗成為下一代智算中心的演進(jìn)方向。浪潮信息42kW智算風(fēng)冷算力倉(cāng)實(shí)現(xiàn)了高密度與低能耗并進(jìn),高算效與高能效齊飛,并使算力部署速度跑贏業(yè)務(wù)上線時(shí)間,助力智算中心快速投產(chǎn)高效運(yùn)營(yíng)。

AI 時(shí)代浪潮下,智算中心建設(shè)面臨三重挑戰(zhàn)

隨著AIGC蓬勃發(fā)展,對(duì)計(jì)算資源的需求呈現(xiàn)出指數(shù)級(jí)增長(zhǎng)。傳統(tǒng)數(shù)據(jù)中心基礎(chǔ)設(shè)施的建設(shè)速度難以跟上AI算力需求增長(zhǎng)的速度。同時(shí),傳統(tǒng)機(jī)房由于單柜功率低、網(wǎng)絡(luò)及場(chǎng)地環(huán)境差,改造復(fù)雜,同樣難以滿足智算中心快速建設(shè)和算力服務(wù)快速上線的需求。

另一方面,算力需求猛增導(dǎo)致服務(wù)器單機(jī)功耗以及單機(jī)柜功率密度不斷攀升,傳統(tǒng)數(shù)據(jù)中心單機(jī)柜功率多為3~7kW,而每臺(tái)AI服務(wù)器的功耗現(xiàn)在已超過10kW,這意味著1臺(tái)AI服務(wù)器需要占用兩個(gè)機(jī)柜的電力和散熱資源,機(jī)柜資源、機(jī)房空間嚴(yán)重浪費(fèi),智算中心需要實(shí)現(xiàn)更高算力密度的部署,并解決隨之而來的如何在有限空間內(nèi)實(shí)現(xiàn)高效散熱和供電的難題。

同時(shí),AI算力發(fā)展也使得智算中心的能耗問題更加突出。國(guó)家相關(guān)政策對(duì)數(shù)據(jù)中心PUE進(jìn)行了嚴(yán)格限制要求,提出2025年底,新建/改擴(kuò)建大型及超大型數(shù)據(jù)中心PUE不超過1.25,算力樞紐節(jié)點(diǎn)PUE不超過1.2。當(dāng)場(chǎng)地限制不具備液冷部署條件時(shí),如何實(shí)現(xiàn)高密風(fēng)冷智算中心的高效散熱、節(jié)能降碳是亟需解決的難題。

創(chuàng)新42kW智算風(fēng)冷算力倉(cāng)快速建成"高密低耗"智算中心

為解決AI時(shí)代智算中心建設(shè)面臨的高密度部署、高功率散熱挑戰(zhàn),實(shí)現(xiàn)高密度與低能耗齊頭并進(jìn),能投天府云和浪潮信息創(chuàng)新開發(fā)42kW智算風(fēng)冷算力倉(cāng)解決方案,以AI算力為核心,兼容國(guó)內(nèi)外主流的CPU和異構(gòu)加速芯片,集計(jì)算/存儲(chǔ)/網(wǎng)絡(luò)于一體,高效融合機(jī)柜、配電、UPS、空調(diào)、監(jiān)控、消防等系統(tǒng),極大提升智算中心建設(shè)交付速度,是為AI服務(wù)器量身定制的支持高算力密度部署的新一代智算基礎(chǔ)設(shè)施。

  • 快速交付帶來"省時(shí)",智算中心建設(shè)周期縮短70%。采用高度集成系統(tǒng)設(shè)備,模塊化設(shè)計(jì)、積木式建設(shè)、去工程化安裝等方法,例如出廠集成冷熱通道,無需施工搭建傳統(tǒng)風(fēng)冷通道件,計(jì)算/存儲(chǔ)/網(wǎng)絡(luò)按需擴(kuò)容等,實(shí)現(xiàn)AI服務(wù)器+數(shù)據(jù)中心基礎(chǔ)設(shè)施一體化交付。
  • 高密部署促成"省地",大幅提升智算中心算力密度。單機(jī)柜功率密度從3~7kW提升至42kW,意味著比傳統(tǒng)數(shù)據(jù)中心減少40%模塊部署量和60%建設(shè)用地。而高密部署必然要實(shí)現(xiàn)高密散熱,當(dāng)單柜功率密度提升至8~10倍后,如何解決風(fēng)冷散熱問題,智算風(fēng)冷算力倉(cāng)一方面采用封閉冷熱通道,避免傳統(tǒng)大空間彌漫式送風(fēng)導(dǎo)致的風(fēng)量處理不集中及冷量散失問題,實(shí)現(xiàn)冷量100%利用;另一方面,獨(dú)創(chuàng)空調(diào)雙群控策略,嵌套兩組輪巡調(diào)控算法,避免因單臺(tái)空調(diào)設(shè)備故障或輪巡休眠出現(xiàn)的局部熱點(diǎn)超溫問題,提升系統(tǒng)可靠性的同時(shí)將制冷系統(tǒng)能效比提升逾10%。
  • 高效節(jié)能造就"省電",給智算中心卸下重負(fù)。供配電系統(tǒng)創(chuàng)新采用全功率簡(jiǎn)鏈路供電+高效UPS一體設(shè)計(jì),實(shí)現(xiàn)兆瓦級(jí)一體解決方案,供電效率大幅提升,有效降低電能損耗30%以上,風(fēng)冷散熱PUE能降至1.25以下。
  • 安全智能引致"省心",為智算中心運(yùn)營(yíng)吃下定心丸。采用浪潮信息InManage+動(dòng)環(huán)融合創(chuàng)新平臺(tái),解決兩套獨(dú)立軟件平臺(tái)數(shù)據(jù)不互通的問題,實(shí)現(xiàn)了智算中心統(tǒng)一納管,并進(jìn)行高密單排微模塊2D/3D可視化、核心制冷部件遠(yuǎn)程調(diào)控等5大功能創(chuàng)新,實(shí)現(xiàn)智算中心智能管理、精準(zhǔn)運(yùn)維,安全可靠性提升30%;采用AIStation智能業(yè)務(wù)生產(chǎn)創(chuàng)新平臺(tái),還能有效提升大模型算力平臺(tái)的使用效率,助力客戶加速AI大模型開發(fā)與部署。

42kW風(fēng)冷智算算力倉(cāng)一經(jīng)推出便廣受客戶青睞,短短1個(gè)季度內(nèi)就實(shí)現(xiàn)了規(guī)模化應(yīng)用,以天府智算西南算力中心為樣板,打造為AI而生的新一代智算中心。在天府智算西南算力中心,國(guó)內(nèi)首款42kW智算風(fēng)冷算力倉(cāng)投運(yùn),"高密度、低能耗"雙管齊下,智算中心實(shí)現(xiàn)算效、能效雙提升,作為成渝樞紐的重要組成部分,為人工智能產(chǎn)業(yè)發(fā)展提供優(yōu)質(zhì)算力支撐。

消息來源:浪潮信息
China-PRNewsire-300-300.png
全球TMT
微信公眾號(hào)“全球TMT”發(fā)布全球互聯(lián)網(wǎng)、科技、媒體、通訊企業(yè)的經(jīng)營(yíng)動(dòng)態(tài)、財(cái)報(bào)信息、企業(yè)并購(gòu)消息。掃描二維碼,立即訂閱!
collection