北京2024年4月10日 /美通社/ -- 步入AIGC時(shí)代,尤其是類似OpenAI Sora文生視頻工具的普及,算力需求呈指數(shù)級(jí)增長(zhǎng)。大模型訓(xùn)練、推理和實(shí)時(shí)交互等均需要更多算力的支撐,預(yù)計(jì)數(shù)據(jù)中心、智算中心將迎來更快發(fā)展。高算力往往也伴隨著高能耗,數(shù)據(jù)中心及服務(wù)器面臨的高能效挑戰(zhàn)越發(fā)突出,如何在提供高算力的同時(shí),實(shí)現(xiàn)節(jié)能降耗?針對(duì)液冷散熱、供電等高能效技術(shù)領(lǐng)域的研究與實(shí)踐備受關(guān)注。
近日,由OCP中國(guó)社區(qū)、開放計(jì)算標(biāo)準(zhǔn)工作委員會(huì)(OCTC)主辦,浪潮信息承辦的 "數(shù)據(jù)中心高能效研究與實(shí)踐(液冷、供電等)" 第11期開放計(jì)算技術(shù)沙龍?jiān)诰┏晒εe行。本期沙龍由OCP中國(guó)社區(qū)負(fù)責(zé)人葉毓睿牽頭組織,OCTC專項(xiàng)技術(shù)專家張斌主持,匯集來自O(shè)PPO、英特爾、維諦、浪潮信息等產(chǎn)學(xué)研用領(lǐng)域相關(guān)專家代表,圍繞可持續(xù)架構(gòu)設(shè)計(jì)、負(fù)壓液冷技術(shù)、整機(jī)柜/智算中心液冷、冷電聯(lián)動(dòng)、供電系統(tǒng)演進(jìn)等話題方向,共同探討數(shù)據(jù)中心和服務(wù)器液冷散熱及供電技術(shù)的創(chuàng)新發(fā)展與實(shí)踐。
OCTC秘書長(zhǎng)陳海在會(huì)上發(fā)言表示,隨著數(shù)據(jù)要素、數(shù)據(jù)資產(chǎn)、數(shù)據(jù)基礎(chǔ)設(shè)施等一系列政策出臺(tái),數(shù)據(jù)中心的能源消耗和環(huán)境影響日益受到社會(huì)各界的廣泛關(guān)注。推動(dòng)數(shù)據(jù)中心的開放、創(chuàng)新和可持續(xù)發(fā)展是OCTC的一項(xiàng)重要任務(wù)。"提高數(shù)據(jù)中心的能效不僅是實(shí)現(xiàn)綠色發(fā)展的重要途徑,也是提升整個(gè)行業(yè)競(jìng)爭(zhēng)力的關(guān)鍵所在。"通過采用先進(jìn)的制冷技術(shù)、優(yōu)化能源管理、利用人工智能和機(jī)器學(xué)習(xí)等創(chuàng)新手段,可以有效降低數(shù)據(jù)中心的能耗,實(shí)現(xiàn)更高效的能源利用。同時(shí),這也需要聯(lián)合產(chǎn)業(yè)鏈上下游在標(biāo)準(zhǔn)制定、技術(shù)研究、產(chǎn)品開發(fā)和市場(chǎng)應(yīng)用等多個(gè)層面進(jìn)行深入合作,共同探索和實(shí)踐。
主持人張斌在開場(chǎng)分享中提到,整機(jī)柜服務(wù)器和液冷散熱方案是數(shù)據(jù)中心高能效的有效技術(shù)路徑,但這些技術(shù)方案的廣泛應(yīng)用和推廣需要一個(gè)成熟的生態(tài)系統(tǒng)作為支撐,這包括技術(shù)標(biāo)準(zhǔn)、設(shè)備兼容性、維護(hù)流程等各個(gè)方面的標(biāo)準(zhǔn)化。標(biāo)準(zhǔn)化建設(shè)是整機(jī)柜服務(wù)器和液冷生態(tài)系統(tǒng)完善的核心。通過制定統(tǒng)一的技術(shù)規(guī)范和操作流程,可以促進(jìn)不同廠商之間的設(shè)備和服務(wù)解耦,使得數(shù)據(jù)中心能夠靈活選擇和集成各種整機(jī)柜服務(wù)器和液冷解決方案。這種解耦不僅降低了數(shù)據(jù)中心高能效新型技術(shù)方案的門檻,還激發(fā)了市場(chǎng)創(chuàng)新,吸引了更多企業(yè)的參與和投資,進(jìn)而推動(dòng)了整個(gè)產(chǎn)業(yè)的繁榮發(fā)展。
在主題演講環(huán)節(jié),英特爾(中國(guó))首席工程師張駿分享了"可持續(xù)計(jì)算:人工智能時(shí)代新型計(jì)算范式的可持續(xù)演進(jìn)"。他指出,在人工智能時(shí)代,可持續(xù)計(jì)算涵蓋智能、安全、異構(gòu)等新型計(jì)算范式的處理器、平臺(tái),系統(tǒng)以及全棧解決方案,涉及電力、可再生能源和智能算力融合運(yùn)用的性能、效能及模型等資源的優(yōu)化策略算法,硬件設(shè)備和基礎(chǔ)設(shè)施的全生命周期智能管控及其供電和散熱先進(jìn)技術(shù),可彈性擴(kuò)展的軟件架構(gòu)設(shè)計(jì)等,實(shí)現(xiàn)碳優(yōu)化計(jì)算,有效應(yīng)對(duì)大規(guī)模人工智能部署帶來的能源和資源危機(jī)挑戰(zhàn)。
綠色算力開啟了人類智能時(shí)代的新篇章,當(dāng)算力成為新的生產(chǎn)力基礎(chǔ)時(shí),算力、算效和能效的并行高速發(fā)展就成為必然。維諦研發(fā)總監(jiān)張迪發(fā)表了"綠色算力時(shí)代基礎(chǔ)設(shè)施冷電融合技術(shù)探討"主題演講。他表示,綠色算力要求電力具備更多的配電靈活度、綠電融合能力和電網(wǎng)支撐彈性;制冷將從風(fēng)冷逐步轉(zhuǎn)化成直達(dá)芯片的高效全鏈路液冷。在此過程中,人工智能也將在用能的自主調(diào)控方面發(fā)揮優(yōu)勢(shì)。
在"雙碳"目標(biāo)下,液冷技術(shù)憑借散熱效率高、能耗小,可實(shí)現(xiàn)高密度高能耗散熱等優(yōu)勢(shì)成為新型數(shù)據(jù)中心的重要選擇。OPPO算力資源負(fù)責(zé)人唐虎分享了"液冷的前提假設(shè)與產(chǎn)業(yè)挑戰(zhàn)"。他表示,摩爾定律的指數(shù)級(jí)增長(zhǎng)已難以為繼,隨著大模型智慧計(jì)算的發(fā)展,能源與散熱成為難解之題。"我們知道服務(wù)器即使在空閑模式,仍然有40%以上的功耗,我們需要有效使用這些功耗。"從數(shù)據(jù)中心內(nèi)部來說,需要從過去 "基于性能解熱"導(dǎo)向改變?yōu)?quot;基于散熱提高性能"導(dǎo)向;從數(shù)據(jù)中心外部來說,需要從"排熱"導(dǎo)向改變?yōu)?quot;用熱"導(dǎo)向。
浪潮信息數(shù)據(jù)中心技術(shù)專家劉廣志、朱亮、王令巖分別就"負(fù)壓液冷技術(shù)與實(shí)踐"、"液冷快接頭UQD(Universal Quick Disconnect)標(biāo)準(zhǔn)化"、"數(shù)據(jù)中心及服務(wù)器供電系統(tǒng)演進(jìn)與實(shí)踐"等主題進(jìn)行了精彩分享。劉廣志指出,隨著液冷技術(shù)在數(shù)據(jù)中心的日益普及,節(jié)能降耗的同時(shí)也帶來了不少安全隱患。負(fù)壓液冷技術(shù)革新了數(shù)據(jù)中心冷卻循環(huán)動(dòng)力單元,實(shí)現(xiàn)冷卻液運(yùn)行壓力低于大氣壓,確保管路即使截?cái)嘁膊话l(fā)生泄露,是一種高可靠、高安全的液冷應(yīng)用技術(shù),有效解決了用戶關(guān)注的漏液痛點(diǎn)。
同時(shí),隨著液冷技術(shù)的快速發(fā)展,液冷標(biāo)準(zhǔn)化成為業(yè)界共同的需求。朱亮表示,液冷快接頭做為液冷系統(tǒng)中的關(guān)鍵部件,標(biāo)準(zhǔn)化程度不夠。不但給液冷用戶造成了建設(shè)和升級(jí)不便,更影響液冷系統(tǒng)的解耦及產(chǎn)業(yè)化推廣。浪潮信息牽頭與行業(yè)伙伴一起,共同推進(jìn)液冷快接頭標(biāo)準(zhǔn)化工作,助力液冷技術(shù)的可持續(xù)發(fā)展。
從供電角度看,在算力芯片到服務(wù)器以及整機(jī)柜的系統(tǒng)功耗和電流急劇增長(zhǎng)的背景下,王令巖詳細(xì)分享了以整機(jī)柜為底座的高壓直流母線供備電架構(gòu)的解決方向,服務(wù)器供電系統(tǒng)內(nèi)的48伏供電架構(gòu)及高效VR供電技術(shù),以及千安級(jí)負(fù)載大電流的垂直供電技術(shù)等解決思路。
在最后的"綠色高效數(shù)據(jù)中心的創(chuàng)新與實(shí)踐"圓桌討論環(huán)節(jié),各位嘉賓分別從技術(shù)、市場(chǎng)等方面分享了數(shù)據(jù)中心制冷、供電等相關(guān)領(lǐng)域的創(chuàng)新思考與展望,并與現(xiàn)場(chǎng)觀眾進(jìn)行了熱烈探討與交流。