omniture

IBM 發(fā)布光學(xué)技術(shù)關(guān)鍵突破,生成式AI迎來"光速時代"

IBM China
2024-12-12 10:00 50410

新的光電共封裝技術(shù)或取代數(shù)據(jù)中心中的電互連裝置,大幅提高AI 和其他計算應(yīng)用的速度與能效

北京2024年12月12日 /美通社/ -- 近日,IBM(紐約證券交易所代碼:IBM)發(fā)布了其在光學(xué)技術(shù)方面的突破性研究成果,有望顯著提高數(shù)據(jù)中心訓(xùn)練和運行生成式 AI 模型的效率。IBM研究人員開發(fā)的新一代光電共封裝 (co-packaged optics,CPO) 工藝,通過光學(xué)技術(shù)實現(xiàn)數(shù)據(jù)中心內(nèi)部的光速連接,為現(xiàn)有的短距離光纜提供了有力補充。通過設(shè)計和組裝首個宣布成功的聚合物光波導(dǎo) (PWG),IBM 研究人員展示了光電共封裝技術(shù)將如何重新定義計算行業(yè)在芯片、電路板和服務(wù)器之間的高帶寬數(shù)據(jù)傳輸。

IBM optics module
IBM optics module

今天,光纖技術(shù)已經(jīng)被廣泛用于遠距離的高速數(shù)據(jù)傳輸,實現(xiàn)了"以光代電"來管理全球幾乎所有的商業(yè)和通信傳輸。雖然數(shù)據(jù)中心的外部通信網(wǎng)絡(luò)已經(jīng)采用光纖,但其內(nèi)部的機架仍然主要使用銅質(zhì)電線進行通信。通過電線連接的 GPU 加速器可能有一半以上的時間處于閑置狀態(tài),在大型分布式訓(xùn)練過程中需要等待來自其他設(shè)備的數(shù)據(jù),導(dǎo)致高昂的成本和能源浪費。

IBM 研究人員發(fā)現(xiàn)了一種將光學(xué)的速度和容量引入數(shù)據(jù)中心的新方法。在其最新發(fā)表的一篇論文中,IBM 展示了其全球首發(fā)、可實現(xiàn)高速光學(xué)連接的光電共封裝原型。這項技術(shù)可大幅提高數(shù)據(jù)中心的通信帶寬,最大限度地減少 GPU 停機時間,同時大幅加快 AI 工作速度。該創(chuàng)新將實現(xiàn)以下新突破:

  • 降低規(guī)?;瘧?yīng)用生成式 AI 的成本:與中距電氣互連裝置相比,能耗降低 5 倍以上,[1]同時將數(shù)據(jù)中心互連電纜的長度從 1 米延長至數(shù)百米。
  • 提高 AI 模型訓(xùn)練速度:與傳統(tǒng)的電線相比,使用光電共封裝技術(shù)訓(xùn)練大型語言模型的速度快近五倍,從而將標準大語言模型的訓(xùn)練時間從三個月縮短到三周;用于更大的模型和更多的 GPU,性能將獲得更大提升。[2]
  • 大幅提高數(shù)據(jù)中心能效:在最新光電共封裝技術(shù)的加持下,每訓(xùn)練一個 AI 模型所節(jié)省的電量,相當于 5000 個美國家庭的年耗電量總和。[3]

IBM 高級副總裁、IBM研究院院長 Dario Gil 表示:"生成式AI需要越來越多的能源和處理能力,數(shù)據(jù)中心必須隨之升級換代,而光電共封裝技術(shù)可以幫助數(shù)據(jù)中心從容面向未來。隨著光電共封裝技術(shù)取得突破,光纖電纜將大幅提升數(shù)據(jù)中心的數(shù)據(jù)傳輸效率,芯片之間的通信、AI工作負載的處理也會更高效,我們將進入一個更高速、更可持續(xù)的新通信時代。"

比現(xiàn)有芯片間通信帶寬快 80 倍
得益于近年芯片技術(shù)的進步,芯片上可以容納更多、更密集的晶體管;比如,IBM 的 2 納米芯片技術(shù)可在單一芯片上植入 500 多億個晶體管。光電共封裝技術(shù)旨在擴大加速器之間的互連密度,幫助芯片制造商在電子模組上添加連接芯片的光通路,從而超越現(xiàn)有電子通路的限制。IBM 的論文所述的新型高帶寬密度光學(xué)結(jié)構(gòu)和其他創(chuàng)新成果,比如,通過每個光通道傳輸多個波長,有望將芯片間的通信帶寬提高至電線連接的 80 倍。

與目前最先進的光電共封裝技術(shù)相比,IBM 的創(chuàng)新成果可以使芯片制造商在硅光子芯片邊緣增加六倍數(shù)量的光纖,即所謂的"鬢發(fā)密度 (beachfront density)"。每根光纖的寬度約為頭發(fā)絲的三倍,長度從幾厘米到幾百米不等,可傳輸每秒萬億比特級別的數(shù)據(jù)。IBM 團隊采用標準封裝工藝,在 50 微米間距的光通道上封裝高密度的聚合物光波導(dǎo) (PWG),并與硅光子波導(dǎo)絕熱耦合。

論文還指出,上述光電共封裝模塊采用50微米間距的聚合物光波導(dǎo),首次通過了制造所需的所有壓力測試。這些模組需要經(jīng)受高濕度環(huán)境、-40°C 至 125°C 的溫度以及機械耐久性測試,以確保光互連裝置即使彎曲,也不會斷裂或丟失數(shù)據(jù)。此外,研究人員還展示了 18 微米間距的聚合物光波導(dǎo)技術(shù):將四個聚合物光波導(dǎo)設(shè)備堆疊在一起,可以實現(xiàn)多達 128 個通道的連接。

IBM 持續(xù)引領(lǐng)半導(dǎo)體技術(shù)研發(fā)
面對日益增長的 AI 性能需求,光電共封裝技術(shù)開創(chuàng)了一條新的通信途徑,并可能取代從電子到光學(xué)的模塊外通信。這一技術(shù)突破延續(xù)了IBM 在半導(dǎo)體創(chuàng)新方面的領(lǐng)導(dǎo)地位,包括全球首個 2 納米芯片技術(shù)、首個 7 納米和 5 納米工藝技術(shù)、納米片晶體管、垂直晶體管 (VTFET)、單芯片 DRAM 和化學(xué)放大光刻膠等。

該項目的設(shè)計、建模和模擬工作在美國紐約州奧爾巴尼完成,其原型組裝和模塊測試則由位于加拿大魁北克省布羅蒙的IBM實驗室承接,后者是北美地區(qū)最大的芯片組裝和測試基地之一。

[1] 從每比特 5 微焦降至不到 1 微焦。

[2] 數(shù)據(jù)基于使用行業(yè)標準 GPU 和互連裝置對 700 億參數(shù)大語言模型的訓(xùn)練。

[3] 數(shù)據(jù)基于使用行業(yè)標準 GPU 和互連裝置對超大型大語言模型(如 GPT-4)的訓(xùn)練。

關(guān)于IBM
IBM 是全球領(lǐng)先的混合云、人工智能及企業(yè)服務(wù)提供商,幫助超過 175 個國家和地區(qū)的客戶,從其擁有的數(shù)據(jù)中獲取商業(yè)洞察,簡化業(yè)務(wù)流程,降低成本,并獲得行業(yè)競爭優(yōu)勢。金融服務(wù)、電信和醫(yī)療健康等關(guān)鍵基礎(chǔ)設(shè)施領(lǐng)域的超過 4000 家政府和企業(yè)實體依靠 IBM 混合云平臺和紅帽 OpenShift 快速、高效、安全地實現(xiàn)數(shù)字化轉(zhuǎn)型。IBM 在人工智能、量子計算、行業(yè)云解決方案和企業(yè)服務(wù)方面的突破性創(chuàng)新為我們的客戶提供了開放和靈活的選擇。對企業(yè)誠信、透明治理、社會責(zé)任、包容文化和服務(wù)精神的長期承諾是 IBM 業(yè)務(wù)發(fā)展的基石。了解更多信息,請訪問:https://www.ibm.com/cn-zh 

媒體聯(lián)絡(luò)人
崔守峰,shou.feng.cui@ibm.com 

IBM Corporation logo.
IBM Corporation logo.
消息來源:IBM China
相關(guān)股票:
NEO:IBM NYSE:IBM
China-PRNewsire-300-300.png
全球TMT
微信公眾號“全球TMT”發(fā)布全球互聯(lián)網(wǎng)、科技、媒體、通訊企業(yè)的經(jīng)營動態(tài)、財報信息、企業(yè)并購消息。掃描二維碼,立即訂閱!
collection