北京2021年11月17日 /美通社/ -- 日前,亞馬遜云科技宣布Amazon Elastic Compute Cloud (Amazon EC2) DL1實例正式可用,這是一種專為訓(xùn)練機(jī)器學(xué)習(xí)模型而設(shè)計的新實例類型。Amazon EC2 DL1實例由來自Habana Labs 的Gaudi加速器提供支持,與當(dāng)前基于GPU的Amazon EC2實例相比,其機(jī)器學(xué)習(xí)模型訓(xùn)練性價比提高40%。借助Amazon EC2 DL1實例,客戶可以針對自然語言處理、對象檢測和分類、欺詐檢測、推薦和個性化引擎、智能文檔處理、業(yè)務(wù)預(yù)測等工作負(fù)載進(jìn)行優(yōu)化,更快、更經(jīng)濟(jì)高效地訓(xùn)練他們的機(jī)器學(xué)習(xí)模型。Amazon EC2 DL1實例可通過低成本的即用即付模式按需提供,無需預(yù)付費(fèi)用。
機(jī)器學(xué)習(xí)正成為主流,在云中大規(guī)模部署機(jī)器學(xué)習(xí)模型,已經(jīng)對企業(yè)的業(yè)務(wù)產(chǎn)生了實際的影響。要在其業(yè)務(wù)應(yīng)用中使用機(jī)器學(xué)習(xí),客戶需要從構(gòu)建和訓(xùn)練模型開始,通過從樣本數(shù)據(jù)中學(xué)習(xí)來識別模式,然后再將模型應(yīng)用于新數(shù)據(jù),進(jìn)行預(yù)測。例如,基于大量呼叫中心通話記錄而訓(xùn)練的機(jī)器學(xué)習(xí)模型,可以做出預(yù)測來通過聊天對話機(jī)器人為客戶提供實時個性化幫助。為了提高模型的預(yù)測準(zhǔn)確性,數(shù)據(jù)科學(xué)家和機(jī)器學(xué)習(xí)工程師正在構(gòu)建越來越大且復(fù)雜的模型。為了保持模型的預(yù)測準(zhǔn)確性和高質(zhì)量,工程師們需要經(jīng)常調(diào)整和重新訓(xùn)練模型。這需要大量的高性能計算資源,導(dǎo)致基礎(chǔ)設(shè)施成本增加。這些成本可能讓客戶無法以維持高精度預(yù)測所需的頻率重新訓(xùn)練模型,同時也給想要開始試驗機(jī)器學(xué)習(xí)的客戶帶來阻礙。
全新Amazon EC2 DL1實例使用專為加速機(jī)器學(xué)習(xí)模型訓(xùn)練而構(gòu)建的Gaudi加速器,與通用GPU相比,它以更低的成本提供更高的計算效率。DL1實例配備多達(dá)8個Gaudi加速器、256GB 高帶寬內(nèi)存、768GB系統(tǒng)內(nèi)存、定制的第二代英特爾至強(qiáng)可擴(kuò)展(Cascade Lake)處理器、400Gbps的網(wǎng)絡(luò)吞吐量和4TB的本地NVMe存儲。這些創(chuàng)新疊加,比當(dāng)前用于機(jī)器學(xué)習(xí)常見模型訓(xùn)練的基于GPU的Amazon EC2實例的性價比提高40%??蛻艨梢允褂门c主流機(jī)器學(xué)習(xí)框架(如TensorFlow和PyTorch)集成的Habana SynapseAI SDK快速輕松地開始使用DL1實例,只需更改少量代碼,即可將其當(dāng)前在基于GPU或基于CPU的實例上運(yùn)行的機(jī)器學(xué)習(xí)模型無縫遷移到DL1實例進(jìn)行訓(xùn)練。開發(fā)人員和數(shù)據(jù)科學(xué)家還可以從Habana GitHub存儲庫中提供的針對Gaudi加速器優(yōu)化的參考模型開始,其中包括適用于各種應(yīng)用程序的流行模型,包括圖像分類、對象檢測、自然語言處理和推薦系統(tǒng)。
亞馬遜云科技Amazon EC2副總裁David Brown表示:“機(jī)器學(xué)習(xí)的使用正在激增。然而,機(jī)器學(xué)習(xí)模型訓(xùn)練的一大挑戰(zhàn)是計算密集型負(fù)載,同時隨著客戶不斷改進(jìn)和重新訓(xùn)練模型,成本也會變高。亞馬遜云科技為任何機(jī)器學(xué)習(xí)項目或應(yīng)用程序提供了廣泛而強(qiáng)大的計算選項。采用Gaudi加速器的DL1實例為云中基于GPU的實例提供了迄今為止最具性價比的替代方案。這一價格和性能的最佳組合讓客戶可以降低訓(xùn)練成本,訓(xùn)練更多模型并加快創(chuàng)新速度?!?/p>
客戶可以使用Amazon Deep Learning AMI、Amazon Elastic Kubernetes Service (Amazon EKS) 或Amazon Elastic Container Service (Amazon ECS) 為容器化應(yīng)用程序啟動DL1實例。通過Amazon SageMaker訪問DL1實例,客戶基于托管服務(wù)的體驗,讓開發(fā)人員和數(shù)據(jù)科學(xué)家在云端構(gòu)建、訓(xùn)練機(jī)器學(xué)習(xí)模型,以及在云端和邊緣端部署,變得更加輕松和快捷。DL1實例受益于Amazon Nitro系統(tǒng),可將許多傳統(tǒng)虛擬化功能卸載到專用硬件和軟件,以提供高性能、高可用性和高安全性,同時降低虛擬化開銷。DL1實例可作為按需實例、通過Saving Plans、預(yù)留實例或Spot實例購買。DL1實例目前已在美國東部(弗吉尼亞北部)和美國西部(俄勒岡)區(qū)域正式可用。
希捷科技40多年來一直是提供數(shù)據(jù)存儲和管理解決方案的全球領(lǐng)導(dǎo)者。希捷的數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)工程師已經(jīng)構(gòu)建了一個先進(jìn)的深度學(xué)習(xí)(DL)缺陷檢測系統(tǒng),并將其部署在公司的全球制造設(shè)施中。在最近的概念驗證項目中,Habana Gaudi超越了Seagate當(dāng)前訓(xùn)練一個用于生產(chǎn)的DL語義分割模型的性能目標(biāo)。“我們期待由Habana Gaudi加速器提供支持的Amazon EC2 DL1實例帶來的顯著性價比優(yōu)勢,希望該實例成為亞馬遜云科技計算集群的有力補(bǔ)充?!毕=葸\(yùn)營、技術(shù)和高級分析高級工程總監(jiān)Darrell Louder表示:“隨著Habana Labs不斷發(fā)展并覆蓋更多的運(yùn)營者,將Amazon EC2 DL1擴(kuò)展到更多企業(yè)用例的潛力巨大,從而能夠進(jìn)一步節(jié)省成本?!?/p>
英特爾開發(fā)了3D運(yùn)動員跟蹤技術(shù),可實時分析運(yùn)動員的動作視頻,為訓(xùn)練過程表現(xiàn)提供信息,并增強(qiáng)比賽期間的觀眾體驗?!霸谟蒆abana Gaudi加速器提供支持的Amazon EC2 DL1實例上訓(xùn)練模型,讓我們可以準(zhǔn)確可靠地處理數(shù)千個視頻并生成相關(guān)性能數(shù)據(jù),同時降低訓(xùn)練成本?!庇⑻貭栦N售與市場營銷集團(tuán)副總裁Rick Echevarria表示,“通過使用DL1實例,可以滿足我們高速度和低成本的模型訓(xùn)練需求,為各類運(yùn)動以及各個級別的運(yùn)動員、團(tuán)隊和廣播公司提供高效的服務(wù)?!?/p>
Riskfuel為管理金融投資組合的公司提供實時估值和風(fēng)險敏感評估,幫助他們提高交易準(zhǔn)確性和績效表現(xiàn)。Riskfuel首席執(zhí)行官Ryan Ferguson表示:“有兩個因素吸引我們使用基于Habana Gaudi AI加速器的Amazon EC2 DL1實例。首先,我們希望確保銀行和保險客戶能夠運(yùn)行Riskfuel模型以充分利用最新硬件。我們發(fā)現(xiàn),只需更改幾行代碼,即可將模型簡單直接的遷移到DL1實例。其次,模型訓(xùn)練成本是支出的重要組成部分,DL1實例性價比提升40%,為我們帶來了潛在的實質(zhì)性收益?!?/p>
引領(lǐng)風(fēng)向,重塑未來 2021亞馬遜云科技re:Invent全球大會即將開啟
備受業(yè)界關(guān)注的2021亞馬遜云科技re:Invent全球大會,將于2021年11月29日(當(dāng)?shù)貢r間)在美國盛大開啟。始于2012年的亞馬遜云科技re:Invent全球大會是全球云計算領(lǐng)域領(lǐng)先的行業(yè)盛會。今年正值re:Invent全球大會十周年,亞馬遜云科技將發(fā)布一系列重塑未來的創(chuàng)新技術(shù)和服務(wù),并邀請全球各行各業(yè)的客戶及亞馬遜云科技合作伙伴分享前沿商業(yè)創(chuàng)新實踐,繼續(xù)引領(lǐng)云技術(shù)和產(chǎn)業(yè)未來發(fā)展的風(fēng)向。本次大會將進(jìn)行同步線上直播,詳情可關(guān)注亞馬遜云科技官方微信。