亞馬遜云科技宣布Amazon EC2 P5e 實例正式可用

亞馬遜云科技

2024-09-18 14:00 1791

北京2024年9月18日 /美通社/ -- 亞馬遜云科技宣布由英偉達H200 GPU提供支持的 Amazon Elastic Compute Cloud P5e（Amazon EC2 P5e）實例現(xiàn)已正式可用。亞馬遜云科技是首個將英偉達H200 GPU用于生產(chǎn)環(huán)境的領先云提供商。與基于英偉達H100 GPU的Amazon EC2 P5實例相比，Amazon EC2 P5e實例GPU內(nèi)存容量提升1.7倍，GPU內(nèi)存寬帶提升1.5倍。Amazon EC2 P5e非常適用于復雜的大型語言模型(LLM)和多模態(tài)基礎模型(FM)的訓練、微調(diào)和推理，用于支持最苛刻和計算密集型的生成式AI應用，如問答、代碼生成、視頻和圖像生成、語音識別等。

Amazon EC2 P5e實例提供8個英偉達H200 GPU，具有1128GB高帶寬GPU內(nèi)存，同時提供第三代AMD EPYC處理器，2TB系統(tǒng)內(nèi)存和30TB本地NVMe存儲。Amazon EC2 P5e實例還提供 3,200 Gbps的聚合網(wǎng)絡帶寬并支持GPUDirect RDMA，從而能夠繞過CPU進行節(jié)點間通信，實現(xiàn)更低的延遲和高效的橫向擴展性能。Amazon EC2 P5e實例具有的更高的內(nèi)存帶寬、更大的GPU內(nèi)存容量和對更大的batch sizes的支持，從而顯著提升客戶工作負載的性能、降低成本并簡化運營。

Amazon EC2 P5e實例現(xiàn)已可通過Amazon EC2 Capacity Block for ML工具訪問并在美國東部(俄亥俄州)區(qū)域正式可用。

此外，亞馬遜云科技還宣布將推出Amazon EC2 P5en實例，通過將英偉達H200 GPU與定制的第四代英特爾Xeon可擴展處理器相結合支持PCle Gen5，將提供高達四倍的CPU和GPU之間的帶寬，降低網(wǎng)絡延遲，進一步提高工作負載性能。

消息來源：亞馬遜云科技