浪潮信息劉軍：AI新時代，智算力就是創(chuàng)新力

浪潮信息

2022-12-20 11:59 4362

北京2022年12月19日 /美通社/ -- 浪潮信息副總裁、浪潮AI&HPC產(chǎn)品線總經(jīng)理劉軍在近日舉行的量子位“MEET2023智能未來大會”上發(fā)表了主題演講《AI新時代，智算力就是創(chuàng)新力》。

在該大會公布的“2022人工智能年度評選”榜單上，浪潮信息獲評為“2022年度人工智能領(lǐng)航企業(yè)”，劉軍獲評為“2022年度人工智能領(lǐng)軍人物”。

以下為劉軍在MEET2023智能未來大會的演講實(shí)錄：

為什么說智算力就是創(chuàng)新力？

當(dāng)今在人工智能前沿領(lǐng)域的大模型，就是在智算算力驅(qū)動下重大創(chuàng)新的典型，比如GPT-3，浪潮“源1.0”等等，這些大模型發(fā)展的背后是算力的極大支撐。

我們提出用“算力當(dāng)量”來對AI任務(wù)所需算力總量進(jìn)行度量，單位是PetaFlops/s-day也就是PD，即用每秒千萬億次的計(jì)算機(jī)完整運(yùn)行一天消耗的算力總量（PD）作為度量單位。一個任務(wù)需要多少PD的計(jì)算量，就把它視為這個任務(wù)的“算力當(dāng)量”。GPT-3的算力當(dāng)量是3640個PD，源1.0是2457億的參數(shù)的大模型，它的算力當(dāng)量是4095個PD。

當(dāng)前元宇宙非常關(guān)注的數(shù)字人的建模和渲染方面，如果要做一個栩栩如生的人物形象的創(chuàng)建和渲染，以《阿麗塔：戰(zhàn)斗天使》來舉例，它平均每一幀需要花100個小時來渲染，總共這部影片的渲染計(jì)算使用了4.32億小時的算力。

在自動駕駛領(lǐng)域，特斯拉創(chuàng)建了DOJO的智算系統(tǒng)，用于感知模型的訓(xùn)練和仿真。它的FSD全自動駕駛系統(tǒng)的融合感知模型，訓(xùn)練消耗的算力當(dāng)量是500個PD。

在備受關(guān)注的AI+Science領(lǐng)域、蛋白質(zhì)的結(jié)構(gòu)預(yù)測、分子動力學(xué)的模擬、流體力學(xué)的仿真，它不僅融合了傳統(tǒng)的HPC計(jì)算也融合了當(dāng)今的AI計(jì)算。比如說，經(jīng)常被提及的AlphaFold2，它的訓(xùn)練消耗的算力當(dāng)量是300個PD。與此同時，為AlphaFold2訓(xùn)練所做的數(shù)據(jù)準(zhǔn)備，需要花費(fèi)200M CPU-hours HPC算力。

我們可以確切地認(rèn)識到，今天在AI領(lǐng)域的眾多創(chuàng)新背后離不開智算力的支撐，可以說智算力就是創(chuàng)新力。

接下來和大家來分享當(dāng)前智算發(fā)展的三個重要的趨勢：算力多元化、模型巨量化以及元宇宙。

算力多元化需要軟硬一體的支撐平臺

第一，算力多元化。Henessy和Patterson在幾年前的《計(jì)算機(jī)架構(gòu)的新黃金時代》中提出了特定領(lǐng)域的體系架構(gòu)Domain Specific Architectures(DSAs)的概念，這也可以用來解釋為什么今天我們會看到這么多的多元算力芯片。

在中國，市場上有十幾種的CPU芯片，有將近一百種AI算力的芯片。為什么會有這樣的需求？今天算力的應(yīng)用場景是多元化的，不同的場景需要不同的計(jì)算精度類型和計(jì)算特征。比如說，高性能計(jì)算里面可能會需要FP64雙精度計(jì)算，AI訓(xùn)練需要使用數(shù)字范圍更大、精度低的16位浮點(diǎn)計(jì)算，AI推理可以使用INT8或者INT4格式。而為適應(yīng)這些計(jì)算的特點(diǎn)，需要我們引入多元的芯片來進(jìn)行支撐。如何從軟件和硬件上來應(yīng)對這樣的挑戰(zhàn)？浪潮信息認(rèn)為，重點(diǎn)是從系統(tǒng)的硬件平臺和軟件角度來進(jìn)行相應(yīng)的創(chuàng)新支撐。

首先是在硬件方面的系統(tǒng)支持，當(dāng)今AI計(jì)算用的非常多的還是采用英偉達(dá)GPU的AI服務(wù)器。但是對于其他品牌的AIPU來說，要用什么樣的一個AI服務(wù)器系統(tǒng)來支撐呢？浪潮信息打造了全球首款開放加速的AI服務(wù)器，在一個系統(tǒng)里能夠支持8顆國內(nèi)最高性能的AI芯片進(jìn)行高速互聯(lián)，從而能夠完成大規(guī)模的模型訓(xùn)練所需要的算力。芯片之間使用了開放加速的接口標(biāo)準(zhǔn)，芯片間可以進(jìn)行高速通信。今天，這個系統(tǒng)已經(jīng)可以支持多個品牌的國內(nèi)最高端的GPU和AIPU，并且已經(jīng)在眾多的客戶場景里面實(shí)現(xiàn)了落地。同時，它還支持先進(jìn)的液冷技術(shù)，使得我們構(gòu)建的AI算力集群的PUE會低于1.1。

作為智算中心的核心，如何來調(diào)度多元的算力？這是一個平臺軟件方面的挑戰(zhàn)，浪潮為此推出了業(yè)界首款智算中心算力調(diào)度軟件AIStation，實(shí)現(xiàn)了對異構(gòu)AI芯片進(jìn)行標(biāo)準(zhǔn)化與流程化管理，不僅能夠充分發(fā)揮多元異構(gòu)芯片的性能潛力，并且能夠提升智算中心的整體效能。從基本的接入適配到業(yè)務(wù)應(yīng)用在異構(gòu)算力的使用優(yōu)化，AIStation提供了完備的工具與解決方案，與傳統(tǒng)開源方案相比，芯片接入穩(wěn)定性方面提升30%，減少接入工作量90%以上。標(biāo)準(zhǔn)化、流程化也使得AIStation在芯片管理種類上達(dá)到了業(yè)界前列，已經(jīng)支持了30多款國內(nèi)外最頂尖的AI芯片，包括X86和ARM等CPU芯片、FPGA芯片，也包括今天應(yīng)用非常廣泛的GPU和AIPU，例如像英偉達(dá)的GPU系列，以及各類國產(chǎn)AIPU等等。

我們做了眾多的實(shí)踐落地，位于宿州的淮海智算中心采用全球領(lǐng)先的“E級AI元腦”智算架構(gòu)，通過開放多元的系統(tǒng)架構(gòu)，在底層基礎(chǔ)設(shè)施層支持通用處理器、通用加速處理器、專用芯片、可編程芯片等，通過AIStation實(shí)現(xiàn)了異構(gòu)算力的調(diào)度，提供FP64、FP32、FP16、INT8等多種精度的計(jì)算類型支持，并支持國內(nèi)外主流的深度學(xué)習(xí)的框架、數(shù)據(jù)庫、數(shù)據(jù)集以降低用戶的學(xué)習(xí)成本。

大模型成為AIGC算法引擎

第二，大模型。大模型正在成為AIGC的算法引擎，今天大家看到的DALL?E或者Stable Diffusion的背后都是大模型在驅(qū)動。大模型使得AI從五年前的”能聽會看”，走到今天“能思考、會創(chuàng)作”，下一步甚至于到“會推理、能決策”的進(jìn)步。但是我們知道大模型帶給我們的是在算力方面巨大的挑戰(zhàn)。如何能夠把大模型的能力交付到眾多的中小企業(yè)中，幫助他們實(shí)現(xiàn)智能化的轉(zhuǎn)型，是我們今天要去解決的重要課題，所以在這方面我們認(rèn)為Model as a Service（MaaS）是比較好的一種方式。

今天，在大模型的能力加持下，AIGC，包括文本生成、文生圖以及虛擬數(shù)字人等應(yīng)用都會快速的進(jìn)入到商業(yè)化階段。

“源1.0”是浪潮去年推出的中文語言巨量模型，擁有2457億參數(shù)，在眾多的評測里面表現(xiàn)出了非常優(yōu)異的成績。團(tuán)隊(duì)圍繞深度學(xué)習(xí)框架、訓(xùn)練集群IO、通信開展了深入優(yōu)化，構(gòu)建了面向大模型的軟硬件協(xié)同體系結(jié)構(gòu)，訓(xùn)練平臺的算力效率達(dá)到45%，這遙遙領(lǐng)先于GPT-3、MT-NLG這樣的大模型。同時，通過在AI編譯器與深度學(xué)習(xí)推理框架上的優(yōu)化，“源”已經(jīng)實(shí)現(xiàn)了對多元AI芯片的支持。

下面分享幾個基于“源1.0”構(gòu)建的實(shí)際應(yīng)用案例：

第一個案例是AI劇本殺。劇本殺是大家比較熟悉的游戲，一位開發(fā)者基于“源1.0”構(gòu)建了一個AI角色來和人類玩劇本殺，玩到最后其他人類玩家都很難察覺到自己是在和AI一起玩劇本殺，因?yàn)锳I在這里面所表現(xiàn)出來的場景理解能力、目的性對話能力是我們在傳統(tǒng)的AI算法上面很難見到的。目前項(xiàng)目已經(jīng)在GitHub上開源，大家感興趣可以嘗試。

第二個案例，上海一個開發(fā)者群體基于“源1.0”構(gòu)建了數(shù)字社區(qū)助理，類似于給我們的居委會打造了一個教練員，通過讓AI模擬來居委會咨詢的居民，提升社區(qū)工作者應(yīng)對居民突發(fā)狀況服務(wù)的能力，這種將大模型反向應(yīng)用于教培領(lǐng)域的案例給AI發(fā)展帶來了更多想象空間。

最近，大家都在討論ChatGPT，簡單來說它就是基于大模型的面向長文本、多輪對話的AIGC應(yīng)用。其實(shí)我們基于“源1.0”也開發(fā)了公文寫作助手?，F(xiàn)在大家希望有個助手來協(xié)助寫總結(jié)報(bào)告、學(xué)習(xí)體會，所以我們希望打造一個寫作助手來幫助大家進(jìn)行長本文創(chuàng)作。其中，我們突破了可控文本內(nèi)容生成技術(shù)，解決了長文本內(nèi)容偏移問題，生成文本的語義一致性高達(dá)96%。這樣的優(yōu)化使得我們的中文寫作助手能夠帶來非常驚艷的效果，目前我們的產(chǎn)品處于內(nèi)測階段，歡迎大家來申請使用。

我們把“源”大模型應(yīng)用在浪潮自己的業(yè)務(wù)上，賦能自身業(yè)務(wù)智能化轉(zhuǎn)型。浪潮信息是中國最大、全球第二的服務(wù)器廠商。我們擁有一個覆蓋非常廣泛的客戶服務(wù)系統(tǒng)，傳統(tǒng)的智能客服更多是基于規(guī)則和提煉的知識來構(gòu)建的問答系統(tǒng)，這樣的問答系統(tǒng)大部分情況下是不能幫客戶滿意地解決問題的。今天基于“源1.0”構(gòu)建的浪潮信息智能客服可以進(jìn)行長文本的內(nèi)容生成，能夠持續(xù)地多輪對話，同時非常重要的是它不僅僅是基于知識規(guī)則而構(gòu)建的問答系統(tǒng)，它可以自己去閱讀和服務(wù)器相關(guān)的產(chǎn)品技術(shù)文檔，我們說它可謂是服務(wù)器的“服務(wù)大腦”，在它的支撐下，浪潮信息的客戶服務(wù)效率得到了大幅的提升，這個項(xiàng)目榮獲了《哈佛商業(yè)評論》鼎革獎，即年度新技術(shù)突破獎。

元宇宙需要強(qiáng)大的算力基礎(chǔ)設(shè)施

第三，元宇宙。大家可能會驚奇元宇宙需要算力嗎？我們告訴大家，元宇宙非常需要算力。元宇宙的構(gòu)建有四個大的作業(yè)環(huán)節(jié)，協(xié)同創(chuàng)建、高精仿真、實(shí)時渲染、智能交互，每一個環(huán)節(jié)上面都需要大量算力做支撐。比如說，在高精仿真的階段，要實(shí)現(xiàn)元宇宙場景中逼真的、符合物理定律的仿真，不僅需要AI計(jì)算，同時還需要HPC算力。在圖形渲染環(huán)節(jié)，不僅傳統(tǒng)的光線追蹤、路徑追蹤等圖像渲染算法需要大量算力，當(dāng)今基于AI的DLSS等算法也需算力支撐。到了最后的智能交互環(huán)節(jié)，今天所看到的數(shù)字人、多輪的語言交互等等，它背后都是基于算力才得以實(shí)現(xiàn)，這就是為什么說元宇宙需要強(qiáng)大的算力支持。

今年浪潮信息推出的MetaEngine元宇宙服務(wù)器就是為了應(yīng)對這樣的算力挑戰(zhàn)，有興趣的可以看下我們?nèi)绾位贛etaEngine來創(chuàng)建虛擬數(shù)字人和數(shù)字孿生的全過程。

為了推動了元宇宙的快速落地，上個月青田人民政府和浪潮信息和我們合作伙伴谷梵科技一起，簽約建設(shè)國內(nèi)首個元宇宙算力中心，用于支撐在青田、浙江乃至于長三角在元宇宙的數(shù)字空間創(chuàng)建、數(shù)字產(chǎn)業(yè)發(fā)展，支撐數(shù)字經(jīng)濟(jì)、數(shù)實(shí)融合的發(fā)展。

我的演講到此結(jié)束。謝謝大家！

消息來源：浪潮信息