北京2022年6月24日 /美通社/ -- 近幾年,“AI大模型”儼然是AI界的“當(dāng)紅明星”,從國(guó)外的谷歌、微軟、英偉達(dá),到國(guó)內(nèi)的浪潮信息、阿里、百度,都在不遺余力的布局AI大模型,而AI大模型的參數(shù)量更是屢創(chuàng)新高。
AI大模型究竟有什么魔力能吸引如此關(guān)注?AI大模型的產(chǎn)業(yè)應(yīng)用價(jià)值有多大?產(chǎn)業(yè)化道路是布滿荊棘還是一路坦途?
近期,浪潮信息AI軟件研發(fā)總監(jiān)吳韶華博士和復(fù)旦大學(xué)管理學(xué)院張誠(chéng)教授受財(cái)聯(lián)社邀請(qǐng)做客鯨平臺(tái)直播間,與財(cái)聯(lián)社科創(chuàng)板日?qǐng)?bào)記者黃心怡就AI大模型與人工智能產(chǎn)業(yè)發(fā)展的關(guān)系展開了一場(chǎng)高端對(duì)話。
一訓(xùn)多能的算法基礎(chǔ)設(shè)施
AI大模型的出現(xiàn),讓很多產(chǎn)業(yè)人士認(rèn)為這項(xiàng)技術(shù)會(huì)改變信息產(chǎn)業(yè)格局,即基于數(shù)據(jù)的互聯(lián)網(wǎng)時(shí)代、基于算力的云計(jì)算時(shí)代之后,將進(jìn)入基于大模型的AI時(shí)代。在未來(lái),人工智能像供水供電一樣流向終端,流向用戶、流向企業(yè),誰(shuí)能先做到這點(diǎn),誰(shuí)就會(huì)在AI產(chǎn)業(yè)布局中獲得先發(fā)優(yōu)勢(shì)。
什么是AI大模型?吳韶華博士從技術(shù)角度給出解釋,AI大模型是“人工智能預(yù)訓(xùn)練大模型”的簡(jiǎn)稱,包含了“預(yù)訓(xùn)練”和“大模型”兩層含義,二者結(jié)合產(chǎn)生了一種新的人工智能模式,即模型在大規(guī)模數(shù)據(jù)集上完成了預(yù)訓(xùn)練后無(wú)需微調(diào),或僅需要少量數(shù)據(jù)的微調(diào),就能直接支撐各類應(yīng)用。例如浪潮信息于去年9月推出的2457億參數(shù)的大模型“源 1.0”,一個(gè)模型就能提供聊天、對(duì)話、知識(shí)問(wèn)答、寫作等各類應(yīng)用。
張誠(chéng)教授從應(yīng)用角度指出,大模型與訓(xùn)練數(shù)據(jù)、預(yù)訓(xùn)練等構(gòu)成了AI的基礎(chǔ)架構(gòu),這種基礎(chǔ)架構(gòu)即浪潮信息提出的“算法基礎(chǔ)設(shè)施”,在此基礎(chǔ)上,可以支持算法更高效地融入當(dāng)前企業(yè)各類業(yè)務(wù)所使用的工具軟件,形成算法應(yīng)用價(jià)值的商業(yè)變現(xiàn)。
大模型加速AI產(chǎn)業(yè)化進(jìn)程
當(dāng)前人工智能落地面臨長(zhǎng)尾場(chǎng)景應(yīng)用的“碎片化”和應(yīng)用開發(fā)的“高門檻”等挑戰(zhàn),而AI大模型是解決AI產(chǎn)業(yè)化應(yīng)用痛點(diǎn)的一劑良方。
吳韶華博士提出,AI大模型將對(duì)AI模型的構(gòu)建及應(yīng)用產(chǎn)生極大影響,它會(huì)將傳統(tǒng)煙囪式的、碎片化的AI應(yīng)用開發(fā)轉(zhuǎn)向集中式開發(fā)。一方面AI大模型具備很好的泛化能力,一個(gè)模型可以支撐各類不同應(yīng)用,有效緩解碎片化開發(fā)反復(fù)建模的困境;另一方面,圍繞AI大模型構(gòu)建的算法基礎(chǔ)設(shè)施,比如浪潮“源1.0”大模型開放的API、開源的應(yīng)用代碼等,使開發(fā)者無(wú)需關(guān)心底層技術(shù),設(shè)置無(wú)需配置編程環(huán)境,就可以直接將應(yīng)用構(gòu)建于AI大模型的能力之上,在降低開發(fā)門檻的同時(shí),讓開發(fā)人員能夠?qū)⒏嗟木劢购诵臉I(yè)務(wù)邏輯。
張誠(chéng)教授則認(rèn)為,AI大模型代表了人工智能技術(shù)向產(chǎn)品化、產(chǎn)業(yè)化落地的趨勢(shì),這個(gè)趨勢(shì)的持續(xù)發(fā)展會(huì)深刻改變產(chǎn)業(yè)格局。同時(shí),人們對(duì)AI的認(rèn)知、行業(yè)對(duì)其能力的評(píng)估都將越來(lái)越體系化。
AI大模型的“先天優(yōu)勢(shì)”為其加速AI產(chǎn)業(yè)化發(fā)展奠定了基礎(chǔ)。在數(shù)字經(jīng)濟(jì)的未來(lái),AI大模型以及包含大模型在內(nèi)的人工智能模型,憑借優(yōu)秀的數(shù)據(jù)價(jià)值挖掘能力,較高的應(yīng)用智能化水平,將會(huì)成為數(shù)字經(jīng)濟(jì)的智能化核心,甚至?xí)蔀閿?shù)字經(jīng)濟(jì)中的智能大腦。
當(dāng)然,AI大模型的發(fā)展也并非一蹴而就的。吳韶華博士指出,AI大模型的構(gòu)建,首先需要大規(guī)模、高質(zhì)量數(shù)據(jù)集的支撐,數(shù)據(jù)集的質(zhì)量很大程度上決定了模型的質(zhì)量。在大規(guī)模高質(zhì)量數(shù)據(jù)集上,目前不但缺少相關(guān)配套軟件,也缺少數(shù)據(jù)集質(zhì)量評(píng)測(cè)標(biāo)準(zhǔn);其次還有模型算法以及訓(xùn)練算力等方面的挑戰(zhàn)。張誠(chéng)教授則認(rèn)為,當(dāng)前AI大模型和企業(yè)提升勞動(dòng)效率需求的結(jié)合是最大的挑戰(zhàn),也就是如何讓AI大模型在生產(chǎn)中真正發(fā)揮生產(chǎn)力作用。
挑戰(zhàn)只是暫時(shí)的,AI大模型代表了人工智能技術(shù)發(fā)展的方向。吳韶華博士和張誠(chéng)教授堅(jiān)信,AI大模型會(huì)在技術(shù)上產(chǎn)生更多的突破,也會(huì)對(duì)應(yīng)用的規(guī)模化落地產(chǎn)生更好的促進(jìn)作用。
采訪實(shí)錄
黃心怡:請(qǐng)談?wù)剬?duì)AI大模型的理解。
吳韶華:AI大模型的出現(xiàn)帶來(lái)一種新的現(xiàn)象,它將AI應(yīng)用的開發(fā)從碎片化、煙囪式的開發(fā),轉(zhuǎn)變成集中式開發(fā),這種開發(fā)范式的變化,有望緩解當(dāng)前人工智能落地難的問(wèn)題,更好的賦能人工智能應(yīng)用創(chuàng)新。
張誠(chéng):我們可以把人工智能到商業(yè)應(yīng)用看成上下游的關(guān)系,上游對(duì)機(jī)器學(xué)習(xí)模型進(jìn)行很好的預(yù)訓(xùn)練,做成更扎實(shí)的“半成品”,幫助下游落時(shí)更好地把注意力放到商業(yè)問(wèn)題的優(yōu)化上,這樣算法的商業(yè)應(yīng)用就會(huì)更快、更有效。比如,AI大模型因?yàn)槠渥陨砭哂械募嫒菪阅苓m應(yīng)更多場(chǎng)景,同時(shí)大模型做到了相對(duì)標(biāo)準(zhǔn)化,下游可以降低對(duì)算法的使用成本,以及和商業(yè)問(wèn)題的適配成本。當(dāng)然,企業(yè)對(duì)這種改變的適應(yīng)也是影響大模型產(chǎn)生效果的重要影響因素。
吳韶華:浪潮信息將大模型看作算法基礎(chǔ)設(shè)施,這種基礎(chǔ)模型在算法層面的能力,還要聯(lián)合服務(wù)軟件才能在應(yīng)用中發(fā)揮出來(lái)。因此,在應(yīng)用支撐上模型和服務(wù)軟件共同形成一種類似于算法基礎(chǔ)設(shè)施的作用。
黃心怡: 您認(rèn)為AI大模型的應(yīng)用價(jià)值有多大?對(duì)于推進(jìn)人工智能規(guī)?;涞啬芊衿鸬阶饔茫?/b>
吳韶華:首先是應(yīng)用的碎片化,尤其是長(zhǎng)尾場(chǎng)景應(yīng)用的碎片化,是人工智能落地的難題。碎片化意味著不同場(chǎng)景需要有針對(duì)性的建模,每個(gè)小場(chǎng)景都要從數(shù)據(jù)到模型、應(yīng)用整個(gè)流程走一遍。此外,隨著數(shù)據(jù)的更新,模型也要更新。設(shè)想下,對(duì)于一個(gè)維護(hù)上百個(gè)模型的企業(yè),要同時(shí)更新上百個(gè)模型及應(yīng)用,投入是巨大的。因?yàn)榇竽P途邆浔容^廣泛的普適應(yīng)用支撐能力,將傳統(tǒng)AI應(yīng)用的煙囪式、碎片化開發(fā)轉(zhuǎn)變成集中式開發(fā),很好的緩解了碎片化場(chǎng)景反復(fù)建模的現(xiàn)象。
其次,大模型也可以使研發(fā)人員聚焦在應(yīng)用開發(fā)的核心要素上。在算法基礎(chǔ)設(shè)施層面,包括浪潮信息構(gòu)建的源 1.0都是開源開放的,開發(fā)者不需要關(guān)心底層搭建的技術(shù),就能直接調(diào)用源1.0的大模型能力。這種能力把AI應(yīng)用的開發(fā)往上推了一大步,讓開發(fā)者聚焦應(yīng)用最核心的業(yè)務(wù)邏輯,把跟模型相關(guān)的內(nèi)容放在模型層面或算法基礎(chǔ)設(shè)施的層面。比如,基于源1.0搭建的“劇本殺”游戲,可以直接復(fù)用源1.0的開源代碼,開發(fā)過(guò)程基本不需要寫代碼和調(diào)試代碼,就完成了整個(gè)應(yīng)用的構(gòu)建,此時(shí),開發(fā)者能把更多精力放在劇情內(nèi)容等創(chuàng)意的創(chuàng)作上。
總結(jié)一下,大模型一方面會(huì)將AI應(yīng)用的開發(fā)從煙囪式轉(zhuǎn)變到集中式開發(fā),另一方面大模型降低了AI應(yīng)用的開發(fā)難度,讓開發(fā)者能夠更聚焦在核心業(yè)務(wù)邏輯上,這是大模型給AI的應(yīng)用落地帶來(lái)的兩大益處。
張誠(chéng):大模型和AI產(chǎn)業(yè)的發(fā)展是一個(gè)必然趨勢(shì),對(duì)這種趨勢(shì)的未來(lái)判斷其實(shí)通過(guò)回顧信息技術(shù)的商業(yè)應(yīng)用歷史來(lái)對(duì)照。上世紀(jì)90年代早期管理信息系統(tǒng)(MIS)剛開始在商業(yè)得到應(yīng)用的時(shí)候,企業(yè)往往需要18個(gè)月到36個(gè)月才能完成信息系統(tǒng)的建設(shè)和流程的配合。但是到了最近二十年,相關(guān)產(chǎn)品越來(lái)越標(biāo)準(zhǔn),3個(gè)月到12個(gè)月就能完成中等規(guī)模信息系統(tǒng)的設(shè)計(jì)和上線應(yīng)用。從新技術(shù)發(fā)展來(lái)說(shuō),早期很重的項(xiàng)目定制化咨詢方式,到現(xiàn)在越來(lái)越多的系統(tǒng)以產(chǎn)品化、標(biāo)準(zhǔn)化的方式復(fù)制實(shí)施。
同時(shí),現(xiàn)在越來(lái)越多的云服務(wù)被采納,算法基礎(chǔ)設(shè)施使得算法逐漸產(chǎn)品化、技術(shù)集中化,最終完成“標(biāo)準(zhǔn)產(chǎn)品”應(yīng)用+二次開發(fā)的成熟模式。算法被標(biāo)準(zhǔn)化,應(yīng)用或設(shè)置也可以標(biāo)準(zhǔn)化,那么人工智能應(yīng)用的開發(fā)就不用從零開始做,時(shí)間也會(huì)大大縮短。同時(shí),大模型的產(chǎn)品化、基礎(chǔ)化過(guò)程,讓企業(yè)智能化的成本越來(lái)越低,進(jìn)一步促進(jìn)人工智能產(chǎn)業(yè)的應(yīng)用發(fā)展。
黃心怡:浪潮信息在實(shí)際應(yīng)用過(guò)程中有沒(méi)有成本降低的案例
吳韶華:劇本殺就是一個(gè)典型的案例,在大模型出現(xiàn)之前,如果要做這樣一個(gè)游戲,需要很強(qiáng)大的模型,這個(gè)模型既要有對(duì)話能力,也要有邏輯推理能力,這對(duì)于模型的開發(fā)、數(shù)據(jù)的選擇門檻很高。
我們?cè)谠?.0開放過(guò)程中也遇到了很多類似情況,比如一個(gè)模型即可以支撐用戶的隨機(jī)閑聊,公文寫作,還可以支持一些特定場(chǎng)景的各類任務(wù),這些在沒(méi)有大模型和算法基礎(chǔ)設(shè)施支撐之前,用戶需要有自己的算法人員,從頭開始收集數(shù)據(jù)、標(biāo)注數(shù)據(jù),然后做模型等,經(jīng)過(guò)一系列研發(fā)流程,最后才能走到最核心的業(yè)務(wù)邏輯上。
現(xiàn)在有了大模型,這些問(wèn)題都可以得到很好的解決或者緩解,開發(fā)者不再關(guān)注底層算法基礎(chǔ)設(shè)施的構(gòu)建,只要通過(guò)API就能獲得相應(yīng)能力。所以大模型不管是從規(guī)?;?yīng),還是針對(duì)單用戶的應(yīng)用場(chǎng)景,都在成本方面有比較好的促進(jìn)作用。
黃心怡:AI大模型的落地還存在哪些技術(shù)和應(yīng)用瓶頸?
張誠(chéng):技術(shù)的應(yīng)用在商業(yè)上要回答好兩個(gè)最基本的問(wèn)題:投入產(chǎn)出比(ROI)和價(jià)值創(chuàng)造。
第一個(gè)問(wèn)題涉及商業(yè)運(yùn)營(yíng)的基本利益原則:技術(shù)帶來(lái)的生產(chǎn)效率提升超過(guò)技術(shù)投入,企業(yè)才愿意去使用它。隨著技術(shù)成本不斷降低,達(dá)到收益-成本的均衡點(diǎn)后,自然會(huì)有越來(lái)越多的企業(yè)愿意接受,現(xiàn)在只是企業(yè)在等待均衡點(diǎn)到達(dá)的合適時(shí)間點(diǎn)。關(guān)鍵是第二個(gè)問(wèn)題,涉及企業(yè)競(jìng)爭(zhēng)優(yōu)勢(shì)和可持續(xù)發(fā)展的戰(zhàn)略問(wèn)題,即企業(yè)究竟需要什么樣的AI可以產(chǎn)生超越競(jìng)爭(zhēng)者的競(jìng)爭(zhēng)優(yōu)勢(shì)。這個(gè)問(wèn)題不完全是由技術(shù)決定的,而是由企業(yè)需求決定的。特別是實(shí)體企業(yè),比如像制造業(yè)、傳統(tǒng)服務(wù)業(yè),人在哪個(gè)地方做不好,哪個(gè)地方的生產(chǎn)效率或者轉(zhuǎn)換效率就會(huì)很低,如果用技術(shù)能夠解決、改變,技術(shù)與生產(chǎn)的結(jié)合就會(huì)非常重要。
假設(shè)把技術(shù)看成一種推動(dòng)力,哪些業(yè)務(wù)場(chǎng)景是AI真正能夠緊密結(jié)合在企業(yè)流程里,能夠解決企業(yè)實(shí)際的生產(chǎn)需求或者某個(gè)決策需求,同時(shí)經(jīng)濟(jì)和社會(huì)收益都是值得去做的,那么AI大模型就能順利落地。所以,從應(yīng)用的角度來(lái)看,大模型可能會(huì)遇到的瓶頸就是怎樣和實(shí)體企業(yè)的勞動(dòng)效率提升和形成競(jìng)爭(zhēng)優(yōu)勢(shì)這兩個(gè)需求結(jié)合起來(lái)。
吳韶華:大模型在技術(shù)上仍面臨著較大挑戰(zhàn)。首先大模型的構(gòu)建過(guò)程中面臨大規(guī)模、高質(zhì)量的數(shù)據(jù)集開發(fā)。數(shù)據(jù)集的質(zhì)量決定了模型的質(zhì)量,大規(guī)模的、高質(zhì)量數(shù)據(jù)集的構(gòu)建,是一個(gè)比較普遍的挑戰(zhàn)。不管是語(yǔ)言、文字等單模態(tài)數(shù)據(jù),還是多模態(tài)數(shù)據(jù),都面臨類似問(wèn)題。
第一是在軟件及方法方面,業(yè)界缺少開源軟件,也缺少數(shù)據(jù)集構(gòu)建和數(shù)據(jù)集質(zhì)量評(píng)測(cè)的相關(guān)標(biāo)準(zhǔn)。我們?cè)跇?gòu)建數(shù)據(jù)集的時(shí)候,基本上從零起步,從軟件、算法的角度構(gòu)建了一個(gè)關(guān)于數(shù)據(jù)集的端到端開發(fā)平臺(tái)。多模態(tài)數(shù)據(jù)集更是如此,多模態(tài)數(shù)據(jù)可能會(huì)包含文字、圖象、語(yǔ)音、視頻等,它不僅需要原始數(shù)據(jù),還需要對(duì)原始數(shù)據(jù)進(jìn)行對(duì)齊,這更進(jìn)一步增強(qiáng)了數(shù)據(jù)集構(gòu)建的難度。大模型需要海量數(shù)據(jù)來(lái)做支撐,海量數(shù)據(jù)的收集本身就是一件比較有挑戰(zhàn)的事情。
構(gòu)建數(shù)據(jù)集后,需要一個(gè)大規(guī)模集群來(lái)做訓(xùn)練。以源1.0為例,在2128顆業(yè)界最先進(jìn)的GPU集群上開展訓(xùn)練。大規(guī)模集群算力的獲取就是一個(gè)比較大的挑戰(zhàn)。此外,怎么用好這個(gè)集群,加速訓(xùn)練過(guò)程,進(jìn)而降低算力成本開銷,也同樣充滿挑戰(zhàn)。
所以,從技術(shù)層面來(lái)講,大模型既有數(shù)據(jù)獲取,構(gòu)建的挑戰(zhàn),也有模型算法、訓(xùn)練算力性能優(yōu)化的挑戰(zhàn)。
黃心怡:人工智能在數(shù)字經(jīng)濟(jì)當(dāng)中發(fā)揮的價(jià)值?它的挑戰(zhàn)以及機(jī)遇有哪些?
吳韶華:大模型以及其他人工智能模型,將會(huì)是數(shù)字經(jīng)濟(jì)的核心支撐。一方面它可以很好的挖掘數(shù)據(jù)價(jià)值,另外一方面,在應(yīng)用的智能化上也會(huì)發(fā)揮關(guān)鍵作用,大模型有可能會(huì)成為數(shù)字經(jīng)濟(jì)的智能大腦。
大模型帶來(lái)了很多新的機(jī)會(huì),隨著技術(shù)的成熟,還會(huì)涌現(xiàn)更多機(jī)會(huì)。比如建模,AI大模型帶來(lái)的集中式建模能力將有效緩解碎片化應(yīng)用開發(fā)的痛點(diǎn)。同時(shí),大模型本身也能否孵化出新型應(yīng)用,比如大模型具有很強(qiáng)的對(duì)話、交流能力,可以很好的賦能元宇宙的虛擬人場(chǎng)景。大模型對(duì)多模態(tài)信息的強(qiáng)大處理能力,也會(huì)孵化出來(lái)更豐富的多模態(tài)應(yīng)用。
張誠(chéng):在過(guò)去的十年,更多的是人工智能和大模型的宣傳,嘗試,探索階段。接下來(lái)的十年會(huì),對(duì)人工智能的應(yīng)用會(huì)更好、也會(huì)更成熟,企業(yè)更懂得人工智能、大模型技術(shù)是什么、什么時(shí)候應(yīng)用,同時(shí)還會(huì)很專業(yè)的評(píng)定收入產(chǎn)出比,評(píng)定人工智能對(duì)企業(yè)造成的成本增減,亦即獲得收益之間的平衡。當(dāng)AI大模型的應(yīng)用越來(lái)越成熟,我們就可以期待接下來(lái)每一年都比以前會(huì)更好。
黃心怡:總結(jié)一下您對(duì)AI大模型的一些思考
吳韶華:大模型將在技術(shù)上產(chǎn)生更多的突破,也會(huì)對(duì)應(yīng)用的規(guī)模化落地產(chǎn)生更好的促進(jìn)作用。
張誠(chéng):大模型代表了人工智能技術(shù)發(fā)展向產(chǎn)品化、產(chǎn)業(yè)化落地的趨勢(shì),這個(gè)趨勢(shì)繼續(xù)下去,會(huì)更深刻改變產(chǎn)業(yè)的格局。