omniture

IBM專家解讀watsonx新功能: 硬幣的兩面

IBM China
2024-07-09 18:16 3084

北京2024年7月9日 /美通社/ -- 今年五月,在美國波士頓舉行的一年一度 THINK 大會上,IBM宣布了watsonx 平臺的幾項新的更新和新推出的數據與自動化功能,旨在使人工智能(AI)對企業(yè)而言更具開放性、成本效益與靈活性。為了幫助中國客戶和合作伙伴進一步了解這些新功能的業(yè)務價值,IBM中國科技事業(yè)部的數據與人工智能資深技術專家吳敏達撰文做了以下解讀。


IBM專家觀點: 硬幣的兩面

作者:吳敏達
IBM科技事業(yè)部 數據與人工智能資深技術專家

引言

IBM Think 是年度盛會,每年都會有令人興奮的新技術推出。作為一家在人工智能(AI)領域有著深厚積淀的百年企業(yè),IBM在今年五月的 Think 大會上宣布了 watsonx 平臺上的新功能,并且在六月發(fā)布了這些新功能的產品和版本。從這些新發(fā)布中我看到了硬幣的兩面,看到了IBM 在 AI 實踐中的成熟思考。

AI 從創(chuàng)新技術走向商業(yè)價值需要全面整體地通盤考慮,并不是單一技術就能解決的,這會包含很多的兩面性問題,而這些兩面性又是相輔相成,最后構成企業(yè)自己的最佳實踐。比如,AI 技術要與咨詢服務相輔相成,重塑利用 AI 開展業(yè)務;有效的 AI 模型,需要安全可靠的管控,啟用可信任、透明且可解釋的數據和 AI 工作流程。

“此兩者同出而異名,同謂之玄;玄之又玄,眾妙之門”,只有把硬幣的兩面充分結合,才能讓企業(yè)真正從生成式 AI 中獲益。本文試圖結合 Think 2024 帶來的產品最新能力來解剖這些兩面性,幫助理解 watsonx 解決方案獨特的價值和魅力。

IBM專家解讀watsonx新功能: 硬幣的兩面
IBM專家解讀watsonx新功能: 硬幣的兩面

分與合

企業(yè)級 AI 應用的未來在于開放和開源,在過去一年中可以看到國內外大模型百花齊放。社區(qū)開源可以讓大模型變得更有活力,企業(yè)有更多的可供選擇的基礎大模型,這是“分”的好處。但是硬幣的另一面,也要考慮“合”的問題,需要讓社區(qū)方便地協作并更新現有的大模型,而不是創(chuàng)建多個克隆,依然處于“分”的狀態(tài)?,F在HuggingFace 上有超過兩萬個 llama 模型分支,這也證明缺少好的方法讓社區(qū)協作為大模型做出貢獻,可以想像如果這兩萬個分支能合作在一起,將會產生更強大的模型。

其實這個問題不僅僅在社區(qū)存在,企業(yè)應用也是一樣,一家公司希望跨部門在企業(yè)內部做大模型的迭代升級,希望利用內部獲取的技能和知識進行更新。如何跨部門內部獲取技能,重復使用技能,如果不解決“合”的問題,各部門用自己的大模型各自為政,不僅成本高,知識也無法共享。

IBM專家解讀watsonx新功能: 硬幣的兩面
IBM專家解讀watsonx新功能: 硬幣的兩面

在Think 2024大會上,IBM 和 紅帽聯合推出了 InstructLab 這一首創(chuàng)的模型對齊技術,這是圍繞大模型推動開源創(chuàng)新的革命性方法,可將開源社區(qū)的資源直接引入大語言模型。與此同時,watsonx.ai 也最新引入 InstructLab 來解決“分”與“合”的問題,亮點是易于理解、結構良好的分類法,它是一個根據共享特征或關系將實體分類和組織為層次類別的分類樹。 InstructLab  分為三個主要分支:知識、核心技能和組合技能。 例如,在這個企業(yè)財務領域知識的例子中,企業(yè)可以自己添加自己的知識分類,葉節(jié)點就是企業(yè)自己的知識文檔,可以是手冊等文檔。用分類驅動的方法取代了原來在“分”時候的隨機選擇,通過關注每個葉節(jié)點內的特定企業(yè)示例,從而保證“合”的多樣性和模型質量。

IBM專家解讀watsonx新功能: 硬幣的兩面
IBM專家解讀watsonx新功能: 硬幣的兩面

在 watsonx.ai 使用 InstructLab 有四個步驟:首先選擇合適的大模型進行嘗試,找到不足的知識或技能,并可以通過模型的訓練分類法標簽看到知識分類和每個分類的知識問答示例。比如以下圖示的例子里看到的是有關 IBM 歷史的知識以及在知識分類的位置。

IBM專家解讀watsonx新功能: 硬幣的兩面
IBM專家解讀watsonx新功能: 硬幣的兩面

然后添加知識或技能,并生成訓練數據。訓練數據立足于源材料,根據與新主題相關的特定文檔、手冊或書籍生成問題和答案,這確保了信息準確且來源可靠。在評估和驗證階段,模型充當評估器,檢查生成的響應是否忠實于原始材料。 這樣就能保持新知識的完整性和準確性,最后再學習新的知識和技能“合”成新的模型。

解決“分”與“合”的問題,可以幫助企業(yè)的大語言模型與最新的技能和知識保持同步,InstructLab 可以幫助企業(yè)獲得最新的社區(qū)貢獻技能并保持最新狀態(tài)。很多企業(yè)希望了解訓練大型語言模型需要做些什么,以便能夠更有效地調整模型,watsonx.ai 分類法探索器可以幫助 AI 開發(fā)人員了解訓練模型所需的技能和知識結構,并能夠輕松識別差距。

IBM專家解讀watsonx新功能: 硬幣的兩面
IBM專家解讀watsonx新功能: 硬幣的兩面

IBM watsonx Code Assistant for Z 使用 InstructLab 對 COBOL 編程語言轉 Java 進行訓練相較于傳統方法訓練,從原來需要9個月、14次迭代的過程減少為 1周、1次迭代,通過這一方法,代碼轉化效能提升了20%。

縱與橫

企業(yè)從生成式 AI 的試驗階段轉向生產階段, 通常有“縱”與“橫”兩種消費模式:“縱”是從應用出發(fā),企業(yè)采用預打包的AI 解決方案;“橫”是從平臺出發(fā),企業(yè)基于工具平臺來構建自有 AI 應用。

IBM專家解讀watsonx新功能: 硬幣的兩面
IBM專家解讀watsonx新功能: 硬幣的兩面

人工智能助手就是為“縱”的需求而生的,是針對企業(yè)最關注的特定領域量身定制的開箱即用的應用:代碼現代化應用 watsonx Code Assistant、重塑客戶服務的應用 watsonx Assistant、工作流程自動化應用 watsonx Ochestrate 和智能對答業(yè)務分析應用 watsonx BI Assistant。通過部署人工智能助手,企業(yè)可以利用自然語言理解和機器學習技術來自動化業(yè)務流程,將各種數據轉化為個性化的見解和及時的自動化操作,從而為團隊提供所需的專業(yè)知識,達成更高水平的績效,包括更快回應和解決客服問題,提高開發(fā)人員工作效率等。

IBM專家解讀watsonx新功能: 硬幣的兩面
IBM專家解讀watsonx新功能: 硬幣的兩面

watsonx BI Assistant 是最新推出的人工智能業(yè)務分析助手,提供真正的自助分析同時保持數據一致性、治理和可組合的全棧解決方案。它的底層是接受過企業(yè)相關內容訓練和可信的大模型;語義自動化層可以自動理解數據并構建語義模型,根據值得信賴且經過行業(yè)驗證的業(yè)務詞匯表訓練大模型以豐富元數據的語義。指標目錄定義并發(fā)布分析指標,能夠提取第三方數據模型和語義層中定義的指標。最后以自然語言對話方式,零學習曲線的體驗為業(yè)務用戶提供高級分析和個性化洞察的能力。

比如提問:“今年每個市場所有產品的收入是多少?”,watsonx 助手不僅能給出數據和報表,還能給出洞察:“新款 Tablet-5 出人意料地增長了 10%,英國市場增長了 15%”,最后會根據數據給出行動指導:“建議將資源轉移到這些增長領域”。

IBM專家解讀watsonx新功能: 硬幣的兩面
IBM專家解讀watsonx新功能: 硬幣的兩面

watsonx Code Assistant 是不斷發(fā)展的一系列代碼助手,均由專為代碼生成而設計的 IBM Granite 模型提供支持,不僅有廣泛的客戶采用,而且 IBM內部也利用該能力進行更有效地進行軟件開發(fā)。適用于 Ansible Lightspeed、主機的 COBOL和 Java 的代碼助手,因為專注所以專業(yè),開箱即用地提供基于特定編程語言的預訓練模型,以確保代碼生成的可信和準確。

IBM專家解讀watsonx新功能: 硬幣的兩面
IBM專家解讀watsonx新功能: 硬幣的兩面

watsonx 最核心的產品集watsonx.data、watsonx.ai、watsonx.governance 就是解決“橫”的需求,提供完整的平臺工具。企業(yè)可以使用 wasonx 平臺根據特定業(yè)務數據、專業(yè)知識對模型進行調整。隨著時間的推移,它變得越來越專業(yè),對業(yè)務也越來越有價值。由于企業(yè)可以控制平臺、 流程和數據,結合強有力的人工智能治理能力,企業(yè)累積的價值隨時間推移變得越來越大。

在實際的企業(yè)自己的最佳實踐中,“縱”與“橫”往往會交錯在一起,watsonx 在打造這一體系的時候也是采用同樣的技術架構,每個人工智能助手都是構建在 watsonx 平臺上的應用程序,這使得企業(yè)在任何階段都能夠無縫疊加應用或平臺的能力。最終企業(yè)要無感知地應用人工智能,SDK 和 API 也是很重要的環(huán)節(jié),所有的人工智能都是嵌入式的,“縱”與“橫”的體系中間是通過生態(tài)系統整合在一起的。

知與行

企業(yè)采用人工智能技術的目的是運用,所以“知”“行”合一變得尤為重要。 在大模型時代,企業(yè)的大模型是數據的表現形式,這是人工智能模型的本質,也是企業(yè)的競爭優(yōu)勢,不要外包它,而應該保護它。模型和數據都是企業(yè)最重要的資產,IBM Knowledge Catalog 就是“知”的部分:它是 AI 時代的智能數據目錄,可幫助企業(yè)采取智能自助的方式發(fā)現數據、模型等。

Knowledge Catalog 最新采用大模型能力來豐富元數據以實現分類自動化,生成數據描述以解釋數據屬性和值,生成數據名稱并將業(yè)務術語映射到列,可以通過對話和搜索進行知識目錄中的數據查找和操作。

IBM專家解讀watsonx新功能: 硬幣的兩面
IBM專家解讀watsonx新功能: 硬幣的兩面

最新發(fā)布 IBM Data Product Hub 是“行”的部分:它是數據和模型資產消費解決方案,通過簡化企業(yè)內部生產者和消費者之間的數據產品共享,幫助加速企業(yè)實現數據驅動的成果。采用“將數據作為產品進行管理”的方法,數據所有者和數據管理員等數據生產者將能夠管理和發(fā)布數據產品(數據集、報表、模型、代碼和定制的數據衍生品集合)。 這些數據產品易于發(fā)現、管理和可重用,確保業(yè)務分析師、業(yè)務線用戶、數據科學家和其他數據消費者可以迅速找到并使用。

IBM Data Product Hub 從 IBM Knowledge Catalog 導入數據資產,并將其打包以供整個企業(yè)的自助服務使用,并管理整個數據產品生命周期,從數據產品的加入到報廢。新增的數據合同定義了包含條款和條件以及服務水平協議的數據共享協議,將為數據生產者和數據消費者提供相互保證,確保數據以合規(guī)的方式共享和使用,從而在數據交換過程中融入信任。整個方案采用生成式人工智能技術來加速數據產品的發(fā)現、創(chuàng)建和消費。

IBM專家解讀watsonx新功能: 硬幣的兩面
IBM專家解讀watsonx新功能: 硬幣的兩面

通過“知”“行”合一,可以根據不同的場景,通過文件、API 和自然語言查詢等方法自動向業(yè)務用戶交付數據產品,從而更快地 AI 在企業(yè)大規(guī)模應用,產生業(yè)務價值??梢栽谄髽I(yè)內外實現大規(guī)模的數據共享,為業(yè)務用戶構建單一入口,以便瀏覽整個企業(yè)的數據產品,形成真正的數字化“超級”市場?!盃杹砜创嘶〞r”,一旦找到精選的穩(wěn)定數據產品,“則此花顏色一時明白起來”。

總結

企業(yè)廣泛采用人工智能的時代已經到來,AI 正從企業(yè)內部的小型實驗試點轉向大規(guī)模實施,但這是馬拉松長跑,而不是百米沖刺,在過程中需要從不同的維度循序漸進地迭代展開。 具體實踐中會遇到很多“硬幣”的兩面,本文拋磚引玉談到了“分”與“合”、“縱”與“橫”、“知”與“行”。在數據和人工智能項目中還碰到更多的兩面,例如:“虛”與“實”:數據是邏輯的集中(“虛”: Data Virtualization)還是物理的集中(“實”:watsonx.data);“動”與“靜”:管道實時可觀測(“動”:Databand)還是數據血緣和沿襲(“靜”:Manta),等等。

作為數據和人工智能的領導者,IBM 不僅服務于眾多企業(yè)客戶,而且自身也在利用生成式人工智能進行著改變。隨著 watsonx 產品系列每季度的迭代更新和發(fā)展,越來越多的硬幣兩面會被注意到,并統一在 watsonx 中:“夫道一而已矣”。IBM 愿與您攜手,以開放與創(chuàng)新共參 AI 之道!

IBM專家解讀watsonx新功能: 硬幣的兩面
IBM專家解讀watsonx新功能: 硬幣的兩面

作者簡介:吳敏達是 The Open Group 卓越級技術專家(Distinguished Technical Specialist),同時擁有計算機技術與軟件專業(yè)系統架構設計師技術資格。他現在是 IBM 科技事業(yè)部數據與人工智能資深技術專家,擁有 20 多年數據分析軟件相關技術經驗,是 IBM 認證的大數據架構師和 Watson 開發(fā)者,專長是大數據、人工智能等領域。他是 IBM Developer 的大師級作者,已經發(fā)表了 40 余篇技術文章和教程?,F從事大數據、人工智能相關技術支持和架構設計工作。

IBM專家解讀watsonx新功能: 硬幣的兩面
IBM專家解讀watsonx新功能: 硬幣的兩面
消息來源:IBM China
China-PRNewsire-300-300.png
全球TMT
微信公眾號“全球TMT”發(fā)布全球互聯網、科技、媒體、通訊企業(yè)的經營動態(tài)、財報信息、企業(yè)并購消息。掃描二維碼,立即訂閱!
collection