北京2024年10月22日 /美通社/ -- 在美國(guó)時(shí)間10月21日舉行的IBM(紐約證券交易所代碼:IBM)年度TechXchange大會(huì)上,IBM宣布推出其迄今為止最先進(jìn)的AI模型家族——Granite 3.0。IBM的第三代Granite旗艦語(yǔ)言模型在許多學(xué)術(shù)和行業(yè)基準(zhǔn)測(cè)試中均能超越或匹敵同類領(lǐng)先模型提供商的模型,展示出強(qiáng)大的性能、透明性和安全性。
與公司對(duì)開(kāi)源 AI 的承諾一致,Granite 模型在寬松的 Apache 2.0 許可證下發(fā)布,它們憑借在性能、靈活性和自主性方面的獨(dú)特組合能夠?yàn)槠髽I(yè)客戶和整個(gè)社區(qū)提供服務(wù)。
IBM的Granite 3.0家族系列包括:
新款 Granite 3.0 8B 和 2B 語(yǔ)言模型被設(shè)計(jì)為企業(yè)級(jí)AI的"主力"模型,能夠在檢索增強(qiáng)生成(RAG)、分類、摘要、實(shí)體提取和工具使用等任務(wù)中提供強(qiáng)大的性能。這些緊湊的多功能模型旨在根據(jù)企業(yè)數(shù)據(jù)進(jìn)行微調(diào),并在各種業(yè)務(wù)環(huán)境或工作流程中無(wú)縫集成。
許多大型語(yǔ)言模型(LLM)是基于公開(kāi)可用的數(shù)據(jù)進(jìn)行訓(xùn)練的,絕大多數(shù)企業(yè)數(shù)據(jù)仍然未被利用。通過(guò)將小型 Granite 模型與企業(yè)數(shù)據(jù)相結(jié)合,特別是使用 IBM 和 RedHat 在五月推出的革命性對(duì)齊技術(shù) InstructLab, IBM 相信企業(yè)可以實(shí)現(xiàn)與大型模型相媲美的特定任務(wù)性能,而成本只是其中的一小部分(基于在幾個(gè)早期概念驗(yàn)證中觀察到的成本比大型前沿模型低 3 到 23 倍的范圍[i])。
Granite 3.0 版本的發(fā)布重申了 IBM 對(duì)建立 AI 產(chǎn)品透明度、安全性和信任的承諾。Granite 3.0 技術(shù)報(bào)告和負(fù)責(zé)任使用指南提供了用于訓(xùn)練這些模型的數(shù)據(jù)集描述,詳細(xì)說(shuō)明了所應(yīng)用的過(guò)濾、清洗和處理步驟,并全面展示了模型在主要學(xué)術(shù)和企業(yè)基準(zhǔn)測(cè)試中的性能結(jié)果。
至關(guān)重要的是,IBM 為 watsonx.ai 上的所有 Granite 模型提供知識(shí)產(chǎn)權(quán)賠償,旨在增強(qiáng)企業(yè)客戶將企業(yè)數(shù)據(jù)融入模型的信心。
提高標(biāo)準(zhǔn):Granite 3.0 基準(zhǔn)測(cè)試
Granite 3.0 語(yǔ)言模型在原始性能上也展示出良好的結(jié)果。
在 Hugging Face 的 OpenLLM 排行榜定義的標(biāo)準(zhǔn)學(xué)術(shù)基準(zhǔn)測(cè)試中,Granite 3.0 8B Instruct 模型的整體性能平均領(lǐng)先于 Meta 和 Mistral 中類似大小的開(kāi)源模型的最先進(jìn)性能。在 IBM 的先進(jìn) AttaQ 安全基準(zhǔn)測(cè)試中,Granite 3.0 8B Instruct 模型在所有測(cè)量的安全維度上均領(lǐng)先于 Meta 和 Mistral 的模型[ii]。
在檢索增強(qiáng)生成(RAG)、工具使用和網(wǎng)絡(luò)安全領(lǐng)域的核心企業(yè)任務(wù)中,Granite 3.0 8B Instruct 模型的平均表現(xiàn)優(yōu)于Mistral 和 Meta 中類似規(guī)模的開(kāi)源模型[iii]。
Granite 3.0 模型是在超過(guò) 12 萬(wàn)億個(gè)標(biāo)記上進(jìn)行訓(xùn)練的,這些數(shù)據(jù)來(lái)自 12 種不同的自然語(yǔ)言和 116 種不同的編程語(yǔ)言,采用了一種新穎的兩階段訓(xùn)練方法,利用了數(shù)千個(gè)旨在優(yōu)化數(shù)據(jù)質(zhì)量、數(shù)據(jù)選擇和訓(xùn)練參數(shù)的實(shí)驗(yàn)結(jié)果。到今年年底,預(yù)計(jì) 3.0 8B 和 2B 語(yǔ)言模型將支持?jǐn)U展的 128K 上下文窗口和多模態(tài)文檔理解能力。
IBM 展示了性能和推理成本的完美平衡,提供了其 Granite 專家混合(MoE)機(jī)構(gòu)模型,Granite 3.0 1B-A400M 和 Granite 3.0 3B-A800M,這些較小且輕量級(jí)的模型可用于低延遲應(yīng)用程序以及基于 CPU 的部署。
IBM 還宣布了其預(yù)訓(xùn)練 Granite 時(shí)間序列模型的更新版本,早期版本于今年早些時(shí)候發(fā)布。這些新模型在 3 倍的數(shù)據(jù)上進(jìn)行訓(xùn)練,在所有三個(gè)主要時(shí)間序列基準(zhǔn)測(cè)試中表現(xiàn)出色,超越了來(lái)自 Google、Alibaba 等公司 10 倍更大模型的性能。更新后的模型還提供了更大的建模靈活性,支持外部變量和滾動(dòng)預(yù)測(cè)[iv]。
Granite Guardian 3.0:開(kāi)啟負(fù)責(zé)任AI的新時(shí)代
作為此次發(fā)布的一部分,IBM 還推出了一個(gè)新的 Granite Guardian 模型系列,允許應(yīng)用程序開(kāi)發(fā)人員通過(guò)檢查用戶提示和 LLM 響應(yīng)來(lái)實(shí)施安全護(hù)欄,以發(fā)現(xiàn)各種風(fēng)險(xiǎn)。Granite Guardian 3.0、8B 和 2B 型號(hào)提供了當(dāng)今市場(chǎng)上最全面的風(fēng)險(xiǎn)和危害檢測(cè)功能。
除了社會(huì)偏見(jiàn)、仇恨、毒性、褻瀆、暴力、越獄等危害維度外,這些模型還提供了一系列獨(dú)特的檢索增強(qiáng)生成(RAG)特定檢查,如基于事實(shí)性、上下文相關(guān)性和答案相關(guān)性。在針對(duì) 19 項(xiàng)安全性和 RAG 基準(zhǔn)的廣泛測(cè)試中,Granite Guardian 3.0 8B 模型在危害檢測(cè)方面的整體準(zhǔn)確性平均高于 Meta 的所有三代 Llama Guard 模型。它在幻覺(jué)檢測(cè)方面的整體性能也與專門的幻覺(jué)檢測(cè)模型 WeCheck 和 MiniCheck 相當(dāng)[v]。
雖然 Granite Guardian 模型派生自相應(yīng)的 Granite 語(yǔ)言模型,但它們可以與任何開(kāi)放或?qū)S械?AI 模型一起使用,以實(shí)施安全保護(hù)措施。
Granite 3.0 模型的可用性
整個(gè) Granite 3.0 模型套件和更新的時(shí)間序列模型都可以在 HuggingFace 上根據(jù)寬松的 Apache 2.0 許可證下載。新的 Granite 3.0 8B 和 2B 語(yǔ)言模型的指令(instruct)變體以及 Granite Guardian 3.0 8B 和 2B 模型現(xiàn)已在 IBM 的 watsonx 平臺(tái)上提供商業(yè)用途。部分 Granite 3.0 模型也將作為 NVIDIA NIM 微服務(wù)提供,并通過(guò) Google Cloud 的 Vertex AI Model Garden與 HuggingFace 的集成提供。
為給開(kāi)發(fā)者提供多種選擇和易用性,并支持本地和邊緣部署,一套精選的 Granite 3.0 模型也可在 Ollama 和 Replicate 上獲得。最新一代 Granite 模型擴(kuò)展了 IBM 強(qiáng)大的開(kāi)源 LLM 目錄。IBM 與 AWS、Docker、Domo、Qualcomm Technologies, Inc.(通過(guò)其 Qualcomm® AI Hub)、Salesforce、SAP 等生態(tài)系統(tǒng)合作伙伴合作,將多種 Granite 模型集成到這些合作伙伴的產(chǎn)品中,或在他們的平臺(tái)上提供 Granite 模型,為全球企業(yè)提供更大的選擇空間。
從助理(Assistants)到智能體(Agents):實(shí)現(xiàn)企業(yè)級(jí)AI 的未來(lái)
IBM 正在通過(guò)一系列技術(shù)推進(jìn)企業(yè)級(jí)AI的發(fā)展,從模型和助理 (Assistants),到為公司獨(dú)特的數(shù)據(jù)和用例調(diào)優(yōu)和部署 AI 所需的工具。IBM 還在為未來(lái)能夠自我導(dǎo)向、反思并在動(dòng)態(tài)商業(yè)環(huán)境中執(zhí)行復(fù)雜任務(wù)的 AI 智能體(AI agents)鋪平道路。
IBM 不斷發(fā)展其 AI 助理(Assitants)技術(shù)組合,從幫助公司通過(guò)低代碼工具和自動(dòng)化構(gòu)建自己的助理的watsonx Orchestrate,到用于特定任務(wù)和領(lǐng)域(如客戶服務(wù)、人力資源、銷售和營(yíng)銷)的各種預(yù)構(gòu)建助理。全球各地的組織已經(jīng)使用 watsonx Assistant 幫助他們構(gòu)建 AI 助理,用于回答客戶或員工的日常問(wèn)題、實(shí)現(xiàn)大型機(jī)和傳統(tǒng) IT 應(yīng)用程序現(xiàn)代化、幫助學(xué)生探索潛在的職業(yè)路徑,或?yàn)橘?gòu)房者提供數(shù)字抵押貸款支持等任務(wù)。
IBM 還公布了即將發(fā)布的下一代 watsonx Code Assistant,該版本由 Granite 代碼模型提供支持,能夠?yàn)?C、C++、Go、Java 和 Python 等語(yǔ)言提供通用編碼輔助,并為企業(yè)級(jí) Java 應(yīng)用程序[vi]提供高級(jí)應(yīng)用程序現(xiàn)代化功能。Granite 的代碼功能現(xiàn)在也可以通過(guò) Visual Studio Code 擴(kuò)展程序 IBM Granite.Code訪問(wèn)。
IBM 還計(jì)劃發(fā)布新工具來(lái)幫助開(kāi)發(fā)人員,利用watsonx.ai 更高效地構(gòu)建、定制和部署 AI,包括代理框架、與現(xiàn)有環(huán)境的集成以及用于常見(jiàn)用例(如 RAG 和智能體)的低代碼自動(dòng)化[vii]。
IBM 專注于開(kāi)發(fā)具有更高自主性、復(fù)雜推理能力和多步驟問(wèn)題解決能力的 AI 智能體(AI Agents)技術(shù)。Granite 3.0 8B 模型的初始版本支持關(guān)鍵的智能體功能,如高級(jí)推理和用于實(shí)現(xiàn)工具使用工作流程的高度結(jié)構(gòu)化聊天模板和提示風(fēng)格。IBM 還計(jì)劃在 IBM watsonx Orchestrate 中引入新的 AI 智能體聊天功能,利用智能體功能協(xié)調(diào) AI 助理、技能和自動(dòng)化,幫助用戶提高整體的團(tuán)隊(duì)生產(chǎn)力[viii]。IBM 計(jì)劃在 2025 年繼續(xù)在其產(chǎn)品組合中構(gòu)建智能體功能,包括為特定領(lǐng)域和用例預(yù)構(gòu)建的智能體。
擴(kuò)展的 AI 驅(qū)動(dòng)的交付平臺(tái),以 AI 增強(qiáng) IBM 顧問(wèn)的能力
IBM 還宣布大幅擴(kuò)展其 AI 驅(qū)動(dòng)的交付平臺(tái) IBM Consulting Advantage。該多模型平臺(tái)包含 AI 智能體、應(yīng)用程序和方法(如可重用的框架),賦能 16 萬(wàn)名 IBM 顧問(wèn),以更低的成本、更好更快地為客戶提供價(jià)值。
作為擴(kuò)展的一部分,Granite 3.0 語(yǔ)言模型將成為 Consulting Advantage 的默認(rèn)模型。借助 Granite 的性能和效率, IBM Consulting 將能夠幫助最大限度地提高 IBM 客戶的生成式 AI 項(xiàng)目的投資回報(bào)。
擴(kuò)展的另一個(gè)關(guān)鍵部分是引入 IBM Consulting Advantage for Cloud Transformation and Management 和 IBM Consulting Advantage for Business Operations。每一項(xiàng)都包括特定領(lǐng)域的 AI 智能體、應(yīng)用程序和融合了 IBM 最佳實(shí)踐的方法,使 IBM 顧問(wèn)能夠幫助客戶加速云和 AI 轉(zhuǎn)型任務(wù)(如代碼現(xiàn)代化和質(zhì)量工程),或跨領(lǐng)域(如財(cái)務(wù)、人力資源和采購(gòu))實(shí)施轉(zhuǎn)型和運(yùn)營(yíng)。
了解有關(guān) Granite 和 IBM 的 AI for Business 戰(zhàn)略的更多信息,請(qǐng)?jiān)L問(wèn)https://www.ibm.com/granite
關(guān)于IBM
IBM 是全球領(lǐng)先的混合云、人工智能及企業(yè)服務(wù)提供商,幫助超過(guò) 175 個(gè)國(guó)家和地區(qū)的客戶,從其擁有的數(shù)據(jù)中獲取商業(yè)洞察,簡(jiǎn)化業(yè)務(wù)流程,降低成本,并獲得行業(yè)競(jìng)爭(zhēng)優(yōu)勢(shì)。金融服務(wù)、電信和醫(yī)療健康等關(guān)鍵基礎(chǔ)設(shè)施領(lǐng)域的超過(guò) 4000 家政府和企業(yè)實(shí)體依靠 IBM 混合云平臺(tái)和 Red Hat OpenShift 快速、高效、安全地實(shí)現(xiàn)數(shù)字化轉(zhuǎn)型。IBM 在人工智能、量子計(jì)算、行業(yè)云解決方案和企業(yè)服務(wù)方面的突破性創(chuàng)新為我們的客戶提供了開(kāi)放和靈活的選擇。對(duì)企業(yè)誠(chéng)信、透明治理、社會(huì)責(zé)任、包容文化和服務(wù)精神的長(zhǎng)期承諾是 IBM 業(yè)務(wù)發(fā)展的基石。了解更多信息,請(qǐng)?jiān)L問(wèn):https://www.ibm.com/cn-zh
媒體聯(lián)絡(luò)人:
郭韜 gguotao@cn.ibm.com
[i] 成本計(jì)算基于 IBM watsonx 的開(kāi)放模型和 openAI 的 GPT4 模型(假設(shè) 80% 輸入,20% 輸出)的每 100 萬(wàn)個(gè)代幣的 API 成本定價(jià),用于客戶概念驗(yàn)證。
[ii] IBM Research technical paper: Granite 3.0 Language Models
[iii] IBM Research technical paper: Granite 3.0 Language Models
[iv] The Tiny Time Mixer: Fast Pre-Trained Models for Enhanced Zero/Few Shot Forecasting on Multivariate Time Series
[v] Evaluation results published in Granite Guardian GitHub Report
[vi] Planned availability for Q4 2024
[vii] Planned availability for Q4 2024
[viii] Planned availability for Q4 2024