北京2024年9月5日 /美通社/ -- 亞馬遜云科技宣布,Stability AI最新發(fā)布的三款文本生成圖像模型:Stable Image Ultra、Stable Diffusion 3 Large和Stable Image Core現(xiàn)已在Amazon Bedrock中正式可用。這些模型大大提升了對(duì)包含多個(gè)對(duì)象提示詞的處理能力、圖像質(zhì)量和文字排版效果,可廣泛應(yīng)用于營(yíng)銷(xiāo)、廣告、媒體、娛樂(lè)、零售等領(lǐng)域,快速生成高質(zhì)量視覺(jué)內(nèi)容。
這些模型生成的圖像異常逼真,具有生動(dòng)的細(xì)節(jié)、色彩和明暗效果,并有效解決了如手部和面部真實(shí)感渲染等常見(jiàn)挑戰(zhàn)。憑借卓越的提示詞理解能力,這些模型能夠準(zhǔn)確解釋涉及空間推理、構(gòu)圖和風(fēng)格的復(fù)雜指令。
Amazon Bedrock上提供的三款Stability AI新模型覆蓋了不同的使用場(chǎng)景:
Stable Image Ultra——可生成最高質(zhì)量的寫(xiě)實(shí)輸出,適用于專(zhuān)業(yè)印刷媒體和大尺寸印刷等場(chǎng)景。該模型在細(xì)節(jié)渲染和寫(xiě)實(shí)性方面表現(xiàn)卓越。
Stable Diffusion 3 Large——在圖像生成速度和質(zhì)量之間實(shí)現(xiàn)平衡,是制作網(wǎng)站、新聞簡(jiǎn)報(bào)和營(yíng)銷(xiāo)材料等大批量、高質(zhì)量數(shù)字內(nèi)容的理想之選。
Stable Image Core——專(zhuān)門(mén)用于快速且經(jīng)濟(jì)地生成圖像,非常適合在創(chuàng)意構(gòu)思階段快速迭代。
新模型的關(guān)鍵特性:
特性 |
Stable Image Ultra |
Stable Diffusion 3 Large |
Stable Image Core |
參數(shù) |
160億 |
80億 |
26億 |
輸入 |
文本 |
文本或圖像 |
文本 |
排版 |
為大規(guī)模展示定制 |
為大規(guī)模展示定制 |
適用不同尺寸和應(yīng)用場(chǎng)景,具有多樣性和可讀性 |
視覺(jué)美感 |
超寫(xiě)實(shí)圖像輸出 |
高度寫(xiě)實(shí),細(xì)節(jié)更精細(xì) |
良好的渲染效果,但細(xì)節(jié)不如其他模型豐富 |
相比 Stable Diffusion XL (SDXL) ,Stable Image Ultra 和 Stable Diffusion 3 Large的主要改進(jìn)之一是生成圖像中的文字質(zhì)量。得益于創(chuàng)新的Diffusion Transformer架構(gòu),新模型減少了拼寫(xiě)和排版錯(cuò)誤。該架構(gòu)為圖像和文字分別設(shè)計(jì)了兩套獨(dú)立的權(quán)重,但允許兩種模態(tài)之間的信息流動(dòng)。
以下是使用這些模型生成的一些圖像。
Stable Image Ultra – 提示詞:照片,寫(xiě)實(shí)風(fēng)格,一名女子坐在田野中看著天空中的風(fēng)箏,暴風(fēng)雨的天空,細(xì)節(jié)豐富,概念藝術(shù),復(fù)雜、專(zhuān)業(yè)構(gòu)圖。
Stable Diffusion 3 Large – 提示詞:漫畫(huà)風(fēng)格插畫(huà),男偵探站在路燈下,黑暗城市,穿著風(fēng)衣,戴著軟呢帽,雨夜,霓虹燈招牌,濕漉漉的人行道上的倒影,細(xì)節(jié)豐富,氛圍感十足的光影。
Stable Image Core – 提示詞:專(zhuān)業(yè)的 3D 渲染,一只白色和橙色的運(yùn)動(dòng)鞋,懸浮在中心,漂浮,高質(zhì)量,寫(xiě)實(shí)風(fēng)格。
Amazon Bedrock 中 Stability AI 新模型的應(yīng)用場(chǎng)景
文本生成圖像模型為各行業(yè)的企業(yè)帶來(lái)了變革性的潛力,能夠顯著簡(jiǎn)化營(yíng)銷(xiāo)和廣告部門(mén)的創(chuàng)意工作流程,為營(yíng)銷(xiāo)活動(dòng)、社交媒體內(nèi)容和產(chǎn)品模型快速生成高質(zhì)量的視覺(jué)效果。通過(guò)加快創(chuàng)作過(guò)程,企業(yè)可以更快地響應(yīng)市場(chǎng)趨勢(shì),縮短新產(chǎn)品或項(xiàng)目的上市時(shí)間。此外,這些模型還能在創(chuàng)意討論階段為概念提供即時(shí)的視覺(jué)呈現(xiàn),激發(fā)更多創(chuàng)新靈感。
對(duì)于電商企業(yè),AI生成的圖像可以幫助大規(guī)模創(chuàng)建多樣化的產(chǎn)品展示和個(gè)性化營(yíng)銷(xiāo)材料。在用戶體驗(yàn)和界面設(shè)計(jì)領(lǐng)域,這些工具能夠快速生成線框圖和原型,加快推動(dòng)設(shè)計(jì)迭代過(guò)程。采用文本生成圖像模型可以顯著節(jié)約成本、提高生產(chǎn)效率,并在視覺(jué)傳播方面為各行業(yè)企業(yè)提供競(jìng)爭(zhēng)優(yōu)勢(shì)。
以下是一些跨行業(yè)的應(yīng)用場(chǎng)景示例:
廣告與營(yíng)銷(xiāo)
電商
媒體與娛樂(lè)
Stability AI三款全新模型——Stable Image Ultra、Stable Diffusion 3 Large 和 Stable Image Core今天起在的亞馬遜云科技美國(guó)西部(俄勒岡州)區(qū)域內(nèi)的Amazon Bedrock正式可用。