助力客戶實現(xiàn)Zero-ETL
北京2023年7月11日 /美通社/ -- 亞馬遜云科技宣布,完全托管的PB級云數據倉庫服務Amazon Redshift的數據共享功能現(xiàn)已在由光環(huán)新網運營的亞馬遜云科技中國(北京)區(qū)域和由西云數據運營的亞馬遜云科技中國(寧夏)區(qū)域推出。該功能可以讓客戶安全、方便地在Amazon Redshift集群之間實時共享數據,助力客戶邁向一個"Zero-ETL"的未來。
亞馬遜云科技一直致力于為客戶消除數據ETL(提取、轉換和加載)和其它數據遷移任務所帶來的繁重壓力,幫助客戶專注于分析數據,幫助業(yè)務獲取新的洞察。此次推出的Amazon Redshift數據共享功能是在Amazon Redshift數據倉庫之間共享數據的簡單直接的方式。
此前,當需要在兩個集群環(huán)境運行不同業(yè)務負載時,客戶不得不復制和移動同一套數據才能實現(xiàn)數據共享,這一過程不僅提高了使用成本,也大大增加了數據維護和保證數據一致性的難度。如今借助數據共享功能,客戶可以實現(xiàn)即時、精細和高性能的數據訪問,為所有數據使用者提供實時、一致的數據視圖,從而在組織內和組織之間、以及與外部相關方進行安全受控的協(xié)作。利用該項功能,客戶還可以將數據倉庫的數據與多個BI和分析集群共享;多個業(yè)務組之間可以方便地協(xié)作開展更廣泛的分析和數據科學研究;組織內以及跨組織的協(xié)作也可以共享數據服務,以各種精度共享數據。
數據共享可以在同一賬戶內進行,也可以跨不同賬戶,只要賬戶在同一區(qū)域即可。在Amazon Redshift集群上使用數據共享不會產生額外成本,RA3節(jié)點類型的Amazon Redshift集群可以直接使用該功能。
在"Zero-ETL"技術領域,亞馬遜云科技很早就在Amazon Redshift上推出聯(lián)邦查詢(Federated Query)功能,讓用戶可以對跨數據庫、數據倉庫和數據湖的數據進行查詢和分析,而無需移動數據。聯(lián)邦查詢功能可實現(xiàn)實時數據集成并簡化ETL處理流程。2022年底,亞馬遜云科技進一步發(fā)布兩項功能,分別助力客戶使用Amazon Redshift近乎實時地分析Amazon Aurora中的數據,無需在不同服務之間進行數據ETL;以及幫助客戶可以在Amazon Redshift的數據上輕松運行Apache Spark應用程序。通過這些新功能的陸續(xù)發(fā)布,亞馬遜云科技幫助客戶逐漸邁入一個"Zero-ETL"的未來。
知名生物制藥公司Moderna將大部分臨床試驗數據都存儲在亞馬遜云科技之上。Moderna使用Amazon Redshift進行數據分析,其中包括支持新冠疫苗開發(fā)的分析。通過包括Amazon Redshift數據共享在內的多項功能,Moderna能夠輕松擴大系統(tǒng)規(guī)模,加快業(yè)務流程,只用42天就交付出新冠疫苗,迅速將其供應到幾十個國家。Moderna首席執(zhí)行官Stéphane Bancel表示:"mRNA藥物背后的科學發(fā)展速度迅猛。Moderna在亞馬遜云科技上構建技術平臺,為我們的科學家提供了所需的洞察力、靈活性和安全性,才使得我們能夠不斷在行業(yè)中保持領先地位。"
GE Digital的Proficy制造數據云(Proficy MDC)是其制造執(zhí)行系統(tǒng)(MES)整套解決方案的一部分。通過將Proficy MDC平移到Amazon Redshift,GE Digital提高了可擴展性,降低了運營成本,并且優(yōu)化了新功能路線圖。從數據源到數據模型的延遲降低了87%,ETL(數據抽取、轉換與加載)效率提高了75%,降低了基礎設施、維護和管理成本,提高了客戶獲取信息的能力,簡化了開發(fā)流程。GE Digital高級軟件工程師Madhu Muppagownigi還表示:"通過Amazon Redshift,我們能夠為客戶提供更多功能。"