北京2015年8月25日電 /美通社/ -- 企業(yè)級基礎(chǔ)云服務(wù)商青云QingCloud日前宣布,Spark服務(wù)作為QingCloud大數(shù)據(jù)基礎(chǔ)平臺的重要組件現(xiàn)已正式上線。通過QingCloud Spark服務(wù),用戶能夠在2-3分鐘內(nèi)創(chuàng)建一個Spark集群,并支持橫向和縱向的在線伸縮,提供豐富的監(jiān)控告警服務(wù),極大地簡化了大數(shù)據(jù)集群的運維和管理,讓用戶從繁重的運維工作中解脫出來,投入到業(yè)務(wù)創(chuàng)新中。
數(shù)據(jù)是新一代的自然資源,是判別企業(yè)競爭力的試金石。然而,隨著數(shù)據(jù)量的爆炸式增長、數(shù)據(jù)來源和結(jié)構(gòu)的多樣化,傳統(tǒng)IT基礎(chǔ)架構(gòu)已無法滿足企業(yè)對數(shù)據(jù)處理的需求,Hadoop、Spark等支持PB級別數(shù)據(jù)的分布式存儲和分布式計算框架應(yīng)運而生。
青云QingCloud系統(tǒng)工程師&大數(shù)據(jù)基礎(chǔ)平臺負(fù)責(zé)人周小四(Ray Zhou)表示,基礎(chǔ)架構(gòu)是大數(shù)據(jù)應(yīng)用的基石,如果沒有底層數(shù)據(jù)架構(gòu)的支持,大數(shù)據(jù)就是紙上談兵。此次推出的Spark服務(wù)就是基于QingCloud穩(wěn)定高效、資源秒級響應(yīng)、彈性可伸縮的IaaS之上,能夠較大限度地發(fā)揮Spark輕巧、靈活和快速的優(yōu)勢。
Spark 是繼Hadoop之后新一代的大數(shù)據(jù)分布式處理平臺。它是一個基于內(nèi)存的、容錯型的分布式計算引擎。與Hadoop MapReduce相比,Spark的計算速度要快100倍。即便同樣采用硬盤計算,Spark也比MapReduce快10倍。Spark卓越的用戶體驗以及統(tǒng)一的技術(shù)堆棧基本上解決了大數(shù)據(jù)領(lǐng)域所有核心問題,使得Spark迅速成為當(dāng)前最為熱門的大數(shù)據(jù)基礎(chǔ)平臺。
Spark 提供了多語言支持,如Scala、Python、Java、R等,支持交互式操作。它在RDD(Resilient Distributed Datasets,一個容錯的、并行的數(shù)據(jù)結(jié)構(gòu)) 基礎(chǔ)之上提供了Spark Streaming流式計算,結(jié)構(gòu)化數(shù)據(jù)處理組件Spark SQL,機器學(xué)習(xí)庫 MLlib 以及圖計算GraphX等功能。
具體而言,青云QingCloud提供的Spark服務(wù)有如下特征:
青云QingCloud CEO 黃允松(Richard Huang)表示,Spark服務(wù)的發(fā)布標(biāo)志著QingCloud完整的大數(shù)據(jù)基礎(chǔ)平臺已初步建立,接下來QingCloud還會陸續(xù)發(fā)布一系列大數(shù)據(jù)相關(guān)服務(wù),如Hadoop、Cassandra、Hive、HBase和Storm等。未來,大數(shù)據(jù)、數(shù)據(jù)庫、緩存和對象存儲將同IaaS組件一起構(gòu)成QingCloud完整的數(shù)據(jù)產(chǎn)品生態(tài)圈,提供一站式的計算、存儲和數(shù)據(jù)處理服務(wù),更好地幫助用戶實現(xiàn)數(shù)據(jù)的價值。
圖片 - http://photos.prnasia.com/prnh/20150825/0861507886
圖標(biāo) - http://photos.prnasia.com/prnh/20140401/0861402031LOGO