數(shù)據(jù)處理
阿里云計算開放數(shù)據(jù)處理服務(wù)(Open Data Processing Service,ODPS)是飛天平臺上的大規(guī)模分布式數(shù)據(jù)處理服務(wù),它以RESTfulAPI 的形式支持基于描述性查詢語言SQL 的數(shù)據(jù)處理,并提供MapReduce的并行計算框架。ODPS 重點面向數(shù)據(jù)量大(PB 級別)且實時性要求不高的OLAP(On-Line AnalyticalProcessing)應(yīng)用,適用于海量數(shù)據(jù)統(tǒng)計、數(shù)據(jù)建模、數(shù)據(jù)挖掘、數(shù)據(jù)商業(yè)智能等互聯(lián)網(wǎng)應(yīng)用。
計算性能
基于數(shù)據(jù)驅(qū)動的多級流水線并行計算框架,支持Map、Reduce、Join、Union 等多種數(shù)據(jù)節(jié)點處理模式,支持直接使用SQL 語句對海量數(shù)據(jù)進(jìn)行離線分析。通過數(shù)據(jù)分裂將海量數(shù)據(jù)散布在整個集群內(nèi)部,數(shù)據(jù)容量瓶頸問題得以解決。同時,計算壓力也被平均分布在集群內(nèi)部,很好地解決了計算性能問題。
高可用性
系統(tǒng)提供錯誤監(jiān)控機(jī)制,對于故障采取自動遷移,采用多份備份來確保數(shù)據(jù)的安全性,系統(tǒng)達(dá)到高可用性。
語法兼容
提供與ANSI SQL 高度兼容的語法支持,支持用戶復(fù)雜的數(shù)據(jù)分析需求。提供Client 工具、RESTful 開放接口以及Java SDK 來為用戶服務(wù),用戶可以根據(jù)自己的需求選擇合適的方式來使用該服務(wù)