數據庫市場形成今天的格局已經很久了,商業(yè)數據庫為王,這幾乎沒有變過。不過,云來了,以AWS、阿里云為代表的云服務商攜云原生數據庫發(fā)起了新一輪挑戰(zhàn)。與以往歷次的挑戰(zhàn)不同,這次的競賽換了賽道。
3月21日,阿里云對外發(fā)布了POLARDBv2.0。此前的POLARDB針對的是MySQL用戶,這一次POLARDB還可以兼容Oracle數據庫。據悉,這也是首個兼容Oracle的云原生數據庫,可幫助金融、醫(yī)療、制造等大型企業(yè)在數小時內完成業(yè)務遷移,10TB數據備份只需10分鐘。
因云而生的POLARDB
數據庫誕生于上個世紀70年代,經過這些年的發(fā)展,無論是技術還是市場格局都已經趨于穩(wěn)定,因此市場很長時間以來一直處于波瀾不驚的狀態(tài),不過,云時代的到來打破了這種平靜,因為在云時代傳統(tǒng)數據庫面臨很多新的挑戰(zhàn),這就給了新生的云原生數據庫以機會。
在2019阿里云峰會·北京站上,阿里云智能總裁張建鋒在演講時曾提到了云給這個世界帶來的三個變化,即IT基礎設施的云化、核心技術的互聯網化、應用的數據化和智能化。
“基礎設施的云化需要一套新的系統(tǒng),需要基于互聯網技術來進行改造。因此,下一代的技術一定構建在互聯網技術和云化基礎設施上的。”張建鋒表示。
而阿里云的數據庫POLARDB正是適應基礎設施的云化而誕生的,正因為此,POLARDB這類數據庫也被稱為云原生數據庫,包括AWS的Aurora也是這一類型的代表。
實際上,阿里云早期也是傳統(tǒng)數據庫的使用者,正是因為云的誕生,因為自身業(yè)務不斷成長,發(fā)現傳統(tǒng)數據庫越來越難以滿足自身的需求,才有了自研的云原生POLARDB。
“阿里的業(yè)務很復雜,數據量很大,隨著業(yè)務的發(fā)展,基于開源數據庫的分布分表中間件的解決方案已經不能滿足。這就是POLARDB誕生的直接原因?!卑⒗镌浦悄軘祿飚a品線總負責人李飛飛說。
享受云等諸多技術紅利
作為一款誕生于云時代、一開始就架構在云平臺之上的云原生數據庫天生地具有很多優(yōu)勢。比如,彈性伸縮能力就是云原生數據庫最重要的特點,即當用戶業(yè)務量低的時候,就少分配資源;當業(yè)務負載高的時候,通過只讀節(jié)點等逐漸擴展的方式,讓數據庫支持業(yè)務的增長。這種彈性伸縮的能力還帶來另一個好處,就是按需付費,成本節(jié)約。所以,云原生數據庫往往具有更高的性價比。
“傳統(tǒng)數據庫的典型架構就是單節(jié)點架構,有存儲引擎、查詢引擎和優(yōu)化器引擎,再上面是SQLParser,這一套架構中存儲和計算是綁定在一起的,而云原生數據庫存儲與計算是分離的?!崩铒w飛表示。
李飛飛介紹說,POLARDB采用的是分布式共享存儲架構,計算與存儲分離。由于計算與存儲的解耦,存儲就可以通過RDMA高速網絡做成一個分布式存儲,而看起來仍然像一個本地盤。正是由于采用了計算與存儲分離的架構設計使得POLARDB的最大數據容量可以達到100TB,這是開源數據庫難以企及的,也成為POLARDB很多早期用戶采用它來取代MySQL的一個主要原因。
除了借助RDMA等網絡技術實現彈性伸縮能力之外,POLARDB還享受了很多現代技術的紅利。比如,POLARDB采用了英特爾的傲騰——這是一種訪問速度介于內存和SSD之間的新型存儲介質,如果需要擴容,可以在5分鐘之內完成節(jié)點規(guī)格的升級和進行只讀節(jié)點的擴展,極速適配。
實際上,傲騰的對數據庫的影響不只是快速,它也在一定程度上改變了數據庫的設計邏輯,讓數據一旦寫了之后實時就可持續(xù)性了,持久化了。
另外,像GPU加速在POLARDB中也有采用。在POLARDB中一些重復性或相似性比較高的計算,會Offload到FPGA來做,通過FPGA的定制化的計算模塊重復調用,來節(jié)省CPU的時間,從而帶給用戶更好地體驗。
不斷升級的產品
POLARDB也在不斷升級,目前阿里云還在研發(fā)POLARDB的分布式版本,今年會宣布公測。該版本的目標客戶是業(yè)務數據量超過單機數據庫的承受能力,業(yè)務復雜對資源彈性要求高,例如要求數據不丟失,系統(tǒng)高穩(wěn)定高可用。
據悉,它能支持更海量的數據、更高并發(fā)的處理能力,基于阿里的核心業(yè)務十余年打磨,圍繞高效低成本存儲引擎X-Engine,提供企業(yè)化高可用的X-Paxos協議實現。
李飛飛介紹,POLARDB分布式版本的一大特性就是解決了分庫分表問題。早期互聯網公司采用基于中間件技術的分庫分表技術解決資源擴展問題,但這會大大增加系統(tǒng)的復雜度和對應用的侵入。因為很多時候這意味著業(yè)務邏輯的重構、軟件的改寫,成本非常高。而POLARDB分布式版本具有類似GoogleSpanner的先進架構,同時又擺脫其昂貴復雜的原子鐘依賴。
“阿里很多大促活動,比如‘雙11’,光靠云原生共享存儲是無法完全解決這個問題。過去兩年,我們一直在研發(fā)自己的分布式存儲技術,它的核心思路就是分布分表,但我們不希望用中間件的解決方案?!崩铒w飛說。
李飛飛解釋說,與基于中間件技術的分庫分表不同,阿里云希望做一個原生的分布式數據庫,在內核里面做分布分表,以盡可能減少對業(yè)務層的沖擊?,F在阿里云要把分布式數據庫的技術和POLARDB有機地結合起來。
“我們的目標是打造一個通用的商業(yè)數據庫,要求非常產品化、標準化,能夠支持不同產品。未來POLARDB分布式版本能夠提供一個基于共享存儲的一寫多讀的云原生數據庫,同時利用分布式架構能夠快速靈活拓展。這樣,不管是在公有云上,還是針對線下的一些企業(yè)級超大規(guī)模的用戶,我們都能夠用POLARDB去統(tǒng)一滿足用戶需求?!崩铒w飛說。
有挑戰(zhàn)更是機遇
很顯然,在數據庫市場,POLARDB是一個新來者,甚至與AWS的Aurora相比,POLARDB也要晚幾年。但李飛飛認為,作為挑戰(zhàn)阿里云的數據庫具有自己的獨特優(yōu)勢,而最大的優(yōu)勢是背后有阿里的業(yè)務在推動。
“任何技術都是業(yè)務推動來衍生的,只要你有業(yè)務場景,技術就一定會逐步從發(fā)展到領先。比如阿里電商‘雙11’在世界上就絕無僅有,阿里云的數據庫必須經受住海量和高并發(fā)的實戰(zhàn)考驗。”李飛飛說。
實際上,阿里云數據庫技術也得到國際咨詢機構的認可,在2018Gartner數據庫魔力象限中,阿里云成為國內首個入選的科技公司。
“這代表了阿里云的數據庫技術已經和頂級數據庫廠商站在了同一個舞臺。中國數據庫廠商有這個機會,非常榮幸。不能只說是阿里的功勞,也是整個中國IT產業(yè)、中國經濟發(fā)展的結果。如果沒有中國數字化經濟的蓬勃發(fā)展,我們是不可能取得這樣的成功?!崩铒w飛說。
李飛飛坦言,作為挑戰(zhàn)者阿里云數據庫要真正與數據庫巨頭競爭,面臨不小的挑戰(zhàn)。
第一個是阿里云和傳統(tǒng)數據庫廠商有一個非常大的不同,就是傳統(tǒng)數據庫廠商可以只研發(fā)數據庫產品,而阿里云數據庫還要支持集團的業(yè)務,還要服務自己云上的客戶以及私有云、混合云的外部客戶。
“我們面臨的是非常復雜的一個場景:又要研發(fā),又要運維。既要支持集團的業(yè)務,又要支持云上的業(yè)務,所以穩(wěn)定性、安全運維這絕對是我們第一生命線?!崩铒w飛表示。
第二個挑戰(zhàn)也是李飛飛認為最核心的挑戰(zhàn),是混合云部署所帶來的,這里面既有技術上的挑戰(zhàn)也有業(yè)務上的挑戰(zhàn)。比如,你怎么保證安全、穩(wěn)定、高效地部署混合云,混合云的數據架構如何設計等等。
第三個是數據的安全隱私保護,這是阿里云數據庫一直不敢放松的。
第四點就是智能化大規(guī)模落地和應用。當系統(tǒng)越來越復雜,數據量越來越大,運維挑戰(zhàn)越來越高的時候,就必須利用人工智能、機器學習的技術盡可能地實現自動運維,提高運維效能。
“這些是挑戰(zhàn)也是機遇,阿里云的業(yè)務快速發(fā)展正在不斷驅動我們技術的發(fā)展,驗證和帶領技術不斷往前走,我們已經走在了云原生數據庫領域的前列?!崩铒w飛總結說。
聲明:本文為轉載類文章,如涉及版權問題,請及時聯系我們刪除(QQ: 2737591964),不便之處,敬請諒解!