隨著AI時(shí)代的來臨,AI技術(shù)同樣對數(shù)據(jù)庫未來的發(fā)展有著重要的影響,數(shù)據(jù)庫面臨著又一次進(jìn)化。百度云在數(shù)據(jù)庫領(lǐng)域起步不算晚,近年來牢牢抓住了數(shù)據(jù)庫技術(shù)發(fā)展趨勢,在AiDB、NewSQL等領(lǐng)域都取得了頗多出色的建樹。本文將聚焦百度云數(shù)據(jù)庫的發(fā)展歷程和未來規(guī)劃,訪談全文如下。
Q:能否介紹一下百度云數(shù)據(jù)庫的發(fā)展歷程?
王龍:眾所周知,百度是做搜索引擎起家的,業(yè)務(wù)跟電商、游戲等有著很大區(qū)別,因此在這之前,百度是一家弱依賴數(shù)據(jù)庫的公司。隨著百度公司業(yè)務(wù)的發(fā)展,像鳳巢、O2O、金融等業(yè)務(wù)的出現(xiàn),百度的數(shù)據(jù)維度發(fā)生了很大改變,百度的數(shù)據(jù)庫技術(shù)也隨之高速成長。直到今天,百度云提倡ABC三位一體喚醒萬物、賦能行業(yè)的戰(zhàn)略,百度云數(shù)據(jù)庫也朝著數(shù)據(jù)庫ABC化的方向進(jìn)化。
具體來說,百度云數(shù)據(jù)庫團(tuán)隊(duì)在2010年正式成立,百度云數(shù)據(jù)庫產(chǎn)品架構(gòu)經(jīng)歷了從單主、級聯(lián)、集群、分布式到云數(shù)據(jù)庫、交易數(shù)據(jù)庫、安全數(shù)據(jù)庫的發(fā)展歷程。重要的時(shí)刻包括:
2010年之前處于簡單的單機(jī)時(shí)代。
2010年開始進(jìn)入三層架構(gòu)時(shí)代,實(shí)現(xiàn)了多層級聯(lián)、負(fù)載均衡、流量調(diào)度架構(gòu)。
2012年開始進(jìn)入分布式數(shù)據(jù)庫時(shí)代,實(shí)現(xiàn)了多機(jī)Join、分片、故障自恢復(fù)架構(gòu)。
2014年進(jìn)入到云數(shù)據(jù)庫時(shí)代,并在2015年、2016年陸續(xù)發(fā)布交易數(shù)據(jù)庫、安全數(shù)據(jù)庫,持續(xù)深化數(shù)據(jù)庫在垂直領(lǐng)域的場景應(yīng)用。
可以說,百度云數(shù)據(jù)庫雖然起步較晚,但是發(fā)展十分迅速,產(chǎn)品幾乎每年都會(huì)邁上一個(gè)重要的臺(tái)階。當(dāng)前百度云數(shù)據(jù)庫多項(xiàng)技術(shù)在國內(nèi)都是領(lǐng)先的,并且在數(shù)據(jù)庫前沿領(lǐng)域的探索和布局走在前列。
Q:介紹一下當(dāng)前百度云數(shù)據(jù)庫產(chǎn)品和技術(shù)的主要特點(diǎn)?
王龍:當(dāng)前,百度云分布式數(shù)據(jù)庫XDB是一款兼具高可用、靈活擴(kuò)展、商業(yè)級安全等特點(diǎn)的數(shù)據(jù)庫產(chǎn)品。主要特點(diǎn)包括:
金融級高可用,采用分布式數(shù)據(jù)庫可以實(shí)現(xiàn)自動(dòng)故障恢復(fù),有效避免腦裂,多地域多機(jī)房容災(zāi)提供小時(shí)級從零恢復(fù)。
數(shù)據(jù)高可靠RPO->0,分布式事務(wù)強(qiáng)一致性,首次完整實(shí)現(xiàn)MySQL分布式事務(wù)ACID特性。
靈活可靠擴(kuò)展的分布式設(shè)計(jì),多種路由規(guī)則的數(shù)據(jù)切片,完美支撐業(yè)務(wù)高并發(fā),按需彈性擴(kuò)容。
低成本的云服務(wù)架構(gòu),實(shí)現(xiàn)數(shù)據(jù)庫云化、數(shù)據(jù)壓縮業(yè)界領(lǐng)先的分布式PC架構(gòu),可自動(dòng)化運(yùn)維。
5A級數(shù)據(jù)安全,數(shù)據(jù)庫防火墻,內(nèi)核級加密與脫敏,軟硬一體化的安全保護(hù)。
Q:目前百度云數(shù)據(jù)庫產(chǎn)品在行業(yè)領(lǐng)域的應(yīng)用情況如何?
王龍:百度云的數(shù)據(jù)庫產(chǎn)品在金融、交通、制造等多個(gè)領(lǐng)域有著廣泛應(yīng)用,百度云堅(jiān)持?jǐn)?shù)據(jù)庫產(chǎn)品在垂直領(lǐng)域的場景深化。以金融行業(yè)為例,核心業(yè)務(wù)對于性能、安全性、合規(guī)性都有著極高的要求,百度云為此提供了金融數(shù)據(jù)庫一體機(jī)這種產(chǎn)品,與金融業(yè)場景強(qiáng)耦合。通過一站式交付、快速部署、統(tǒng)一管理和維護(hù),提供高性價(jià)比、高安全、高性能等特性,支持金融客戶的商業(yè)智能分析和實(shí)時(shí)交易等典型應(yīng)用。
百度云金融數(shù)據(jù)庫一體機(jī)并不是百度云拍腦袋想出來的,而是通過在金融領(lǐng)域的長期耕耘和摸索而沉淀出來的。比如,百信銀行是中國首家獨(dú)立法人形式的直銷銀行,是國內(nèi)運(yùn)用ABC技術(shù)打造智能銀行的領(lǐng)先代表,它的PaaS平臺(tái)就采用了百度云PaaS技術(shù)。數(shù)據(jù)庫是PaaS平臺(tái)中重要的組件,百度云的數(shù)據(jù)庫產(chǎn)品與技術(shù)很好地支撐了百信銀行的各種核心業(yè)務(wù)系統(tǒng),即很好地滿足了金融各項(xiàng)監(jiān)管,又很好地支撐了銀行各項(xiàng)核心業(yè)務(wù)系統(tǒng)的運(yùn)營。
類似百信銀行的金融客戶還有很多。隨著百度云的工程能力進(jìn)一步加強(qiáng),比如百度云金融數(shù)據(jù)庫一體機(jī)將會(huì)在國內(nèi)更多金融機(jī)構(gòu)中得到采用。
Q:金融行業(yè)對于數(shù)據(jù)安全以及合規(guī)有著極高的要求,百度云數(shù)據(jù)庫產(chǎn)品是如何滿足金融客戶在這些方面的需求?
王龍:百度云的數(shù)據(jù)庫產(chǎn)品在多家金融客戶中經(jīng)歷了考驗(yàn),全部都順利通過了監(jiān)管部門的考核。這主要得益于百度云數(shù)據(jù)庫出色的多梯次縱身防御安全解決方案。
百度云數(shù)據(jù)庫安全解決方案,內(nèi)核級利用AES加密算法存儲(chǔ)加密、SQL解析技術(shù)、語法解析+機(jī)器學(xué)習(xí)雙引擎審計(jì)等技術(shù)實(shí)現(xiàn)了敏感數(shù)據(jù)“看不見”、核心數(shù)據(jù)“拿不走”、運(yùn)維操作“能審計(jì)”、安全防護(hù)“全鏈路”,讓金融客戶在數(shù)據(jù)安全以及合規(guī)上得到充分保障。
Q:從百度云的角度來看,數(shù)據(jù)庫技術(shù)現(xiàn)在正朝著什么方向發(fā)展?
王龍:數(shù)據(jù)庫技術(shù)從誕生到現(xiàn)在已經(jīng)走過了將近50年的歷史,從最早IBM的數(shù)據(jù)庫論文開始到2008年,傳統(tǒng)關(guān)系型數(shù)據(jù)庫(RDBMS)一直是數(shù)據(jù)庫的主要發(fā)展方向;2008年之后,移動(dòng)互聯(lián)網(wǎng)、移動(dòng)應(yīng)用的興起產(chǎn)生了海量數(shù)據(jù),NoSQL數(shù)據(jù)庫的出現(xiàn)則兼顧了關(guān)系型和海量數(shù)據(jù);現(xiàn)在,數(shù)據(jù)庫則朝著NewSQL的方向發(fā)展,所謂NewSQL就是強(qiáng)關(guān)系型+海量數(shù)據(jù)+橫向擴(kuò)展;而在未來,數(shù)據(jù)庫技術(shù)一定會(huì)朝著ABC化的方向發(fā)展。
所謂數(shù)據(jù)庫技術(shù)ABC化,主要體現(xiàn)在三個(gè)方面:第一就是AI技術(shù)與數(shù)據(jù)庫的融合;第二,在業(yè)務(wù)層面,OLTP與OLAP融合,并且數(shù)據(jù)庫會(huì)出現(xiàn)更多的領(lǐng)域定制;第三,軟硬件會(huì)更加緊密的結(jié)合。
Q:百度云數(shù)據(jù)庫在NewSQL領(lǐng)域是如何規(guī)劃的?
王龍:百度云數(shù)據(jù)庫在NewSQL有著很深的布局。
首先,百度云與開源CockroachDB有著緊密的合作。眾所周知,CockroachDB是Google Spanner的開源實(shí)現(xiàn),是一款非常優(yōu)秀的全球分布式數(shù)據(jù)庫,擁有去中心化架構(gòu)、跨地域、分布式事務(wù)、多副本、強(qiáng)一致性等優(yōu)點(diǎn)。百度云吸收了開源的優(yōu)勢,并且結(jié)合實(shí)際業(yè)務(wù)情況進(jìn)行了優(yōu)化和云化,讓CockroachDB更加符合中國用戶的業(yè)務(wù)場景。
接下來,百度云數(shù)據(jù)庫將會(huì)加快NewSQL數(shù)據(jù)庫產(chǎn)品的軟硬件一體化,通過軟硬件的深度融合、GPU加速等,來進(jìn)一步實(shí)現(xiàn)產(chǎn)品的優(yōu)化和提升。
到2020年左右,百度云數(shù)據(jù)庫產(chǎn)品將會(huì)與AI、NLP進(jìn)行深度融合。
用作品證明實(shí)力,網(wǎng)站建設(shè)行業(yè)排名前列