专访阿里云王伟民:一站式全链路,阿里云向云原生数据库2.0跃迁
数据库与操作系统、中间件并称为基础软件,“核高基”中的“基”指的就是这三类基础软件产品,它们在软件产业中有举足轻重的作用。很长时间以来,数据库一直是甲骨文、IBM、微软等国际厂商的天下,国产数据库始终处于市场边缘。不过,这一切正在悄然发生改变。在迈向大数据时代的今天,受益于中国经济的蓬勃发展和云计算等技术红利,市场格局正在悄悄变化,国产数据库从市场边缘逐渐走上舞台中央,成为一股不可忽视的新兴力量。
不久前,Gartner发布了2021年《全球云数据库魔力象限》,阿里云连续第二年被评为领导者。去年,阿里云首次挺进领导者象限,这也是中国数据库40多年来首次跻身全球顶级数据库行列。此番再次入选,代表阿里云数据库综合实力已稳居全球第一阵营。除了阿里云,今年入选的中国企业还有位列“Niche Players”象限的华为云,2021年入选Gartner魔力象限共有20家数据库厂商,中国占据两席,表明中国数据库厂商整体实力有了很大提升。
01因云而生的云原生数据库
为了跻身全球数据库第一阵营,中国数据库行业为之努力了40多年,一路走来实属不易。这期间先后涌现了包括人大金仓、南大通用、达梦、神州通用等优秀的国产数据库厂商,国家也先后推出了不少扶持政策和计划,包括“核高基”专项等,但国产数据库始终被Oracle、DB2、SQL Server等传统商业数据库压制,一直游离在主流市场之外。究其原因,国外数据库厂商起步早,产品成熟稳定、用户信任,更为重要的是它们已经建立了完善的生态,树立了很高的市场门槛。作为追赶者,国产数据库一直在跟随,而核心技术创新不足,迟迟无法取得突破。
这一切随着云时代的到来出现了转机,移动化、物联网的普及使得数据呈现爆炸性增长,对数据存储和计算分析的能力要求不断加强,衍生了企业对数据库的诸多新需求,诸如TB级乃至PB级的数据规模、更高并发、灵活按需扩展等对传统数据库提出了严重挑战。特别是,随着技术的进步,IT架构从传统物理机向云架构转换,企业上云趋势让越来越多的企业将应用向云转移,应用数据上云自然需要云上的数据库,给新一代数据库带来了新的机会和挑战。云原生数据库就此应运而生,阿里云PolarDB便是其中之一。
与传统数据库相比,云原生数据库能更充分利用云计算的潜力。“从传统数据库到云原生数据库,最大的技术变革是资源池化与资源解耦,以及由此而带来的弹性、高可用、容器化部署、智能化运维等核心能力。”阿里云数据库产品事业部负责人、达摩院首席数据库科学家李飞飞曾多次对外表达这样的观点。
实际上,阿里云数据库就充分了利用云技术的红利。PolarDB采用了分布式共享存储架构,通过计算与存储分离实现了数据库的高可扩展性。2021年PolarDB在存算分离上又前进了一步,实现了计算、内存、存储三层解耦的架构,通过内存池化让PolarDB实现秒级弹性。另外,作为全栈的云服务商,阿里云还提供IaaS层服务,这使得阿里云在软硬件协同方面有机会做一步优化,实现数据库整体性能的提升。
“比如,由于存储我们有机会参与定义,很多工作(如数据的过滤、解压缩)都可以放到存储层来做,通过offloading从而取得更多性能优势。”阿里云数据库事业部产品与解决方案部总经理王伟民在接受采访时表示。
阿里云数据库事业部
产品与解决方案部总经理 王伟民
另外,由于阿里云同时提供RDS、ECS等服务,使得RDS可以充分享受底层ECS的能力。比如,ECS对底层异构资源技术进行了有效屏蔽,通过RDS ON ECS,可以快速实现异构架构的支持。此外,云计算带来了海量的租户和先进的大规模分布式技术,使得云服务商可以用AI技术大幅提升运维运营的人效,从而降低成本。
“通常一名成熟的DBA可管理15~20个数据库实例。如果数据库部署在客户的数据中心,按我们当前的数据库实例规模需要数千人的运维团队,而通过引入了‘数据库自动驾驶技术(即数据库自治服务DAS)’,很多工作都可以自动完成,运维成本明显降低。”王伟民表示。
正是因为云数据库充分利用了云计算的技术红利,使得其在成本、扩展性等方面拥有先天性的优势,云数据库也被认为代表了数据库的未来。Gartner早在2018年就在《The Future of the Database Management System (DBMS) Market Is Cloud》这份报告中明确提出,传统自行部署数据库的方式已经过时,并预测到2023年云数据库的收入将占整个数据库的一半,后来又修正了预测,将这个时间提前了一年,认为2022年这个目标就可以实现。
02向云原生数据库2.0跃迁
在传统数据库时代,企业需要处理的数据以结构化为主,传统数据库也都基于此来进行架构设计。今天,越来越多的半结构化和非结构化数据的出现,比如,视频、日志以及物联网设备带来种类繁多的数据类型,也带来各种新的处理需求。面对多样化的需求,在传统数据库、数据仓库之外,一批新产品和技术开始兴起,包括图数据库、数据湖、各种数据迁移工具、分析和发现工具等。如何满足各种新兴的需求,对于新生代数据库厂商既是挑战也是机会。
基于十余年的深厚技术积累和强大的自研能力,今天的阿里云已经能为用户提供全面的数据库产品、服务和解决方案。截至目前,阿里云数据库技术与产品体系涵盖关系型数据库、非关系型数据库、数据仓库、数据库生态工具四大版块,从数据生产和集成(DTS、DMS和DBS)、数据实时处理与存储(RDS、PolarDB产品系列、Lindorm、Tair)、数据分析和发现(AnalyticDB产品系列)、数据开发、管理和智能运维(DMS、DAS)。阿里云通过一站式全链路、全生命周期、全场景的数据管理与服务,以及触手可及、简单易用、安全可靠的云数据库,可以让数据无缝的自由流动。这也就是阿里云数据库所说“一站式全链路数据管理与服务”,阿里云数据库将此作为新的战略目标,并将此定义为“云原生数据库2.0”的核心特征。
“云原生数据库2.0是一次升级,有两个升级方向:第一个是持续对原有的服务进行提升,比如内存、存储、计算三层解耦;另一个是一站式、全生命周期,也就是用户想要的负载和处理场景都有相应的服务能满足,并能完整覆盖数据的生产、发现、分析、洞察、展现、甚至到消亡的整个生命周期。”王伟民解释说。不仅如此,阿里云还通过线上线下融合将云原生数据库的能力赋能线下客户,混合云数据库平台DBStack就是一个很好的例子。这款产品在2021云栖大会上正式发布,主要面向政企客户。DBStack允许客户在自有数据中心部署,在享受私有部署的安全性的同时还能享受云原生数据库稳定、安全、低成本等能力。而且,DBStack还提供数据库一键迁移能力,方便政企客户替换传统商业数据库,快速上云。
众所周知,政企市场是检验云数据库产品竞争力的试金石,也是数据库能否真正站稳市场的根本。如今,阿里云数据库已得到越来越多政企客户的高度认可,其中包括自然人税收管理系统、中国邮政、中国太平洋保险、申万宏源证券、中国南方航空、友邦保险等一批行业头部客户。
这个成绩的背后,离不开阿里云的合作伙伴和阿里云数据库生态系统的建设。王伟民介绍,打造一个开放繁荣的生态是阿里云数据库的重点工作之一,阿里云正从以下几个方面发力:
-
与重点行业和区域的头部ISV合作,在银行、证券、保险行业遴选出一些合作伙伴,在联合解决方案方面进行产品的联调、对接、优化。
-
推出相关的培训和认证。阿里云有面向个人的认证(如ACA、ACP),也有面向合作伙伴解决方案的认证(PSA)。对于合作伙伴,阿里云希望不只是能转售阿里云的产品和服务,还能够基于这些进行创新,开发出新的解决方案。
另外,阿里云正在筹备生态联盟,一方面是希望让更多的用户参与进来,另一方面也希望和一些大规模、有能力、有意愿的用户一起共创,双方分工、协作推出新的解决方案。
03认认真真地开源
近年来,随着开源的普及,不少数据库选择了开源模式。2021年,阿里云数据库也走上了开源之路,先是在2021年5月率先开源了PolarDB for PostgreSQL分布式版,随后又在10月底的云栖大会上宣布开源云原生分布式数据库PolarDB-X和PolarDB for PostgreSQL共享存储版,后续还将开源云原生多模数据库Lindorm。与很多公司不同,阿里云开源的数据库产品都是在阿里云内部得到充分验证的原创性技术,阿里云的开源是真正完整、彻底的开源。
阿里云数据库开源的背后是阿里云对开源的高度认可以及自身的开源文化。其实,阿里云数据库的发展就与开源数据库有着颇深的渊源,当初就是用开源数据库MySQL替换了商业数据库,并在此基础上有了阿里云版的MySQL——AliSQL,而且阿里云的技术人员在MySQL、MariaDB等开源社区也非常活跃。
“我们认为开源是数据库未来的主流趋势,因为数据库的发展离不开庞大的生态支持,核心产品开源是充分利用社区力量建设生态的最佳方法。”王伟民说。
阿里云数据库开源的目的之一就是让更多人参与到数据库产业之中,做大生态。“因为云是规模经济,要让更多的用户将来更彻底地生于云、长于云。我们希望他从第一天开始就用我们这个产品,这样如果将来业务要上云了,他可能会选择我们云上对应的服务。”王伟民说。
第二个目的是加速技术的更新。在王伟民看来,“开源相当于智力的众筹,无论是缺陷的发现还是信任的建立、还是新功能特性的发展,都能够快速迭代。这也是云时代对传统软件时代的一个超越,是一种软件的进化。”。
当然,开源还体现了阿里云数据库的自信,开源作为一种可以让用户检验软件质量的方式,能够把信任建立过程中的挑战大幅度降低。
不过,王伟民同时也表示,开源不是灵丹妙药。开源的本质是回馈开发者和技术社区,让更多人参与并融入技术最前沿,是能够让技术发展更快的一个手段而已,并不是决定数据库公司、厂商能否在未来竞争中脱颖而出的必要条件。
“这里重要的是坚持开放的态度,要聚集众人的力量一起努力,以建立多元化的生态。”王伟民说,有了这个态度之后,至于如何开源这些细节其实不重要。比如,你可以拿开源做商业化,也可以拿开源做科研。
04结束语
今天,国家正在大力发展数字经济,而数据量的激增必将继续推动数据库市场的快速增长。另一方面,新的数据类型和处理需求不断涌现,库仓一体、实时数仓、湖仓一体等新概念频出,传统数据库面临新的挑战,这正是国产数据库脱颖而出的机会。
作为中国数据库厂商的优秀代表,阿里云能够进入并蝉联Gartner全球数据库魔力象限的领导者地位,背后体现的正是国产数据库进步。“一花不是春,孤雁难成行”,我们希望在阿里云等厂商的带领下有更多的国产数据库涌现出来,为我国数字经济的落地与发展提供更为强力的支持。
我有话说: