分布式数据库哪家强?中国评测来帮忙

2020-06-24


分布式关系型数据库具有成本低、部署灵活、性能好、可靠性高等优势,目前已广泛应用于大规模、高并发、多模式的互联网业务场景,并已成为金融等关键领域信息化升级的重要技术方向。2019年,中国人民银行发布的《金融科技(FinTech)发展规划》中明确提出了加强分布式数据库研发应用,加大研发与应用投入力度,妥善解决分布式数据库产品在数据一致性、实际场景验证、迁移保障规范、新型运维体系等方面的问题。可见作为分布式数据库的重要应用行业,金融领域一方面要加强分布式数据库的使用,另一方面也要规避分布式数据库带来的潜在风险。


分布式关系型数据库具有物理分布性、逻辑整体性和站点自治性等特点,相对于传统的集中式数据库,分布式数据库一般使用普通的PC服务器,其成本更低;并且可以通过增加PC服务器的数量来获得更好的并发处理能力,适用于大规模并发场景;同时其分布式架构本身避免了集中式数据库的单点故障瓶颈,在某一个节点宕机后可以迅速调用备份节点,确保数据完整、不丢失,容灾能力更强。


那么,根据分布式数据库的特征和优势,如何对该技术能力进行科学客观量化评价?中国软件评测中心结合相关标准和工具,创新设计了分布式关系型数据库评价指标,并开展了测评实践,以为其在金融等关键领域应用提供参考。



以验证容灾能力为例:

我们将恢复点目标(Recovery Point Object,RPO)作为衡量其可靠性的核心指标,用以验证分布式关系型数据库的容灾能力。在对分布式关系型数据库持续进行写操作过程中,人为制造故障场景后(如切断一个或多个数据库的计算节点),观察其是否仍可稳定运行,并监测数据库性能恢复时间,统计故障恢复时间内写入数据的丢失率。


(一)搭建模拟业务场景的测试环境

搭建模拟实际业务场景的系统环境,部署分布式关系型数据库及其支持的应用系统。按照分布式关系型数据库技术特点,硬件设备方面一般需准备6台服务器及配套交换机,用于部署被测数据库,其中1台可复用部署业务场景模拟系统;另需1台桌面终端,部署压力测试工具。



211E


(二)模拟灾难进行测试,实时监测性能数据

测试工具建议选择LoadRunner,其作用一是模拟实际用户持续访问业务场景模拟系统,对被测数据库进行持续写入操作;二是监测在故障发生时数据库的性能表现。


测试时,首先通过LoadRunner模拟多用户并发,以固定速率对业务场景模拟系统进行持续数据(以数据记录为单位)写入操作;平稳运行5 分钟后,手动关闭被测数据库的1个计算节点,模拟该节点运行发生故障并退出;继续保持数据写入操作,等待系统运行稳定。期间,由系统、测试工具监测记录故障恢复时间、故障期间应写入数据记录和实际写入数据记录等数据,并计算RTO(恢复时间目标)、故障期间数据丢失率等指标。


50C2


(三)测试结果分析

参照GB/T 20889-2007《信息安全技术 信息系统灾难恢复规范》等标准要求,根据RTO、数据丢失率等指标结果,确定被测数据库支持的灾难恢复等级。






中国软件评测中心作为中国最早的、最权威的第三方测试机构之一,自2000年起就在国家“863”、核高基等重大专项中承担数据库软件的测试技术研究与测试实施工作,是推动数据库高质量发展的重要支撑力量,近二十年来,牵头作为国家队参与了多次数据库以测助评工作,对数据库技术发展趋势有深刻的理解,与数据库厂商及上下游企业共同建立了良好的生态关系。


中国软件评测中心牵头编制的分布式数据库测试大纲,覆盖了功能性、效率、可靠性、安全性、易用性、维护性、可移植性、兼容性、可扩展性等数据库的关键属性。为了高效的实施分布式数据库的效率、可靠性和可扩展性测试,自主研发了模拟进行数据库核心操作的模拟应用程序,结合loadrunner、Jmeter等压力工具,用以验证分布式数据库在高并发压力操作场景下表现;研究实现了恢复点目标(Recovery Point Object,RPO)测试方法,用以验证分布式关系型数据库的容灾能力。


近年来,中国软件评测中心已经实施了十多款主流分布式数据库产品的测试,你说你的分布式关系型数据库产品好,是否还差我们的评价?




业务联系人:

王郁 信息技术应用业务发展部副总经理

电话:010-68209209

手机:13366992611

邮箱:wangyu1@cstc.org.cn



作者:信息技术应用创新工程中心


3349381607