网易互娱的数据库选型和 应用实践 TiDB (网易互娱的数据怎么看)

网易互娱的数据库选型和 应用实践 TiDB (网易互娱的数据怎么看)

业务架构简介

计费组是为网易互娱产品提供统一登录和支付高效解决方案的公共支持部门,对内是互娱的各个游戏工作室,对外是国内外数百个渠道。由于业务场景的特殊性,我们为各个游戏产品部署了不同的应用服务,其中大产品环境独立,小产品集中部署。

随着部门业务量的激增,单机 MySQL 在容量、性能、扩展性等方面都遇到了瓶颈,我们开始对其他数据库产品进行调研选型。本文将详细介绍网易互娱计费组针对自己场景的数据库选型对比方案,以及使用 TiDB 后解决的问题,并分享使用 TiDB 过程中集群管理、监控和数据迁移等方面的最佳实践,以供大家参考和交流。

MySQL 使用架构

网易互娱计费组线上 MySQL 的基本使用架构,如下图所示,其中箭头方向表示数据或请求的指向:

MySQL 使用的现状与问题

随着业务的发展,部门内各应用服务产生的数据量也在快速增长。业务落地数据量不断激增,导致单机 MySQL 不可避免地会出现性能瓶颈 。主要体现在以下几个方面:

数据库选型

调研目标

针对目前存储架构存在的问题,有需要使用其他存储方案的可能。考虑到目前的业务与 MySQL 高度耦合,对数据库选型的主要要求有:

其他要求:

可选方案

测试

基于 MySQL 的解决方案

一开始仍然是倾向使用基于 MySQL 的解决方案,比如 MySQL InnoDB Cluster 或 MySQL + 中间件的方案。

我们测试了 MySQL 集群 5.7.25 版本对比 8.0.12 版本,在 128 并发写各 1000 万行的 10 个表,比较单节点、3 节点和 5 节点下的情况,如下图所示:

在测试中发现,使用 MySQL InnoDB 集群的方案写性能比单机 MySQL 差约 30%,其他的读写测试结果也不甚满意。之后陆续测试 MySQL InnoDB Cluster 或 MySQL + 中间件的方案,不是测试结果性能不达要求,就是需要修改大量代码。

因此我们得出了基于 MySQL InnoDB Cluster 或 MySQL + 中间件的方案的不满足我们的业务场景的结论。总结来说,我们不使用 MySQL 分库分表、中间件或 MySQL 集群,原因主要是以下两点:

仔细分析来看,其实基于 MySQL InnoDB Cluster 或 MySQL + 中间件的方案,本质上是 MySQL 主从结构的延伸,并非真正的分布式拓展,像是以打“补丁”的方式来实现横向扩展,很多功能特性自然也难以让人满意

CockroachDB VS TiDB

在开源的分布式 NewSQL 领域,知名的有 TiDB 和 CockroachDB(简称 CRDB),二者都是基于 Google Spanner 论文的开源实现。我们对这两种数据库的功能和性能做了大量的调研和测试。

测试方面,我们也进行了全面地对比和测试。这里说其中一个测试案例:10 台机器 5 存储节点,160 并发访问单表 2 亿行,我们于 2018 年 7 月,对 CRDB-v2.1.0 版本和 TiDB-v2.0.5 版本进行了读写测试(CRDB 和 TiDB 集群均使用默认配置,未进行调优)。

集群拓扑

测试语句

 SELECT c FROM sbtest%u WHERE id BETWEEN ? AND ? SELECT SUM(k) FROM sbtest%u WHERE id BETWEEN ? AND ? SELECT c FROM sbtest WHERE id BETWEEN ? AND ? ORDER BY c SELECT DISTINCT c FROM sbtest%u WHERE id BETWEEN ? AND ? ORDER BY c
复制代码
 SELECT id, k, c, pad FROM sbtest1 WHERE k IN (?)
复制代码
 SELECT count(k) FROM sbtest1 WHERE k BETWEEN ? AND ? OR k BETWEEN ? AND ?
复制代码
 UPDATE sbtest%u SET k=k+1 WHERE id=?
复制代码
 UPDATE sbtest%u SET c=? WHERE id=?
复制代码

其中一个重要的测试结果如下:

结论

最终选型

综合对比结果如下表:

经过谨慎的考量,我们选择了 TiDB。

TiDB 在网易互娱计费组的使用

TiDB 使用架构

网易互娱使用 TiDB 的架构设计如下:

TiDB 解决了哪些需求

TiDB 使用现状

最佳实践分享

集群管理

运维实践

Prometheus 监控

官方集成了 Prometheus + Grafana 的实时监控平台,从集群的各个方面进行了完善的监控,包括:

PD 监控示意图如下,集群管理员可以很方便地掌握集群的最新状态,包括集群的空间 Region 等所有情况。

如果集群运行过程出错,在监控面板上很容易就发现,下图是使用过程中的一个案例:

应用访问 TiDB 写入数据时发现特别慢,读请求正常。排查后,根据 TiKV 面板发现 Raft Store CPU 这项指标异常。深入了解原因是因为数据库副本复制是单线程操作,目前已经到了集群的瓶颈。解决办法有以下两点:

解决方法:删除过期数据。

解决方法:从 2.1.5 升级到 2.1.15,开启自动 Region Merge 功能。

部分运维问题及解决方案

全网数据库遍历

以前部分业务遍历全网数据库获取所需数据,需要维护多个源,而且是异构源,非常复杂和繁琐。使用 TiDB 很好地解决了这个问题,只需要访问一个源就可以获取到所有想要的数据。

数据迁移

MySQL 到 TiDB

MySQL 数据库迁移到 TiDB 分为两个部分:全量和增量。

数据迁出 TiDB

如果数据需要反向导入或同步,可以利用TiDB Binlog工具将 TiDB 集群的 binlog 同步到 MySQL。TiDB Binlog 支持以下功能场景:

导入的方式:

优雅地「去分库分表」

举例:一个超级大表按天分表,现在打算查询某个账号一年间的信息。

 SELECT xx FROM HFeeall join HFee20190101 join ... join ...join ... join HFee20190917 WHERE xx;
复制代码

需要连接 N 个 join 条件,查询需要等待较长时间。

 SELECT xxFROM SuperHfeeall WHERE xx ;
复制代码

应用此方案,最大单表 700+GB,13+ 亿行,索引查询秒返回。

业务迁移

目标:利用 TiDB 的水平扩展特性,解决容量瓶颈和系统吞吐量瓶颈。

迁移原则

1)数据同步

使用或者 Syncer 将上游 MySQL 的数据同步到 TiDB 集群。同步流搭建后注意需要检查上下游数据一致性。

观察一段时间,同步无误后,可以根据业务需要迁移部分读流量到 TiDB 集群。

2)读写验证

这一阶段是验证应用访问 MySQL 和访问 TiDB 可以得到相同的结果,验证业务访问的准确性问题。

停止数据同步,使用流量复制工具将线上流量完全拷贝出来,同时读写 MySQL 和 TiDB。将两边的访问结果进行对比,核查 TiDB 是否可靠和可信。根据需要,这个阶段可以测试较长时间。

3)灰度切换

将步骤 2 的双写停止,即关双写,同时拉起上游的 DM 同步。

把访问部分非核心业务的库表写操作迁移到 TiDB,打开 TiDB 的 Binlog 开关对线上 MySQL 进行反向同步。这个操作,保证只写 MySQL 的数据同步到 TiDB ,只写 TiDB 的数据也可以反向同步到 MySQL,保证出了问题,随时可以回滚。当业务长时间访问正常,可以增加切换流量,进行灰度切换。 建议观察一段时间,至少一个月

4)迁移完成

当流量完全迁移完成,保持 TiDB 反同步到 MySQL 过程,继续观察一段时间,确认无误后,断开反向同步,100% 迁移完成。

总结与展望

TiDB 兼容 MySQL 协议,支持 TP/AP 事务且扩展性好,能很好地解决网易互娱计费组业务大容量、高可用等问题。目前我们的业务在不断深入和扩大规模使用 TiDB 。因为看好它,所以这里提出一些使用中的问题以帮助原厂持续打磨产品:

最后,根据网易互娱计费组已有的使用情况,我们计划继续加大、加深 TiDB 的使用场景,丰富业务类型和使用规模,期待 TiDB 给我们的业务带来更多便利

作者介绍

李文杰,网易互娱计费组,高级数据库管理工程师,TiDB User Group (TUG) 大使 。

原文链接

声明:本文来自用户分享和网络收集,仅供学习与参考,测试请备份。