【最佳实践】巡检项:云数据库(Redis)CPU 使用率高
问题描述
Redis作为内存型数据库,通常CPU并不会成为性能瓶颈,但是如果因为使用不当,那么也会出现CPU利用率高的问题影响处理效率。
常见的引起Redis CPU利用率高的可能原因包括:
1. 运行时间复杂度高的命令
2. 热点Key的大量访问导致负载高
3. 超出预期的访问请求量
解决方案
场景一:通过腾讯云Redis云监控查看到QPS突增导致的CPU负载高
评估增加的业务请求是否符合预期,如果是预期内正常的请求增加,那么建议通过集群水平扩展来增加CPU处理能力。
常见两种水平扩展的方式:增加分片数量或者增加只读副本数量。
1. 写请求增加的场景或者对数据一致性要求高的场景,增加集群分片数量
- 标准版本优先评估升级至集群版本
具体实施办法请查看专栏文章的解决方案步骤一标准版本Redis升级集群版本
- 集群版本增加分片数量
具体实施办法请查看专栏文章的解决方案步骤二Redis集群版本添加分片
2. 读请求增加的场景,开启读写分离并增加只读副本数量来获得读扩展能力
- 开启读写分离
- 增加只读副本
2.1 开启读写分离
2.1.1 注意事项:
- 开启读写分离可能会导致数据读取不一致(副本节点数据延后于主节点),请业务优先确定接受可能的读数据不一致行为。
- 跨可用区部署的实例开启读写分离后,读请求会引入跨区访问延迟,请提前评估。
2.2.2 前提条件:
- 数据库实例版本为4.0及其以上。
- 数据库实例状态为运行中。
2.2.3 实施步骤:
- 在控制台-实例详情-节点管理页面,右上角开启副本只读开关。
- 参考如下参数说明,来勾选只读路由策略。
只读路由策略:
默认为副本节点,系统账号的所有读请求均发往副本节点。
同时勾选副本节点和主节点,系统账号的读请求将发往主节点和副本节点。
只读本地节点:当实例为多可用区部署时,显示该参数。指就近访问功能,固定为已禁用。可在控制台参数配置页面配置参数 read-local-node-only 来开启和关闭该功能。
- (可选)创建业务用的自定义只读账号。
基于客户的业务需求,来创建自定义的只读账号,查看如下参数说明来创建自定义的只读账号。
自定义账号的鉴权方式为账号名@密码,作为访问 Redis 的密码参数。
命令权限:
勾选只读权限,表示账号只有读取数据的权限,无修改数据的权限。
如果勾选读写权限,表示账号具有读和写数据的权限。
只读路由策略:
将指定账号的读请求分发到仅副本节点或者/和主节点。
没有开通副本只读的实例,不支持路由到副本节点。
存在访问副本节点账号的实例,不允许关闭副本只读功能。
2.2 增加只读副本数量
腾讯云Redis每个分片支持1-5副本部署,基于实例读业务的需求,在目标可用区部署新的副本即可。
【注意事项】增加副本会执行bgsave操作。
实施方法:
- 在腾讯云控制台-实例列表页面,选择【配置变更】-【增加副本】发起任务。
- 阅读变更影响。
- 选择目标副本数量和副本/副本组所在的可用区,确认费用,点击【确认】即可。
针对单可用区实例,在当前可用区添加副本即可;针对多可用区实例,基于就近访问原则来评估新增副本所在的可用区。
场景二:通过腾讯云Redis云监控查看到突发热点Key大量访问导致单个分片CPU突增
热点Key的场景通常无法单纯通过水平扩展的方式来降低CPU,需要把热点Key 拆分到不同的分片,来降低单个分片的CPU负载。
1.获取异常热Key
- 在腾讯云Redis控制台-系统监控页面,分析TOP 10 热 Key;例如下图获取实时热Key。
或者DBbrain-诊断优化-慢日志分析-实例页面获取Redis慢查询。
2. 由客户基于业务逻辑针对获取到的复杂命令进行优化。