阿里云-云小站(无限量代金券发放中)
【腾讯云】云服务器、云数据库、COS、CDN、短信等热卖云产品特惠抢购

一个表缺失索引引发的CPU资源瓶颈案例

183次阅读
没有评论

共计 1273 个字符,预计需要花费 4 分钟才能阅读完成。

背景

近几日,公司的应用团队反应业务 系统 突然变慢了,之前是一直比较正常。后与业务部门沟通了解详情,得知最近生意比较好,同时也在做大的促销活动,使得业务数据处理的量出现较大的增长,最终系统在处理时出现瓶颈。

分析和追踪问题的根源

首先:通过工具追踪服务器的性能,主要定位什么资源、在什么时候出现瓶颈。

这样的工具很多,可以网上搜搜工具和使用方法如 PerMon 和 PAL 等,最终得到结果是在业务高峰期(中午 12 点到 23 点前)如下图,CPU 资源使用率一直很高,初步可以判断是 CPU 资源紧张。那真的“资源”不够吗?!不一定,进一步分析。

一个表缺失索引引发的 CPU 资源瓶颈案例

 

下一步,要更进一步实时监测到底什么东西在消耗 CPU 资源。

可以实时监控 SQL Server 资源的工具也很多,我这里使用的 SQL Server Profiler,通过过滤和筛选相关 Event 后抓取想要的列,最主要是 CPU 这一列的值,如下:

一个表缺失索引引发的 CPU 资源瓶颈案例

 

上图,查看每一列 CPU 资源使用情况,看起来是不是很累,还好有另外一个国外很好的工具ClearTrace,它可以很轻松地分析出 trc 文件中最占资源的如 CPU/Reads/Writes 等,这里重点分析 CPU,如下图标出,第一二行就是导致 CPU 资源瓶颈的 SQL 语句

一个表缺失索引引发的 CPU 资源瓶颈案例

 

 

下一步,重点单独调试、分析上面列出的有问题语句。

我采用做法是将上面拷贝出来并填写对应条件参数的值,将整个语句拿到 SSMS 中单独调试,开启 Actual Execution Plan 和 IO、Time 统计,如下图显示单次执行 logical read 接近 8.5w 次,执行计划显示查找是通过索引扫描,这个表比较大,所以查询效率很低。而恰恰在这个案例中该语句执行频率极高,最终给资源特别是 CPU 造成很大损耗。

这里推荐大家另外一个不错的 执行计划分析工具sqlsentry plan Explorer。

一个表缺失索引引发的 CPU 资源瓶颈案例

接下来,试着在 QA 环境中,根据语句条件加上合适的非聚集索引。

看一下效果如下图,logical reads 降到个位数,加上非聚集索引后,执行计划走的 Index Seek,查询效率极大提升。

一个表缺失索引引发的 CPU 资源瓶颈案例

 

最后,实施到生产环境后,查看优化效果。

一个表缺失索引引发的 CPU 资源瓶颈案例

 

总结

很多时候,当我们遇到系统性能问题,需要先收集数据后,再通过数据分析确定问题根源。本案例在日常数据库运维中比较典型的,常规入手点就是检查 PerfMon 输出,已识别 Memory、I/O、CPU 的瓶颈,资源瓶颈可能就是来自于某个或几个执行效率特别差的查询语句,经过适当的数据收集、分析处理基本可以锁定根源,并通过适当的方法如调整索引、调整语句写法等基本可以解决主要性能问题,特别是在系统上线不久这些问题尤为明显。另外就是随着时间推移,系统的业务压力增加,数据量增加也会带来类似性能问题。总的来说,建议一定要先从应用层面、数据库中索引、存储过程代码等最基本的方面入手进行调优,最大程度榨取提升性能的空间,然后再考虑数据库配置、硬件等。另外特别提醒,解决一个瓶颈可能带来另一个瓶颈,所以建议对调优的内容做一段时间的监控。

本文永久更新链接地址:http://www.linuxidc.com/Linux/2016-12/138416.htm

正文完
星哥玩云-微信公众号
post-qrcode
 0
星锅
版权声明:本站原创文章,由 星锅 于2022-01-22发表,共计1273字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
【腾讯云】推广者专属福利,新客户无门槛领取总价值高达2860元代金券,每种代金券限量500张,先到先得。
阿里云-最新活动爆款每日限量供应
评论(没有评论)
验证码
【腾讯云】云服务器、云数据库、COS、CDN、短信等云产品特惠热卖中