levycui 发表于 2022-9-6 18:04:52

SQL执行速度优化案例

本帖最后由 levycui 于 2022-9-6 18:06 编辑

问题导读:
1、问题背景是什么?
2、如何进行问题分析?
3、疑问点排查及分析思路是什么?
4、有哪些优化点?

聊聊SQL优化分析过程。

技术人人都可以磨炼,但处理问题的思路和角度各有不同,希望这篇文章可以抛砖引玉。

以一个例子为切入点

一、问题背景

某业务模块反馈SQL慢,优化过程中的一些思考做个记录。

基础环境:


[*]    主机类型:阿里云
[*]    操作系统:CentOS release 7.4
[*]    存储:EMC
[*]    内存:64 G
[*]    CPU型号:Intel(R) Xeon(R) Platinum 8163 CPU @ 2.50GHz ( 1 U * 8 core)
[*]    CPU核数:16CORE
[*]    数据库环境:11.2.0.4

问题现象:

慢SQL

简单说明:

在很多应用场景中,SQL 的性能直接决定了系统的性能。此外,查询速度慢并不只是因为 SQL 语句本身,还可能是因为内存分配不佳、文件结构不合理、优化器判断异常等其他原因。

本文介绍一些通过调整 SQL 语句就能优化SQL的通用小技巧,优化 SQL 的方法不能解决所有的性能问题,但是却能处理很多因 SQL 写法不合理而产生的性能问题。

二、分析说明


[*]    通过分析定位慢SQL,分析慢SQL原因;
[*]    追溯SQL执行历史数据,分析关键指标在SQL多次执行的波动,这些关键指标可以用来做为SQL健康度参考指标。
[*]    用实际数据来验证推断,排除掉其它干扰因素,定位SQL慢的根本原因,帮助快速修复。

三、疑问点排查及分析思路

1、原SQL结构如下:
select ... from ...
where
(
    (
   order_creation_date>= to_date(20120208,'yyyy-mm-dd') and
    order_creation_date<to_date(20120209,'yyyy-mm-dd')
    )
or
    (
   send_date>= to_date(20120208,'yyyy-mm-dd') and send_date<to_date(20120209, 'yyyy-mm-dd')
    )
)
andnvl(a.bd_id,0) = 1
业务需求我看了一下,还真不能怪开发小哥这么写。

2、SQL执行计划



从执行计划(Pstart、Pstop)中可以看出来,SQL涉及了一个分区表,扫描了所有分区。

3、如何改写?

找到了原因,下一步就是改写SQL了。

两个思路:

第一通过union all把原来的SQL拆分;

第二通过调整日期格式,使分区特性起效。


尝试改写为:

select ...
from ...
where
    order_creation_date >= to_date(20120208,'yyyy-mm-dd') and
    order_creation_date<to_date(20120209,'yyyy-mm-dd')
union all
select ...
from ...
where
send_date>= to_date(20120208,'yyyy-mm-dd') and
    send_date<to_date(20120209,'yyyy-mm-dd') and
nvl(a.bd_id,0) = 5

改写后SQL执行计划如下:




效果还不错,缺点是扫描了两遍表,SQL性能得到了很大提升,执行时间从1个多小时缩减到1分钟。


总结

1、通过使用union all,简化条件判断。
2、规范SQL的写法:对于非标准的日期格式,Oracle在复杂逻辑判断的情况下分区特性会失效。这种情况下,会走全表扫描,结果是正确的,但是执行效率会很低。

作者:阿陶学长
来源:https://mp.weixin.qq.com/s/zvIjG1jgieE7WV2xm_kcZw


最新经典文章,欢迎关注公众号http://www.aboutyun.com/data/attachment/forum/201903/18/215536lzpn7n3u7m7u90vm.jpg

页: [1]
查看完整版本: SQL执行速度优化案例