一次PostgreSQL行估算偏差导致的慢查询分析

会员服务 ·

一次PostgreSQL行估算偏差导致的慢查询分析

2017 年 9 月 19 日 DBAplus社群 陈华军

皮卡丘引导关注动图

作者介绍

陈华军，苏宁云商IT总部资深技术经理，长期从事数据库相关的开发和维护工作，PostgreSQL中国用户会核心成员，为PostgreSQL及周边社区贡献过少量Patch，熟悉PostgreSQL及MySQL的部署和维护。

问题

最近某业务系统上线了新功能，然后我们就发现PostgreSQL日志中多了很多慢查询。这些SQL语句都比较相似，下面是其中一个SQL的explain analyze执行计划输出。

这个SQL执行了18秒，从上面的执行计划不难看出，时间主要耗在两次嵌套join时对子表的顺序扫描(图中蓝线部分)。乘以5429的循环次数，每个join都要顺序扫描2000多万条记录。

分析

既然是顺序扫描惹的祸，那么在join列上加个索引是不是就可以了呢？

但是查看相关表定义后，发现在相关的表上已经有索引了；而且即使没有索引，PG也应该可以通过Hash join回避大量的顺序扫描。

再仔细看下执行计划里的cost估算，发现PG估算出的rows只有1行，而实际是5429(图中红线部分)。看来是行数估算的巨大偏差导致PG选错了执行计划。

为什么估算行数偏差这么大？

通过尝试，发现问题出在下面的过滤条件上。不加这个过滤条件估算行数和实际行数是基本吻合的，一加就相差的离谱。

Filter: (((zsize)::text = '2'::text) AND ((tmall_flg)::text = '1'::text))

而上面的zsite的数据类型是char(10)，tmall_flg的数据类型是int，难道是类型转换惹的祸？在测试环境把尝试去掉SQL里的类型转换，发现执行时间立刻从10几秒降到1秒以内。看来原因就是它了。

zsize::text = '2' AND tmall_flg::text = '1'

==》

zsize = '2' AND tmall_flg = 1

生产环境下，因为修改应用的SQL需要时间，临时采用下面的回避措施

alter table bi_dm.tdm_wh_zl057_rt alter zsize type varchar(10);

即把zsize的类型从char(10)改成varchar(10)(varchar到text的类型转换不会影响结果行估算)。由于没有改tmall_flg，修改之后，估算的行数是79行，依然不准确。但是这带来的cost计算值的变化已经足以让PG选择索引扫描而不是顺序扫描了。修改之后的执行时间只有311毫秒。

原理

PG如何估算结果行数

PG通过收集的统计信息估算结果行数，并且收集的统计信息也很全面，包括唯一值数量，频繁值分布，柱状图和相关性，正常情况下应该是比较准确的。看下面的例子：

无where条件

postgres=# explain select * from bi_dm.tdm_wh_zl057_rt;

QUERY PLAN

---------------------------------------------------------------------------

Seq Scan on tdm_wh_zl057_rt (cost=0.00..81318.21 rows=2026121 width=154)

(1 row)

全表数据的估算值来自`pg_class`

postgres=# select reltuples from pg_class where relname='tdm_wh_zl057_rt';

reltuples

-----------

2026121

(1 row)

估算值和实际值的误差只有5%左右

postgres=# select count(*) from bi_dm.tdm_wh_zl057_rt;

count

---------

2103966

(1 row)

带等值where条件

postgres=# explain select * from bi_dm.tdm_wh_zl057_rt where tmall_flg = 1;

QUERY PLAN

--------------------------------------------------------------------------

Seq Scan on tdm_wh_zl057_rt (cost=0.00..86403.32 rows=523129 width=154)

Filter: (tmall_flg = 1)

(2 rows)

带where条件后，PG根据`pg_stats`收集的列值分布信息估算出where条件的选择率。

`tmall_flg = 1`属于频繁值，`most_common_freqs`中直接记录了其选择率为0.258133322

postgres=# select * from pg_stats where tablename='tdm_wh_zl057_rt' and attname='tmall_flg';

-[ RECORD 1 ]----------+--------------------------------------

schemaname | bi_dm

tablename | tdm_wh_zl057_rt

attname | tmall_flg

inherited | f

null_frac | 0.00033333333

avg_width | 4

n_distinct | 5

most_common_vals | {0,1,2}

most_common_freqs | {0.626866639,0.258133322,0.114566669}

histogram_bounds | {3,4}

correlation | 0.491312951

most_common_elems |

most_common_elem_freqs |

elem_count_histogram |

结合总记录数，可以算出估算结果行数。

postgres=# select 2026121*0.258133322;

?column?

------------------

523009.344503962

(1 row)

估算值和实际值的误差只有1%左右

postgres=# select count(*) from bi_dm.tdm_wh_zl057_rt where tmall_flg = 1;

count

--------

532630

(1 row)

带等值where条件，且条件列带类型转换

postgres=# explain select * from bi_dm.tdm_wh_zl057_rt where tmall_flg::text = '1';

QUERY PLAN

-------------------------------------------------------------------------

Seq Scan on tdm_wh_zl057_rt (cost=0.00..96561.46 rows=10131 width=155)

Filter: ((tmall_flg)::text = '1'::text)

(2 rows)

一旦在条件列上引入包括类型转换，函数调用之类的计算，PG就无法通过`pg_stats`计算选择率了，于是笼统地采用了一个0.005的默认值。通过这个默认的选择率计算的结果行数可能会和实际结果行数有巨大的偏差。如果where条件中这样的列不止一个，偏差会被进一步放大。

postgres=# select 2026121*0.005;

?column?

-----------

10130.605

(1 row)

相关内容

TDM

关注 0

【ICML2020-南大周志华老师组】针对未见类未标记数据的安全深度半监督学习

专知会员服务

42+阅读 · 2020年7月5日

【普林斯顿Yuxin Chen】噪声矩阵补全的推理与不确定性量化，117页ppt

专知会员服务

47+阅读 · 2020年6月29日

【SIGIR2020】用于冷启动推荐的内容感知神经哈希

专知会员服务

23+阅读 · 2020年6月2日

【CMU博士论文】使用静态和动态图来异常检测，Mining Anomalies using Static and Dynamic Graphs

专知会员服务

68+阅读 · 2020年5月26日

【2020新书】MySQL 8查询性能调优，974页pdf，一种提高执行速度的系统方法

专知会员服务

70+阅读 · 2020年3月25日

【香港中文大学-VLDB2020】Dash:可扩展的持久内存哈希，Scalable Hashing

专知会员服务

25+阅读 · 2020年3月17日

【2020新书】如何构建数据团队？:设计集成的技能、需求和解决方案，257页pdf

专知会员服务

115+阅读 · 2020年3月11日

【2020新书】Kafka实战：Kafka in Action，209页pdf

专知会员服务

69+阅读 · 2020年3月9日

【论文推荐WWW2020-UIUC】修正排序系统中的选择偏差：Correcting for Selection Bias in Learning-to-rank Systems

专知会员服务

32+阅读 · 2020年2月1日

宾西法利亚大学-统计分类中的对抗性学习:对攻击防御的全面回顾

专知会员服务

24+阅读 · 2019年10月20日

在K8S上运行Kafka合适吗？会遇到哪些陷阱？

DBAplus社群

9+阅读 · 2019年9月4日

携程用ClickHouse轻松玩转每天十亿级数据更新

DBAplus社群

11+阅读 · 2019年8月6日

实战▍一个完整的电信客服分析平台大数据项目：架构、实现、数据

36大数据

13+阅读 · 2019年3月20日

威胁情报驱动：F3EAD 之利用

计算机与网络安全

4+阅读 · 2018年12月28日

资源消耗降低2/3，Flink在唯品会实时平台的应用（有彩蛋）

DBAplus社群

4+阅读 · 2018年11月1日

干货：数据分析师的完整流程与知识结构体系

数据分析

8+阅读 · 2018年7月31日

【案例分析】京东大数据赋能业务，揭秘用户画像最佳实践

产业智能官

7+阅读 · 2017年9月28日

超越Spark，大数据集群计算的生产实践（内含福利）

CSDN大数据

6+阅读 · 2017年9月15日

【机器学习】【案例分析】基于机器学习的磁盘故障预测

产业智能官

12+阅读 · 2017年8月13日

Spark App自动化分析和故障诊断

CSDN大数据

7+阅读 · 2017年6月22日

MetaSelector: Meta-Learning for Recommendation with User-Level Adaptive Model Selection

Arxiv

4+阅读 · 2020年2月13日

Sogou Machine Reading Comprehension Toolkit

Arxiv

8+阅读 · 2019年3月28日

Joint Face Detection and Facial Motion Retargeting for Multiple Faces

Arxiv

4+阅读 · 2019年2月27日

One for All: Neural Joint Modeling of Entities and Events

Arxiv

11+阅读 · 2018年12月1日

Learning Personalized End-to-End Goal-Oriented Dialog

Arxiv

4+阅读 · 2018年11月12日

Testing Matrix Rank, Optimally

Arxiv

3+阅读 · 2018年10月18日

Efficient and Effective $L_0$ Feature Selection

Arxiv

5+阅读 · 2018年8月7日

FuzzerGym: A Competitive Framework for Fuzzing and Learning

Arxiv

4+阅读 · 2018年7月19日

Phrase Table as Recommendation Memory for Neural Machine Translation

Arxiv

3+阅读 · 2018年5月25日

MARS: Memory Attention-Aware Recommender System

Arxiv

6+阅读 · 2018年5月18日

VIP会员

一次PostgreSQL行估算偏差导致的慢查询分析

从传统银行到互联网，异地多活究竟有多难？

从一次火烧眉毛的SQL优化，看应用架构规范与敏捷之殇

2017 Gdevops北京站：说好的干货与PPT来喽！

如何打造一个日均PV千万级别的大型系统？

警惕：重Java轻SQL乃性能大忌！

相关内容