MySQL挑战：10万连接数

2019 年 3 月 15 日 Python程序员

在这篇文章中，我想探索一种与MySQL建立100,000个连接的方法。不限于空闲连接，还有执行查询功能的连接。

你可能会问，使用MySQL的时候真的有必要建立100,000个连接吗？虽然看起来有点过于追求极致，我还是在客户部署的时候看到很多不同的设计方案。有的部署了应用程序连接池，每一个连接池中有100个应用服务和1000个连接。有的应用程序使用了一种很糟糕的技术，“在查询慢时重连或重用”。这有可能会导致雪球效应，并在几秒钟内建立数千个MySQL连接。

所以现在我想设置一个超出预期的目标，看看能否实现。

配置

为此我将使用以下硬件配置：

由packet.net提供的裸机服务器，实例大小：c2.medium.x86
物理内核 @ 2.2 GHz (1 X AMD EPYC 7401P)
内存: 64 GB of ECC RAM
磁盘: INTEL® SSD DC S4500, 480GB

这是一个服务器级的 SATA SSD。

我们将使用到5台主机，下面作出解释，一个用于MySQL服务器的主机，以及四个用于客户端连接的主机。

在服务器上，我将使用带有线程池插件的Percona Server for MySQL 8.0.13-4。这个插件可以支持数千个数据库连接。

初始化服务器设置

网络设置（Ansible格式）：

这些是推荐用于10Gb网络和高并发工作负载的典型设置。

systemd限制设置：

还有my.cnf文件中MySQL相关设置：

客户端使用sysbench 0.5版本而不是1.0.x版本，原因我们将在下面解释。

工作负载配置

第一步 10,000连接数

这一步很简单，没有太多的事情需要处理。我们可以只用一个客户端实现，但是你有可能会遇到下面的错误：

这个是由于打开文件数限制引起的，也叫做TCP/IP套接字连接限制。可以在客户端设置 ulimit -n 100000 来解决。

我们能观察到的：

第二步 25,000连接数

使用25,000个连接的时候，在MySQL端会看到错误信息：

如果你查找这个错误的信息的话，你可能会看到这篇文章：

https://www.percona.com/blog/2013/02/04/cant_create_thread_errno_11/

但是这并不能解决我们的问题，因为我们已经把限制设置的足够高了：

我们是从这里开始使用线程池功能的：https://www.percona.com/doc/percona-server/8.0/performance/threadpool.html

在my.cnf中增加：

并重启 Percona 服务器。

打印结果：

现在还是相同的吞吐量，但是实际上95%的响应时间已经从3690毫秒优化到979毫秒（由于使用了线程池）。

第三步 50,000连接数

这是目前我们遇到的最大的挑战。首先，在尝试从sysbench中获取50,000个连接的时候遇到了以下错误：

Error(99)是一个很隐蔽的错误，它表示：无法分配请求地址。

它是由应用程序可以打开的端口限制所触发，我的操作系统默认情况下是：

这表示有28231个端口可用（60999减32768），或者说是与给定IP地址所能建立的TCP连接的端口数限制。

你可以在客户端和服务端上使用一个更大的范围来扩展这些端口。

这给我们提拱了61000个连接，但是已经非常接近一个IP地址的连接限制了（最大端口号65535）。关键点在于，如果我们想要更多的连接数，那么则需要为MySQL服务器分配更多的IP地址。为了实现100,000连接数，我将在运行MySQL的服务器上使用两个IP地址。

在整理出端口范围后，sysbench又抛出了以下问题

这是sysbench的内存分配问题（即lua子系统）。Sysbench只能为32,351个连接分配内存，这个问题在sysbench 1.0.x版本中尤为严重。

Sysbench 1.0.x的局限

Sysbench 1.0.x使用了一套不同的Lua JIT（Just In Time，即时编译技术），甚至在连接数达到4000的时候就会产生内存问题，所以使用Sysbench 1.0.x想要超过4000连接数都是不可能的。

因此，与Percona Server相比，sysbench会更早达到连接数瓶颈。我们需要使用更多的sysbench客户端来实现更多的连接。如果sysbench的连接上限是32,351，那么至少要使用4个sysbench客户端才能达到100,000个连接。

我使用2台服务器（每个服务器运行单独的sysbench）实现50,000个连接，每个sysbench上运行25,000个线程。

每个sysbench上执行结果如下：

然而同样的吞吐量（总共 16794 * 2 = 33588 tps）的情况下，有95%的响应时间都翻了一倍。这是可以预见的，因为相比于25,000个基准测试连接，我们使用的连接数是原来的两倍。

第三步 75,000连接数

我们将使用3个sysbench服务器来实现75,000个连接，每个服务器上运行25,000个连接。

每个sysbench的运行结果：

第四步 100,000连接数

实现连接数从75k到100k并没有什么大的变化，我们只需要启动一个额外的服务器并启动sysbench就可以了。对于100,000个连接，我们需要四个sysbench服务器，每一个服务器显示：

所以相同吞吐量（总共 8065 * 4 = 32260 tps）时，有95%的相应时间为3405ms。

一个很重要的点是：建立100k个连接并使用线程池，95%的响应时间甚至比不带线程池的10k个连接更快。线程池使得Percona Server更有效的管理资源并提供更快的响应时间。

总结

MySQL实现10万连接数是完全可行的，而且我相信我们还可以更进一步。这里有三个组件可以帮助我们实现目标：

Percona Server的线程池
适当调整网络限制
服务器主机使用多个IP地址（一个IP地址支持大约60k个连接）

附录：my.cnf

英文原文：https://www.percona.com/blog/2019/02/25/mysql-challenge-100k-connections/
译者：敦伟

登录查看更多

相关内容

Mysql

关注 397

一个开源的关系型数据库，开发者为瑞典 MySQL AB 公司。在2008年1月16号被 Sun 公司收购。而2009年，SUN 又被 Oracle 收购.目前 MySQL 被很多互联网企业所使用。有体积小、速度快、总体拥有成本低，开放源码等优点

【2020新书】实战R语言4，323页pdf

专知会员服务

102+阅读 · 2020年7月1日

【硬核课】分布式深度学习，93页ppt概述最新DDL技术发展

专知会员服务

96+阅读 · 2020年6月8日

【WWW2020-微软】理解用户行为用于文档推荐

专知会员服务

36+阅读 · 2020年4月5日

【2020新书】MySQL 8查询性能调优，974页pdf，一种提高执行速度的系统方法

专知会员服务

70+阅读 · 2020年3月25日

深度神经网络实时物联网图像处理，241页pdf

专知会员服务

78+阅读 · 2020年3月15日

【2020新书】如何构建数据团队？:设计集成的技能、需求和解决方案，257页pdf

专知会员服务

115+阅读 · 2020年3月11日

【2020新书】Kafka实战：Kafka in Action，209页pdf

专知会员服务

69+阅读 · 2020年3月9日

【大数据白皮书 2019】中国信息通信研究院

专知会员服务

138+阅读 · 2019年12月12日

【干货】大数据入门指南：Hadoop、Hive、Spark、 Storm等

专知会员服务

98+阅读 · 2019年12月4日

【电子书】C++ Primer Plus 第6版，附PDF

专知会员服务

88+阅读 · 2019年11月25日

在K8S上运行Kafka合适吗？会遇到哪些陷阱？

DBAplus社群

9+阅读 · 2019年9月4日

分享8个强大的黑客技术学习网站

黑客技术与网络安全

89+阅读 · 2019年8月29日

Packet Sender - 免费的UDP和TCP网络测试实用程序（Android App）

黑白之道

25+阅读 · 2019年3月8日

介绍WAF以及过滤机制

黑白之道

22+阅读 · 2019年2月5日

【大数据】海量数据分析能力形成和大数据关键技术

产业智能官

17+阅读 · 2018年10月29日

终于有人把云计算、大数据和人工智能讲明白了！(有赠书）

DBAplus社群

3+阅读 · 2018年3月13日

Neo4j 和图数据库起步

Linux中国

8+阅读 · 2017年12月20日

十五条有用的Golang编程经验

CSDN大数据

5+阅读 · 2017年8月7日

Spark的误解-不仅Spark是内存计算，Hadoop也是内存计算

大数据技术

5+阅读 · 2017年7月28日

一个人的企业安全建设之路

FreeBuf

5+阅读 · 2017年7月7日

Neural Module Networks for Reasoning over Text

Arxiv

9+阅读 · 2019年12月10日

DC-SPP-YOLO: Dense Connection and Spatial Pyramid Pooling Based YOLO for Object Detection

Arxiv

3+阅读 · 2019年3月20日

Graph Neural Networks for Social Recommendation

Arxiv

10+阅读 · 2019年2月19日

LNEMLC: Label Network Embeddings for Multi-Label Classification

Arxiv

4+阅读 · 2019年1月1日

Image Captioning

Arxiv

11+阅读 · 2018年5月13日

Deep Communicating Agents for Abstractive Summarization

Arxiv

5+阅读 · 2018年3月27日

Bottom-Up and Top-Down Attention for Image Captioning and Visual Question Answering

Arxiv

14+阅读 · 2018年3月14日

Triplet-based Deep Similarity Learning for Person Re-Identification

Arxiv

3+阅读 · 2018年2月9日

Graph Attention Networks

Arxiv

10+阅读 · 2018年2月4日

Deep Reinforcement Learning for List-wise Recommendations

Arxiv

13+阅读 · 2018年1月5日

VIP会员