下一代负载均衡的思考与实践

2022 年 7 月 21 日 InfoQ

作者 | 卢万龙
策划 | 辛晓亮

当下,Web 3.0 大火,各种炒币、非同质化代币、元宇宙等应用模式纷纷粉墨登场。这些场景有一个共同的点就是——上”链”(这里所说都是指公链。我个人认为联盟链都是假的,巨头的跑马圈地,最多就是 Web 2.0 重来一遍。只有公链才是真的,所有场景都值得重塑一遍)。上”链”有一点难度的,一是因为应用场景可能受政治因素影响,另外一个是技术也是影响场景落地的一个关键要素。

我认为技术关键点可能有三个,计算、存储和网络。这其中,又以网络因素影响最大。为什么呢?无限计算和存储的基础是通过网络连接构成一个”超级计算机”,使其拥有海量算力和存储。所以如何提高网络”力量”是根本,如何无”墙”连接?如何提速?如何合理流量调度?都是需要我们解决的问题。今天,咱们来一起聊下网络的流量调度,这时候就不得不提网络流量大闸——负载均衡。

一. 背景与现状

主流的负载均衡器有很多,大致分为两类,商业和开源。商业负载均衡代表产品有 F5 和 A10,它们的典型特征是运行稳定,功能齐全,但价格偏高,性能有限。例如 F5 中端产品 配置 4core CPU-32G mem-1G net bandwidth 的,应对如今的互联网的海量数据转发场景,根本无法应对。价格又偏高,低端 BIG-IP I2000 系列是 25 万 +,中端 BGP-IP i4000 系列是 45 万 +。性价比极低。

开源负载均衡又可以分为两类,一类是成熟的开源负载均衡,例如 Nginx、Haproxy 等。典型特征是功能基本满足,灵活,但缺少 vip 管理,热加载功能会造成业务抖动,配置数据基于文件存储,管理困难,对于企业级应用,不成熟。另一类是新兴开源负载均衡,例如 iqiyi dpvs、openELB 和 metaLB 等,特点是要么架构复杂,依赖特别多,dpvs 是典型代表。或者,社区不活跃,维护比较困难,有问题基本靠自己解决,难上加难。

综述,我们是否能有一个负载均衡器?它是一种全新设计模式的,分布式的,性能强的,云原生的,它是为未来海量流量调度而生的。它能充分解决上述问题,设计简单,成本低又易用?——是的,是有的,那就是负载均衡器 - 合页(Parasaus)。

二. 原理:设计架构与实现特性

合页(Parasaus)按照数据面和控制面分离的架构而设计,数据面只负责数据转发,控制面负责 watch 条目的变化、管理员的增删改查及节点探活,架构简单清晰。

  1. 数据面的流量转发节点无状态,支持横向扩展,最多支持 254 个节点。

  2. 流量转发基于 lvs 实现,流量转发在内核态完成,性能优异,非常高效。

  3. 整个负载均衡维护一个 ip 地址池和端口池,容量有 35000 个地址。可以为每个服务都创建一个连接地址。

  4. 控制面比较轻量,功能简洁,circle-watch 模块观察到条目变化,触发一个 hook,在 circle-healthcheck 添加探活条目,用以及时监测到服务是否可用。circle-healthcheck 探测到有不可用服务条目或服务恢复条目时,触发一个 hook,在数据面对转发流量进行调整,使流量能全部转发到所有服务健康节点上。

  5. 服务健康检查方式支持三种,分别是 L7 http、L4 tcp、mysql。

  6. 支持容器部署,产生的元数据存储到 etcd 中,易于管理,并保证高可用。

  7. 数据面的实现借鉴了 Kubernetes Service 的架构,支持多种负载均衡策略,例如 RR、LC、WLC、WRR、Source Hash 等。

  8. 配置的增删改均支持热加载,即使是业务高峰期,对业务也是零影响。

  9. 硬件均采用普通 x86 服务器,无需任何特殊配置(例如 dpvs 的 dpdk 驱动)或硬件,成本极低。自主可控,支持信创。

  10. 管理接口支持多种方式,例如接口、Yaml 文件和 Dashboard 界面,简单易操作。

三. 应用场景:为云原生而生

场景 1:完全云原生,是 Cloud-Native,更是 Kubernetes-Native 的,可大幅缩短通讯链路,有效降低延迟。举例:在传统场景中,K8S 中 pod 应用对外部服务的访问必须流出容器集群虚拟网络而进入数据中心物理网络,每次进出其他子网和经过转发节点(例如 DNS、负载均衡等),都会耗费时间,且增加故障域,如下:

在新场景中,借助合页((Parasaus)的强大功能,可实现流量转发操作全部在一个区域内完成。针对以上案例,负载均衡和探活功能由合页完成,且是在容器集群内全部完成,大大缩短链路和减少故障域。

场景 2:在数据中心内进行流量调度,用作于基础设施底层的一环,将流量在南 - 北向和东 - 西向进行合理分配。

四. 优势表现
  1. 性能:

我们针对当前比较主流的负载均衡开源产品进行了比较和测试,相较于 Nginx、Haproxy,合页 (Parasaus) 性能表现更好。

  1. 稳定性:

因为合页 ((Parasaus) 负载均衡是完全分布式的,网络流量是从交换机上通过等价路由完全均匀转发的。发生故障时,可以在 10 秒内完成故障转移,所以 SLA 是非常有保证的。

  1. 成本:

在合页 ((Parasaus) 作为云原生负载均衡的场景中,合页是作为一个应用运行在云中(1-3 个 pod),基本等同于免费。毋庸置疑,肯定比云上的任何一个负载均衡成本都低。hw 负载均衡 >0.32 元 / 小时,tencent 负载均衡 >0.788 元 / 小时,ali 负载均衡 >0.1+0.02*GB 元 / 小时(计算价格像是双 11 的网购,需要有奥数的本领)。

另外一个场景,合页 (Parasaus) 作为一台标准负载均衡,只需要三台服务器,估计 10w 左右,便可获得拥有海量数据转发的能力。比任何一种商业负载均衡价格都低。

五. 使用方式

目前合页 (Parasaus) 负载均衡支持三种方式,分别是 Dashboard 页面、Yaml 文件和 API 接口方式,使用方便,对开发人员和运维人员都很友好。举例:

Dashboard 页面方式:

Yaml 文件方式:

六. 关于合页(Parasaus)

合页(Parasaus)是 NextArch 基金会孵化的首个面向企业级生产就绪的下一代云原生分布式负载均衡开源项目。旨在为企业级用户提供多元、复杂化的使用场景,如数据中心、边缘、虚拟化 / 容器等场景,具有高安全性和稳定性、易部署和易运维可扩展等优点。

最后,希望有兴趣的同学关注和使用合页(Parasaus)Github加入社区,共同成长。

Github地址:

https://github.com/Dinosaur-Park/heyelb

点击底部阅读原文访问 InfoQ 官网,获取更多精彩内容!

今日好文推荐

开源大佬从谷歌离职:在 Go 语言项目上停滞不前,要去更小的企业寻求变革

这群 WebAssembly 大佬创业失败了:有时从 JS 迁移到 Wasm 并不值当?

没有内卷、996 和“老板”,乐视过上神仙日子?WPS 重申“删除用户本地文件”一事;小米被指违反 GPL 协议 | Q 资讯

相比高人气的 Rust、Go,为何 Java、C 在工具层面进展缓慢?

点个在看少个 bug 👇

登录查看更多
0

相关内容

互联网行业:下一代ODN网络建设解决方案白皮书
专知会员服务
13+阅读 · 2022年9月17日
企业数据治理痛点与阿里巴巴数据治理方案
专知会员服务
44+阅读 · 2022年7月4日
实时数据湖在字节跳动的实践
专知会员服务
29+阅读 · 2022年5月28日
6G内生AI网络架构十问
专知会员服务
37+阅读 · 2022年5月18日
邬贺铨院士关于6G的十点思考
专知会员服务
32+阅读 · 2022年3月24日
面向端边云协同架构的区块链技术综述
专知会员服务
48+阅读 · 2021年12月24日
多样性算力技术愿景白皮书
专知会员服务
81+阅读 · 2021年4月29日
混合云的多活架构指南
InfoQ
1+阅读 · 2022年6月4日
如何使用流处理器 Pipy 来创建网络代理
InfoQ
0+阅读 · 2022年2月25日
数据分片架构的下一次进化
InfoQ
0+阅读 · 2022年2月20日
解读 5 种软件架构模式
InfoQ
2+阅读 · 2022年2月15日
从托管到原生,MPP架构数据仓库的云原生实践
阿里技术
1+阅读 · 2022年1月21日
Proxyless Service Mesh在百度的实践与思考
InfoQ
0+阅读 · 2021年12月11日
从实践出发,解锁 Serverless 的不同面
InfoQ
0+阅读 · 2021年11月12日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
已删除
Arxiv
32+阅读 · 2020年3月23日
Optimization for deep learning: theory and algorithms
Arxiv
104+阅读 · 2019年12月19日
Arxiv
35+阅读 · 2019年11月7日
VIP会员
相关VIP内容
互联网行业:下一代ODN网络建设解决方案白皮书
专知会员服务
13+阅读 · 2022年9月17日
企业数据治理痛点与阿里巴巴数据治理方案
专知会员服务
44+阅读 · 2022年7月4日
实时数据湖在字节跳动的实践
专知会员服务
29+阅读 · 2022年5月28日
6G内生AI网络架构十问
专知会员服务
37+阅读 · 2022年5月18日
邬贺铨院士关于6G的十点思考
专知会员服务
32+阅读 · 2022年3月24日
面向端边云协同架构的区块链技术综述
专知会员服务
48+阅读 · 2021年12月24日
多样性算力技术愿景白皮书
专知会员服务
81+阅读 · 2021年4月29日
相关资讯
混合云的多活架构指南
InfoQ
1+阅读 · 2022年6月4日
如何使用流处理器 Pipy 来创建网络代理
InfoQ
0+阅读 · 2022年2月25日
数据分片架构的下一次进化
InfoQ
0+阅读 · 2022年2月20日
解读 5 种软件架构模式
InfoQ
2+阅读 · 2022年2月15日
从托管到原生,MPP架构数据仓库的云原生实践
阿里技术
1+阅读 · 2022年1月21日
Proxyless Service Mesh在百度的实践与思考
InfoQ
0+阅读 · 2021年12月11日
从实践出发,解锁 Serverless 的不同面
InfoQ
0+阅读 · 2021年11月12日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员