微服务发展至今, Service Mesh 在业界有哪些值得参考的落地实践?

2020 年 3 月 11 日 InfoQ

微服务在过去几年中已在各个行业的系统架构中实践得如火如荼,在三四年前可能还会有是否要选择微服务架构的问题,但在今天几乎不会有这样“用”还是“不用”的疑问,大家关注的焦点变成了如何升级现有的微服务基础设施。特别是在大红大紫的云原生时代,“微服务”再次被推上风口浪尖。

比如 Service Mesh 就在过去两年中迅速走红,并有了诸多的落地实践。为什么会有这么多的 Service Mesh 实践,它背后的推动力是什么?另外在多年的“全民”微服务后,在这个时间点上我们也应该去复盘一下微服务架构的“好”与“坏”。任何架构都会有它的适用场景,今天的我们是否要在微服务架构之外再去实践新的架构方式以解决当前遇到的新问题呢?

如果你也有种种疑问,不妨关注一下QCon北京2020的微服务专题,来自阿里巴巴、腾讯、网易、美团等公司的技术专家将分享他们的实践案例。

1 阿里巴巴:Service Mesh 规模化落地实践

阿里巴巴集团在内部很早就开始使用 Service Mesh 了,是国内 Service Mesh 应用规模最大的公司之一,为了在集团大规模落地 Service Mesh,在内部对 Envoy 和 Istio 做了大量优化,同时也将这些优化贡献给了社区。目前阿里巴巴是国内对于 Envoy 贡献最多的公司,给 Envoy 贡献了 Dubbo filter、内存优化、EGDS 等。阿里巴巴内部集群的规模很大,上百万 Endpoint 的集群是很常见的,一个应用通常都会使用上百个服务,频繁的服务上下线会导致大量的 xDS 推送,他们对 Envoy 和 Istio 做了很多优化以解决这些问题。

通过阿里巴巴高级工程师张义飞的分享,你可以了解到 Envoy 和 Istio 在大规模落地时会遇到的一些问题,以及如何来解决。如 Envoy Subset 重复计算和内存占用大、Istio 全量推送 EDS 导致数据面产生大量的 CPU 开销、Envoy 连接池优化、优雅热升级等问题。

内容大纲
1. 运维和架构
  • Service Mesh 的架构演进思路

  • 如何控制 Service Mesh 上线的风险

  • Service Mesh 在阿里巴巴内部的部署和运维

2. Service Mesh 内部落地所遇到的问题和价值
  • 服务规模大

  • 接入 Service Mesh 成本高

  • Serivce Mesh 价值短期很难体现

  • 为什么要落地 Service Mesh

3. 开源和内部优化
  • EGDS (解决频繁推送问题)

  • Subset 优化(解决 Envoy CPU 和内存高的问题)

  • 连接池优化 (解决连接数过多的问题)

  • Dubbo filter 优化(解决数据面带来的 RT 损耗)

  • 优雅热升级 (数据面频繁升级如何不影响业务)

  • 透明拦截 (方便接入 Mesh,控制风险)

4. 未来展望
  • 下一步的规划

你将收获
  • 了解 Service Mesh 落地可能会遇到的一些问题

  • 了解 Service Mesh 所带来的一些价值

  • 了解 Service Mesh 在大规模场景下存在哪些问题,如何解决?

2 腾讯:微服务治理之负载保护和监控

随着业务迅速扩张,越来越多后端团队采用微服务设计方案。微服务设计在降低业务开发门槛的同时,对系统基础设施提出更高要求。在微服务场景中,后台服务数量迅速膨胀,各个服务技术选型多样化。两个问题显得尤为突出:

第一是系统整体负载保护。微服务场景中,各个服务之间调用 Topo 关系复杂,各种服务技术选型多样化,性能 / 健壮性参差不齐,有些服务具有"玻璃体质"。各种业务流量变化无常,有些纯粹 bug 引起,单个服务负载保护,不能防止整个系统"崩溃",需要一种机制整体负载保护机制保证各种业务流量安全运营,确保系统任何情况下都不发生"雪崩”。

第二是系统整体监控。系统异常时如何在噪声很大的信息量中迅速定位系统问题,并为系统设计优化提供建议或方案:如确定系统中哪些技术选型或设计方案是不合理的;系统正常时如何减少不必要的报警骚扰;系统亚健康时如何提供预警;确保监控为系统安全运营提供一层安全网。如果你也有这样的问题,不妨来看看腾讯科技增值服务部互娱 AMS 监控系统负责人朱龙云的分享。

内容大纲
1. 微服务理解
  • 软件设计演进史

  • 微服务哲学

  • 微服务基础设施

2. 系统负载保护
  • 负载保护设计方案和原则

  • 负载保护的职责和边界

  • 上游流控设计方案

  • 本机负载保护设计方案

  • 下游熔断方案

  • 负载保护效果

  • 流控在业务特性功能的应用拓展

3. 系统监控
  • 监控的历史和未来发展

  • 监控系统的境界,职责和边界

  • 监控方法比较以及与智能关系

  • 监控对象和数据上报方案

  • 监控定位问题方案和相关架构

  • 基于曲线检测的高频报警监控方案

  • 监控可视化和线下治理

你将收获
  • 微服务环境上游流控 / 本机负载保护 / 下游熔断方案相结合的整体系统负载保护方案;

  • 微服务环境下监控设计的方案,与传统监控差异,以及未来可能的发展方向。

3 美团:服务治理 Mesh 化过程中的挑战与应对

业界 Mesh 化趋势如火如荼,从 2019 年开始,美团基于公司海量场景及业务形态从 0 到 1 搭建起了 Service Mesh 体系。美团资深技术专家、基础开发团队负责人舒超将分享美团 Service Mesh 的架构演进历程,如:运维部署、性能优化、业务推进策略,以及无缝兼容公司原有服务治理体系的过程。

内容大纲
1. 美团 Service Mesh 历史概况
  • 美团为什么选择 Service Mesh

  • 早期美团 Service Mesh 的发展状况

2. 美团 Service Mesh 公司全面落地面临的挑战
  • 性能上的挑战

  • 服务治理兼容性上的挑战

  • 运维部署上的挑战

3. 美团 Service Mesh 性能优化
  • 流量转发优化

  • 策略缓存优化

  • 序列化反序列化优化

  • 其它优化

4. 美团 Service Mesh 与服务治理生态的兼容
  • 服务注册

  • SDK 兼容

  • 服务路由

  • 流量录制

  • 服务鉴权

  • 熔断限流


5. 美团 Service Mesh 部署运维
  • 如何在十几万节点中部署运维

  • 如何做到业务无感知热升级

  • 如何做到系统自身容灾降级

  • 如何做端到端全链路巡检

  • 美团 Service Mesh 未来规划

你将收获
  • Service Mesh 部署治理方案

  • 如何进行性能优化及运维

4 网易:基于 Istio 的 Service Mesh 2.0 架构升级实践

网易部分业务(严选、传媒等)自 2016 年起便开始探索用 Service Mesh 架构支撑微服务体系建设,并于 2017 年进行了落地,我们称之为 Mesh 1.0。这套架构在支撑业务快速发展的同时,也暴露出其在管控能力、流量治理方面存在的不足,于是在 2019 年开始落地基于定制 Istio 和扩展 Envoy 的云原生 Mesh 2.0 架构,Mesh 2.0 通过对 Mesh 1.0 架构的平滑升级,很好地支撑了业务度过大促、大事件等大规模高并发场景,取得了较好的落地效果。来跟网易架构师、技术专家冯常健看看他们的实践。

内容大纲


  • 网易的 Mesh 1.0 架构以及为什么要做架构升级;

  • 网易落地 Service Mesh 架构的前提条件;

  • 网易 Service Mesh 架构落地和升级的关键点,重点关注可落地性,比如平滑升级和迁移,以及这个过程中需要的系统改造、性能优化、支撑平台设计等。

你将收获


  • 了解 Service Mesh 系统建设的技术价值和真实收益;

  • 了解网易 Service Mesh 的基本架构和演进思路;

  • 了解企业实施 Service Mesh 架构会面临哪些问题、如何应对以及落地关键点。

适合人群:

有容器、微服务技术平台相关的项目经验,具备 K8s、Service Mesh、API 网关、服务框架、云原生等知识储备。

更多架构升级、业务中台、实时数据分析、架构演进、调度系统实践等前沿技术实践请持续关注 QCon 北京 2020,目前大会报名限时折扣中,还有门票买三赠一、买五赠二等多重优惠。识别二维码或点击【阅读原文】了解更多大咖实践。有任何问题欢迎联系 Ring:17310043226(微信同号)

登录查看更多
6

相关内容

FPGA加速系统开发工具设计:综述与实践
专知会员服务
64+阅读 · 2020年6月24日
大数据安全技术研究进展
专知会员服务
91+阅读 · 2020年5月2日
德勤:2020技术趋势报告,120页pdf
专知会员服务
189+阅读 · 2020年3月31日
《人工智能2020:落地挑战与应对 》56页pdf
专知会员服务
195+阅读 · 2020年3月8日
【新书】Java企业微服务,Enterprise Java Microservices,272页pdf
【阿里技术论文】AliMe KBQA:阿里小蜜中的结构化知识问答
专知会员服务
82+阅读 · 2019年12月14日
【阿里技术干货】知识结构化在阿里小蜜中的应用
专知会员服务
96+阅读 · 2019年12月14日
【干货】大数据入门指南:Hadoop、Hive、Spark、 Storm等
专知会员服务
95+阅读 · 2019年12月4日
医疗知识图谱构建与应用
专知会员服务
380+阅读 · 2019年9月25日
基于Prometheus的K8S监控在小米的落地
DBAplus社群
16+阅读 · 2019年7月23日
阿里技术大牛:一份架构师成神路线图!
51CTO博客
30+阅读 · 2019年7月6日
网易游戏海外AWS实践分享
高效开发运维
3+阅读 · 2019年5月21日
工行基于MySQL构建分布式架构的转型之路
炼数成金订阅号
15+阅读 · 2019年5月16日
每个架构师都应该培养业务思维
InfoQ
3+阅读 · 2019年4月21日
靠谱!NLP值得学习的关键技术有哪些?
AI前线
6+阅读 · 2019年3月10日
蚂蚁金服微服务实践(附演讲PPT)
开源中国
17+阅读 · 2018年12月21日
40+一线大厂AI落地案例指南|年终干货总结
InfoQ
8+阅读 · 2018年11月18日
今日头条推荐系统架构演进之路
QCon
32+阅读 · 2017年6月21日
Learning Implicit Fields for Generative Shape Modeling
Arxiv
10+阅读 · 2018年12月6日
Learning Blind Video Temporal Consistency
Arxiv
3+阅读 · 2018年8月1日
Arxiv
9+阅读 · 2018年3月23日
Arxiv
3+阅读 · 2018年3月22日
VIP会员
相关VIP内容
FPGA加速系统开发工具设计:综述与实践
专知会员服务
64+阅读 · 2020年6月24日
大数据安全技术研究进展
专知会员服务
91+阅读 · 2020年5月2日
德勤:2020技术趋势报告,120页pdf
专知会员服务
189+阅读 · 2020年3月31日
《人工智能2020:落地挑战与应对 》56页pdf
专知会员服务
195+阅读 · 2020年3月8日
【新书】Java企业微服务,Enterprise Java Microservices,272页pdf
【阿里技术论文】AliMe KBQA:阿里小蜜中的结构化知识问答
专知会员服务
82+阅读 · 2019年12月14日
【阿里技术干货】知识结构化在阿里小蜜中的应用
专知会员服务
96+阅读 · 2019年12月14日
【干货】大数据入门指南:Hadoop、Hive、Spark、 Storm等
专知会员服务
95+阅读 · 2019年12月4日
医疗知识图谱构建与应用
专知会员服务
380+阅读 · 2019年9月25日
相关资讯
基于Prometheus的K8S监控在小米的落地
DBAplus社群
16+阅读 · 2019年7月23日
阿里技术大牛:一份架构师成神路线图!
51CTO博客
30+阅读 · 2019年7月6日
网易游戏海外AWS实践分享
高效开发运维
3+阅读 · 2019年5月21日
工行基于MySQL构建分布式架构的转型之路
炼数成金订阅号
15+阅读 · 2019年5月16日
每个架构师都应该培养业务思维
InfoQ
3+阅读 · 2019年4月21日
靠谱!NLP值得学习的关键技术有哪些?
AI前线
6+阅读 · 2019年3月10日
蚂蚁金服微服务实践(附演讲PPT)
开源中国
17+阅读 · 2018年12月21日
40+一线大厂AI落地案例指南|年终干货总结
InfoQ
8+阅读 · 2018年11月18日
今日头条推荐系统架构演进之路
QCon
32+阅读 · 2017年6月21日
Top
微信扫码咨询专知VIP会员