AWS案例研究:IGG

2018 年 7 月 18 日 Linux中国

关于IGG

IGG成立于2005年,是全球领先的手机游戏开发商及运营商,为全球游戏玩家提供游戏和相关服务。IGG总部位于新加坡,在美国、中国、加拿大、日本、韩国、泰国、白俄罗斯及菲律宾设有分支机构,客户遍及全世界200 多个国家和地区。截止到2016年底,IGG拥有逾3.4亿个全球玩家账户,其中月活跃用户约1,860万。在App Annie发布的“2016年度全球手游52强发行商”榜单中,IGG位列第27名。IGG于2013年10月在港交所上市,并在2015年完成了从香港创业板到主板的跳跃。2016年3月,IGG被纳入恒生互联网科技业指数、恒生环球综合指数、恒生综合指数系列的成份股

面临的挑战

IGG的游戏玩家遍及全球,为了给玩家提供最佳的用户体验,IGG需要在全球多个区域部署服务器。在使用AWS云服务之前,IGG拥有自建的机房,同时也采用多家公司的主机租用服务

随着业务的快速发展,原有的服务部署模式开始面临多方面的挑战,主要体现在三个方面:其一是服务器资源管理不方便、扩展性和灵活性受限制,当访问峰值来临时,部署新服务器的周期较长,而当某款游戏的访问量暂时降低时,又会造成已有服务器资源的浪费;其二是开发和运营新游戏时难以控制成本,因为对游戏运营公司来说,一款游戏是否成功受很多因素的影响,但在运营每一款新游戏时都需要投入大量的IT资源,万一不成功,则会浪费已购置的服务器资源;其三是如何建立双活的灾备系统以确保在任何情况下都能为全球玩家提供持续可靠的服务。

为了应对这些挑战,IGG开始考虑采用公有云服务作为自有数据中心(下面简称:自有IDC)的补充。经过考察、分析和对比,IGG决定采用AWS云服务,并从几年前开始尝试使用AWS在新加坡、法兰克福、日本、美国等可用区的云服务部署海外游戏节点。2016年8月,为了提升整个游戏运营系统的稳定性和可靠性,IGG决定为其位于北加州的核心业务系统建立双活灾备系统,在AWS 专业服务团队的帮助下,IGG利用AWS在美国俄勒冈州可用区的云服务,成功地搭建起双冗余的灾备中心,确保IGG的核心业务不会因突发意外而中断

为什么选择AWS

IGG最初使用AWS云服务源自于几年前的一个新项目,该项目是一个即时通信产品,需要大量的IT资源,必须部署数百台高配置的服务器以应对高并发的需求,依靠原有的自有IDC是无法快速提供服务的。更关键的是项目属于探索性质,万一项目不成功,数百台新增服务器就会浪费掉,而采用AWS云服务,IGG只需要按月付费,一旦项目发生变化或不成功,可以直接关掉云服务器,不会导致更大的损失。“事实证明这是一个非常明智的决定。” 伍建平说。尽管市场上也有其他一些云服务商,但AWS云服务所具有的全球化覆盖、丰富的功能、成熟可靠的技术及专业服务能力是促使IGG选择AWS 的主要原因

全球化的覆盖

AWS云服务包含全球 16 个地理区域内的 44 个可用区,遍及美东、美西、圣保罗、爱尔兰、法兰克福、伦敦、新加坡、北京、东京、悉尼、首尔、孟买等地,服务范围涵盖全球。此外,与其他云服务商不同的是,AWS的每个服务区都包括多个可用区,通过跨可用区的应用部署,用户可以轻松地获得容错能力并降低延迟。这些特性使得IGG可以轻松地完成全球化的服务器部署,为遍及世界各地的玩家提供快速、稳定、可靠的服务

丰富的功能

AWS云服务为用户提供了丰富的功能,涵盖了计算、存储、联网、分析、管理、安全及身份管理、移动服务等方方面面。“我们可以根据业务的实际需求,将AWS云服务用于不同的领域。”伍建平说。例如,IGG的全球化游戏运营平台对扩展性、安全性和可靠性都有很高的要求,当某款游戏的玩家激增时,需要在极短的时间内部署并启用新的服务器,IGG就利用Amazon Elastic Compute Cloud (Amazon EC2)Auto ScalingAmazon CloudWatch等服务,通过设定规则、编写脚本,自动完成服务器的增加与减少,既能快速响应峰值需求,为玩家提供最佳的游戏体验,又能节省成本。此外,为了改善域名系统(DNS)的稳定性和可靠性,IGG采用了Amazon Route 53,它具有速度快、使用方便且经济高效的特点,可以非常方便地通过AWS管理控制台创建和管理DNS。AWS云服务丰富的功能使IGG能够不断地利用新服务来改善原有系统的不足,增强系统的稳定性和可靠性

专业服务能力

IGG的游戏运营是全球化的,不仅要为玩家提供游戏,同时还要提供大量的公共服务,这些核心业务都部署在IGG 位于美国北加州的IDC中,并没有灾备系统。但考虑到北加州处于地震带,发生地震的概率比较大,一旦出现极端情况,IGG的整个核心业务都会受到影响。因此IGG希望借助AWS云服务建立双活的灾备系统。为此IGG选择了AWS 专业服务,在AWS专业技术团队的帮助下,梳理业务逻辑和需求,进行场景模拟、搭建、测试实验架构,最终成功地完成了双活灾备系统的建立。“在与AWS Professional Service接触之前,我们评估认为建立传统意义的灾备系统投入产出比很差,而如何充分发挥AWS的功能,建立云端的灾备系统对我们是个挑战。得益于AWS Professional Service的帮助,我们才完成了在过去难以完成的任务。”伍建平说

及时、专业的技术支持服务

AWS为用户提供了不同级别的技术支持服务,在架构设计、开发、运维等各个环节为用户提供全方位的支持,从而使用户能够专注于自身的业务系统。在建立海外站点之前,海康威视已经拥有基于私有云的“萤石云”,在将现有系统平移到海外站点的过程中,曾经遇到Amazon EC2的性能未达到预期的问题,在复现问题的过程中,AWS技术支持团队在一天内就部署了Amazon EC2测试集群,模拟客户环境完成了选型测试,成功帮助客户达到超过预期DAS直接连接数24.4%的性能目标。“选型完成后,AWS技术支持团队又针对实施过程中Amazon S3的配置及操作、Amazon EC2连接、Amazon Route 53解析等具体问题,给出了快速清晰的解答。这种及时到位的技术服务使我们可以专注于业务。”李兴波说。

获得的成效

目前IGG已经将AWS云服务用于业务的各个方面。依据区域的不同,AWS云服务在IGG的应用也不一样:在北加州,AWS云服务主要用于IGG的即时通信产品;在俄罗冈州,AWS云服务是IGG的灾备中心,用于IGG全球的数据备份和恢复;在法兰克福、新加坡,AWS云服务分别为欧洲玩家和亚洲玩家服务。IGG已经使用的AWS云服务包括Amazon EC2、Amazon Simple Storage Service (Amazon S3)Elastic Load Balancing、Auto Scaling、Amazon CloudWatch、Amazon Route 53、Amazon DynamoDBAmazon Virtual Private Cloud (VPC)等。图1是基于AWS云服务的IGG双活灾备中心示意图

图1 基于AWS云服务的IGG双活灾备中心

使用AWS云服务给IGG带来的最大好处是用较低的成本建立起远程的双活灾备中心,实现了核心业务异地实时同步备份,在主机房出现故障时能快速切换到云端,保证服务的连续性。整个灾备系统完全满足IGG的业务需求:RTO不超过30分钟、RPO为0,增强了IGG游戏运营系统的稳定性和可靠性。除此之外,使用AWS云服务也节省了灾备系统的成本,因为利用AWS云服务建立双活灾备系统时并不需要1:1的资源配置,这点相比传统的本地灾备具有极大的性价比优势。

使用AWS云服务的第二个好处是大幅度提升了IGG游戏运营系统的弹性和灵活性,无论是某款游戏突然热销或是某个地区的玩家突然激增,IGG都可以根据事先设定的规则,自动部署新增服务器,并且将部署时间从过去的4小时缩短为数秒,确保玩家始终拥有优异的游戏体验。一旦需求下降,多余的云服务器即可自动释放,实现节省成本的目标。

使用AWS 云服务给IGG带来的第三个好处是简化了运维管理,节省了运维成本,同时由于运维自动化程度的提升,使得整个系统的安全性和可靠性得到极大地增强

8月9日,AWS技术峰会北京站,敬请期待!
报名注册点击“阅读原文”

登录查看更多
1

相关内容

由亚马逊云平台提供的一种信息服务。
【2020新书】实战R语言4,323页pdf
专知会员服务
100+阅读 · 2020年7月1日
【IJCAI2020-华为诺亚】面向深度强化学习的策略迁移框架
专知会员服务
27+阅读 · 2020年5月25日
【ACL2020-Facebook AI】大规模无监督跨语言表示学习
专知会员服务
33+阅读 · 2020年4月5日
【德勤】中国人工智能产业白皮书,68页pdf
专知会员服务
303+阅读 · 2019年12月23日
关系图谱在贝壳找房风控体系的应用与实践
DataFunTalk
49+阅读 · 2020年2月12日
艾瑞发现:小黑鱼企业案例研究报告
艾瑞咨询
4+阅读 · 2019年5月31日
网易游戏海外AWS实践分享
高效开发运维
3+阅读 · 2019年5月21日
浅谈 Kubernetes 在生产环境中的架构
DevOps时代
11+阅读 · 2019年5月8日
华为和其“公关危机”下的5G发布会
1号机器人网
7+阅读 · 2019年1月27日
人工智能大数据平台中Golang的应用实践
MomentaAI
5+阅读 · 2018年9月27日
智慧停车行业深度研究与分析报告
智能交通技术
4+阅读 · 2018年3月20日
2018-2020年中国服务机器人行业深度研究报告
机器人大讲堂
5+阅读 · 2018年1月30日
Rapid Customization for Event Extraction
Arxiv
7+阅读 · 2018年9月20日
Arxiv
27+阅读 · 2018年4月12日
Arxiv
9+阅读 · 2018年3月28日
Arxiv
3+阅读 · 2018年3月2日
Arxiv
7+阅读 · 2018年1月30日
Arxiv
5+阅读 · 2018年1月30日
VIP会员
相关资讯
关系图谱在贝壳找房风控体系的应用与实践
DataFunTalk
49+阅读 · 2020年2月12日
艾瑞发现:小黑鱼企业案例研究报告
艾瑞咨询
4+阅读 · 2019年5月31日
网易游戏海外AWS实践分享
高效开发运维
3+阅读 · 2019年5月21日
浅谈 Kubernetes 在生产环境中的架构
DevOps时代
11+阅读 · 2019年5月8日
华为和其“公关危机”下的5G发布会
1号机器人网
7+阅读 · 2019年1月27日
人工智能大数据平台中Golang的应用实践
MomentaAI
5+阅读 · 2018年9月27日
智慧停车行业深度研究与分析报告
智能交通技术
4+阅读 · 2018年3月20日
2018-2020年中国服务机器人行业深度研究报告
机器人大讲堂
5+阅读 · 2018年1月30日
Top
微信扫码咨询专知VIP会员