绝大部分行业场景,尤其是互联网行业,每天都会产生大量的数据。游戏中每时每刻都会产生大量的玩家日志信息;旅游应用中每天有各类酒店各种交通工具的实时价格;涉及供应链和日销量的零售电商,每月都为生产(购进)多少货而发愁;就连生产电子元器件、供电箱等传统生产企业,这些零件每时每刻都会产生大量的数据。而我们称这种不同时间收到的,描述一个或多种特征随着时间发生变化的数据,为时间序列数据(Time Series Data)。
结合上文中的时间序列数据,我们能够做什么?最显而易见的是,我们可以通过过去产生的时间序列数据,来预测未来。
我们可以通过游戏历史的玩家消费时间序列数据,预测该玩家在接下来一周的付费意愿和付费大致金额,从而定制化的推送相关游戏礼包和活动,这通常和传统的用户画像是互补的。旅游应用中,利用历史数据对未来酒店、机票的价格进行预测,从而为用户推荐最低价的购买点(例如:提示用户五天后购买会更便宜),这一个小功能就足够获取大量忠实用户并实现变现,而北美已经有网站实现了这个功能来预测机票价格。
一言以蔽之,时间序列预测就是通过多种维度的数据本身内在与时间的关联特性,其中可能包含季节性、趋势性等等特征,利用历史的数据预测未来的场景,细分场景除了上述介绍之外,还有很多很多。
时间序列预测在实际使用中,难免会遇到关于数据的问题,例如无法完整收集所有影响因素的数据,影响因素在未来具有不确定性,有时只有很少甚至没有历史数据。数据往往是卡住大多数时序预测工作负载最大的问题。
Amazon SageMaker 中内置的 DeepAR 算法能够在一定程度上减轻对数据的要求。DeepAR 直接在模型内部补充缺省值。在导入数据的过程中,我们不需要人为的扫描数据寻找缺省值,不需要为如何填补缺省值大费周章,DeepAR 模型内部会解决这一问题。
同时,DeepAR 上手难度并不高,在 Amazon SageMaker 中,可以快速方便的直接调用现成实现好的算法,输入自己的数据进行训练。
课程主题:使用 DeepAR 进行时间序列预测
课程时间:6 月 4 日 20:00
课程主讲:王元恺,AWS高级解决方案架构师
讲师简介:高级解决方案架构师,负责基于AWS的云计算方案的架构设计,同时致力于AWS云服务在国内和全球的应用和推广。毕业于上海交通大学,毕业后直接加入AWS中国。对前沿技术如计算机视觉、自然语言处理及其应用有着深入的研究与热情。在大规模全球同服游戏、Serverless无服务器架构以及人工智能等领域有着广泛的设计与实践经验。
课程概要:本课程将介绍时间序列预测的场景、常见的分类及对应算法、DeepAR 算法的优势以及如何使用 DeepAR 算法进行时间序列预测,并通过现场演示,让大家理解如何训练 DeepAR 用于具体的应用场景。
直播间地址:http://suo.im/614kNR(点阅读原文或识别上方海报二维码直达)