时间序列预测:一课掌握亚马逊开源算法DeepAR

2020 年 6 月 3 日 机器之心

绝大部分行业场景,尤其是互联网行业,每天都会产生大量的数据。游戏中每时每刻都会产生大量的玩家日志信息;旅游应用中每天有各类酒店各种交通工具的实时价格;涉及供应链和日销量的零售电商,每月都为生产(购进)多少货而发愁;就连生产电子元器件、供电箱等传统生产企业,这些零件每时每刻都会产生大量的数据。而我们称这种不同时间收到的,描述一个或多种特征随着时间发生变化的数据,为时间序列数据(Time Series Data)。


结合上文中的时间序列数据,我们能够做什么?最显而易见的是,我们可以通过过去产生的时间序列数据,来预测未来。


我们可以通过游戏历史的玩家消费时间序列数据,预测该玩家在接下来一周的付费意愿和付费大致金额,从而定制化的推送相关游戏礼包和活动,这通常和传统的用户画像是互补的。旅游应用中,利用历史数据对未来酒店、机票的价格进行预测,从而为用户推荐最低价的购买点(例如:提示用户五天后购买会更便宜),这一个小功能就足够获取大量忠实用户并实现变现,而北美已经有网站实现了这个功能来预测机票价格。


一言以蔽之,时间序列预测就是通过多种维度的数据本身内在与时间的关联特性,其中可能包含季节性、趋势性等等特征,利用历史的数据预测未来的场景,细分场景除了上述介绍之外,还有很多很多。


时间序列预测在实际使用中,难免会遇到关于数据的问题,例如无法完整收集所有影响因素的数据,影响因素在未来具有不确定性,有时只有很少甚至没有历史数据。数据往往是卡住大多数时序预测工作负载最大的问题。


Amazon SageMaker 中内置的 DeepAR 算法能够在一定程度上减轻对数据的要求。DeepAR 直接在模型内部补充缺省值。在导入数据的过程中,我们不需要人为的扫描数据寻找缺省值,不需要为如何填补缺省值大费周章,DeepAR 模型内部会解决这一问题。


同时,DeepAR 上手难度并不高,在 Amazon SageMaker 中,可以快速方便的直接调用现成实现好的算法,输入自己的数据进行训练。


如果你是一位刚上手机器学习的小白,并且想要动手来自行训练,更多的定制化和手动处理数据,控制训练过程,以及自定义部署流程,Amazon SageMaker是一个非常好的选择。 

Amazon SageMaker  是一项完全托管的服务,可以帮助开发人员和数据科学家快速构建、训练和部署机器学习 (ML) 模型。SageMaker 完全消除了机器学习过程中每个步骤的繁重工作,让开发高质量模型变得更加轻松。

为了帮助大家快速上手 SageMaker,本周四晚8点,我们邀请到AWS高级解决方案架构师王元恺为大家带来主题分享《使用 DeepAR 进行时间序列预测》


课程主题:使用 DeepAR 进行时间序列预测


课程时间:6 月 4 日 20:00 


课程主讲:王元恺,AWS高级解决方案架构师


讲师简介:高级解决方案架构师,负责基于AWS的云计算方案的架构设计,同时致力于AWS云服务在国内和全球的应用和推广。毕业于上海交通大学,毕业后直接加入AWS中国。对前沿技术如计算机视觉、自然语言处理及其应用有着深入的研究与热情。在大规模全球同服游戏、Serverless无服务器架构以及人工智能等领域有着广泛的设计与实践经验。


课程概要:本课程将介绍时间序列预测的场景、常见的分类及对应算法、DeepAR 算法的优势以及如何使用 DeepAR 算法进行时间序列预测,并通过现场演示,让大家理解如何训练 DeepAR 用于具体的应用场景。


直播间地址:http://suo.im/614kNR(点阅读原文或识别上方海报二维码直达)


下面还有一个大神出没的微信群:



关于本系列课程


Amazon SageMaker 是一套强大的完全托管服务,可以帮助开发者和数据科学家快速构建、训练和部署机器学习 (ML) 模型。 这款工具可以大幅度消除机器学习过程中的繁重工作,让开发高质量模型变得更加轻松。

为了帮助开发者快速上手 Amazon SageMaker,机器之心联合 AWS 开设《快速上手 Amazon SageMaker,轻松玩转机器学习》线上公开课,3周时间,6次课程,通过讲解如何使用 SageMaker 完成构建生成对抗网络、运行中文命名实体识别、简化 Kubernetes 上的机器学习任务管理等任务,帮助开发者熟悉 Amazon SageMaker 各项组件的使用方法,轻松玩转机器学习。 具体安排可以点这里。


时不我待,赶快加入, 点击 阅读原文 ,直达直播间
登录查看更多
13

相关内容

时间序列(或称动态数列)是指将同一统计指标的数值按其发生的时间先后顺序排列而成的数列。时间序列分析的主要目的是根据已有的历史数据对未来进行预测。经济数据中大多数以时间序列的形式给出。根据观察时间的不同,时间序列中的时间可以是年份、季度、月份或其他任何时间形式。
《动手学深度学习》(Dive into Deep Learning)PyTorch实现
专知会员服务
119+阅读 · 2019年12月31日
初学者系列:推荐系统Wide & Deep Learning详解
Python数据分析案例实战
炼数成金订阅号
5+阅读 · 2019年5月9日
你真的懂时间序列预测吗?
腾讯大讲堂
104+阅读 · 2019年1月7日
如何入门并成为一名出色的算法工程师?
【入门】数据分析六部曲
36大数据
18+阅读 · 2017年12月6日
Arxiv
12+阅读 · 2019年3月14日
Arxiv
7+阅读 · 2018年12月26日
Hierarchical Deep Multiagent Reinforcement Learning
Arxiv
8+阅读 · 2018年9月25日
Arxiv
22+阅读 · 2018年8月30日
A Survey on Deep Transfer Learning
Arxiv
11+阅读 · 2018年8月6日
Arxiv
23+阅读 · 2018年8月3日
VIP会员
相关资讯
初学者系列:推荐系统Wide & Deep Learning详解
Python数据分析案例实战
炼数成金订阅号
5+阅读 · 2019年5月9日
你真的懂时间序列预测吗?
腾讯大讲堂
104+阅读 · 2019年1月7日
如何入门并成为一名出色的算法工程师?
【入门】数据分析六部曲
36大数据
18+阅读 · 2017年12月6日
相关论文
Arxiv
12+阅读 · 2019年3月14日
Arxiv
7+阅读 · 2018年12月26日
Hierarchical Deep Multiagent Reinforcement Learning
Arxiv
8+阅读 · 2018年9月25日
Arxiv
22+阅读 · 2018年8月30日
A Survey on Deep Transfer Learning
Arxiv
11+阅读 · 2018年8月6日
Arxiv
23+阅读 · 2018年8月3日
Top
微信扫码咨询专知VIP会员