动态 | 不必再为基础设施烦恼,亚马逊新的云服务 SageMaker 让从业人员只需关注模型就好

2017 年 12 月 1 日 AI科技评论 杨晓凡

AI 科技评论按:2017年11月27日至12月1日,亚马逊在拉斯维加斯举办年度的“re:INVENT”大会,发布许多新服务、硬件,也带来许多开发者和AWS的专家们之间交流的机会。在人工智能、机器学习如此火热的年代,亚马逊AWS也发布了以 SageMaker 为重点的多个机器学习服务。AI 科技评论把相关情况简单介绍如下。



一个新的机器学习云服务


云服务的意义是把传统来讲非常复杂的软件管理流程以及IT硬件管理流程一股脑丢掉,让企业只需要关注于自己真正的业务,而且还能方便地随时扩大规模。如今,机器学习受到了开发者们越来越多的关注,而它也同样也会遇到软硬件环境的配置的问题。AWS看到了这种需求,也就打算站出来摆平这其中的种种困难。


在这次“re:INVENT 2017”大会上,亚马逊就正式宣布了自己的机器学习云服务 SageMaker,它会给开发人员和数据科学家们提供一个新的框架,让他们方便地管理机器学习模型相关的整个过程,很多以往躲不掉的基础性工作现在都可以交给AWS完成。


AWS的高级技术人员 Randall Hunt 同步发出一篇博客介绍了一些技术细节。他也介绍道,SageMaker的目的就是建立一个开发框架,在它的帮助下可以让企业更快地把机器学习集成到自己的新应用中。“Amazon SageMaker 是一个带有完全的管理能力的端到端机器学习服务,它可以让数据科学家、开发者、机器学习专家们快速地建立、训练、运行大规模的机器学习模型”。


在发布会上,AWS CEO Andy Jassy 的介绍是“让每天都需要和机器学习打交道的开发者们方便地训练和部署机器学习模型”。


认识一下新工具


AWS的这个新服务可以分成三个主要部分。



不必再为基础设施烦恼,亚马逊新的云服务 SageMaker 让从业人员只需关注模型就好


第一部分,授权。无需配置就可以把标准的 Jupyter 编辑器作为集成开发环境(IDE),执行数据查看、数据清洗、预处理等等任务。这些任务可以在通用型的服务器上运行,当然也可以用带有GPU的服务器。


第二部分,模型训练。在这里,亚马逊提供了分布式的模型构建、训练和验证服务。SegeMaker里会自带一些常用的监督学习和无监督学习算法以及框架,用户也可以借助Docker容器创建自己的训练算法。训练过程可以在几十台服务器上分布式运行,以提供更快的训练速度。训练数据会从S3云存储服务器读取,模型产生的数据同样也会存在S3服务器上;这些数据主要是独立于训练数据的模型参数,而不是可以执行的、能够直接用于推理任务的代码。这种仔细思考之后的设计选择,使得在 SegeMaker 中训练的模型可以很方便地部署到其它平台上去(比如物联网设备中)


第三部分,模型承载。带有HTTPs接口的模型承载服务可以调用设定好的模型,得到实时的推理结果。这些承载接口支持拓展,可以扩大规模、支持更密集的访问,也可以设置为A/B对比,同时测试多个不同模型的结果。和前面一样,这些接入点可以用内嵌的SDK构建,也可以通过Docker写入自己的配置。


延续的一站式体验


在发布会的演讲中,Jassy重点强调了 SageMaker 的高灵活性。既可以用现成的工具,也可以构建自己的新工具。不管哪种情况下,SageMaker 都能够处理热门的算法,不受来源的限制。


在 Constellation Research的副总裁、高级分析师 Holger Mueller 看来,这种灵活性是一柄双刃剑。“SageMaker大幅度减少了企业构建机器学习应用所需的工作量、知识水平以及花费的精力。但同时这也意味着AWS是背后的那个搞定一切的人,而且在想方设法把它的云服务用户留下来、把计算和数据负载留下来。”他觉得AWS要是野心足够大,可能还会发布一个自己的神经网络开发平台(像TensorFlow那样的)。不过目前还没有任何迹象。


不管怎么说,亚马逊已经打算接手运行模型所需的所有基础设施,以及帮用户自动处理节点掉线、扩容以及安全补丁等等问题。


Jassy说,一旦模型准备好了,就可以在SageMaker上把它用在任意别的服务中。“对数据科学家和开发者来说这事意义重大”。


另外,发布会上同时还发布了机器学习可编程摄像头DeepLens、轻量机器学习运行环境Greengrass ML Inference、视频内容识别Rekognition Video、音频转文字Transcribe、语言翻译Translate、语言识别Comprehend等多个机器学习服务,与已有的图像识别Rekognition Image、聊天机器人Lex、文字转语音Polly一同构成了强大完善的可用服务。


今天开始AWS就会开始免费提供SageMaker,作为免费服务策略的一部分。在达到一定程度之后,SageMaker也就会开始根据用量和地区开始收费了。


SageMaker主页:https://aws.amazon.com/sagemaker/ 


SageMaker使用介绍:https://aws.amazon.com/cn/blogs/aws/sagemaker/ 


via TechCrunch,AI 科技评论编译

 推荐阅读 


—————  AI 科技评论招人啦!  —————

我们诚招学术编辑 N 枚(全职,坐标北京)、学术兼职 N 枚。

详情请参见最后一篇招聘推送文!

欢迎发送简历到 guoyixin@leiphone.com

————————————————————

登录查看更多
0

相关内容

由亚马逊云平台提供的一种信息服务。
【干货书】高级应用深度学习,294页pdf
专知会员服务
153+阅读 · 2020年6月20日
【干货书】现代数据平台架构,636页pdf
专知会员服务
255+阅读 · 2020年6月15日
Python导论,476页pdf,现代Python计算
专知会员服务
260+阅读 · 2020年5月17日
TensorFlow Lite指南实战《TensorFlow Lite A primer》,附48页PPT
专知会员服务
69+阅读 · 2020年1月17日
最新《分布式机器学习》论文综述最新DML进展,33页pdf
专知会员服务
119+阅读 · 2019年12月26日
免费!Google Colab现已支持英伟达T4 GPU
新智元
5+阅读 · 2019年4月25日
深度学习开发必备开源框架
九章算法
12+阅读 · 2018年5月30日
从基础概念到实现,小白如何快速入门PyTorch
机器之心
13+阅读 · 2018年2月26日
2017年四巨头的深度学习框架之战,你支持谁?
全球人工智能
6+阅读 · 2017年12月29日
【人工智能架构】深度解密京东登月平台基础架构
产业智能官
11+阅读 · 2017年9月26日
【机器学习】推荐13个机器学习框架
产业智能官
8+阅读 · 2017年9月10日
Arxiv
6+阅读 · 2019年9月25日
Arxiv
3+阅读 · 2018年6月18日
Arxiv
7+阅读 · 2018年1月30日
VIP会员
相关VIP内容
【干货书】高级应用深度学习,294页pdf
专知会员服务
153+阅读 · 2020年6月20日
【干货书】现代数据平台架构,636页pdf
专知会员服务
255+阅读 · 2020年6月15日
Python导论,476页pdf,现代Python计算
专知会员服务
260+阅读 · 2020年5月17日
TensorFlow Lite指南实战《TensorFlow Lite A primer》,附48页PPT
专知会员服务
69+阅读 · 2020年1月17日
最新《分布式机器学习》论文综述最新DML进展,33页pdf
专知会员服务
119+阅读 · 2019年12月26日
相关资讯
免费!Google Colab现已支持英伟达T4 GPU
新智元
5+阅读 · 2019年4月25日
深度学习开发必备开源框架
九章算法
12+阅读 · 2018年5月30日
从基础概念到实现,小白如何快速入门PyTorch
机器之心
13+阅读 · 2018年2月26日
2017年四巨头的深度学习框架之战,你支持谁?
全球人工智能
6+阅读 · 2017年12月29日
【人工智能架构】深度解密京东登月平台基础架构
产业智能官
11+阅读 · 2017年9月26日
【机器学习】推荐13个机器学习框架
产业智能官
8+阅读 · 2017年9月10日
Top
微信扫码咨询专知VIP会员