AutoML破解深度学习寒冬论,夏粉教小白5分钟搞定机器学习建模

2018 年 6 月 14 日 新智元





  新智元报道  

作者:克雷格


【新智元导读】昨天,国内AutoML领域创业公司智铀科技发布了自动化机器学习产品“小智”,据公开数据显示,这是国内首款可私有部署的AutoML商用产品。新智元创始人杨静女士作为特邀嘉宾,在智铀科技产品发布会上对AI软硬件发展现状和趋势以及AutoML应用做了主题演讲。


“AI寒冬”论调不减,但AI软硬件能力增长却是不争的事实。


OpenAI发布的数据显示,自2012年以来,AI计算力每3.5个月增长一倍,六年间这个指标已经增长了30万倍以上。


同时,AMD也在上周展示了全球首款7纳米制程的GPU芯片原型,显示硬件能力依旧与摩尔定律赛跑。


在这样的大背景下,数据挖掘和自动化建模等企业级服务迎来了巨大的市场空间,AutoML的出现则让企业能迅速投入AI应用而不过度依赖数据科学家,同时也解决了传统企业AI人才匮乏、人力成本高、时间成本高等问题。


昨天,国内AutoML领域创业公司智铀科技发布了自动化机器学习产品“小智”,据公开数据显示,这是国内首款可私有部署的AutoML商用产品。新智元创始人杨静女士作为特邀嘉宾,在智铀科技产品发布会上对AI软硬件发展现状和趋势以及AutoML应用做了主题演讲。


AI算力6年增长30万倍,软硬件能力增长破除深度学习“寒冬论”


最近,计算机视觉专家 Filip Piekniewski 的《AI Winter is Well on its Way》文章刷屏,认为深度学习的热度已经大大下降,AI寒冬将至。


“深度学习是否有天花板?”杨静在《让机器学习更智能》演讲中问道。目前,包括人脸识别或者语音识别,准确率已经达到了98%、99%的水平,“那剩下的1%、2%的话,是不是说可改进的空间比较小了?”


新智元创始人兼CEO杨静女士


UC伯克利大学教授马毅最近也发微博称,越来越多的证据表明,通过拟合数据得到的深度神经网络模型(在classification,detection,segmentation等)对输入很小的数值扰动和很小的变换deformation(甚至平移)都是不稳定的(unstable),更谈不上鲁棒。


所以目前基于深度学习的“人工智能”,用在不痛不痒的应用上,也就罢了。把这样的模型用在严肃的问题上(例如需要有安全、隐私、可靠性保障的),应该是十分危险的。



杨静认为,过去几年深度学习的确出现了一个爆发的情况,但是未来,特别是到2020年是否还会有这样的一个爆发的增长速度呢?所以质疑深度学习的言论就出来了。


不过,从学术界到产业界的努力都在让深度学习保持持续的爆发力。


OpenAI最近发布的一份关于AI计算能力增长趋势的分析报告显示,自2012年以来,AI训练中所使用的计算力每3.5个月增长一倍,自2012年以来,这个指标已经增长了30万倍以上,这远远超过摩尔定律的增长。这种突飞猛进的速度让深度学习以及机器学习充满着无限的可能,充满了爆发性的增速。

硬件方面,AMD在上周展示了全球首款7纳米制程的GPU芯片原型,含有32GB的高带宽内存,专为人工智能和深度学习设计。杨静认为,AI相关的硬件有非常高速度的成长,因此说其实深度学习本身的发展速度的确是比摩尔定更快。


数据挖掘和自动化建模:企业级服务市场爆发机会


AI软硬件能力增长速度为企业级的数据挖掘和自动化建模等云服务带来了巨大的市场空间,亚马逊、微软、谷歌等公司在企业级云服务都有特别强大的机器学习方面的支撑。


IDC的分析指出,人工智能硬件、软件企业级市场规模供未来几年会有四五倍的提升,目前可以看到的是,在AI云市场上亚马逊现在占了40%多的份额,微软和Google紧随其后。



Google在AI云服务市场上异军突起,在于它在AI云服务方面提供了全新的软硬件一体化的解决方案。


这个方案包括TPU、TensotFlow和AutoML,这种三位一体的组合形成了谷歌在企业级云软硬件的巨大优势。


杨静指出,对于中国企业来讲,开源框架和AI芯片方面都很薄弱,但AutoML真正是一个空白和机会。“我们就像中国缺少芯片一样,我们也缺开源框架,也缺自动化机器学习的自己的算法,但我们在AutoML这方面,我觉得至少智铀科技是非常值得期待的一支黑马。”


与此同时,机器学习目前严重依赖数据科学家,并且面临人才匮乏、人力成本高、时间成本高等问题,企业对无监督或者自主的学习的需求日益旺盛。


清华大学计算机科学与技术系副教授朱军认为,这是机器学习研究人员让技术推向产业要解决的一个关键的问题。“Alpha Zero是一个比较正面的例子,像在环境规则有限、能够明确表达的时候,可以通过自主学习来增强它的能力。”


智铀发布国内首款AutoML商用产品,AI小白5分钟搞定机器学习建模


智铀科技在昨天发布了AutoML产品“小智”。


AutoML 的概念源自2012年学术界提出一个新观念——Programming by Optimization(PbO),字面上的意思是指以最优化程序开发,实质上就是要解决编程时人工调校参数的问题。


与谷歌Cloud AutoML专注于图像识别领域不同,智铀科技目前主要以结构化数据为主,致力于为企业带来全流程、自动化的建模和部署能力,开发了自动化机器学习产品“小智”帮助企业构建人工智能核心,实现AI驱动。



智铀科技CEO夏粉博士毕业于中科院自动化所,拥有超过15年机器学习领域的研究和应用经验,曾在百度任资深科学家,负责百度超大规模机器学习团队。(新智元此前曾独家报道智铀科技融资情况


智铀科技是少数几个掌握AutoML的公司,有以下几方面技术优势:



  • 数据处理。独创重要性采样技术,选择1% 样本就能达到90%随机样本效果。

  • 参数学习。独创参数搜索算法,解决人工调参费时耗力的问题。

  • 模型算法。

模型算法优化:千层模型算法,LR收敛速度提升60%;FGBDT算法比XGBoost既快又好;

大规模神经网络:支持千亿样本、迁移特征数据量,模型从千层到深层灵活支持,可建立万亿链接神经网络结构DNN。

  • 特征学习。独创特征工程算法:组合特征挖掘效率提升上千倍,丰富的高阶特征提取方式;支持从无标签数据中提取有效特征。


此次智铀发布的产品“小智”,可以自动构建高精度模型,为用户提供从数据预处理、特征工程、模型调参、模型评估、模型预测到结果分析等一站式服务。


除了以独创的算法实现了自动建模,小智在产品的交互方面也贯彻着简单易用的原则,直观的web界面允许任何人和小智进行交互,不需要AI背景,用户也可以一键完成建模,内置的可视化效果,如ROC曲线图和准确&召回曲线,能够使用户对自己的业务有更深刻的理解。据夏粉介绍:“在通用场景下,普通业务人员借助小智也能达到高级建模人员水平。”


据悉,小智将以产品的形式提供给行业,除了支持公有云、SAAS模式外,还提供私有化部署。




【加入社群】


新智元 AI 技术 + 产业社群招募中,欢迎对 AI 技术 + 产业落地感兴趣的同学,加小助手微信号: aiera2015_3  入群;通过审核后我们将邀请进群,加入社群后务必修改群备注(姓名 - 公司 - 职位;专业群审核较严,敬请谅解)。


登录查看更多
3

相关内容

专知会员服务
80+阅读 · 2020年6月20日
零样本图像识别综述论文
专知会员服务
57+阅读 · 2020年4月4日
简明扼要!Python教程手册,206页pdf
专知会员服务
47+阅读 · 2020年3月24日
Sklearn 与 TensorFlow 机器学习实用指南,385页pdf
专知会员服务
129+阅读 · 2020年3月15日
CMU博士论文:可微优化机器学习建模
专知会员服务
59+阅读 · 2019年10月26日
生成式对抗网络GAN异常检测
专知会员服务
116+阅读 · 2019年10月13日
AutoML:机器学习的下一波浪潮(附代码&链接)
THU数据派
4+阅读 · 2019年4月29日
「AI寒冬论」| 风未停,猪未醒
线性资本
4+阅读 · 2018年8月27日
【深度学习】深度学习的核心:掌握训练数据的方法
产业智能官
12+阅读 · 2018年1月14日
机器学习必备手册
机器学习研究会
19+阅读 · 2017年10月24日
Arxiv
38+阅读 · 2020年3月10日
The Measure of Intelligence
Arxiv
6+阅读 · 2019年11月5日
AutoML: A Survey of the State-of-the-Art
Arxiv
69+阅读 · 2019年8月14日
Arxiv
5+阅读 · 2018年9月11日
Arxiv
4+阅读 · 2018年9月6日
VIP会员
相关VIP内容
专知会员服务
80+阅读 · 2020年6月20日
零样本图像识别综述论文
专知会员服务
57+阅读 · 2020年4月4日
简明扼要!Python教程手册,206页pdf
专知会员服务
47+阅读 · 2020年3月24日
Sklearn 与 TensorFlow 机器学习实用指南,385页pdf
专知会员服务
129+阅读 · 2020年3月15日
CMU博士论文:可微优化机器学习建模
专知会员服务
59+阅读 · 2019年10月26日
生成式对抗网络GAN异常检测
专知会员服务
116+阅读 · 2019年10月13日
相关资讯
AutoML:机器学习的下一波浪潮(附代码&链接)
THU数据派
4+阅读 · 2019年4月29日
「AI寒冬论」| 风未停,猪未醒
线性资本
4+阅读 · 2018年8月27日
【深度学习】深度学习的核心:掌握训练数据的方法
产业智能官
12+阅读 · 2018年1月14日
机器学习必备手册
机器学习研究会
19+阅读 · 2017年10月24日
相关论文
Arxiv
38+阅读 · 2020年3月10日
The Measure of Intelligence
Arxiv
6+阅读 · 2019年11月5日
AutoML: A Survey of the State-of-the-Art
Arxiv
69+阅读 · 2019年8月14日
Arxiv
5+阅读 · 2018年9月11日
Arxiv
4+阅读 · 2018年9月6日
Top
微信扫码咨询专知VIP会员