“Not Hotdog” 背后的人工智能思考

2017 年 6 月 29 日 TechCrunch中国 John Mannes

在刚刚结束HBO的《硅谷》第四季,剧中人物杨建开发出了一款热狗识别应用“Not Hotdog”,里面用到了机器学习。其实如果他们像过去的科技剧那样,做一些截屏也未尝不可,或者搞一个勉强可用的应用糊弄一下也是可以理解的。但值得称道的是,“Not Hotdog”背后的研发工程师蒂姆·安格拉德(Tim Anglade)对人工智能是相当认真的。

安格拉德并没有使用谷歌CloudVision API这样的开发工具,而是迎难而上,用TensorFlow和Keras不断展开实验。因为Not Hotdog运行在本地移动设备,所以安格拉德遇到了所有移动端机器学习开发者都要遭遇的挑战。

在Medium上面的一篇博文中,安格拉德称他最初努力对Inception构架进行再训练,利用笔记本电脑安装的eGPU对数千张热狗照片进行迁移学习(transfer learning)操作。但即便如此,他的模型仍然太大,无法可靠运行于移动设备上。

所以,他试用了SqueezeNet,这是一个更加精简的网络,不需要占用太多内存。不幸的是,尽管SqueezeNet大小合适,但其表现因过度拟合和拟合不足而受到很大制约。

即便使用大量热狗和“不是热狗”的照片进行训练,这种模式也无法充分领悟到构成热狗一般要素的抽象概念,反而作出了错误的判断,例如将热狗上的辣酱与热狗划上等号。

幸运的是,谷歌刚刚发布了他们的MobileNets文章,提出了在移动设备上运行神经网络的新方法。谷歌提出的解决方案是采用介于经过渲染的Inception构架和脆弱的SqueezeNet之间的中间路线。更为重要的是,它允许安格拉德轻松对网络作出微调,实现平衡的准确性和计算的可用性。

安格拉德将来自GitHub的开源框架Keras作为起始点,然后作出一系列调整,对整个模型进行简化和优化,令其专用于单一目的。

接着,安格拉德用由15万张图片组成的数据集对最终模型进行训练。在这15万张图片中,有14.7万张不是热狗,只有3000张属于热狗的图片。安格拉德故意设计出这一比例,旨在反映世界上大部分物体不是热狗的事实。

大家可以点击下方阅读原文浏览他的整篇文章,安格拉德介绍了关于这款应用的几乎一切细节。比如在应用提交给苹果App Store商店审核以后,如何利用CodePush对神经网络进行实时注入升级。尽管安格拉德纯粹出于玩笑的目的开发了这款应用,但文章的最后他还是花了很大篇幅严肃地讨论了UX/UI重要性以及在机器学习过程中他所面对的问题。

翻译:皓岳

登录查看更多
1

相关内容

迁移学习(Transfer Learning)是一种机器学习方法,是把一个领域(即源领域)的知识,迁移到另外一个领域(即目标领域),使得目标领域能够取得更好的学习效果。迁移学习(TL)是机器学习(ML)中的一个研究问题,着重于存储在解决一个问题时获得的知识并将其应用于另一个但相关的问题。例如,在学习识别汽车时获得的知识可以在尝试识别卡车时应用。尽管这两个领域之间的正式联系是有限的,但这一领域的研究与心理学文献关于学习转移的悠久历史有关。从实践的角度来看,为学习新任务而重用或转移先前学习的任务中的信息可能会显着提高强化学习代理的样本效率。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
【Google】平滑对抗训练,Smooth Adversarial Training
专知会员服务
49+阅读 · 2020年7月4日
专知会员服务
32+阅读 · 2020年4月24日
简明扼要!Python教程手册,206页pdf
专知会员服务
48+阅读 · 2020年3月24日
终于有人把云计算、大数据和人工智能讲明白了
Python开发者
3+阅读 · 2018年6月13日
卷积网络背后的直觉
论智
6+阅读 · 2018年5月31日
软件工程师如何转型人工智能?
机器学习算法与Python学习
6+阅读 · 2018年4月26日
终于有人把云计算、大数据和人工智能讲明白了!
大数据技术
7+阅读 · 2018年4月2日
对抗样本引发的系列讨论
机器学习研究会
5+阅读 · 2018年3月22日
Mesh R-CNN
Arxiv
4+阅读 · 2019年6月6日
Deep Reinforcement Learning: An Overview
Arxiv
17+阅读 · 2018年11月26日
Rapid Customization for Event Extraction
Arxiv
7+阅读 · 2018年9月20日
Exploring Visual Relationship for Image Captioning
Arxiv
15+阅读 · 2018年9月19日
Arxiv
7+阅读 · 2018年1月30日
VIP会员
相关资讯
终于有人把云计算、大数据和人工智能讲明白了
Python开发者
3+阅读 · 2018年6月13日
卷积网络背后的直觉
论智
6+阅读 · 2018年5月31日
软件工程师如何转型人工智能?
机器学习算法与Python学习
6+阅读 · 2018年4月26日
终于有人把云计算、大数据和人工智能讲明白了!
大数据技术
7+阅读 · 2018年4月2日
对抗样本引发的系列讨论
机器学习研究会
5+阅读 · 2018年3月22日
相关论文
Top
微信扫码咨询专知VIP会员