美图秀秀让你变美的背后,是这些技术在起作用

2019 年 8 月 20 日 PingWest品玩
深度学习和 TensorFlow,是美图 AI 的法宝。
长久以来,一提到 “美图公司”,大家能想到的都是 “美图秀秀”、“美颜相机”、“美拍” 这些美颜类产品,而为这些产品提供 AI 技术支持的美图影像实验室(以下简称 MTlab)一直鲜为人知。
成立于 2010 年的 MTlab,早已不止是一个实验室 —— 它在美图产品线背后扮演着 “大脑” 的角色。 在 MTlab 的工具箱里,深度学习模型和 TensorFlow 是最有效的利器。
美图各个产品的功能决定了,MTlab 会大量使用到计算机视觉技术。
“2013 年开始,MTlab 就用机器学习做计算机视觉方面的研发。 最早做的是人脸相关技术,以及美颜算法。 ”MTlab 负责人万鹏飞告诉 PingWest 品玩,“那时开源工具还没有现在这么丰富,很多算法和工具需要自己手动实现。
采用传统机器学习来做计算机视觉的好处是,整个训练过程完全透明,允许研发人员更好地评估训练出来的算法,是否在训练环境之外依然有效。 但不足的地方是,人工提取特征的工作量大,而且鲁棒性差。
万鹏飞对 PingWest 品玩表示,当时他们面临的主要技术挑战,正是“算法在各种极端用户使用场景下的鲁棒性”。
利用深度学习的卷积神经网络模型,能很好解决这个问题。 “深度学习这种数据驱动的方法,在鲁棒性方面比传统计算机视觉算法有明显优势。 ”万鹏飞说。
决定采用深度学习后,他们最早使用的框架是 Caffe。 这个深度学习框架于 2013 年在 Github 上发布,作者是加州大学伯克利分校的贾扬清博士。
2015 年,Google 发布深度学习开源框架 TensorFlow,“MTlab 马上就去了解这个工具”。 2016 年,MTlab 开始在项目中尝试用 TensorFlow。
万鹏飞介绍道,MTlab 用 TensorFlow 最早做的是图像去噪,整体感觉比较灵活,对自定义的网络结构比较友好。 一个灵活的深度学习框架对于算法自研很重要,因为很多实际的问题需要通过一些创新的方法解决,而一个好用的深度学习框架无疑能提高计算机视觉算法研发的效率。
很快,TensorFlow 凭借着灵活的特性成为了他们主要的深度学习框架。 2016 年 MTlab 在用深度学习做人像分割功能时,初期使用 Caffe 实现自定义的卷积神经网络层不太方便,需要自己实现前向 / 反向传播算法。 Debug(调试)操作起来也比较麻烦。
“后来使用了 TensorFlow,其基于 dataflow graph(数据流向图)的计算结构对于自定义的深度学习操作很友好,也便于 debug。 ” 万鹏飞说,“另外对循环神经网络的支持也比较好,大大提高了研发效率。
如今,TensorFlow 已经被应用在美图旗下产品多个功能的网络训练中,如肢体关键点检测、五官分析、人像分割、图像画质增强、天空分割。 万鹏飞对 TensorFlow 评价颇高: “TensorFlow 的分布式训练能力,大大提高了深度学习网络的训练效率。
万鹏飞同时还提及 TensorFlow 社区对 MTlab 的帮助。 完善的官方文档说明、丰富的课程、以及对新手友好的互助氛围,都吸引着更多开发者加入 TensorFlow 社区。
TensorFlow 官方也在努力促进社区的壮大。 在今年的世界人工智能大会上, TensorFlow将举办“智在启无限”主题论坛,邀请国内外不同领域,数十位重量级嘉宾,共同探讨机器学习如何在商业中应用,帮助企业和开发者解决现实生活的问题:
TensorFlow 全球产品总监将深度解析机器学习的内核; 通用电气贝克休斯高级总监将分享如何确保安全生产、预测组件寿命和系统异常、避免意外停机; 网易严选算法总监将分享如何实现季节性商品销量预测、提升用户点击、节约仓储和供应链成本; 腾讯医疗大数据科学家将分享如何优化用户意图理解、为医院、医生和病人提供更优质的服务。 还有一些前沿的机器学习研究者们也将来到本次论坛,分享机器学习在文化和艺术领域取得突破的经验。
8月30-31日,你还能在上海世博中心TensorFlow特色展览中体验到最新最酷“黑科技”。 扫码或点击阅读原文,立即报名!


CFA认证的猫品种数已增至45种

你认识其中几种?

快点击下方小程序进行测试

▽▽▽

登录查看更多
2

相关内容

美图秀秀是一款傻瓜式的免费图片处理软件,不用学习就会用。独有的图片特效、美容、拼图、场景、边框、饰品等功能,加上每天更新的精选素材,可以让你1分钟做出影楼级照片,还能一键分享到新浪微博、人人网。继PC版之后,美图秀秀又推出了iPhone版、Android版、iPad版及网页版
【干货书】高级应用深度学习,294页pdf
专知会员服务
153+阅读 · 2020年6月20日
【CMU】深度学习模型中集成优化、约束和控制,33页ppt
专知会员服务
45+阅读 · 2020年5月23日
【2020新书】如何认真写好的代码和软件,318页pdf
专知会员服务
63+阅读 · 2020年3月26日
深度神经网络实时物联网图像处理,241页pdf
专知会员服务
76+阅读 · 2020年3月15日
专知会员服务
103+阅读 · 2020年3月12日
【新加坡国立大学】深度学习时代数据库:挑战与机会
专知会员服务
34+阅读 · 2020年3月6日
分析 | 抖音背后的计算机视觉技术
计算机视觉life
9+阅读 · 2019年5月31日
如何快速入门TensorFlow ?丨极客时间
InfoQ
4+阅读 · 2019年1月8日
AutoKeras:谷歌 AutoML 的杀手!
云头条
3+阅读 · 2018年8月2日
深度学习人脸识别系统DFace
深度学习
17+阅读 · 2018年2月14日
开源 AI 技术潜在危机爆发,被大肆用于色情方向
抖音的 2017 和它背后的黑科技
PingWest品玩
8+阅读 · 2018年1月4日
Real-time Scalable Dense Surfel Mapping
Arxiv
5+阅读 · 2019年9月10日
CoCoNet: A Collaborative Convolutional Network
Arxiv
6+阅读 · 2019年1月28日
Arxiv
6+阅读 · 2018年7月9日
Arxiv
5+阅读 · 2018年1月30日
Arxiv
7+阅读 · 2018年1月21日
VIP会员
相关VIP内容
相关资讯
分析 | 抖音背后的计算机视觉技术
计算机视觉life
9+阅读 · 2019年5月31日
如何快速入门TensorFlow ?丨极客时间
InfoQ
4+阅读 · 2019年1月8日
AutoKeras:谷歌 AutoML 的杀手!
云头条
3+阅读 · 2018年8月2日
深度学习人脸识别系统DFace
深度学习
17+阅读 · 2018年2月14日
开源 AI 技术潜在危机爆发,被大肆用于色情方向
抖音的 2017 和它背后的黑科技
PingWest品玩
8+阅读 · 2018年1月4日
Top
微信扫码咨询专知VIP会员