成为VIP会员查看完整内容
VIP会员码认证
首页
主题
会员
服务
注册
·
登录
0
美图秀秀让你变美的背后,是这些技术在起作用
2019 年 8 月 20 日
PingWest品玩
深度学习和 TensorFlow,是美图 AI 的法宝。
长久以来,一提到 “美图公司”,大家能想到的都是 “美图秀秀”、“美颜相机”、“美拍” 这些美颜类产品,而为这些产品提供 AI 技术支持的美图影像实验室(以下简称 MTlab)一直鲜为人知。
成立于 2010 年的 MTlab,早已不止是一个实验室 —— 它在美图产品线背后扮演着 “大脑” 的角色。
在 MTlab 的工具箱里,深度学习模型和 TensorFlow 是最有效的利器。
美图各个产品的功能决定了,MTlab 会大量使用到计算机视觉技术。
“2013 年开始,MTlab 就用机器学习做计算机视觉方面的研发。
最早做的是人脸相关技术,以及美颜算法。
”MTlab 负责人万鹏飞告诉 PingWest 品玩,“那时开源工具还没有现在这么丰富,很多算法和工具需要自己手动实现。
”
采用传统机器学习来做计算机视觉的好处是,整个训练过程完全透明,允许研发人员更好地评估训练出来的算法,是否在训练环境之外依然有效。
但不足的地方是,人工提取特征的工作量大,而且鲁棒性差。
万鹏飞对 PingWest 品玩表示,当时他们面临的主要技术挑战,正是“算法在各种极端用户使用场景下的鲁棒性”。
利用深度学习的卷积神经网络模型,能很好解决这个问题。
“深度学习这种数据驱动的方法,在鲁棒性方面比传统计算机视觉算法有明显优势。
”万鹏飞说。
决定采用深度学习后,他们最早使用的框架是 Caffe。
这个深度学习框架于 2013 年在 Github 上发布,作者是加州大学伯克利分校的贾扬清博士。
2015 年,Google 发布深度学习开源框架 TensorFlow,“MTlab 马上就去了解这个工具”。
2016 年,MTlab 开始在项目中尝试用 TensorFlow。
万鹏飞介绍道,MTlab 用 TensorFlow 最早做的是图像去噪,整体感觉比较灵活,对自定义的网络结构比较友好。
一个灵活的深度学习框架对于算法自研很重要,因为很多实际的问题需要通过一些创新的方法解决,而一个好用的深度学习框架无疑能提高计算机视觉算法研发的效率。
很快,TensorFlow 凭借着灵活的特性成为了他们主要的深度学习框架。
2016 年 MTlab 在用深度学习做人像分割功能时,初期使用 Caffe 实现自定义的卷积神经网络层不太方便,需要自己实现前向 / 反向传播算法。
Debug(调试)操作起来也比较麻烦。
“后来使用了 TensorFlow,其基于 dataflow graph(数据流向图)的计算结构对于自定义的深度学习操作很友好,也便于 debug。
” 万鹏飞说,“另外对循环神经网络的支持也比较好,大大提高了研发效率。
”
如今,TensorFlow 已经被应用在美图旗下产品多个功能的网络训练中,如肢体关键点检测、五官分析、人像分割、图像画质增强、天空分割。
万鹏飞对 TensorFlow 评价颇高:
“TensorFlow 的分布式训练能力,大大提高了深度学习网络的训练效率。
”
万鹏飞同时还提及 TensorFlow 社区对 MTlab 的帮助。
完善的官方文档说明、丰富的课程、以及对新手友好的互助氛围,都吸引着更多开发者加入 TensorFlow 社区。
TensorFlow 官方也在努力促进社区的壮大。
在今年的世界人工智能大会上, TensorFlow将举办“智在启无限”主题论坛,邀请国内外不同领域,数十位重量级嘉宾,共同探讨机器学习如何在商业中应用,帮助企业和开发者解决现实生活的问题:
TensorFlow 全球产品总监将深度解析机器学习的内核;
通用电气贝克休斯高级总监将分享如何确保安全生产、预测组件寿命和系统异常、避免意外停机;
网易严选算法总监将分享如何实现季节性商品销量预测、提升用户点击、节约仓储和供应链成本;
腾讯医疗大数据科学家将分享如何优化用户意图理解、为医院、医生和病人提供更优质的服务。
还有一些前沿的机器学习研究者们也将来到本次论坛,分享机器学习在文化和艺术领域取得突破的经验。
8月30-31日,你还能在上海世博中心TensorFlow特色展览中体验到最新最酷“黑科技”。
扫码或点击
阅读原文
,立即报名!
CFA认证的猫品种数已增至45种
你认识其中几种?
快点击下方小程序进行测试
▽▽▽
登录查看更多
点赞并收藏
0
暂时没有读者
2
权益说明
本文档仅做收录索引使用,若发现您的权益受到侵害,请立即联系客服(微信: zhuanzhi02,邮箱:bd@zhuanzhi.ai),我们会尽快为您处理
相关内容
美图秀秀
关注
0
美图秀秀是一款傻瓜式的免费图片处理软件,不用学习就会用。独有的图片特效、美容、拼图、场景、边框、饰品等功能,加上每天更新的精选素材,可以让你1分钟做出影楼级照片,还能一键分享到新浪微博、人人网。继PC版之后,美图秀秀又推出了iPhone版、Android版、iPad版及网页版
【2020新书】如何认真写好的代码和软件,318页pdf
专知会员服务
65+阅读 · 2020年3月26日
深度神经网络实时物联网图像处理,241页pdf
专知会员服务
78+阅读 · 2020年3月15日
【新加坡国立大学】深度学习时代数据库:挑战与机会
专知会员服务
35+阅读 · 2020年3月6日
【新书】学习TensorFlow2.0,177页pdf,使用Python实现机器学习和深度学习模型
专知会员服务
224+阅读 · 2019年12月28日
《京东区块链技术实践白皮书》(2019版),95页PDF,京东数字科技编
专知会员服务
50+阅读 · 2019年11月9日
分析 | 抖音背后的计算机视觉技术
计算机视觉life
9+阅读 · 2019年5月31日
如何快速入门TensorFlow ?丨极客时间
InfoQ
4+阅读 · 2019年1月8日
开源 AI 技术潜在危机爆发,被大肆用于色情方向
开源中国
7+阅读 · 2018年2月12日
中科院计算所范意兴专访: 深度文本匹配工具 MatchZoo 背后的个中细节
AI科技评论
4+阅读 · 2017年12月23日
为了让你分清人脸识别与人脸检测,苹果要亲自给你科普
AI前线
5+阅读 · 2017年11月17日
Deep High-Resolution Representation Learning for Human Pose Estimation
Arxiv
5+阅读 · 2019年2月25日
QANet: Combining Local Convolution with Global Self-Attention for Reading Comprehension
Arxiv
4+阅读 · 2018年4月23日
Self Paced Deep Learning for Weakly Supervised Object Detection
Arxiv
8+阅读 · 2018年2月21日
Activation Maximization Generative Adversarial Nets
Arxiv
5+阅读 · 2018年1月30日
Disentangled Person Image Generation
Arxiv
7+阅读 · 2018年1月21日
VIP会员
自助开通(推荐)
客服开通
详情
相关主题
美图秀秀
TensorFlow
深度学习
计算机视觉
美颜相机
美拍
相关VIP内容
【2020新书】如何认真写好的代码和软件,318页pdf
专知会员服务
65+阅读 · 2020年3月26日
深度神经网络实时物联网图像处理,241页pdf
专知会员服务
78+阅读 · 2020年3月15日
【新加坡国立大学】深度学习时代数据库:挑战与机会
专知会员服务
35+阅读 · 2020年3月6日
【新书】学习TensorFlow2.0,177页pdf,使用Python实现机器学习和深度学习模型
专知会员服务
224+阅读 · 2019年12月28日
《京东区块链技术实践白皮书》(2019版),95页PDF,京东数字科技编
专知会员服务
50+阅读 · 2019年11月9日
热门VIP内容
开通专知VIP会员 享更多权益服务
【MIT博士论文】弱监督学习:理论、方法与应用
Andrej Karpathy:2025 年 LLM 年度回顾(2025 LLM Year in Review)
锚定情报:合成欺骗时代的地面真相
NeurIPS 2025 | NMKE:基于神经元归因与动态稀疏掩码的终身知识编辑
相关资讯
分析 | 抖音背后的计算机视觉技术
计算机视觉life
9+阅读 · 2019年5月31日
如何快速入门TensorFlow ?丨极客时间
InfoQ
4+阅读 · 2019年1月8日
开源 AI 技术潜在危机爆发,被大肆用于色情方向
开源中国
7+阅读 · 2018年2月12日
中科院计算所范意兴专访: 深度文本匹配工具 MatchZoo 背后的个中细节
AI科技评论
4+阅读 · 2017年12月23日
为了让你分清人脸识别与人脸检测,苹果要亲自给你科普
AI前线
5+阅读 · 2017年11月17日
相关论文
Deep High-Resolution Representation Learning for Human Pose Estimation
Arxiv
5+阅读 · 2019年2月25日
QANet: Combining Local Convolution with Global Self-Attention for Reading Comprehension
Arxiv
4+阅读 · 2018年4月23日
Self Paced Deep Learning for Weakly Supervised Object Detection
Arxiv
8+阅读 · 2018年2月21日
Activation Maximization Generative Adversarial Nets
Arxiv
5+阅读 · 2018年1月30日
Disentangled Person Image Generation
Arxiv
7+阅读 · 2018年1月21日
大家都在搜
Palantir
突防
大型语言模型
多域作战
未来战争
朱克爱德华兹家族
机场
蓝牙安全攻防
反恐
【论文笔记】用于数据驱动交通预测的扩散卷积循环神经网络(DCRNN)
Top
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top