作者 | 周翔
近日,小米科技董事长兼 CEO 雷军在微博上放出多张军装照, 还真是有浓浓的红军年代感...。
实际上,这是人民日报为了建军 90 周年策划的一个活动——“穿上军装 H5”,相当于一键P图,雷军不过是赶了个时髦而已。
打开这个 H5 界面,从“2007-2017、1999-2007、1987-1999、1985-1987、1965-1985、1955-1965、1950-1955、解放战争、抗日战争、红军时期、南昌起义”中选择你感兴趣的年代,然后上传个人照片,选择性别,点击“穿上军装”即可。
据人民日报社新媒体中心统筹策划室副主编余荣华介绍,这次活动从确定创意到29日晚发布,共花了两周时间。期间,人民日报与腾讯旗下的天天P图达成了合作,后者负责提供图像处理支持和后端服务器支持。
有报道称,天天P图使用了业内首创的“人脸融合”技术,才使得这次的合成照片看起来比较自然。比如下面 BAT 三位大佬的军装照。
不过,天天P图到底是怎样实现人脸融合的?为什么很多照片的违和感依然很强?用户的图片上传之后会泄露隐私吗?带着这些问题,AI科技大本营采访了腾讯天天P图团队,希望能给读者一个解答。
以下是采访内容,AI科技大本营略作修改:
AI科技大本营:每分钟的峰值最高达到多少?用了多少台服务器?
答:峰值出现在 7 月 30 日 23:03,图片生成峰值达到每分钟 117 万次。为了应对巨大的访问量,从一开始的400台服务器,到最高峰动态部署了4000 台腾讯云服务器,并采用了智能分流、柔性策略等办法,确保稳定应对海量的用户用户请求。
AI科技大本营:“人脸融合”是怎样的实现的?
答:军装照H5中,最关键的一环就是将用户照片合成军人形象。而天天P图就是提供了这项名为“人脸融合”的图像处理技术。
天天P图首创的人脸融合技术,是指将用户上传的照片与特定形象进行脸部层面融合,让生成的图片效果既有用户的五官特点,也呈现出对应形象的外貌特征。实现这一融合结果,是基于对人脸和五官的精准识别定位,利用用户照片和特定形象照片中的五官关键点,进行智能匹配贴合。
AI科技大本营:里面涉及到哪些技术,有哪些难点?
答:首先是最基础的人脸识别技术,这项技术对五官和脸型进行精准的定位,为人脸融合的实现打造了基础。这依托于腾讯优图实验室提供的快速稳定,业内领先的人脸识别技术。
其次,天天P图自有的图像技术团队,对图形图像处理技术的不断积累和优化,一步步解决了海量用户在各种复杂环境下的自拍照的人脸检测和人脸融合的难题。
AI科技大本营:人脸融合这个技术是业内首创?竞争对手没有这种技术?
答:天天P图研发的人脸融合技术,属于业内首创。从整体效果上看,合成效果的五官和谐度、肤色的融合度、侧脸处理效果等,都达到了业内最领先的水平。
AI科技大本营:为什么有些图片很不自然?还要哪些优化空间?
答:生成的效果会受拍摄角度及光线等影响,所以建议用户可以尽量选择清晰正脸照片进行变妆。目前除了光照因素影响之外,对于个别用户侧脸照融合后效果还有改进空间,未来我们也会尝试利用 3D 信息来对侧脸进行修正,为用户提供更精准的P图效果。
AI科技大本营:使用的人越多,效果会越好吗?
答:是的,越多人参与活动,可以让后台算法遇到更多不同光照、不同环境、不同人像的照片。对各种场景进行分析,促进算法智能优化,在各种环境中表现出更好的融合效果。同时通过收集用户反馈,可以了解哪些效果和技术用户更感兴趣,从而不断调整优化。
AI科技大本营:用户上传到后台的图片的隐私怎样保证?
AI科技大本营:这些技术未来还可以有哪些有趣的应用?
答:未来一段时间,我们更加聚焦在相机以及人脸图片的处理。在相机这里,我们会在 3D,AR,和智能化这块寻找一些突破口,让相机更加聪明更好玩,做成一款兼具效果美和趣味性强的智能相机;在人脸处理上,我们也会在不断优化换脸效果的同时深度挖掘更多的新玩法。
彩蛋:你能猜出他是哪位大佬吗?
关注福利
关注AI科技大本营,进入公众号,回复对应关键词打包下载学习资料
回复:CCAI,下载《CCAI 2017嘉宾演讲PPT 》
回复:路径,下载深度学习Paper阅读路径(128篇论文,21大领域)
回复:法则,下载《机器学习的四十三条经验法则》
回复:美团,下载《深度学习在美团外卖的应用,NLP在美团点评的应用》,《NLP在美团点评的应用》pdf
回复:沙龙,下载CSDN学院7月15日线下沙龙PPT(蒋涛、孟岩、智亮)
回复:对抗,下载台大李宏毅老师关于生成对抗学习视频教程(附PPT)
回复:AI报告,下载麦肯锡、波士顿、埃森哲咨询公司AI报告
回复:银行,下载银行和证券公司的AI报告
回复:人才,下载 2017 领英《全球AI领域人才报告》
回复:发展,下载2017 全球人工智能发展报告_框架篇
回复:设计,下载人工智能与设计的未来
回复:1986,下载李开复1986年论文《评价函数学习的一种模式分类方法》和1990年论文《The Development of a World Class Othello Program》
回复:中美,下载《中美两国人工智能产业发展全面解读》(腾讯研究院)
人类感知外界信息,80%以上通过视觉得到。2015年,微软在ImageNet大赛中,算法识别率首次超越人类,视觉由此成为人工智能最为活跃的领域。为此,AI100特邀哈尔滨工业大学副教授、视觉技术研究室负责人屈老师,为大家介绍计算机视觉原理及实战。扫描上图二维码或加微信csdn02,了解更多课程信息。