【掌上计算机视觉大有可为】智能终端图像识别、美化、生成应用盘点

2017 年 10 月 1 日 新智元

2017 年 11 月 8 日，在北京国家会议中心举办的 AI WORLD 2017 世界人工智能大会开放售票！早鸟票 5 折抢票倒计时 7 天开抢。还记得去年一票难求的AI WORLD 2016盛况吗？今年，我们邀请了冷扑大师”之父 Tuomas 亲临现场，且谷歌、微软、亚马逊、BAT、讯飞、京东和华为等企业重量级嘉宾均已确认出席。

AI WORLD 2017 世界人工智能大会“AI 奥斯卡”AI Top 10 年度人物、 AI Top10 巨星企业、AI Top10 新星企业、AI Top 10 创投机构、AI 创新产品五个奖项全部开放投票。谁能问鼎？你来决定。

关于大会，请关注新智元微信公众号或访问活动行页面：http://www.huodongxing.com/event/2405852054900?td=4231978320026了解更多

1新智元编译

来源：Forbes

作者：Hovhannes Avoyan

编译：常佩琦

【新智元导读】移动AI，尤其是智能手机上的计算机视觉应用，已经成为人们生活中重要的一部分。本文将会从最新趋势、未来机会、用户将如何使用手机上的AI等方面进行分析。本人作者是PicsArt的联合创始人兼首席执行官。PicsArt是一家领先的社交照片编辑公司，每月有超过9000万活跃用户。

毫无疑问，人工智能和机器学习是近来最热门的话题。大数据和强有力的GPU使得人工智能为几乎所有行业提供动力。现在，AI甚至可以放在手机一类的设备上。移动AI，尤其是计算机视觉，已经成为人们生活中重要的一部分。本文将会从最新趋势、未来机会、用户将如何使用手机上的AI等方面进行分析。

三个计算机视觉方面的应用正在兴起：图像识别、图像优化和图像生成。

图像识别：时尚、零售、设计、医疗……各行业的有趣应用

我们可以期待更多类似于Shazam的应用程序（Shazam 是一款可以识别您周围播放的音乐和电视节目的移动应用程序）。时尚、零售和室内设计等垂直领域能从处理图像的应用程序中受益。看到吸引你的东西时，你可以拍张照片，然后这种图像识别的软件就能帮助用户在线上商店里找到相同或类似的产品。举个其他例子，如果你喜欢某人的外表，你可以给那人拍照，用软件查询在哪里能买到类似的衣服和首饰。

例如，Pinterest最近推出了其镜头工具，用户将手机摄像头对准一个物体，在Pinterest就能查到相同或类似的产品。Houzz是一家家居装饰公司，他们提供视觉匹配服务，帮助用户找到喜欢的图片中的物品。The Flow用户通过相机就能识别在亚马逊销售的产品并获得有关的信息，包括物品描述、评论、视频／音频片段。

在医疗领域，尤其是皮肤病检测，图像识别也很重要。用户可以拍摄照片，获得初步诊断。斯坦福大学的研究人员开发了可以发现皮肤癌的算法。根据结果，其诊断皮肤癌的效率与专业医生相当。该算法并未投入生产，仍有商业机会。我们也期待医疗保健app的出现，特别是x射线诊断和超声诊断，以及可以通过图片诊断糖尿病患者不能吃哪些食物。微软、谷歌、亚马逊提供的云服务消除了开发人员将计算机视觉应用生产的障碍。

我自己的公司，PicsArt，提供自动标记和搜索服务，可以分类用户提交的照片。用户每月上传超过2亿张图像到我们的服务器，我们每天收集20亿次用户活动。这使我们能够大量收集图像编辑历史，并将产品开发成具有用户体验个性化的智能编辑器。例如，平台会向建议用户与他们曾下载过照片类似的图片，来帮助他们发现更多相关照片。

计算机视觉的一个分支是光学字符识别（OCR），可以理解图像中的文本，并将识别的词提取为机器编码的文本流。这适用于各种领域，包括视觉信用卡扫描和银行支票存款。 ABBYY是市场上最准确的OCR引擎之一，并且具有开发更专业的文本和表单扫描器（例如，在医疗保健，银行，零售服务等）的巨大潜力。

图像识别领域还有一个重要的部分是图形分割，应用程序不仅能定位图片中的特定物体，还能识别该物体的界限。这对面孔识别、背景移除、制作贴纸都很有用。

图像美化

图像美化是另一个值得注意的领域，包括风格改变和图像美化。这方面已经有了很多出色的应用。