牛人大讲堂是京东大学演播室推出的业务沉淀、创新实践分享栏目。围绕产品创新、业务创新、技术创新,以视频录播的形式,推广产品及技术。感知识别部的资深算法工程师谭志羽近日参与该节目的录制,为大家分享了AR扫算法和技术框架。
谭志羽所在的京东感知识别团队着力于研究先进的图像,视频算法,如:人脸识别、图片审核、相似相同图片搜索、机器视觉等技术,致力于面向不同行业的多媒体分析、审核需求,提供完整、成熟的解决方案。
AR扫算法和技术框架
京东大学演播室
《牛人大讲堂》
AI牛人专访
京东AI与大数据部 谭志羽
谭志羽,AI与大数据部算法工程师,从事深度学习方向研发。曾获2016年CTO体系最佳新人,在媒体计算及机器学习方向拥有丰富经验,研发方向主要包括:深度学习,图像搜索及计算机视觉等。
Q:目前行业内已有的AR扫类似产品都有哪些?
目前行业内已有的AR扫类似产品,主要有京东商城AR扫,手机QQ-AR识图以及支付宝钱包的AR红包等;这些产品的产品形态主要是,用户通过手机摄像头扫描指定的品牌,指定的商品或指定的logo等,算法通过图像识别,如果识别成功,就给用户发放相应的优惠券,或给用户提供一个互动小程序等。
Q:那这些AR扫的业务场景都是什么?起到了一些什么样的效果呢?
AR扫主要的目标是缩短公司,商家品牌及运营活动触达用户的路径,AR扫算法主要支持三个业务场景:第一种场景,是助力特定的运营活动,用户扫logo识别,例如:京东618期间上线的,扫618logo发优惠券,以及818扫818logo发优惠券,满足活动运营的需求;第二种场景,是助力特定类目运营活动,用户扫物体识别类目,给用户发放类目优惠券,之前3c类目运营活动,就是用的AR扫的方式去做的;第三种场景,是帮助商家针对某款商品做推广运营,用户扫特定的商品,识别后发放特定的优惠券。
Q:都用到了哪些技术和算法?
AR扫算法,主要是基于之前拍照购积累的图像搜索技术,对于用户扫描请求的图像,实现了细粒度图像识别,可以精确到sku的识别,区别于其他公司的AR识别相关产品,我们的算法可以对上千个商品进行细粒度的识别,此外,对于新增加的运营商品,我们的算法可以实现“即插即用”的效果,就是说我们的算法模型,在大数据量的商品“款”的学习之后,对于训练集外的商品款也可以识别,而无需重新训练算法模型,这个是目前其他平台的AR产品所不具备的。
Q:未来的技术方向是什么?
未来,我们会将目前的AR扫算法打造成AR平台,可以成为商家,品牌,公司及运营活动与用户之间的桥梁,实现以最短的路径精准触达用户。从业务角度, AR平台会发展与品牌商合作,帮助品牌提升品牌认知度,增加品牌的曝光度,尤其是针对品牌的深度用户,让AR扫的方式成为用户了解品牌的窗口,同时,让AR扫成为品牌和用户之间的互动的窗口。从算法角度,我们会不断基于用户行为积累数据,优化算法,从而提升算法识别的准确度。从用户角度,培养用户通过扫一扫的方式,获取品牌新品,品牌优惠的信息。
有遇到一些挑战吗?
大家都知道,如果将人工智能比作火箭,其中算法是火箭引擎,而数据是充当火箭燃料的角色。之前遇到的一个挑战是,在缺少数据情况下,或者在仅有少量数据的情况下,如何启动算法,如何进行算法研发。在缺少数据,缺少标注资源的条件下,我们尝试对无监督,半监督的算法以及对抗网络进行探索,使得我们在少量标注数据情况下,就能迭代算法,优化模型。
12
学习方式
TV
内部员工打开京东TV,v.jd.com
搜索牛人大讲堂,进入专题栏目
即可观看学习
京英
内部员工登陆京英学习平台,jdu.jd.com
最新在线课程,或搜索“牛人大讲堂”
即可观看学习
■ 精彩提前看,视频长度1min,只有几M哦~
视觉 | 王小草
采访 | 叶小胖 潘美丽