用50张图训练,就能识别高仿山寨货!阿里安全图灵实验室获ECCV 2020挑战赛冠军

2020 年 8 月 9 日 量子位
贾浩楠 发自 凹非寺
量子位 报道 | 公众号 QbitAI

阿里AI最近拿到了一个“世界第一”:计算机视觉领域顶会ECCV 2020 VIPriors挑战赛分类赛道冠军。

仅用50张图片训练,然后识别特定类别的物体,阿里安全团队的算法击败了所有参赛对手。

阿里的高效分类AI模型,可以解决戴口罩的人脸识别问题;还可以打假,识别零售市场的高仿山寨货。

训练数据50张图,堪称最难分类算法挑战

ECCV 2020 VIPriors挑战赛最困难的一点,是1000个数据类别中,每个类别仅有50张图片作为训练数据

参赛者的模型,必须能在这种训练数据极少的情况下,实现对于目标高精度识别分类。

这样的难度,对于传统的AI模型来讲,几乎是不可能的任务。因为它们普遍需要海量带标签训练数据作为基石,才能保证AI模型的效果。

但是数据的收集和标注需要昂贵的人力成本,需要从不同的角度、光照条件和位置拍摄、收集几千甚至上万张图片并进行标注。

根据招聘平台信息,北京地区,数据标注师的月薪普遍在5000-8000,有数据采集技能的标注师月薪往往超过10000。而数据标注师的培训讲解岗,工资则超过2万。

ECCV 2020 VIPriors挑战赛的初衷,就是鼓励探索能够高效学习的AI神经网络,降低神经网络训练过程中的人力标注成本和计算资源消耗,使用极少的训练数据,一块GPU也可以完成

在分类赛道上,比赛数据基于ImageNet抽取,1000个类别,每个类别仅使用50张图像,训练集共5w张图片,规模仅为Imagenet的1/26。

比赛规定模型只能train from scratch,不能使用额外的训练数据,不能使用预训练模型,不能使用迁移学习,排名以测试集上的Top-1 Accuracy为准。

戴口罩识别+AI零售打假

在比赛中,面对50张训练图片的苛刻要求,阿里安全图灵实验室的智能算法团队从三个技术方向进行了突破:

利用随机抽取的两张训练图像,使用数据增强并进行拼接,最大程度丰富训练样本资源;

设计独特的神经网络结构,加入显著性特征模块挖掘样本的特点,提升分类性能;

利用分层语义结构,让AI模型更好地挖掘数据,实现更好的学习效果。

这三点创新方法,同时与自监督有效结合,在学习更好的数据表征基础上,指导模型高效学习,获得更好的识别能力。

获得了冠军,这项高效AI方案有什么实际应用呢?

阿里安全图灵实验室资深算法专家薛晖介绍,疫情期间,突发口罩佩戴问题使得大量人脸门禁失效,很多小区需要摘下口罩刷脸,带来不必要的健康风险。

而高效AI分类技术的应用大大降低了模型初始化的数据需求量,帮助快速训练好模型,解决了戴口罩的人脸识别问题。

此外,这项AI技术还能用于打假,识别山寨仿冒商品,并且已经投入使用。

对于零售场景,无论是线上还是线下,对于刚刚上新的某种产品,往往是样本数量较少,预训练任务和目标任务存在差异,预训练模型可能损害目标任务的准确率。而高效AI方案恰恰能够解决上述问题。

以某知名品牌运动鞋上新为例,一段时间内仅能获得该产品不同的配色以及商品几个不同角度的图片。

在仅有少量商品展示图的情况下,通过高效AI方案,在新产品问世的极短时间内就能实现新款商品识别能力的覆盖,降低新产品被山寨和假冒的风险

对于在网上购物的你我来说,这项技术使消费者大大降低了碰到真假难辨的高仿货几率。

不用消费者自己动手部署算法去识别商品,阿里安全的高效AI方案在平台端部署,在商品陈列阶段就尽量保证真品,避免出现鱼龙混杂的情况。


除了零售打假,在其他识别类别多、每个类别样本数量很少的场景,比如知识产权商标识别通用商品识别动植物保护等等,阿里的高效AI方案都有用武之地。

目前高效AI方案对内已应用到了阿里多个业务场景,如淘宝视频、淘宝直播、优酷等平台的知识产权保护,为数字基建的安全建设提供样本参考,对外则通过绿网直接服务大中小企业。

阿里安全图灵实验室

阿里安全图灵实验室是阿里巴巴从事安全领域机器学习研发的顶级团队,专注于 CV、NLP 及 ML 领域,团队所研发的 AI 技术被广泛用于阿里巴巴经济体的全球业务网络安全、数据安全、知识产权、新零售安全以及风控反作弊等业务场景。

今年分类赛道共有来自全球的56位选手参与,最终,阿阿里安全的高效AI分类技术超越三星、同济大学等国内外多支队伍的同类技术,勇夺冠军。

“A visual inductive priors framework for data-efficient image classification”也已经被ECCV 2020 Workshop VIPriors接收。

本文系网易新闻•网易号特色内容激励计划签约账号【量子位】原创内容,未经账号授权,禁止随意转载。

每天5分钟,抓住行业发展机遇

如何关注、学习、用好人工智能? 

每个工作日,量子位AI内参精选全球科技和研究最新动态,汇总新技术、新产品和新应用,梳理当日最热行业趋势和政策,搜索有价值的论文、教程、研究等。

同时,AI内参群为大家提供了交流和分享的平台,更好地满足大家获取AI资讯、学习AI技术的需求。扫码即可订阅:

加入AI社群,与优秀的人交流


量子位 QbitAI · 头条号签约作者


վ'ᴗ' ի 追踪AI技术和产品新动态


喜欢就点「在看」吧 !


登录查看更多
0

相关内容

【DeepMind】CrossTransformers: 空间感知的小样本迁移
专知会员服务
39+阅读 · 2020年7月26日
最新《多任务学习》综述,39页pdf
专知会员服务
264+阅读 · 2020年7月10日
少标签数据学习,54页ppt
专知会员服务
198+阅读 · 2020年5月22日
【CVPR 2020-商汤】8比特数值也能训练卷积神经网络模型
专知会员服务
25+阅读 · 2020年5月7日
零样本图像识别综述论文
专知会员服务
57+阅读 · 2020年4月4日
【斯坦福&Google】面向机器人的机器学习,63页PPT
专知会员服务
25+阅读 · 2019年11月19日
商汤及联合实验室入选论文重点解读 | ECCV 2018
Fast AutoAugment
Arxiv
5+阅读 · 2019年5月1日
Few-shot Adaptive Faster R-CNN
Arxiv
3+阅读 · 2019年3月22日
Adaptive Neural Trees
Arxiv
4+阅读 · 2018年12月10日
Arxiv
5+阅读 · 2018年3月6日
VIP会员
相关论文
Fast AutoAugment
Arxiv
5+阅读 · 2019年5月1日
Few-shot Adaptive Faster R-CNN
Arxiv
3+阅读 · 2019年3月22日
Adaptive Neural Trees
Arxiv
4+阅读 · 2018年12月10日
Arxiv
5+阅读 · 2018年3月6日
Top
微信扫码咨询专知VIP会员