近日,创新奇智(AInnovation)在国际权威图像分割竞赛Cityscapes上获得实例分割评测的第一名,以明显优势刷新实例分割任务世界纪录,超越NVIDIA(英伟达)、Facebook、Uber、香港中文大学、商汤、搜狗、科大讯飞等几十支强劲的国际企业和科研机构。
迄今为止,在短短5个月时间内,创新奇智已连续在世界顶级人脸检测竞赛WIDER FACE、物体检测竞赛 PASCAL VOC、图像分割竞赛Cityscapes中取得三连冠的佳绩,充分彰显了创新奇智在计算机视觉识别领域的技术实力和算法创新能力。
图片来源:Cityscapes官网
https://www.cityscapes-dataset.com/benchmarks/#instance-level-scene-labeling-task
Cityscapes 数据集
Cityscapes评测数据集在2015年由奔驰公司推动发布,是目前公认的机器视觉领域内最具权威性和专业性的图像分割数据集之一。在Cityscapes评测数据集之中,共分为像素级分割和实例分割两个子任务,其中相较于像素级分割,实例分割的难度要更大,也是计算机视觉领域最重要、最具挑战的任务之一。
在Cityscapes实例分割任务所对应的数据集中,包含了5000张精细标注的图像和20000张粗略标注的图像,其中包含50个城市的不同场景、不同背景、不同街景,以及30类涵盖地面、建筑、交通标志、自然、天空、人和车辆等的物体标注,以关注真实场景下的环境理解著称,任务难度更高。
截至目前,Cityscapes评测吸引了近百支队伍参赛,包括Facebook、香港中⽂大学、商汤、NVIDIA(英伟达)、搜狗、科大讯飞等众多国内外优秀创新企业和顶尖学术机构参加。创新奇智提出的AInnoSegmentation算法在各项指标中均有突破性进展,各项指标均名列第一,综合成绩第一。
AInnoSegmentation算法
AInnoSegmentation算法是以著名的Mask R-CNN网路架构为基础,骨干网络使用SE-Resnet152网络架构,使用它来提取多尺度特征图,颈部网络采用一个6级特征金字塔网络(FPN),用来生成更加丰富的多尺度卷积特征。然后使用自研的特征融合模块作为特征融合器,后面连接两个共享子网,一个负责分类和框回归,一个负责图像分割。
MaskR-CNN网络图
看看AInnoSegmentation算法的表现吧:
AInnoSegmentation算法在Cityscapes数据集上的表现
实例分割算法的商业价值
创新奇智自成立伊始就瞄准高精尖的人工智能算法在制造、零售、金融等多个领域的商业化产品落地,重点突破人工智能算法的领先性和成熟性,形成具有巨大商业潜力的AI产品和解决方案。目前,创新奇智已经打造出业界领先的自动化机器学习平台和AI工业视觉平台ManuVision,并发表了数篇顶级会议论文。这些成果实实在在提高了算法在实际场景的精度,提升了训练和推理的速度,并极为高效地整合了计算资源。
AInnoSegmentation算法在工业视觉中应用非常广泛,典型场景包括:缺陷检测,定位,识别等复杂场景。例如,创新奇智已将该算法应用于成衣、磁性材料等质检场景下,提高产品的质检精准度。
AInnoSegmentation算法还可以应用于零售场景中的渠道陈列和智能货柜等商品识别场景,提高商品识别准确度的同时,帮助客户提升运营效率。
AInnoSegmentation算法还可应用于创新奇智正在实施的智慧铁水无人机车运输系统上,进一步提高该解决方案的成熟度和技术壁垒。
关于参赛团队
创新奇智本次Cityscapes竞赛夺冠队伍由张发恩、吴佳洪、曹浩天、杨志铮、宋剑飞、黄泽、黄家水和贲圣兰组成。其中团队Leader张发恩现任创新奇智CTO、创新工场人工智能工程院首席架构师和宁波诺丁汉大学荣誉教授,他在人工智能工业界和学术界成绩不菲,曾任职Microsoft、Google和百度,持有多项国内外人工智能算法专利和发表过数篇人工智能顶级会议论文。队伍中其他成员也都有着深厚的人工智能教育背景和从业经历。
创新奇智是创新工场的AI子公司,以“人工智能赋能商业未来”为使命,致力于用最前沿的人工智能技术为企业提供AI相关产品及商业解决方案。创新奇智CEO徐辉在IT行业拥有20余年的销售、产品、技术、服务、管理经验,历任IBM、微软、SAP等多家世界500强科技巨头企业高管,对中国市场各个行业发展有着深入了解。创新奇智采用“技术产品”+“行业场景”双轮驱动模式,商业化速度飞快。
创新奇智拥有优异的技术研发团队,结合AI技术商业化的特点,制定了科学技术人才三级体系建设方案,三级体系形成一个金字塔结构,从顶到下分别是:“创新奇智科研委员会— 创新奇智创新研究院 — 创新奇智工程算法研发团队”。其中,“创新奇智科研委员会” 由世界顶级人工智能科学家及知名专家担任,包括中国工程院院士倪光南、前腾讯AI Lab负责人张潼、 百度研究院三维视觉首席科学家杨睿刚、密歇根州立大学教授张弥、创新工场人工智能工程院执行院长王咏刚、创新奇智CTO张发恩。