随着工业4.0时代的到来,机器视觉在智能制造业领域的作用越来越重要,为了能让更多用户获取机器视觉的相关基础知识,包括机器视觉技术是如何工作的、它为什么是实现流程自动化和质量改进的正确选择等。小编为你准备了这篇机器视觉的干货资料。
随着工业4.0时代的到来,机器视觉在智能制造业领域的作用越来越重要,为了能让更多用户获取机器视觉的相关基础知识,包括机器视觉技术是如何工作的、它为什么是实现流程自动化和质量改进的正确选择等。小编为你准备了这篇机器视觉的干货资料。
我们先从机器视觉的定义开始,根据制造工程师协会的定义:机器视觉就是使用光学非接触式感应设备自动接收并解释真实场景的图像以获得信息控制机器或流程。
那么,这到底是什么意思呢? 简单来说,机器视觉就是为了流程控制或检测所制造的产品而从数字图像中自动提取信息,看下图示范:
机器视觉运用图解
为了更好地理解机器视觉,下面,我们以啤酒厂采用的填充液位检测系统为例来进行说明:
图1 啤酒瓶填充液位检验示例
当每个啤酒瓶移动经过检测传感器时,检测传感器将会触发视觉系统发出频闪光,拍下啤酒瓶的照片。采集到啤酒瓶的图像并将图像保存到内存后,视觉软件将会处理或分析该图像,并根据啤酒瓶的实际填充液位发出通过-未通过响应。如果视觉系统检测到一个啤酒瓶未填充到位,即未通过检测,视觉系统将会向转向器发出信号,将该啤酒瓶从生产线上剔除。操作员可以在显示屏上查看被剔除的啤酒瓶和持续的流程统计数据。
另外,机器视觉系统还能够进行物品测量,比如确定火花塞间隙或提供位置信息,引导机器人在制造组装过程中将元件对位,图2显示的例子主要是说明机器视觉系统如何能够用于进行滤油器(右)通过或未通过检测,以及测量支架上中心轴头的宽度(左)。
图2 机器视觉系统能够在生产线上进行实时测量和检验,比如加工支架(左)或滤油器(右)
在这个应用示例中,填充液位检验系统仅可提供两种结果,这显示了二进制系统的特征:
1、如果产品合格,则检测结果为“通过”
2、如果产品不合格,则检测结果为“未通过”。
虽然人类视觉最擅长于对复杂、非结构化的场景进行定性解释,但机器视觉则凭借速度、精度和可重复性等优势,擅长于对结构化场景进行定量测量,举例来说,在生产线上,机器视觉系统每分钟能够对数百个甚至数千个元件进行检测。配备适当分辨率的相机和光学元件后,机器视觉系统能够轻松检验小到人眼无法看到的物品细节特征。
另外,由于消除了检验系统与被检验元件之间的直接接触,机器视觉还能够防止元件损坏,也避免了机械部件磨损的维护时间和成本投入。通过减少制造过程中的人工参与,机器视觉还带来了额外的安全性和操作优势。此外,机器视觉还能够防止洁净室受到人为污染,也能让工人免受危险环境的威胁。
机器视觉的应用领域
识别
标准一维码、二维码的解码
光学字符识别(OCR)和确认(OCV)
检测
色彩和瑕疵检测
零件或部件的有无检测
目标位置和方向检测
测量
尺寸和容量检测
预设标记的测量,如孔位到孔位的距离
机械手引导
输出空间坐标引导机械手精确定位
机器视觉系统的分类
智能相机
基于嵌入式
基于PC
图像获取:光源、镜头、相机、采集卡、机械平台
图像处理与分析:工控主机、图像处理分析软件、图形交互界面。
判决执行:电传单元、机械单元
光源种类
LED:寿命长/可以有各种颜色/便于做成各种复杂形状/光均匀稳定/可以闪光;
荧光灯:光场均匀/价格便宜/亮度较LED高;
卤素灯:亮度特别高/通过光纤传输后可做成;
氙灯:使用寿命约1000小时/亮度高,色温与日光接近。
(大部分机器视觉照明采用LED)
光源:光路原理
照相机并不能看见物体,而是看见从物体表面反射过来的光。
镜面反射:平滑表面以对顶角反射光线
漫射反射:粗糙表面会从各个方向漫射光线
发散反射:多数表面既有纹理,又有平滑表面,会对光线进行发散反射
光源:作用和要求
在机器视觉中的作用
照亮目标,提高亮度
形成有利于图像处理的效果
克服环境光照影响,保证图像稳定性
用作测量的工具或参照
良好的光场设计要求
对比度明显,目标与背景的边界清晰
背景尽量淡化而且均匀,不干扰图像处理
与颜色有关的还需要颜色真实,亮度适中,不过曝或欠曝;
光源:光场构造
明场: 光线反射进入照相机
暗场:光线反射离开照相机
光源:构造光源
使用不同照明技术对被测目标会产生不同的影响,以滚珠轴承为例:
镜头:主要参数
工业的镜头大都是多组镜片组合在一起的。计算时会忽略厚度对透镜的影响将其等效成没有厚度的播透镜模型,即理想凸透镜。
参数:焦距/视场/物距/像距/光圈/景深/分辨力/放大倍数/畸变/接口
分辨率:对色彩和纹理的分辨能力。
畸变:镜头中心区域和四周区域的放大倍数不相同。
畸变的校正一般用黑白分明的方格图像来进行,过程并不复杂。一般如果畸变小于2%,人眼观察不到;若畸变小于CCD的一个像素,摄像机也看不见。
镜头:分类
CCTV镜头
专业摄影镜头
远心镜头
镜头:远心镜头
在测量系统中,物距常发生变化,从而使像高发生变化,所以测得的物体尺寸也发生变化,即产生了测量误差;
即使物距是固定的,也会因为CCD敏感表面不易精确调整在像平面上,同样也会产生测量误差。
采用远心物镜中的像方远心物镜可以消除物距变化带来的测量误差,而物方远心物镜则可以消除CCD位置不准带来的测量误差。
相机
种类:线&面、隔/逐、黑/彩、数/模、低/高、CCD/CMOS
指标:象元尺寸、分辨率、靶面大小、感应曲线、动态范围、灵敏度、速度噪声、填充因子、体积、质量、工作环境等
工作模式:Free run、Trigger(多种)、长时间曝光等
传输方式:GIGE,Cameralinker,模拟
通过总结我们可以发现,这些初创都有很强的背景,不论是团队背景还是技术能力,并且大多是以人工智能下的视觉处理技术为核心打造各自的算法体系和数据平台。
【商汤科技】
https://www.sensetime.com
商汤科技成立于2014年,主要业务是计算机视觉技术以及深度学习算法,是计算机视觉和深度学习领域的算法提供商。2018年9月初,软银中国的10亿美元投资,将商汤估值抬至60亿美元。
图1 商汤科技生态象限
商汤科技的核心团队由两大部分组成,一部分是来自各大名校的博士、硕士等顶尖行业人才,有150多位人工智能深度学习方向的博士,另一部分则是来自微软、谷歌等相关领域的从业者;核心技术上,主攻人脸识别、视频监控识别算法、增强现实、文字识别、自动驾驶识别算法、医疗影像识别算法几项技术;行业方面,专注于安防监控、金融、手机、移动互联网和深度学习芯片五大领域。
在具体的安防落地案例中,与公安系统合作居多。广州市某公安局使用商汤视图情报研判系统,用以图搜图的检索功能进行案发现场人脸截图与标准库照片比对,进行人员的身份查询,打击已发生的犯罪。2017年以来,视频侦查部门成功比中嫌疑人2000多人,抓获800多人,成功破案近百宗。
营收方面,商汤科技已经实现连续3年间业务年化增长超过400%,2017年已实现全面盈利,营收相比2016年增长420%。其目前的营收来源的四个方向:安防、汽车、手机以及新型业务,智能安防的收入占比最大,占整体营收的30%。此外,60%来自于智能汽车、手机移动互联网方面,剩下10%来自于新型业务。新型业务中,包括了遥感、机器人、视频等业务。
【旷视科技】
https://www.megvii.com
旷视科技成立于2011年,是一家专注于图像识别和深度学习的技术与产品研发的公司,以“Face++”被外界熟知。目前已经完成十几亿美元的融资,最新估值已达30亿美元。
图2 旷世科技生态象限
2014年下半年,旷视成立安防事业部,2015年,旷视决定大力进军安防。2016年从互联网金融切入开始场景落地,并逐渐扩大到安防、手机、新零售、机器人、行业物联等行业。
在金融安全领域,旷视科技已经完成了全球数亿人的远程实名制验证,其智能安防系列解决方案已在全国数十个个省市上线并被中国公安部列入重点技术推广目录。早在2015年,旷视科技就发布了一款面向To B市场的智能安防摄像机——MegEyeC1,该系列已经发展到了MegEye-C3S版本,MegEye-C3S可实现全帧率、全画幅的人脸实时检测与抓拍,单帧可实现100张以上人脸检测与抓拍,特别适用于人流密集的通道、出入口等场景,实现对人群中人脸信息的精准捕捉。
图3 端到端智能安防产品及解决方案架构
【云从科技】
http://www.cloudwalk.cn
云从科技成立于2015年,孵化于中科院重庆研究院,专注于计算机视觉与人工智能等技术的研发,具有国家队背景。其成立的目的是重点转化人脸识别技术、人群监测技术、警用图侦技术和交通识别技术等科研成果。目前三大业务线包括金融、安防及创新,产品覆盖银行、安防、民航等领域,是国内银行业人脸识别的第一大供应商。
图4 云从科技生态象限
在人脸识别应用方面,以银行业为例,国内有能力自建系统的银行为148家。截至2018年3月15日,已完成招标的银行为121家,其中,云从中标88家总行平台,市场占有率为72.7%。
今年3月,云从科技发布的“炬眼”智能识别相机,被称为是世界科技界的一项重大突破。“炬眼”智能人脸识别相机使用Intel架构,在摄像机本地完成全程识别,极速传输识别结果到后台,准确率高达99.8%以上,目前相关产品已在23个省上线实战。
【云天励飞】
http://www.intellif.com
云天厉飞成立于2014年8月,是一家专注于视觉人工智能领域的公司,致力于打造基于视觉芯片、深度学习和大数据技术的“视觉智能加速平台”,为平安城市、智慧商业、工业智造、无人系统、机器人等行业的千家企业提供视觉智能应用解决方案和开发平台。
图5 云天厉飞生态象限
2015年,云天励飞打造了一个基于前端抓拍和云端搜索的人像智能系统;2016年,成功为2016杭州g20峰会西湖核心区域提供动态人像识别安保服务;2017年1月,在云天励飞的帮助下,深圳市公安局在15个小时内就破获一起拐卖儿童案件。
基于云天【深目】人像智能平台,云天励飞目前在深圳市范围内已经部署了5000多路的在线智能前端设备,全部动态人像的数据量也接近150亿张。而云天【深目】动态人像智能平台已在北京、上海、广州、杭州、新疆等先后落地,并进入新加坡、马来西亚等国家。
【依图科技】
http://www.yitutech.com
依图科技成立于2012年,致力于人工智能的研发工作。其计算机视觉技术目前主要应用在安防、金融以及医疗领域三大领域。在安防领域,公司研发的“蜻蜓眼”人像大平台已服务全国上百个地市公安系统,是全国唯一拥有十亿级人像库比对能力的公司;在金融领域,截止2015年,招商银行 1500 多个网点接入了依图系统,刷脸取款技术已经应用于全国2万多台ATM机。
图6 依图科技生态象限
蜻蜓眼智能安防产品包括人像大平台、车辆大平台两大系列。其中人像大平台采用依图自主研发的人脸识别技术,可进行基于图片的静态人脸比对,和基于视频流、图片流的动态人像识别及比对。系统广泛支持x86、GPU架构;提供了完善,可定制的用户体系,授权机制,权限系统和监管能力;支持跨集群协同联动;针对不同应用场景,提供了一体机,便携式单兵工具等多种产品形态。
图7 依图科技蜻蜓眼人像大平台特点
【神目科技】
https://www.deepcam.cn
神目科技是一家计算机视觉公司,成立于2016年12月,是一家以客户为导向的公司,主要以人脸识别、姿态识别、物体识别等核心算法在安防、零售以及移动手机端落地服务。
图8 神目科技生态象限
目前落地比较好的是智能终端,比如手机端。而在安防领域,其人脸识别系统几乎每天可以协助公安人员抓捕一名嫌犯。在智慧零售方面以防止偷盗为主要目的,其市场目前分为国内和海外两块,产品在美国本土应用的店铺超过了2000家,包括知名的零售企业7-11,还有一些体育用品零售店等;在国内合作的零售店铺也已经达到了100多家,其中包括万科、万达、良品铺子连锁店等。
【深醒科技】
https://www.sensingtech.com.cn
深醒科技成立于2016年1月,是一家从事人工智能方向,集研发、生产和销售为一体的高科技公司,以人脸识别技术切入AI战场,目前专注在安防领域人脸识别方向。
图10 深醒科技生态象限
2017年12月,BBC 曾对深醒科技在贵阳公安局安装的“深醒动态人脸识别实时预警系统”进行了一次实地测试。BBC记者逃犯,试图逃离贵阳市。在照片被技术人员录入数据库中后,其所到之处,但凡有摄像头的地方,都会被抓拍到身影。
而其被抓拍到的面部画像、出现位置及时间都实时的出现在了贵阳公安局数控大厅的屏幕上。最终,这名记着仅逃跑了7分钟就被贵阳警察在火车站大厅中“抓获”。
深醒科技在人脸识别的技术方面不仅采用静态算法,同时采用动态识别技术,并且其红外人像识别技术突破了黑暗背景下的人脸识别难题,在阴天、夜晚等低光照条件下仍有较高的识别率。目前其主要客户包括新疆、青海、云、贵、川、黑龙江等省份的公安系统,中航工业、中石油、中铁等大型企业、部分国内商业大厦和商业银行。
【眼神科技】
http://www.eyecool.cn
眼神科技成立于2016年,是一家专注于生物识别技术开发和应用的公司。现已开发完毕并投入使用的生物识别技术包括指纹、人脸和虹膜识别技术,正在研发中的有指静脉识别技术。
图11 眼神科技生态象限
眼神科技的产品当前主要应用在金融、公安、社保、校园、社区等方面。在人脸识别技术方面,眼神已经将其大规模产品化并应用于几十家银行,其算法在LFW人脸识别大赛中准确率达到了99.71%。
目前,眼神科技已经在全国20多个机场和客运站上线了安全管控系统,能够实现动态人脸识别,人、证、票合一检验,重点人员的布控和预警,满足了治安管理、通行管理、报警、门禁等各方面需求。
眼神科技承担了贵州、山东等多地“天网工程”项目建设,通过智能人脸识别摄像机自动抓拍人脸,实时传入指定数据库,能够实现动态人脸识别,重点人员的布控和预警,黑名单识别,轨迹查询,频次分析,同行分析,陌生人检测,图像侦查等功能,同时支持智能报警。
【深瞐科技】
http://www.seemmo.com
深瞐科技成立于2012年,专注于人工智能、机器视觉等领域。其核心技术包括芯片、算法和大数据三大板块,基于FPGA 神经网络算法硬件加速,帧频18fps - 320fps,检测识别八大类目标与GPU相比功耗比提升4-8倍,拥有全球领先的车辆特征识别算法、人脸识别算法、视频结构化算法,大数据分析方面能够达到毫秒级的响应速度。
图12 深瞐科技生态象限
深瞐科技全球首家提出“车脸”识别概念并落地实现,2014年利用深度学习技术推出高精度“车脸”识别算法,对图片视频中的车辆进行精准识别并秒级分析车辆特征,现该算法的车辆识别准确率可达到95% - 99%,能够识别5000多种车型。
车辆识别方面可以实现在海量视频和图片中锁定并追踪涉案车辆,适用于刑侦、情报、反恐等领域。人脸识别方面则能够对静态人脸和动态人脸进行高质量的识别分析,可应用于公安人脸比对、商业人流大数据分析、司法边检身份识别等。
深瞐的客户主要有三大块:一个是安防上市大公司;二是是集成商,主要为他们提供软件服务;三是终端客户,为其提供服务器硬件、软件和算法。目前深瞐科技的营收主要来自安防大公司,其2017年营收3000多万元,来自大公司营收占比80%。
【速感科技】
http://www.qfeeltech.com
速感科技创立于2014年7月,是一家专注于计算机视觉技术的公司。以vSLAM(基于视觉的同时定位与构图)为核心技术,希望通过前端芯片上的算法集成系统来帮助机器实现视觉自主导航、精准跟随等功能。
图13 速感科技生态象限
目前速感科技的主要产品为面向智能设备的系统化视觉解决方案——ULBrain消费级嵌入式视觉相机模组、Inbox工业级SLAM导航定位控制器。ULBrain™视觉感知技术中的动态物体跟踪技术、实时人数统计、场景行为理解技术为智能安防系统的建设提供可行方案。
【智芯原动】
http://www.icetech-bj.com
智芯原动成立于2012年,专注于AI算法和算法芯片技术研究、智能化产品和解决方案开发交付以及智能云服务集成,主要聚焦AI技术在机器视觉领域的应用,曾为海思提供AI协处理器IP授权。
图14 智芯原动生态象限
国内首创AI算法芯片化技术,并构建了上游芯片生态链,为客户提供AI技术、智能硬件等端到端AI解决方案,实现算法、芯片、产品的一体化设计,并结合云端大数据形成完整的AI产业链系统。
其用于智慧社区的“慕颜1”人脸识别终端能够进行人、车防伪识别,支持Anti-Fake活体检测,其人脸识别算法的性能比行业标杆优化50%,检测速度优化到10-30ms,识别速度低于1秒,识别准确率达到99.9%。
旗下合资子公司深圳智汇芯专注于智慧安防,致力于开发车识别、人识别、客流计数和安防视频数据结构化等安防AI模组领域。其超星光人脸模组能在黑暗环境下准确实现人脸识别。
【宇泛智能】
http://www.uni-ubi.com
宇泛智能成立于2014年,基于人脸检测、人脸识别、性别分析、年龄分析、行人检测技术等人工智能技术研发相关产品。2015年10月推出智能前台“Uface”, Uface人脸识别终端通过连入开放平台、由开放平台以API或SDK形式为开发者提供人脸检测、人脸识别、人证比对技术及设备管理功能。
图15 宇泛智能生态象限
该产品识别速度据称可达0.01秒,且属于弱配合识别,即打卡时无需专门对准摄像头,从机器前经过就可以完成识别打卡。目前已在办公、社区、酒店等各类场景落地,包括门禁考勤、闸机控制单元、身份自证和人脸识别终端等。
通过总结我们可以发现,这些初创都有很强的背景,不论是团队背景还是技术能力,并且大多是以人工智能下的视觉处理技术为核心打造各自的算法体系和数据平台。虽然国内的AI企业众多,融资体量也非常大,但是主要的资金还是会流向头部初创,二八定律在这里同样适用。应用方面则是以“大安防”为主,各大公司的主要客户主要以To G和To B为主,其应用场景主要集中在公检法系统和金融体系中,而随着国内智慧城市项目陆续规划和落地,AI+安防的市场会逐渐扩大,但能在大浪中完美冲浪的不会太多。最后,关于AI的看法,在这里引用商汤科技创始人汤晓鸥的话,那就是不存在AI行业,只有AI+行业。
本文来源:高工机器人,感谢作者付出的劳动
工业互联网
产业智能官 AI-CPS
加入知识星球“产业智能研究院”:先进产业OT(工艺+自动化+机器人+新能源+精益)技术和新一代信息IT技术(云计算+大数据+物联网+区块链+人工智能)深度融合,在场景中构建状态感知-实时分析-自主决策-精准执行-学习提升的机器智能认知计算系统;实现产业转型升级、DT驱动业务、价值创新创造的产业互联生态链。
版权声明:产业智能官(ID:AI-CPS)推荐的文章,除非确实无法确认,我们都会注明作者和来源,涉权烦请联系协商解决,联系、投稿邮箱:erp_vip@hotmail.com。