点击上方“深度学习大讲堂”可订阅哦!
编者按:适逢中秋国庆假期,万家灯火庆团圆,这份安定繁华的背后,其实是无数的战士在保卫着祖国的万里河山。以无人智能系统为代表的军事智能化变革已拉开帷幕,中科视拓作为一家计算机视觉国家队发起的人工智能公司,正在与合作的军工单位一起,承担祖国和人民赋予的神圣使命。本文中,中科视拓副总裁袁基睿博士,将从无人机视觉出发,讲述无人智能系统,如何从单机智能走向集群智能,从而守护祖国万里海空长城。
本文为袁基睿9月24日在TEDx成都上的演讲,以下为演讲全文:
都说TEDx是一个交流思想、分享理念的地方,今天我想给大家讲一讲情怀,我做无人机视觉这一研究方向的情怀。
让我们先从两部电影中的虚构人物开始讲起,这两个人物在各自的电影中有着截然不同的结局。让我们先来认识一下《拆弹部队》中的一位配角,Tompson,我想大家已经猜到了,他是一位拆弹专家,顾名思议他的工作就是去拆除炸弹,以避免炸弹爆炸造成伤亡。再来介绍一位美女,《绝密飞行》的女主角Kara Wade,她是一位飞行员。
在一个天气还算不错的午后,虽然不是同一个午后,他们各自接到了命令,要去执行一些危险任务。
Tompson作为第一爆破手,被派往执行拆弹任务,然而很遗憾,在执行任务过程中,由于操作失误他牺牲了。而另一部电影中的女主角Kara Wade则幸运得多,她九死一生存活了下来。
通过一遍遍分析两个人物之间的差异以及双方配置的不同,我得出了一个结论,大概有两个理由造成了他们不同的结局:
首先,最重要的原因,当然是主角光环。这个,你懂的。然而,由于我并不是导演编剧, 因为如果我是导演就无法来到这里做这个talk,所以对这个原因我就不去做进一步的分析了。
那么,另一个原因是什么呢?《绝密飞行》,它是一部科幻片,在该片中,无人机作为第二主角出现,并具备了足够的智能,能够代替人类执行危险的任务,并在最后时刻代替美丽的女主角Kara Wade冲向了毁灭,才换来了主角的保全。
那么这就带给我一个思考:凭什么,同样是演员,一个可以演被保全的主角,另一个却只能演被牺牲的配角,sorry, just kidding。Seriously,带给我这样一个思考,这部电影中的科幻,也就是无人机拥有了足够的智能,并且代替人类执行危险任务,送给了主角一份生命的厚礼。那么如果《拆弹部队》中也配有一部拆弹机器人,是不是就能够避免牺牲、进而拯救更多的人呢?
因此,这引发了我的另一个思考,无论是机器人还是无人机都可以被统称为无人智能系统。那么无人智能系统,何时、以及如何才能成为现实?
首先我们先来回答何时的问题。
1968年有一部电影叫做《星际迷航》,其中有这样一幕,主角在用一个小面板以及语音来操控飞船,这个面板它有一个非常好听的名字,pad。2010年,乔布斯在苹果发布会上向全世界发布了一个新产品,具备Siri语音操作系统的ipad。
所以从1968年的科幻走到2010年的科技,走过了42年。那么2005年的科幻电影《绝密飞行》中无人机拥有足够的智能,这将会何时成为现实呢?大家都知道,随着科技的进步,科技的进步速度是迭代加速的,1968年的42年,在2005年或许只意味着30年。
大胆的猜测了第一个问题的答案之后,我们来看第二个问题,如何!
无人智能系统,如何才能具备足够的智能,智能到可以独立执行任务呢?
首先,我们来看一下,每当提起无人智能系统,我们所期待的是什么?
一定是像《机器人瓦力》中主角Eva一样技术能力超过人类,而自主协同能力接近人类的机器人。Eva第一次见到瓦力时,先扫描了一下,然后没理瓦力,走掉了,因为她的检测结果大概是这样的,瓦力既没有什么威胁、又没有什么用途,所以大概是个废物。而随着Eva同瓦力的不断接触,Eva不但开始认识瓦力、可以合作去打怪,最后甚至产生了感情。
那么我们再来看一下,现有的无人智能系统是什么样子的?
上图为一张无人机从千米高空俯拍的地面图,密集恐惧症患者就不要看了,因为图中所有密密麻麻的小绿框都是检测到的车辆,我不知道大家看到这张图片是什么感觉,我想象了一下,如果我从千米高空俯视地面,别说车辆了,大概连地面我都看不到。
但是,利用中科视拓无人机视觉技术,却很能够高精度地检测、识别出图片中所有的车辆:小轿车、小货车、大卡车、工程车辆等。而人从同样的高度是绝无可能看到地面上的车辆的,即便是后期的标注人员,在标注这批数据时,不但需要一天甚至数天的时间,还会由于重复的机械工作,出现大量的漏标、误标等操作失误。图中局部区域的放大效果恰恰说明了这一问题。
因而,现有的无人智能系统,在一些在单点技术上已达到人类水平、甚至已超过人类的水平。但是这不并是说其在所有方面都能和人的智能媲美了,譬如它虽然能够识别物体,却无法很好的理解场景、理解世界。比如,作为人类,上亿年的进化以及生而为人后的学习,能够轻易地分辨出上图是“万家灯火”的一片祥和,下图是“火光烛天”的一片狼藉。对机器而言,再多的温情脉脉,也只是二维世界里一串冰冷的数字符号。
那么,现有的无人智能系统,还需要哪些能力,才能慢慢的趋近人类的预期呢?
首先要有一双智慧的眼睛,当然目前也有大量的无人机是以通信的方式来执行任务,也就是说按照既定航线来执行任务,通过通信的方式来与控制台进行交互,以执行最终任务,然而这面临着两个问题,通信发生故障的情况下,是否还具备独立智能,以及,与既定航线偏离后如何调整的问题。因此,为无人系统加上智慧的眼睛,其目的是解决执行空域任务过程中的最后一公里问题,以及执行精细任务等问题。
此外,无人系统还需要具备哪些能力呢?
无人系统要具备自主学习能力,与世界的每一次交互,都能够自主记录、自主训练、并从中学习。智能体要从原始输入中自主学习,从环境中回馈信号。从而自主完成它与环境的每一次交互。而在无人系统中,让机器通过探索周围的环境自主学习要执行什么任务,可以实现更多智能化创造性的任务。这样我们才可能会培养出像大白那样出得厅堂、下得厨房、打得怪兽、上得战场的智能机器人。图中展示了Eva与瓦力看到电视里的舞蹈,随之翩翩起舞的过程,这展现的就是自主学习能力。
此外,无人系统还要具备理解与推演能力。左图是Eva与瓦力的初见,瓦力用一个灯泡来讨好Eva向Eva示好的过程,而右图则是瓦力打怪受伤后,Eva用同一个灯泡献宝地讨好瓦力的过程。这展现的是Eva对瓦力行为的理解、以及对其喜好的推演的能力。
具备以上能力之后,我们能有期待一个较高的单机智能,但是还不够,因为人是不能脱离群体存在的,办一家公司需要一个创始团队,而tedx要举办这样一场盛会,背后也有一个非常棒的团队,因此,无人系统之间还要具备协同交互的能力。
著名的兰切斯特方程揭示了一个道理,数量的增加会带来战斗力的指数型增强,随着执行任务的复杂性不断增加,单个无人系统体现出无法克服自身局限性、灵活性差、效率低等特点,因此多方面协同作业系统将是无人智能系统发展的主要趋势。
然而现在还不能做到,为什么呢?这涉及到了单点的技术无法融合, 不同摄像头采集到的数据甚至无法统一处理的问题,因此,还需要能够协调不同数据、算法、算力的统一的平台,来进行相应的处理协同。
当感知能力、理解与推演能力、自主学习能力、以及协同交互能力都发展到了一定水平之后,我们能够期待什么呢?集群智能。上图揭示了兰切斯特方程在无人机集群作战中的作用。
最后,回到我们最初的那份悸动,虽然今天是从两部电影进行切入,Tompson也只是电影中的一个虚拟人物,然而,或许就在此刻,世界上的某一个角落,就有相似的悲剧正在发生,更是曾经有无数的消防官兵、人民战士牺牲在各种危险任务之中,他们此刻只是我身后屏幕上的一列列沉默的名字、一排排冰冷的墓碑,然而,他们的身后承载着的却是他们所在的家庭的希望。此番英勇无畏值得用心铭记,而此般凄凉痛楚仅供岁月沉淀。
每当看到这份名单时,都会有一种使命感油然升起,我只希望,无人智能系统的开发能够快些、再快些,在还来得及的时候,为这些英雄们,为这些英雄所在的家庭,送上一份生命的礼物。
For them, to enjoy present as a present. Thank you!
该文章属于“深度学习大讲堂”原创,如需要转载,请联系 astaryst。
作者信息:
袁基睿,深度学习大讲堂常务副主编,中科视拓副总裁&联合创始人,芬兰坦佩雷工业大学博士。目前从事无人机视觉方向研究,带领团队与多家军口单位建立深度合作。研究领域涉及通用目标检测跟踪、地面目标搜索、基于视觉的空中编队、异构数据迁移等。
往期精彩回顾
欢迎关注我们!
深度学习大讲堂是由中科视拓运营的高质量原创内容平台,邀请学术界、工业界一线专家撰稿,致力于推送人工智能与深度学习最新技术、产品和活动信息!
中科视拓(SeetaTech)将秉持“开源开放共发展”的合作思路,为企业客户提供人脸识别、计算机视觉与机器学习领域“企业研究院式”的技术、人才和知识服务,帮助企业在人工智能时代获得可自主迭代和自我学习的人工智能研发和创新能力。
中科视拓目前正在招聘: 人脸识别算法研究员,深度学习算法工程师,GPU研发工程师, C++研发工程师,Python研发工程师,嵌入式视觉研发工程师,运营经理。有兴趣可以发邮件至:hr@seetatech.com,想了解更多可以访问,www.seetatech.com
中科视拓
深度学习大讲堂
点击阅读原文打开中科视拓官方网站