对着售票机喊句话就能买到地铁票?这个在过去看来完全无法想象的事,在阿里的黑科技加持下已成现实。
13秒视频感受“语音售票机”
12月5日,语音购票、刷脸进站、智能客流监测等多项“黑科技”首度惊艳亮相上海。这三项技术是今年10月上海地铁牵手阿里云以来的最新阶段成果。目前,这些技术已经完成实验室测试,进入样机研制阶段,未来都将应用于上海地铁。
马老师亲自体验「动动嘴」买票乘地铁
下面阿里妹为大家逐一分析语音购票、刷脸进站、智能客流监测三项核心技术。
语音购票机
语音购票机
地铁语音售票机是由阿里巴巴、蚂蚁金服和申通地铁集团联合推出的新一代售票机。它能够让市民以免唤醒的自然人机交互方式,实现在地铁售票机上快速、便捷的购票操作,包括指定站名或票价购票、目的地模糊搜索购票等功能。即使是在地铁站十分嘈杂的环境下,仍能够实现远距离的语音交互,让人工智能落地到广大老百姓的日常交通生活中。
阿里巴巴iDST资深人工智能专家鄢志杰表示,“一般的智能语音交互产品,都是在家居弱噪声环境或者车载这种中等噪声环境中工作,但在公众场所强噪声嘈杂环境下,业界此前尚无可以达到大规模商用水平的远场语音交互整体解决方案。地铁语音售票机,是全球首个能在嘈杂的公共场所环境下,实现精准远距离语音交互的产品。”据悉,“下一代人机交互”技术正是阿里巴巴达摩院首批公布的重点研究方向之一。
现有的地铁售票机现存有哪些使用痛点?新的地铁语音售票机是如何解决的?
上海地铁语音售票机,主要解决了用户的两大购票痛点:
1、由于地铁线路网络复杂带来的购票步骤繁琐问题:以往需要乘客依次选择线路、站点、购票张数,现在只需直接对售票机说一句“我要买2张去陆家嘴的票”,即可用支付宝扫描售票机显示的二维码进行购票支付;
2、乘客往往只知道目的地却不知应坐到哪一站、如何换乘的问题:以往需要乘客事先明确知道离目的地最近的线路和站点,现在只需对售票机说“我要买2张去东方明珠的票”,系统会自动搜索到离东方明珠最近的地铁站陆家嘴站并显示换乘方案,乘客扫码即可购票,一步到位。
上海地铁语音售票机的语音交互系统使用了什么解决方案?
上海地铁语音售票机使用了阿里巴巴iDST的人机交互最新研究成果,即“多模态智能语音交互解决方案”,已申请多项国家专利。
这套多模态智能语音交互解决方案是由数个子系统组成的:
1、大麦克风阵列子系统:在硬件上通过数个麦克风组成大阵列,在软件上通过语音信号处理实现高精度声源定位和语音增强;
2、计算机视觉子系统:通过光学摄像头,实现人脸,特别是眼睛、嘴唇等的检测、跟踪和动态分析;
3、多模态融合子系统:通过语音+视觉融合,实现对目标用户的精确定位及语音提取;
4、远场语音识别、语义理解、对话及语音合成子系统:将目标用户经提取、增强后的语音进行识别、理解,产生对话结果,并通过语音合成将机器的反馈输出给用户。
这套解决方案有哪些技术亮点?
1、公众场所强噪声环境下的高准确率远场语音识别:当前主流的远场语音识别技术在家居、办公室等比较安静的环境下能够很好地工作,但在公众场所嘈杂环境下,业界此前尚无可以达到大规模商用水平的远场语音交互整体解决方案。
2、免唤醒主动语音交互:目前市场上主流远场语音交互产品,都需要通过“唤醒词+语音指令”的方式进行交互。上海地铁语音售票机通过“语音+视觉”多模态融合技术,能够自动检测乘客走近售票机的行为,主动发起交互。此外,通过这一技术还实现了免唤醒的语音交互体验,使人-机交互更接近人-人交互的自然和流畅。
3、支持复杂口语理解并自我进化的对话系统:用户面对机器表达时往往存在语气词、犹豫、停顿、重复等口语化表达,繁琐的多轮询问确认式对话也使得主流的人机交互略显呆板。上海地铁语音售票机能够理解这些口语化表达,并不断从乘客真实对话模式中进行自我进化,变得越来越智能。
这套解决方案在地铁这类有强噪声的公众场合下也能够正常使用,是如何做到的?克服了哪些主要技术难点?
阿里巴巴iDST在语音交互研究方向上,一直以来都非常重视强噪声、强干扰下的人机交互问题,在家居弱噪声环境和互联网汽车中等噪声环境下,均取得了一系列技术突破。
此次针对地铁强噪声环境,首次创新研发了基于深度学习的大型麦克风阵列技术,结合深度优化的声学结构和多模态融合技术,能够自动从强干扰背景语音中提取出目标说话人的语音,并实现增强,从而突破了嘈杂干扰环境下远场语音识别的世界性难题。并且,针对地铁售票机的时变空间,同时进行本地和云端的动态全链路模型匹配,实现端到端的自适应优化,保障每一次流畅的语音交互。
这套解决方案是阿里自主研发的吗?有哪些核心技术?
整套方案完全由阿里巴巴人工智能核心团队iDST自主研发。其中包含了iDST在语音增强、声源定位、人脸和图像识别、远场语音识别、语音合成、自然语言处理、对话管理、多模融合人机交互等方面的最新前沿研究成果。而这里的所有核心技术均为阿里巴巴独家/自有专利技术,并将逐步通过学术论文对外公开。
智能客流分析
智能客流分析
智能客流分析系统,能够有效帮助地铁工作人员,做好日常管理和突发情况处理。平时这套系统可以提前告诉地铁管理人员:地铁站内人有多少?挤不挤?哪里挤?这样就可以,提前采取引导和疏散的措施,优化用户的乘车体验。在突发情况下,比如一辆地铁发生故障中途停下来,智能客流分析系统能够帮助管理人员估算车上乘客有多少,影响相邻站点的乘客有多少,选择最佳的应急措施帮助乘客。
智能客流分析的能够解决什么样的问题?
站内分区域的客流监测与预警,主要为了乘车安全,在某区域发生拥挤时,实时发出警报,让站内工作人员对应;预警功能可以预测未来五分钟可能发生拥挤的区域,好让工作人员提前采取限流或疏导措施。
另外,当前地铁方的一个痛点是,突发故障情况下,不知道站内或车上的确切人数,在决策应急调度方案时,难以把握事件影响范围。智能客流分析,可以解决这一问题,实时提供站内及车内的乘客数量,可帮助估计各种应急方案的影响范围,做应急调度的决策支持。
各个站点的准确客流分析,也有利于优化列车运行计划与客流的匹配,优化列车运行图。
技术是如何实现的?
主要是用了视频人体识别技术,数据分析机器学习技术,以及阿里云的数据可视化的DataV技术。
难点在于:(1)如何在光线条件不稳定的情况下,用地铁现有的标清摄像头,做出高准确度的人体识别; (2)地铁站内许多摄像头,同一乘客会在多个摄像头中多次出现,如何去除这种重复,准确估计站内人数;(3)如何做准确的超短时客流预测。
计划什么时候投入应用?
技术上比较成熟,可以很快落地,具体时间表我们正在和有关部门积极沟通。
人脸识别过闸
人脸识别过闸
上海地铁人脸识别闸机系统,可对乘坐地铁乘客进行快速的自动识别认证,秒级通过。该系统使用了阿里人脸识别技术,基于大量人脸数据和机器学习算法实现,可实时快速的检测跟踪乘客人脸,完成乘客信息的识别,识别速度快准确率高。
采用哪些技术?技术上有什么亮点?
主要是阿里云的分布式计算、存储能力,以及人脸实时检测、跟踪及识别技术,后期也将加入非配合式活体检测技术,主要特点在于高并发、速度快、精度高、并能有效防止身份伪造攻击。
所采用的人脸识别算法具备业内领先的精度和效率,在国际公开的人脸比对评测LFW中,精度超过99.5%;在身份认证1:1比对场景,误识率0.1%条件下,实测精度大于99%;1:3000身份识别场景,现场实测识别率>95%。
人脸检测、定位在Intel I3以上PC可以实时实现,完成一次识别的时间小于200ms,峰值占用内存<400M。
你可能还喜欢
点击下方图片即可阅读
关注「阿里技术」
把握前沿技术脉搏