在1968年上映的科幻电影《2001:太空漫游》中,宇宙飞船的智能控制系统HAL-9000与宇航员能进行很智能的对话,当年这一幻想如今已成为现实。
其实早在“人工智能”一词出现之前,就有人试图制造能听会说的机器,这背后的追求就是今天我们所熟知的智能语音。
然而历史上一项技术的发展往往都是屡遭曲折的,语音技术也不除外。
语音技术的起源可以追溯到爱迪生发明留声机和贝尔发明电话。从这一时刻起,语音正式成为了一种可以被人为制造并物有效存储、传输的信号。
19世纪60年代声源-滤波器模型被提出,而在此后的几十年中,语音研究的基本概念没有突破。
这时不少美国学者认为实现语音识别恐怕要比登月还难,随后1969年随着阿波罗11号的登月,语音难于上终于成为了事实,语音识别与合成研究也遭遇了长时间的低谷。
随着计算机技术与人工智能技术的兴起,智能语音技术在20世纪80年代后成为热点,这个时候语音研究的最大突破,来自于李开复的导师、卡内基梅隆大学教授Raj Reddy用专家系统的方式做语音识别系统。
1988年,在导师Raj Reddy的支持下,李开复用统计方法来解决语音识别的难题并在博士论文中提出了世界上第一个“非特定人连续语音识别系统”,这一成果使得统计学方法在语音识别领域展露头角并逐渐代替之前的模型,同时它也推动了隐马尔可夫模型(HMM)在语音识别领域的进一步研究。
神经网络在1980年代中期到1990年代的二次复兴,使得研究者们开始探索将神经网络运用于语音识别研究之中。
但早期的神经网络的识别结果并不比GMM-HMM好,在很多人都放弃的时候,邓力却看好神经网络,2010年左右,邓力和俞栋将前馈神经网络引入到声学模型建模中并取得了很好的效果。
2010年10月,俞栋分享了使用深度神经网络和senones建模的相关研究的成果。这一技术之后在2012被微软在一次会议上当场演示英文语音识别之后合成中文语音——整场演示非常成功,引起了产业界的轰动,也揭开了语音产业应用的新一页。
2010年,百度加入语音江湖,并于当年10月在掌上百度上推出语音搜索。
2010年前后,AI初创公司思必驰、云之声和出门问问等加入语音产业。
2014年之后,阿里、京东、腾讯等巨头成为新一波语音产业的助推者,相继从智能音箱、智能手表、车载语音设备等领域切入智能语音市场,自此智能语音时代蓝海已来。
其实,智能语音到来的背后是以深度学习为代表的整个AI蓝海时代的到来。人们这几年见证了层出不穷的模型、被刷爆的各大榜单,然而人们同时也见证了理性市场下AI落地之难。
以智能音箱为例,它在始推出之际确实很受人欢迎,但是这两年人们渐渐恢复理智,早已不是当年被AlphaGo震撼和痴迷的模样。于此同时,市面上的智能音箱却没有给人更多的惊喜。智能音箱同质化严重,人们很难区分各个音箱有何差别,也很难识别音箱的“智能”程度有几分;往往一时心动买来的音箱在满足几天好奇心之后只能作为“音箱”来听歌,甚至几个月后被人遗忘在角落。
正如吴恩达所言:AI是新的电力(AI is the new electricity)。作为推动未来世界生产力的基础设施,只有将其置于各种具体场景中,才能发挥最大化的价值。
AI落地难,除了AI技术水平本身的限制外,更多的还是在于具体场景的结合上需要更多的试错,以及如何弥补于大众认识间的误差。打个比方,现在AI的落地正如一百多年前的前汽车时代,当亨利·福特想要造出更好的车,而大众想要的却是“一匹更快的马”。
AI落地不难,今年上半年,一场疫情突如袭来。在疫情之中,无接触服务被迫切需要,智能语音也因此诞生了不少创新应用。如全程实现无接触、无障碍的智能语音电梯,人们通过语音操作就可以方便快捷地操作电梯完成“上行下行”、“到达指定楼层”等全部乘梯操作,有效减少了交叉感染,间接遏制了疫情蔓延。
当然,要让AI、智能语音走入更多的场景,我们要做的还更多。
语音说到底是一种交互方式,就像键盘、鼠标、和触摸屏,语音正在成为下一代人机交互的方式。
智能语音技术是人工智能产业链上的关键一环,是AI落地的一个重要场景。
智能家居是AI落地的完美场景,而语音交互技术则是智能家居应用中的刚需,同时智能音箱又是语音交互技术的载体。
那么我们该
如何提高智能音箱的智能化和人性化,如何让语音技术点亮智能家居 ,让智能家居助力美好生活 ,让美好生活和每个人息息相关?
我们在畅想智能家居的同时又该如何更好地用技术实现智慧教育、智慧交通、智慧医疗、智慧社区,让AI落地遍及方方面面?
这一切都可以在今年CCF-GIAR前沿语音技术专场上找到答案。
作为国内最早关注AI 技术变革与发展的媒体之一,雷锋网致力于对 AI 对整个社会发展各个行业和领域所产生影响的关注和报道,这其中自然包括 AI 在前沿语音技术方面的进展。
2020 年,在中国计算机学会(CCF)的主办之下,雷锋网联合香港中文大学(深圳),将在承办全球人工智能与机器人峰会 (CCF-GAIR) ;本次大会将以 “AI 新基建,产业新未来" 为主题,探讨 AI 的学术基础研究和产业落地。
其中,基于当前人工智能在语音技术领域发展的最新态势,我们特意开设了前沿语音技术专场。
这是 CCF-GAIR 举办五年以来第一次开设前沿语音技术专场,也将是语音技术最前沿的完美亮相。
在本专场中我们将会了解到语音技术如何和自然语言处理、知识图谱等技术结合起来实现多模态的场景智能。
已经有多位学者和专家确认出席本次 CCF-GAIR 大会的前沿语音技术专场。
邹月娴 北京大学教授,深圳市人工智能学会副理事长
张雯 西北工业大学智能声学与临境通信研究中心教授
宋辉 滴滴AI Labs高级专家研究员,语音研究实验室负责人
李明 昆山杜克大学电子与计算机工程副教授
凌震华 中国科学技术大学电子工程与信息科学系副教授
俞凯 上海交通大学计算机系教授,思必驰公司创始人,首席科学家
雷锋网按:由中国计算机学会(CCF)主办、雷锋网和香港科技大学(深圳)承办的 2020 全球人工智能与机器人峰会(简称 CCF-GAIR 2020),将于 2020 年 8 月 7 日至 9 日在深圳举行。
自 2016 年创办以来,CCF-GAIR 已先后邀请到诺贝尔奖得主、图灵奖得主,20 余位中美英法加等国院士、百余位 IEEE / ACM / IAPR Fellow、数百位在各自专业领域享有盛誉的学者以及 AI 领域的知名企业家、投资者和创新者共襄大会,做主题报告、主题演讲以及精彩圆桌分享,成为目前本土人工智能领域规格最高、影响力最大的峰会。
与往年的大拿云集一样,今年 CCF-GAIR 大会的嘉宾阵容同样也是强大无比,备受关注和期待。
目前,CCF-GAIR 峰会门票限量1000张,您可以选择购买VIP门票(¥3999),或者购买早鸟票(¥699),如果您是CCF会员,还能享受七折优惠。
AI研习社为广大学术青年谋得福利专属学生优惠票,为了鼓励更多高校学生参与此次盛会,AI 研习社承诺,只要成功注册,并且在AI研习社认证为“在校学生”即可获得免费门票!
还等什么,你心动了吗,戳“阅读原文”赶紧申请(手慢无)或者扫描下方二维码完成申请吧!