剑桥AI公司:7天精通一门新语言,未来将学会7000种语言

2017 年 11 月 16 日 新智元


新智元 AI World2017世界人工智能大会开场视频


中国人工智能资讯智库社交主平台新智元主办的 AI WORLD 2017 世界人工智能大会11月8日在北京国家会议中心举行,大会以“AI 新万象,中国智能+”为主题,上百位AI领袖作了覆盖技术、学术和产业最前沿的报告和讨论,2000多名业内人士参会。新智元创始人兼CEO杨静在会上发布全球首个AI专家互动资讯平台“新智元V享圈”。


全程回顾新智元AI World 2017世界人工智能大会盛况:


新华网图文回顾:http://www.xinhuanet.com/money/jrzb20171108/index.htm

爱奇艺(上):http://www.iqiyi.com/v_19rrdp002w.html

爱奇艺(下):http://www.iqiyi.com/v_19rrdozo4c.html

阿里云云栖社区: https://yq.aliyun.com/webinar/play/316?spm=5176.8067841.wnnow.14.ZrBcrm

  新智元编译  

来源:Cambridge Independent 

编译:Cecilia

【新智元导读】剑桥AI公司Speechmatics使用机器学习技术Automatic Linguist,可在一天内学会一门语言的基础,一周内掌握一门新语言。该公司希望有朝一日能够掌握世界上的所有语言。



11月11日,剑桥AI公司Speechmatics正式上线其机器学习平台Automatic Linguist,能在一周内掌握一门新语言。该平台沿用剑桥大学研发的技术,能够识别并应用语言中的不同模式。目前,该平台能够识别28种语言,实现从语音到文字的准确转录。


图示: Speechmatics将28种语言逐渐加入其系统中。


一个大公司客户要求Speechmatics两周内学会印地语,该公司发布了一个系统,根据测试,该系统比市场领先者的错误率少23%。

 

Speechmatics首席执行官Benedikt von Thüngen在接受Cambridge Independent采访时表示,“印地语非常简单。我们发现它在发音方面与英语非常相似,所以我们可以使用一个叫做‘适应’的过程。它从我们拥有的不同数据集中学习。”

 

“每种语言都有各自有趣的地方。韩语、土耳其语、芬兰语、德语等语言都是粘着构词,词语结合起来构成新的词汇。这是一个有待解决的有趣问题。”

 

“越南语、汉语等变调语言,也是一个很有意思的挑战。要教会系统去处理这些语言。”

 

Speechmatics首席执行官Benedikt von Thüngen。


语言识别的传统路径要经过繁琐、昂贵的人工过程,专家要手动收集、清理海量数据。这是一个一次性系统,因此只关注使用最广泛的几种语言才算经济实用。

 

但是经过剑桥大学博士、Speechmatics首席技术官Tony Robinson数十年对神经网络的研究,Speechmatics可以通过识别基本声音和语法结构,在一天之内掌握一门语言的基础。


剑桥大学博士、Speechmatics首席技术官Tony Robinson。

 

该软件的主要用途之一是为电视提供准确、实时的字幕,并增加了专业个性化词典,如足球员姓名。

 

Benedikt说金融机构能够使用这一技术进行通话录音,以证明合规性和对PPI不当销售进行审查。他预言:“语音将成为与设备互动的主要机制。”

 

该公司白皮书提到,“我们的终极目标是为所有语言提供一个语言包。鉴于世界上约有7000种语言,这将是一个雄心勃勃的目标,我们希望有朝一日能够全部掌握这些语言。”

 

原文地址:http://www.cambridgeindependent.co.uk/education/technology-2-25341/cambridge-ai-company-speechmatics-can-learn-a-new-language-in-a-week-1-5275810



登录查看更多
2

相关内容

ACM用户界面软件与技术研讨会(UIST)是人机界面创新的首要论坛。UIST由ACM计算机-人交互(SIGCHI)和计算机图形(SIGGRAPH)特别兴趣小组赞助,汇集了来自不同领域的人员,包括图形和web用户界面、有形和无处不在的计算、虚拟和增强现实、多媒体、新的输入和输出设备以及CSCW。密切的规模和密集的项目使研究所成为交流研究成果和想法的理想机会。官网链接:https://uist.acm.org/uist2019/
【干货书】R语言书: 编程和统计的第一课程,
专知会员服务
107+阅读 · 2020年5月9日
【干货书】真实机器学习,264页pdf,Real-World Machine Learning
【干货书】流畅Python,766页pdf,中英文版
专知会员服务
223+阅读 · 2020年3月22日
【新书】Pro 机器学习算法Python实现,379页pdf
专知会员服务
197+阅读 · 2020年2月11日
【强化学习】深度强化学习初学者指南
专知会员服务
178+阅读 · 2019年12月14日
2019语言与智能技术竞赛报名开启
中国计算机学会
16+阅读 · 2019年2月26日
Python3爬虫之入门和正则表达式
全球人工智能
7+阅读 · 2017年10月9日
VrR-VG: Refocusing Visually-Relevant Relationships
Arxiv
6+阅读 · 2019年8月26日
Arxiv
5+阅读 · 2018年10月23日
Mobile big data analysis with machine learning
Arxiv
6+阅读 · 2018年8月2日
VIP会员
Top
微信扫码咨询专知VIP会员