声明:本文转载自公众号 科大讯飞
人和机器如何交流?怎样能让机器听懂人说话、理解其中的语义?这一切都离不开自然语言处理——NLP技术。
EMNLP大会是NLP领域顶级国际会议,2018年度EMNLP大会将于10月31日-11月4日在比利时布鲁塞尔举办。
为了展示NLP领域最新的研究成果、同时给参会选手更好的“热身”,在该领域深耕十几年的科大讯飞于9月15日举行了“自然语言处理前沿技术研讨暨EMNLP2018论文预讲会”。哈工大社会计算与信息检索研究中心有三名师生参会,其中,车万翔教授在会上致辞,耿昕伟、郑博两位博士生分别做了报告。
大会由中国中文信息学会青年工作委员会主办,科大讯飞人工智能研究院和讯飞AI大学承办,邀请了哈尔滨工业大学车万翔教授、科大讯飞研究院胡国平院长及23名论文被EMNLP2018录用的研究者,200余名听众共同出席,探讨NLP等领域的新发展新技术。科大讯飞AI研究院副院长陈志刚主持了会议,他向在场的嘉宾和听众介绍了科大讯飞的发展,以及此次论文预讲会的流程。
陈志刚主持会议
开拓·全新领域 全面赋能
谈起科大讯飞在NLP领域的发展和突破,自然离不开“讯飞超脑计划”。科大讯飞研究院胡国平院长在开幕式致辞中介绍,从2014年提出“讯飞超脑计划”,讯飞就已明确启动了认知智能的研究,让机器不仅能听会说、还要能理解会思考。同时和哈工大组建了联合实验室,重点处理和人类语言相关的方面的技术,重点开展面向认知计算的深度学习共性技术、知识自动构建与推理技术等认知智能基础理论的研究。
中国中文信息学会青年工作委员会副主任、哈尔滨工业大学车万翔教授在致辞中强调了NLP领域研究中人才的重要性,他介绍了中国中文信息学会青年工作委员会(以下简称青工委)的组织架构和主要工作,并代表青工委欢迎全国各高校及企业青年学者加入:“青工委目前有130位正式委员,均来自于国内中文信息处理领域知名研究机构,是近年来活跃在本领域的优秀青年学者。”
车万翔致辞
“一个是语义理解,怎么样理解人类的语言?第二是知识表示,怎么表示行业知识和通用知识?第三是逻辑推理,包括对知识的运用。”胡国平说,当世界上所有机器都可以具备高质量的认知智能时,就可以在更多领域和场景下帮助人类,创造出更大价值,通过不断“赋能”去建设更美好的世界。
胡国平致辞
分享·前沿研究 启发思考
看到新闻报道中的“英勇就义”,你会产生怎样的理解和情感?机器又如何理解多样化的情感词?在研讨会上,研究者们分享了NLP领域的最新研究成果。
比如上述问题就涉及关于相关情绪的排序研究。“一个关于英勇就义的新闻文本可能触发不同用户的多种情绪,可能是感动或者悲伤,这种多义性存在,可以看成看成一个多标记的问题去进行解决,在此基础上引入情绪强度的差别。”由此,研究者提出用可解释的神经网络去解决相关情绪排序的问题。
据悉,此次研讨会入选的论文,研究内容覆盖了机器翻译、知识图谱、文本分类、问答、句法分析、词性标注、命名体识别等多个领域。每一位作者对自己论文的工作都清晰地阐述自己的工作动机和面对问题提出的解决方法,并且给出了充足而有效的实验证明。值得一提的是,很多论文在监督语料有限的情况下,在自己的任务中使用到了迁移学习、对抗学习和多任务学习,来提升模型的鲁棒性和效果,给听众带来很多启发和思考。
交流环节中,演讲者也热情地与听众交流互动,答疑解难。此外,每一篇论文都有对应的海报展示,听众可以和讲者在线下进行更充分的交流。
研讨会现场的分享与交流
展望·技术领航 应用驱动
让机器能处理自然语言,实现能听会说、能理解会思考,科大讯飞多年来在语音与人工智能核心技术研究和产业化方面都做出了突出成绩,在历次国内外语音合成评测,国际说话人、语种识别评测大赛,国际语音识别大赛以及计算机图像识别等比赛中,屡次拔得头筹。
嘉宾参观科大讯飞人工智能演示厅
业界专家也一致认为:真正代表未来人工智能的全球领导者,一定是最先突破了自然语言理解的机构和公司,这样的公司是最权威的。科大讯飞从2017年7月至今,已三次刷新国际权威赛事SQuAD的全球记录,并且让机器在给定文稿、阅读后答题的准确率高出一般人;在2018图文识别挑战赛ICPR MTWI中,更是包揽三项冠军。
而包括自然语言理解在内的认知智能被誉为人工智能发展的“高阶”。人工智能的发展,第一阶段是机器运算智能,让机器具备存储运算的能力;第二阶段是感知智能,也就是机器能听会说,能看会认,例如在这次会议中使用的“讯飞听见”技术,同步把语音转化成文字,这其中就已经具备一部分的自然语言理解;第三个阶段就是认知智能,让机器具备能理解会思考的能力,具备推理学习相关逻辑和知识的综合表达能力,这是人工智能的下一个阶段。而科大讯飞目前不仅在涉及自然语言理解的技术方面占据优势,且于2017年获批承建我国在认知智能领域的第一个国家级重点实验室。
更值得关注的是,科大讯飞在认知智能方面的成就也已广泛应用于医疗、司法、教育等行业。例如在医疗领域,科大讯飞和清华大学联合实验室出品的“智医助理”机器人,成为首个通过国家执业医师资格考试综合笔试评测的机器人,超过96.3%的人类考生,目前“智医助理”人工智能辅助诊疗系统已经能帮助医生辅助诊断300多种常见病。
面向未来,NLP技术还将广泛应用于金融、保险、IT、电信、国防、传媒、广告等各个领域,可以用于分析源自邮件、音频、文件、网页、论坛、社交媒体中的大量数据,发展前景广阔。
科大讯飞愿和学术界、产业界的更多伙伴一起,用NLP技术架起人类语言和机器语言之间的一道桥梁,在未来将驱动更多业务场景带来更大的实际价值。
本期责任编辑:赵森栋
本期编辑:蔡碧波
“哈工大SCIR”公众号
主编:车万翔
副主编: 张伟男,丁效
责任编辑: 张伟男,丁效,赵森栋,刘一佳
编辑: 李家琦,吴洋,刘元兴,蔡碧波,孙卓,赖勇魁
长按下图并点击 “识别图中二维码”,即可关注哈尔滨工业大学社会计算与信息检索研究中心微信公共号:”哈工大SCIR” 。