教程题目:Discourse Analysis and Its Applications
教程简介:
话语处理是从文本中提取多种不同级别的语言学结构的一系列NLP任务,用于从多个层次的文本中发现语言结构,支持多种文本挖掘应用。它包括在一组对话内容中识别话题结构、识别一致性结构、识别互关联结构以及识别对话结构。总之,这些结构可以用于文本总结、文章评分、情感分析、机器翻译、信息提取、问题回答和线索重建。
本教程首先介绍论述分析中的基本概念:单向文本&对话,同步&非同步对话,以及论述分析中的关键语言学结构。然后将会将会介绍传统的机器学习方法以及一些最新的基于深度学习的方法,并且在评测数据上比较它们的表现。对于提及的每种话语结构,讲座中都会介绍它在下游的文本挖掘任务中的使用,也会详细介绍评价它们的方式和指标。最后还会讨论这个领域未来的挑战以及发展机遇。
组织者:
Shafiq Joty是新加坡南洋理工大学(NTU)助理教授,新加坡Salesforce AI研究部高级经理,研究兴趣是自然语言处理:话语处理、机器翻译、图像文字翻译、问题回答、文字摘要、情绪分析;机器学习、概率图形模型、深度学习、强化学习、表征学习。
Giuseppe Carenini是不列颠哥伦比亚大学计算机科学系教授、数据科学硕士联合主任。研究兴趣是人工智能:用户建模、决策理论、机器学习;计算语言学 :自然语言生成、论证、多媒体;HCI:智能接口、信息可视化和交互技术。
Raymond Ng是不列颠哥伦比亚大学的计算机科学教授,数据科学研究所的所长。研究领域是数据挖掘,文本挖掘,健康信息学,传感器分析和数据库。
Gabriel Murray是UFV计算机信息系统副教授,UBC计算机科学系副教授,爱丁堡大学博士学位和理学硕士。研究兴趣为语音与自然语言处理、计算语言学、多模态交互、情感分析,人工智能,机器学习,信念网络,马尔可夫决策过程,马尔可夫奖励过程,数据质量,数据挖掘,统计过程控制。