北京时间12月14日(周四)晚8点,在将门技术社群,我们很开心邀请到(惦记已久的)中国科学院自动化研究所·模式识别国家重点实验室副研究员——刘康博士,他将带来“开放域环境下文本事件抽取”的主题分享。他将会结合自己的工作探讨如何根据任务的热点,自动进行数据的标注,并训练有效的信息抽取模型等问题。
活动信息
▼
主题:开放域环境下文本事件抽取
时间:12月14日(周四)20:00
地点:将门创投斗鱼直播间
分享提纲
▼
面对于开放域环境,即使实在特定一个垂直领域中,我们需要对于多种类型的信息进行抽取。然而,传统基于统计学习的信息抽取模型往往需要丰富标注数据用以训练,也需要各种专家知识进行特征的学习和抽取,这极大的限制了已有方法的可扩展性,产生了“有多少人工就有多少智能”的幻觉。如何根据任务的热点,自动进行数据的标注,并训练有效的信息抽取模型,是我们的目标之一,本次分享将结合我们自己的工作针对这一问题进行探讨。
知识图谱是人工智能和核心基础设施之一,现有知识图谱多关注于以实体为核心的静态知识,缺乏对于以事件为核心的动态知识的刻画和构建。本次分享将结合研究组近些年的工作——
主要介绍从非结构化文本中抽取事件知识的基本方法;
特别介绍在开放域环境下,面对多种事件类型,在缺乏标注数据的前提下,如何自动进行数据标注,训练鲁棒的事件抽取器的有效方法;
同时介绍我们在实践过程中的经验和体会。
嘉宾介绍
▼
如此粉红的...
刘 康
中科院自动所模式识别国家重点实验室副研究员
刘康博士的研究领域包括信息抽取、网络挖掘、问答系统等,同时也涉及模式识别与机器学习方面的基础研究。在自然语言处理、知识工程等领域国际重要会议和期刊发表论文六十余篇(如TKDE、ACL、IJCAI、EMNLP、COLING、CIKM等)。
曾获得KDD CUP 2011 Track2 全球亚军,COLING 2014最佳论文奖,首届“CCF-腾讯犀牛鸟基金卓越奖”、2014年度中国中文信息学会“钱伟长中文信息处理科学技术奖-汉王青年创新一等奖”、2015&2017 GoogleFocused Research Award等。
转自:将门创投
报名方式请点击“阅读原文”