报告主题: 信息抽取前沿动态
报告摘要: 信息抽取是从自然语言文本中抽取指定类型的实体、关系、事件等事实信息,并形成结构化数据输出的文本处理技术。本次报告从特征多元化、语料构建(半)自动化、任务联合学习等方面分析了当前信息提取的任务难点,并提出解决方案。
邀请嘉宾: 陈玉博,博士,中科院自动化所模式识别国家重点实验室助理研究员,研究方向为信息抽取、知识图谱和自然语言处理。在ACL、EMNLP、COLING、CIKM、WWW、AAAI等国际重要会议和期刊发表学术论文20余篇,曾获得NLP-NABD 2016最佳论文奖、CCKS 2017最佳论文奖。主持或参与国家自然科学基金青年基金项目、国家自然科学基金重点项目以及多项企业合作科研项目的研发,合作企业包括:华为、蚂蚁金服、腾讯、云知声等,同时也开发了事件抽取、关系抽取、实体识别和消歧等多项工具和软件。目前为中国中文信息学会青年工作委员会委员、中国中文信息学会语言与知识计算专委会委员。2018年获得中国中文信息学会“钱伟长中文信息处理科学技术奖”一等奖。