来自清华大学的韩旭博士论文,入选2022年度“CCF优秀博士学位论文奖”初评名单!

https://www.ccf.org.cn/Focus/2022-12-08/781244.shtml

知识图谱以结构化符号系统组织人类知识,是推动人工智能发展、支撑智能 服务应用的基础技术。相比于现实世界中的海量知识,已有知识图谱距离完善仍 有较大距离。开放域文本规模大、形式多、内容丰富,从开放域文本中自动获取结 构化知识,是扩充知识图谱的有效手段。本文面向开放域文本结构化知识获取中 “一少三多” 四大挑战,即标注数据少、长尾数据多、增量数据多、数据多源异构, 进行了四方面工作:

(1)面向远程监督的降噪学习,包括:基于内部信息的远程监督降噪,利用对 抗训练挖掘数据内部信息来过滤远程监督自动标注数据中的噪声样本;基于外部 信息的远程监督降噪,利用实体间关系的层次结构作为外部信息来从自动标注数 据中选择高质量样本;远程监督降噪的适用条件分析,系统评测各类远程监督降 噪算法,剖析各类降噪机制的适用条件。 (2)面向长尾关系的小样本学习,包括:小样本知识获取的框架构建,基于元 学习与度量学习构建针对知识获取的小样本学习框架;小样本知识获取的富信息 样本选择,基于混合注意力机制选择富信息样本来强化小样本学习能力;小样本 知识获取的知识迁移,基于预训练语言模型学习无标注数据来缓解样本不足。

(3)面向新增关系的持续学习,包括:知识获取的样本持续挖掘,基于神经雪 球系统持续挖掘开放域文本中适于训练知识获取模型的样本;知识获取的模型持 续学习,基于记忆再巩固进行开放域文本上实体间新关系的持续学习,规避灾难 性遗忘问题。

(4)多源异构数据的联合学习,包括:联合跨结构信息的知识获取,基于互注 意力进行非结构化文本与结构化知识图谱的跨结构联合;联合跨语言信息的知识 获取,基于对抗训练在统一语义空间中进行多语言文本的跨语言联合;联合文本 与规则的知识获取,基于预训练语言模型提示微调进行文本与逻辑规则的联合。

基于上述四方面工作,本文形成了开放域文本的结构化知识获取算法体系。围 绕该算法体系,本文也将从工程实现角度出发,介绍如何构建高效的知识应用系 统。上述算法与系统有利于进一步丰富知识图谱的知识规模,促进当前数据驱动 的深度学习善于刻画特征以及符号表示的结构化知识善于认知推理的双重优势结 合,对于揭示自然语言处理机理、实现智能语言理解具有重要意义。

成为VIP会员查看完整内容
46

相关内容

清华大学是中国乃至亚洲最著名的高等学府之一。其前身即1911年利用美国退还庚子赔款之退款在北京设立之清华学堂,1912年中华民国成立后改为清华学校,1928年北伐后由国民政府改制为国立清华大学。对日抗战期间西迁昆明,与北京大学、南开大学合组国立西南联合大学。1946年迁返北平复校。
基于强化学习的知识图谱综述
专知会员服务
195+阅读 · 2022年8月20日
【CMU博士论文】多视图上下文理解的知识增强表示学习
专知会员服务
34+阅读 · 2022年8月11日
【博士论文】开放环境下的度量学习研究
专知会员服务
46+阅读 · 2021年12月4日
【博士论文】视觉语言交互中的视觉推理研究
专知会员服务
61+阅读 · 2021年12月1日
专知会员服务
41+阅读 · 2021年6月6日
专知会员服务
55+阅读 · 2020年12月20日
【博士论文】开放环境下的度量学习研究
专知
7+阅读 · 2021年12月4日
【知识图谱】知识图谱怎么与深度学习结合?
产业智能官
159+阅读 · 2018年12月18日
徐阿衡 | 知识抽取-实体及关系抽取(一)
开放知识图谱
41+阅读 · 2018年9月18日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
18+阅读 · 2014年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
4+阅读 · 2011年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2010年12月31日
Arxiv
0+阅读 · 2023年2月15日
Arxiv
0+阅读 · 2023年2月14日
Arxiv
33+阅读 · 2021年12月31日
Arxiv
14+阅读 · 2020年9月1日
Arxiv
101+阅读 · 2020年3月4日
Arxiv
23+阅读 · 2018年8月3日
VIP会员
相关VIP内容
基于强化学习的知识图谱综述
专知会员服务
195+阅读 · 2022年8月20日
【CMU博士论文】多视图上下文理解的知识增强表示学习
专知会员服务
34+阅读 · 2022年8月11日
【博士论文】开放环境下的度量学习研究
专知会员服务
46+阅读 · 2021年12月4日
【博士论文】视觉语言交互中的视觉推理研究
专知会员服务
61+阅读 · 2021年12月1日
专知会员服务
41+阅读 · 2021年6月6日
专知会员服务
55+阅读 · 2020年12月20日
相关基金
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
18+阅读 · 2014年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
4+阅读 · 2011年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2010年12月31日
相关论文
Arxiv
0+阅读 · 2023年2月15日
Arxiv
0+阅读 · 2023年2月14日
Arxiv
33+阅读 · 2021年12月31日
Arxiv
14+阅读 · 2020年9月1日
Arxiv
101+阅读 · 2020年3月4日
Arxiv
23+阅读 · 2018年8月3日
微信扫码咨询专知VIP会员