【MIT博士论文】从结构化文档到结构化知识, 150页pdf - 专知VIP

会员服务 ·

28

麻省理工学院 (MIT) · 博士论文 · 知识结构化 · 信息提取 ·

2023 年 8 月 10 日

【MIT博士论文】从结构化文档到结构化知识, 150页pdf

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

结构化文档，如科学文献和医疗记录，是知识的丰富资源。然而，大多数自然语言处理技术将这些文档视为纯文本，忽略了布局结构和视觉信号的重要性。为了全面理解这些文档，对这种结构的建模是至关重要的。本论文提出了从结构化文档中提取结构化知识的新算法。首先，我们提出GraphIE，一个信息提取框架，专门设计用来建模结构化文档中的非局部和非顺序依赖关系。GraphIE 通过图神经网络利用结构信息来增强单词级的标签预测。在三个提取任务的评估中，GraphIE始终超过仅基于纯文本运行的顺序模型。接下来，我们深入研究化学领域的信息提取。科学文献经常以信息图形的形式描述分子和反应。为了提取这些分子，我们开发了MolScribe，一个将分子图像转化为其图形结构的工具。MolScribe在图像到图形生成模型中整合了符号化学约束，显示出对处理各种绘图风格和习惯的稳健性能。为了提取反应方案，我们提出了RxnScribe，它通过序列生成公式解析反应图。尽管RxnScribe是在一个适度的数据集上进行训练的，但它在不同类型的图表上都表现出强劲的性能。最后，我们介绍TextReact，一种直接增强预测化学与文本检索的新方法，绕过了中间的信息提取步骤。我们在反应条件推荐和逆合成预测的实验中展示了TextReact在从文献中检索相关信息并泛化到新输入的有效性。

成为VIP会员查看完整内容

51

相关内容

麻省理工学院 (MIT)

麻省理工学院 (MIT)

麻省理工学院（Massachusetts Institute of Technology，MIT）是美国一所研究型私立大学，位于马萨诸塞州（麻省）的剑桥市。麻省理工学院的自然及工程科学在世界上享有极佳的盛誉，该校的工程系曾连续七届获得美国工科研究生课程冠军，其中以电子工程专业名气最响，紧跟其后的是机械工程。其管理学、经济学、哲学、政治学、语言学也同样优秀。

【CMU博士论文】面向大规模和长期神经图表示，135页pdf

【CMU博士论文】面向大规模和长期神经图表示，135页pdf

专知会员服务

24+阅读 · 2023年9月28日

【伯克利博士论文】多模态长视频理解，126页pdf

【伯克利博士论文】多模态长视频理解，126页pdf

专知会员服务

49+阅读 · 2023年9月3日

【CMU博士论文】超越模型效率:机器学习系统的数据优化，147页pdf

【CMU博士论文】超越模型效率:机器学习系统的数据优化，147页pdf

专知会员服务

53+阅读 · 2023年7月1日

【牛津大学博士论文】机器学习中的组合性和函数不变量，224页pdf

【牛津大学博士论文】机器学习中的组合性和函数不变量，224页pdf

专知会员服务

45+阅读 · 2023年3月25日

【DTU博士论文】面向自然语言处理的深度潜变量模型，232页pdf

【DTU博士论文】面向自然语言处理的深度潜变量模型，232页pdf

专知会员服务

21+阅读 · 2022年12月22日

【MIT博士论文】非参数因果推理的算法方法，424页pdf

【MIT博士论文】非参数因果推理的算法方法，424页pdf

专知会员服务

84+阅读 · 2022年9月20日

【MIT博士论文】分层概率多模态数据融合研究进展，289页pdf

【MIT博士论文】分层概率多模态数据融合研究进展，289页pdf

专知会员服务

76+阅读 · 2022年9月6日

【斯坦福博士论文】用于系统设计的图算法，130页pdf

【斯坦福博士论文】用于系统设计的图算法，130页pdf

专知会员服务

40+阅读 · 2022年8月22日

【伯克利博士论文】面向深度图像合成的机器学习，155页pdf

【伯克利博士论文】面向深度图像合成的机器学习，155页pdf

专知会员服务

36+阅读 · 2021年5月26日

太原理工最新《图神经网络:分类,进展,趋势》综述论文，50页pdf400篇文献

太原理工最新《图神经网络:分类,进展,趋势》综述论文，50页pdf400篇文献

专知会员服务

120+阅读 · 2020年12月19日

【哈佛大学博士论文】构建深度学习的理论基础:一种实证方法，164页pdf

【哈佛大学博士论文】构建深度学习的理论基础:一种实证方法，164页pdf

专知

9+阅读 · 2022年11月28日

【斯坦福大学博士论文】深度学习医学图像解译，205页pdf

【斯坦福大学博士论文】深度学习医学图像解译，205页pdf

专知

4+阅读 · 2022年11月18日

Transformers如何处理表格数据？【VLDB2022教程】Transformer表格数据表示:模型和应用，77页ppt

Transformers如何处理表格数据？【VLDB2022教程】Transformer表格数据表示:模型和应用，77页ppt

专知

3+阅读 · 2022年10月11日

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

专知

10+阅读 · 2022年10月6日

【MIT博士论文】非参数因果推理的算法方法，424页pdf

【MIT博士论文】非参数因果推理的算法方法，424页pdf

专知

4+阅读 · 2022年9月20日

【MIT博士论文】分层概率多模态数据融合研究进展，289页pdf

【MIT博士论文】分层概率多模态数据融合研究进展，289页pdf

专知

2+阅读 · 2022年9月6日

【MIT博士论文】异构医疗数据表示学习，193页pdf

【MIT博士论文】异构医疗数据表示学习，193页pdf

专知

2+阅读 · 2022年9月3日

【斯坦福博士论文】用于系统设计的图算法，130页pdf

【斯坦福博士论文】用于系统设计的图算法，130页pdf

专知

3+阅读 · 2022年8月22日

深度多模态表示学习综述论文，22页pdf

深度多模态表示学习综述论文，22页pdf

专知

33+阅读 · 2020年6月21日

【斯坦福CS520】向量空间中嵌入的知识图谱推理，48页ppt

【斯坦福CS520】向量空间中嵌入的知识图谱推理，48页ppt

专知

24+阅读 · 2020年6月11日

基于各向异性点光源的近场光度学三维重建问题研究

国家自然科学基金

2+阅读 · 2017年12月31日

高性能低比特视觉搜索及芯片结构研究

国家自然科学基金

1+阅读 · 2016年12月31日

图文混合跨媒体知识单元的模糊分类方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

推荐系统的信息核挖掘及其应用研究

国家自然科学基金

8+阅读 · 2015年12月31日

Stokes/Darcy 耦合问题的数值方法及预处理技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

特异材料电磁感应透明的动力学调控研究

国家自然科学基金

1+阅读 · 2015年12月31日

点云变形序列特征提取及可监测性评价研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于张量模式的DTI数据模式分类及其分布式算法研究

国家自然科学基金

2+阅读 · 2015年12月31日

混合分布模型中序性质和维修策略的一些研究

国家自然科学基金

0+阅读 · 2015年12月31日

高光谱遥感影像联合字典学习与分类研究

国家自然科学基金

0+阅读 · 2014年12月31日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

174+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

42+阅读 · 2023年4月19日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

106+阅读 · 2023年4月11日

A Survey on Graph Diffusion Models: Generative AI in Science for Molecule, Protein and Material

Arxiv

86+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

494+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

152+阅读 · 2023年3月29日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

63+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

81+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

179+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

51+阅读 · 2023年3月22日

VIP会员

相关主题

麻省理工学院 (MIT)

知识结构化

相关VIP内容

【CMU博士论文】面向大规模和长期神经图表示，135页pdf

【CMU博士论文】面向大规模和长期神经图表示，135页pdf

专知会员服务

24+阅读 · 2023年9月28日

【伯克利博士论文】多模态长视频理解，126页pdf

【伯克利博士论文】多模态长视频理解，126页pdf

专知会员服务

49+阅读 · 2023年9月3日

【CMU博士论文】超越模型效率:机器学习系统的数据优化，147页pdf

【CMU博士论文】超越模型效率:机器学习系统的数据优化，147页pdf

专知会员服务

53+阅读 · 2023年7月1日

【牛津大学博士论文】机器学习中的组合性和函数不变量，224页pdf

【牛津大学博士论文】机器学习中的组合性和函数不变量，224页pdf

专知会员服务

45+阅读 · 2023年3月25日

【DTU博士论文】面向自然语言处理的深度潜变量模型，232页pdf

【DTU博士论文】面向自然语言处理的深度潜变量模型，232页pdf

专知会员服务

21+阅读 · 2022年12月22日

【MIT博士论文】非参数因果推理的算法方法，424页pdf

【MIT博士论文】非参数因果推理的算法方法，424页pdf

专知会员服务

84+阅读 · 2022年9月20日

【MIT博士论文】分层概率多模态数据融合研究进展，289页pdf

【MIT博士论文】分层概率多模态数据融合研究进展，289页pdf

专知会员服务

76+阅读 · 2022年9月6日

【斯坦福博士论文】用于系统设计的图算法，130页pdf

【斯坦福博士论文】用于系统设计的图算法，130页pdf

专知会员服务

40+阅读 · 2022年8月22日

【伯克利博士论文】面向深度图像合成的机器学习，155页pdf

【伯克利博士论文】面向深度图像合成的机器学习，155页pdf

专知会员服务

36+阅读 · 2021年5月26日

太原理工最新《图神经网络:分类,进展,趋势》综述论文，50页pdf400篇文献

太原理工最新《图神经网络:分类,进展,趋势》综述论文，50页pdf400篇文献

专知会员服务

120+阅读 · 2020年12月19日

热门VIP内容

开通专知VIP会员享更多权益服务

《认知战的历史视角：从冷战心理战行动到AI驱动的信息战》最新报告

大语言模型智能体强化学习：全景综述

《英国智库：瓦解俄罗斯防空系统生产，夺回制空权》最新报告

【伯克利博士论文】从推理服务到训练：面向大规模 LLM 智能体的高效系统

相关资讯

【哈佛大学博士论文】构建深度学习的理论基础:一种实证方法，164页pdf

【哈佛大学博士论文】构建深度学习的理论基础:一种实证方法，164页pdf

专知

9+阅读 · 2022年11月28日

【斯坦福大学博士论文】深度学习医学图像解译，205页pdf

【斯坦福大学博士论文】深度学习医学图像解译，205页pdf

专知

4+阅读 · 2022年11月18日

Transformers如何处理表格数据？【VLDB2022教程】Transformer表格数据表示:模型和应用，77页ppt

Transformers如何处理表格数据？【VLDB2022教程】Transformer表格数据表示:模型和应用，77页ppt

专知

3+阅读 · 2022年10月11日

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

专知

10+阅读 · 2022年10月6日

【MIT博士论文】非参数因果推理的算法方法，424页pdf

【MIT博士论文】非参数因果推理的算法方法，424页pdf

专知

4+阅读 · 2022年9月20日

【MIT博士论文】分层概率多模态数据融合研究进展，289页pdf

【MIT博士论文】分层概率多模态数据融合研究进展，289页pdf

专知

2+阅读 · 2022年9月6日

【MIT博士论文】异构医疗数据表示学习，193页pdf

【MIT博士论文】异构医疗数据表示学习，193页pdf

专知

2+阅读 · 2022年9月3日

【斯坦福博士论文】用于系统设计的图算法，130页pdf

【斯坦福博士论文】用于系统设计的图算法，130页pdf

专知

3+阅读 · 2022年8月22日

深度多模态表示学习综述论文，22页pdf

深度多模态表示学习综述论文，22页pdf

专知

33+阅读 · 2020年6月21日

【斯坦福CS520】向量空间中嵌入的知识图谱推理，48页ppt

【斯坦福CS520】向量空间中嵌入的知识图谱推理，48页ppt

专知

24+阅读 · 2020年6月11日

相关基金

基于各向异性点光源的近场光度学三维重建问题研究

国家自然科学基金

2+阅读 · 2017年12月31日

高性能低比特视觉搜索及芯片结构研究

国家自然科学基金

1+阅读 · 2016年12月31日

图文混合跨媒体知识单元的模糊分类方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

推荐系统的信息核挖掘及其应用研究

国家自然科学基金

8+阅读 · 2015年12月31日

Stokes/Darcy 耦合问题的数值方法及预处理技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

特异材料电磁感应透明的动力学调控研究

国家自然科学基金

1+阅读 · 2015年12月31日

点云变形序列特征提取及可监测性评价研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于张量模式的DTI数据模式分类及其分布式算法研究

国家自然科学基金

2+阅读 · 2015年12月31日

混合分布模型中序性质和维修策略的一些研究

国家自然科学基金

0+阅读 · 2015年12月31日

高光谱遥感影像联合字典学习与分类研究

国家自然科学基金

0+阅读 · 2014年12月31日

相关论文

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

174+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

42+阅读 · 2023年4月19日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

106+阅读 · 2023年4月11日

A Survey on Graph Diffusion Models: Generative AI in Science for Molecule, Protein and Material

Arxiv

86+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

494+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

152+阅读 · 2023年3月29日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

63+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

81+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

179+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

51+阅读 · 2023年3月22日

微信扫码咨询专知VIP会员