事件抽取的再评价:过去、现在和未来的挑战 - 专知VIP

会员服务 ·

13

事件抽取 ·

2023 年 11 月 28 日

事件抽取的再评价:过去、现在和未来的挑战

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

近年来，事件提取由于其在许多应用中的潜力而受到了广泛关注。然而，近期研究发现一些评估挑战，表明报告的分数可能无法反映真实性能。在这项工作中，我们首先识别并讨论这些评估挑战，包括由于关于数据的不同假设或不同数据预处理步骤而导致的不公平比较，当前评估框架的不完整性导致的潜在数据集偏差或数据切分偏差，以及先前研究的低可复现性。为了应对这些挑战，我们提出了TEXTEE，一个标准化、公平且可复现的事件提取基准。TEXTEE包含了针对不同领域十多个数据集的标准化数据预处理脚本和切分。此外，我们汇总并重新实现了近年来发表的十多种事件提取方法，并进行了全面的重新评估。最后，我们探讨了大型语言模型在事件提取中的能力，并讨论了一些未来的挑战。我们期望TEXTEE将作为事件提取领域的一个可靠基准，促进该领域的未来研究。

成为VIP会员查看完整内容

25

相关内容

《大型语言模型归因》综述

《大型语言模型归因》综述

专知会员服务

75+阅读 · 2023年11月8日

【ICML2023】面向决策Transformer的未来条件无监督预训练

【ICML2023】面向决策Transformer的未来条件无监督预训练

专知会员服务

44+阅读 · 2023年5月30日

【AAAI2022】通过自训练加强反事实分类

【AAAI2022】通过自训练加强反事实分类

专知会员服务

25+阅读 · 2021年12月10日

【ICML2021】数据表示的几何评估

专知会员服务

38+阅读 · 2021年6月3日

【ICML2020】持续终身学习的神经主题建模

【ICML2020】持续终身学习的神经主题建模

专知会员服务

39+阅读 · 2020年6月22日

【CVPR2023】探索和利用不确定性的不完整多视角分类

【CVPR2023】探索和利用不确定性的不完整多视角分类

专知

42+阅读 · 2023年4月13日

时空数据挖掘:综述

时空数据挖掘:综述

专知

34+阅读 · 2022年6月30日

【AI与军事】机器学习的军事应用，一种文献计量视角

【AI与军事】机器学习的军事应用，一种文献计量视角

专知

53+阅读 · 2022年4月25日

【MIT】硬负样本的对比学习

【MIT】硬负样本的对比学习

专知

13+阅读 · 2020年10月15日

【Amazon】使用预训练Transformer模型进行数据增强

【Amazon】使用预训练Transformer模型进行数据增强

专知

12+阅读 · 2020年3月6日

不完全信息下的投资组合选择模型研究：一个时间一致性的视角

国家自然科学基金

5+阅读 · 2015年12月31日

模糊情况下的最优消费与投资

国家自然科学基金

3+阅读 · 2015年12月31日

反问题的数学建模、计算及应用

国家自然科学基金

4+阅读 · 2015年12月31日

高维数据下的模型平均方法

国家自然科学基金

6+阅读 · 2014年12月31日

复杂多元数据的半参数统计推断

国家自然科学基金

5+阅读 · 2014年12月31日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

174+阅读 · 2023年4月20日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

495+阅读 · 2023年3月31日

Nature Language Reasoning, A Survey

Arxiv

81+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

180+阅读 · 2023年3月24日

Data-centric Artificial Intelligence: A Survey

Arxiv

25+阅读 · 2023年3月17日

VIP会员

相关主题

相关VIP内容

《大型语言模型归因》综述

《大型语言模型归因》综述

专知会员服务

75+阅读 · 2023年11月8日

【ICML2023】面向决策Transformer的未来条件无监督预训练

【ICML2023】面向决策Transformer的未来条件无监督预训练

专知会员服务

44+阅读 · 2023年5月30日

【AAAI2022】通过自训练加强反事实分类

【AAAI2022】通过自训练加强反事实分类

专知会员服务

25+阅读 · 2021年12月10日

【ICML2021】数据表示的几何评估

专知会员服务

38+阅读 · 2021年6月3日

【ICML2020】持续终身学习的神经主题建模

【ICML2020】持续终身学习的神经主题建模

专知会员服务

39+阅读 · 2020年6月22日

热门VIP内容

开通专知VIP会员享更多权益服务

《无人机系统 - 反无人机系统：测试方法》364页

《无人机蜂群攻击防御的预测建模：面向美军战备的人工智能轨迹预测与最优拦截策略设计》最新报告

美军低成本无人作战攻击系统（LUCAS）：扩大无人机战争规模

《将空中力量带向海洋：美国海军航空发展的四条竞争路径及其教训》报告

相关资讯

【CVPR2023】探索和利用不确定性的不完整多视角分类

【CVPR2023】探索和利用不确定性的不完整多视角分类

专知

42+阅读 · 2023年4月13日

时空数据挖掘:综述

时空数据挖掘:综述

专知

34+阅读 · 2022年6月30日

【AI与军事】机器学习的军事应用，一种文献计量视角

【AI与军事】机器学习的军事应用，一种文献计量视角

专知

53+阅读 · 2022年4月25日

【MIT】硬负样本的对比学习

【MIT】硬负样本的对比学习

专知

13+阅读 · 2020年10月15日

【Amazon】使用预训练Transformer模型进行数据增强

【Amazon】使用预训练Transformer模型进行数据增强

专知

12+阅读 · 2020年3月6日

相关基金

不完全信息下的投资组合选择模型研究：一个时间一致性的视角

国家自然科学基金

5+阅读 · 2015年12月31日

模糊情况下的最优消费与投资

国家自然科学基金

3+阅读 · 2015年12月31日

反问题的数学建模、计算及应用

国家自然科学基金

4+阅读 · 2015年12月31日

高维数据下的模型平均方法

国家自然科学基金

6+阅读 · 2014年12月31日

复杂多元数据的半参数统计推断

国家自然科学基金

5+阅读 · 2014年12月31日

相关论文

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

174+阅读 · 2023年4月20日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

495+阅读 · 2023年3月31日

Nature Language Reasoning, A Survey

Arxiv

81+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

180+阅读 · 2023年3月24日

Data-centric Artificial Intelligence: A Survey

Arxiv

25+阅读 · 2023年3月17日

微信扫码咨询专知VIP会员