The automatic verification of document authorships is important in various settings. Researchers are for example judged and compared by the amount and impact of their publications and public figures are confronted by their posts on social media platforms. Therefore, it is important that authorship information in frequently used web services and platforms is correct. The question whether a given document is written by a given author is commonly referred to as authorship verification (AV). While AV is a widely investigated problem in general, only few works consider settings where the documents are short and written in a rather uniform style. This makes most approaches unpractical for online databases and knowledge graphs in the scholarly domain. Here, authorships of scientific publications have to be verified, often with just abstracts and titles available. To this point, we present our novel approach LG4AV which combines language models and graph neural networks for authorship verification. By directly feeding the available texts in a pre-trained transformer architecture, our model does not need any hand-crafted stylometric features that are not meaningful in scenarios where the writing style is, at least to some extent, standardized. By the incorporation of a graph neural network structure, our model can benefit from relations between authors that are meaningful with respect to the verification process. For example, scientific authors are more likely to write about topics that are addressed by their co-authors and twitter users tend to post about the same subjects as people they follow. We experimentally evaluate our model and study to which extent the inclusion of co-authorships enhances verification decisions in bibliometric environments.


翻译:文件作者的自动核查在各种环境中都很重要,例如,研究人员根据其出版物和公共人物的数量和影响来判断和比较其出版物和公共人物在社交媒体平台上的职位,因此,在常用的网络服务和平台上撰写信息必须正确。一个特定文件是否由特定作者撰写的问题通常被称为作者核查。虽然AV是一个广泛调查的问题,但一般来说,只有很少的作品考虑文件简短和以相当统一的方式撰写的文件的设置。这使得大多数方法对在线数据库和知识图在学术领域不切合实际。在这里,科学出版物的作者必须经过核实,往往只有简单的摘要和标题。至此,我们介绍我们的新颖的LG4AV方法,它将语言模型和图表神经网络结合起来,供作者核查。通过直接将现有文本纳入经过事先训练的变异结构,我们的模型并不需要任何手工制作的体格特征,这些特征在书写风格至少在某种程度上是标准化的情景中并不有意义的。通过将科学出版物的作者的作者的书写方式纳入一个有实际价值的网络结构,我们可能通过将一个有意义的实验性网络的校程的校正的校正的校正,从而作者们的校正的校正的校会的校正的校正的校正的校正的校正的校正的校正的校正的校正的校正的校正的校正的校正的校正的校正的校正的校正的校正的校正的校正的校正的校正的校正的校正的校正的校正的校正环境,使得更有利于。

0
下载
关闭预览

相关内容

【图与几何深度学习】Graph and geometric deep learning,49页ppt
神经网络的拓扑结构,TOPOLOGY OF DEEP NEURAL NETWORKS
专知会员服务
31+阅读 · 2020年4月15日
【AAAI2020知识图谱论文概述】Knowledge Graphs @ AAAI 2020
专知会员服务
133+阅读 · 2020年2月13日
Hierarchically Structured Meta-learning
CreateAMind
26+阅读 · 2019年5月22日
强化学习的Unsupervised Meta-Learning
CreateAMind
17+阅读 · 2019年1月7日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
Facebook PyText 在 Github 上开源了
AINLP
7+阅读 · 2018年12月14日
已删除
清华大学研究生教育
3+阅读 · 2018年6月30日
【推荐】自然语言处理(NLP)指南
机器学习研究会
35+阅读 · 2017年11月17日
Capsule Networks解析
机器学习研究会
11+阅读 · 2017年11月12日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Arxiv
0+阅读 · 2021年10月25日
Arxiv
9+阅读 · 2021年10月5日
Arxiv
8+阅读 · 2019年5月20日
Arxiv
3+阅读 · 2018年2月7日
Arxiv
5+阅读 · 2017年12月29日
VIP会员
相关VIP内容
【图与几何深度学习】Graph and geometric deep learning,49页ppt
神经网络的拓扑结构,TOPOLOGY OF DEEP NEURAL NETWORKS
专知会员服务
31+阅读 · 2020年4月15日
【AAAI2020知识图谱论文概述】Knowledge Graphs @ AAAI 2020
专知会员服务
133+阅读 · 2020年2月13日
相关资讯
Hierarchically Structured Meta-learning
CreateAMind
26+阅读 · 2019年5月22日
强化学习的Unsupervised Meta-Learning
CreateAMind
17+阅读 · 2019年1月7日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
Facebook PyText 在 Github 上开源了
AINLP
7+阅读 · 2018年12月14日
已删除
清华大学研究生教育
3+阅读 · 2018年6月30日
【推荐】自然语言处理(NLP)指南
机器学习研究会
35+阅读 · 2017年11月17日
Capsule Networks解析
机器学习研究会
11+阅读 · 2017年11月12日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
相关论文
Arxiv
0+阅读 · 2021年10月25日
Arxiv
9+阅读 · 2021年10月5日
Arxiv
8+阅读 · 2019年5月20日
Arxiv
3+阅读 · 2018年2月7日
Arxiv
5+阅读 · 2017年12月29日
Top
微信扫码咨询专知VIP会员