弱监督科技论文分类旨在仅使用类别描述(如类别名称、类别指示性关键词)对论文进行分类,而不是依赖人工标注的训练样本来构建分类器。现有的弱监督论文分类研究较少考虑以下两个挑战:(1)在标签空间较大的情况下,论文不仅要分为粗粒度的研究主题,还要分为细粒度的主题,并且有可能分为多个主题;(2)利用全文补充论文标题和摘要进行分类。此外,不要将整篇论文视为一个长线性序列,而是应该利用结构信息,如跨论文的引文链接和每篇论文中部分和段落的层次结构。为了应对这些挑战,本文提出FuTex,一种利用跨论文网络结构和论文层次结构对弱监督下的全文科技论文进行分类的框架。设计了网络感知的对比微调模块和层次感知的聚合模块,分别利用两种类型的结构信号。在两个基准数据集上的实验表明,FuTex的性能明显优于有竞争力的基线,与使用1000到60,000个真实训练样本的全监督分类器相当。

成为VIP会员查看完整内容
21

相关内容

【AAAI2022】跨域少样本图分类
专知会员服务
30+阅读 · 2022年1月22日
专知会员服务
38+阅读 · 2021年9月15日
专知会员服务
18+阅读 · 2021年7月27日
PointNet系列论文解读
人工智能前沿讲习班
17+阅读 · 2019年5月3日
用深度学习做文本摘要
专知
24+阅读 · 2019年3月30日
目标跟踪算法分类
大数据技术
13+阅读 · 2018年9月17日
RASNet 论文笔记
统计学习与视觉计算组
10+阅读 · 2018年4月26日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Arxiv
174+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
495+阅读 · 2023年3月31日
Arxiv
82+阅读 · 2023年3月26日
Arxiv
180+阅读 · 2023年3月24日
VIP会员
相关VIP内容
【AAAI2022】跨域少样本图分类
专知会员服务
30+阅读 · 2022年1月22日
专知会员服务
38+阅读 · 2021年9月15日
专知会员服务
18+阅读 · 2021年7月27日
相关资讯
PointNet系列论文解读
人工智能前沿讲习班
17+阅读 · 2019年5月3日
用深度学习做文本摘要
专知
24+阅读 · 2019年3月30日
目标跟踪算法分类
大数据技术
13+阅读 · 2018年9月17日
RASNet 论文笔记
统计学习与视觉计算组
10+阅读 · 2018年4月26日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
相关论文
Arxiv
174+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
495+阅读 · 2023年3月31日
Arxiv
82+阅读 · 2023年3月26日
Arxiv
180+阅读 · 2023年3月24日
微信扫码咨询专知VIP会员