文本分类中的文本图表示模型和结构化稀疏模型研究 - 专知基金

会员服务 ·

0

文本图表示模型 · 稀疏模型 · 文本分类 ·

2014 年 12 月 31 日

文本分类中的文本图表示模型和结构化稀疏模型研究

国家自然科学基金

国家自然科学基金委员会

项目名称： 文本分类中的文本图表示模型和结构化稀疏模型研究

项目编号： No.61472183

项目类型： 面上项目

立项/批准年度： 2015

项目学科： 计算机科学学科

项目作者： 戴新宇

作者单位： 南京大学

项目金额： 80万元

中文摘要： 文本分类是自然语言处理研究中的一个经典问题。文本分类技术在网络舆情分析、专利分析等领域具有广泛的应用。本课题针对目前文本分类研究中文本表示模型表达能力不足，分类模型不能充分利用结构化信息等问题，研究基于文本结构化表示的结构化稀疏模型。首先，探索研究结合词法、句法、语义及篇章信息，能够蕴含多层次结构化信息的文本图表示模型；其次，基于文本结构化表示的特性，提出能够针对文本图表示的结构特性，将特征选择和模型学习相融合、具有高压缩性、可解释性等良好性质的结构化稀疏模型；给出结构化稀疏模型优化学习算法；最终基于上述理论成果，构建高性能的文本分类系统。本项目的研究成果将对自然语言处理中涉及结构化特征选择和分类模型的任务提供广泛的借鉴意义。本项目可望在重要的国际国内期刊、会议上发表高质量论文5-8篇，申请发明专利2-3项，研制开源平台系统1个，培养学生5-8名。

中文关键词： 文本图表示模型；稀疏模型；文本分类

英文摘要： Text categorization is an important research area for large-scale information retrieval. We propose to do some deep research on text representation and learning model for the application of text categorization. Firstly, we present a text graph representation with rich structured features of lexicon, syntax and semantic knowledge. Secondly,the sparse model with structured regularizer will be designed which can make directly use of the structured features within the text. And we will also present the optimization method for our structured sparse model. Based on our theoretical work, a high performance text categorization system will be designed and implemented. Our work can also be applied to other tasks of structured learning with structured representation in natural language processing area. In this project, we will try to publish several high quality journal papers or conference papers. Two or three patents will be submitted. And we will build a open source platform for text representation and text categorization.

英文关键词： Text Graph Representation;Sparse Model;Text Categorization

成为VIP会员查看完整内容

0

相关内容

文本图表示模型

文本图表示模型

【Facebook AI】fastText是一个用于高效学习单词表示和句子分类的库

【Facebook AI】fastText是一个用于高效学习单词表示和句子分类的库

专知会员服务

22+阅读 · 2022年3月25日

图神经网络综述

图神经网络综述

专知会员服务

206+阅读 · 2022年1月9日

【NeurIPS 2021】强大图表示的重建

专知会员服务

17+阅读 · 2021年10月4日

图神经网络在自然语言处理中的应用(中文版）,23页pdf

专知会员服务

92+阅读 · 2021年4月18日

电子病历文本挖掘研究综述

专知会员服务

73+阅读 · 2021年3月27日

最新《图神经网络模型与应用》综述论文

最新《图神经网络模型与应用》综述论文

专知会员服务

296+阅读 · 2020年8月2日

基于改进卷积神经网络的短文本分类模型

基于改进卷积神经网络的短文本分类模型

专知会员服务

26+阅读 · 2020年7月22日

【ACL2020】基于图神经网络的文本分类新方法

【ACL2020】基于图神经网络的文本分类新方法

专知会员服务

69+阅读 · 2020年7月12日

基于多头注意力胶囊网络的文本分类模型

基于多头注意力胶囊网络的文本分类模型

专知会员服务

78+阅读 · 2020年5月24日

医疗知识图谱构建与应用

医疗知识图谱构建与应用

专知会员服务

390+阅读 · 2019年9月25日

赛尔原创@EMNLP 2021 | 基于稀疏子网络的领域迁移

赛尔原创@EMNLP 2021 | 基于稀疏子网络的领域迁移

哈工大SCIR

0+阅读 · 2022年4月1日

EMNLP 2021 | 以对比损失为微调目标，UMass提出更强大的短语表示模型

EMNLP 2021 | 以对比损失为微调目标，UMass提出更强大的短语表示模型

PaperWeekly

0+阅读 · 2021年11月15日

WWWJ | 基于多视图表示学习的专利分类

WWWJ | 基于多视图表示学习的专利分类

图与推荐

3+阅读 · 2021年9月15日

别用Attention了，用GNN来解释NLP模型吧

别用Attention了，用GNN来解释NLP模型吧

图与推荐

1+阅读 · 2021年3月10日

【ACL2020】基于图神经网络的文本分类新方法

【ACL2020】基于图神经网络的文本分类新方法

专知

22+阅读 · 2020年7月12日

【自然语言处理】清华刘知远55页自然语言处理PPT

【自然语言处理】清华刘知远55页自然语言处理PPT

产业智能官

19+阅读 · 2019年8月23日

挑战知识图谱、生成式对话系统、Bert模型的高阶NLP实战

挑战知识图谱、生成式对话系统、Bert模型的高阶NLP实战

AINLP

20+阅读 · 2019年5月29日

清华大学图神经网络综述：模型与应用

清华大学图神经网络综述：模型与应用

机器之心

76+阅读 · 2018年12月26日

图神经网络综述：模型与应用

图神经网络综述：模型与应用

PaperWeekly

198+阅读 · 2018年12月26日

深度文本匹配在智能客服中的应用

深度文本匹配在智能客服中的应用

AI100

18+阅读 · 2018年10月24日

短文本情感分析关键技术研究

国家自然科学基金

9+阅读 · 2015年12月31日

视觉信息的局部特征表示及应用研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于图像稀疏特性的图像表示、编码与重建研究

国家自然科学基金

2+阅读 · 2014年12月31日

融合文本内容与结构信息的话题分析方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

汉语多层次语篇分析理论方法研究与应用

国家自然科学基金

0+阅读 · 2013年12月31日

高维结构性稀疏特征选择与图像语义理解机制研究

国家自然科学基金

0+阅读 · 2012年12月31日

面向文本信息安全的类别语义模型分类方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

面向复杂数据的稀疏流形学习方法研究

国家自然科学基金

1+阅读 · 2012年12月31日

稀疏信息处理的数学理论与方法

国家自然科学基金

0+阅读 · 2011年12月31日

面向Web文本的因果知识获取方法研究

国家自然科学基金

2+阅读 · 2011年12月31日

Unsupervised Ranking and Aggregation of Label Descriptions for Zero-Shot Classifiers

Unsupervised Ranking and Aggregation of Label Descriptions for Zero-Shot Classifiers

Arxiv

0+阅读 · 2022年4月20日

Pre-training of Deep Protein Models with Molecular Dynamics Simulations for Drug Binding

Arxiv

1+阅读 · 2022年4月19日

Factual Error Correction for Abstractive Summaries Using Entity Retrieval

Arxiv

0+阅读 · 2022年4月18日

What If: Generating Code to Answer Simulation Questions

Arxiv

0+阅读 · 2022年4月16日

Performance and Construction of Polar Codes: The Perspective of Bit Error Probability

Arxiv

0+阅读 · 2022年4月15日

A Survey of Knowledge Enhanced Pre-trained Models

Arxiv

28+阅读 · 2021年10月1日

Interpretable Machine Learning: Fundamental Principles and 10 Grand Challenges

Arxiv

17+阅读 · 2021年7月10日

Graph Enhanced Representation Learning for News Recommendation

Arxiv

24+阅读 · 2020年3月31日

Learning Conceptual-Contexual Embeddings for Medical Text

Arxiv

27+阅读 · 2019年8月16日

From Knowledge Graph Embedding to Ontology Embedding: Region Based Representations of Relational Structures

Arxiv

10+阅读 · 2018年5月26日

阅读: 0 点赞: 0

小贴士

登录享主题订阅及个性化推荐

相关主题

文本图表示模型

热门VIP内容

开通专知VIP会员享更多权益服务

前沿人工智能趋势报告（Frontier AI Trends Report）

【AAAI2026】善始则事半功倍：基于前缀优化的大语言模型推理强化学习

Andrej Karpathy：2025 年 LLM 年度回顾（2025 LLM Year in Review）

音退化问题：基于输入操控的鲁棒语音转换综述

相关VIP内容

【Facebook AI】fastText是一个用于高效学习单词表示和句子分类的库

【Facebook AI】fastText是一个用于高效学习单词表示和句子分类的库

专知会员服务

22+阅读 · 2022年3月25日

图神经网络综述

图神经网络综述

专知会员服务

206+阅读 · 2022年1月9日

【NeurIPS 2021】强大图表示的重建

专知会员服务

17+阅读 · 2021年10月4日

图神经网络在自然语言处理中的应用(中文版）,23页pdf

专知会员服务

92+阅读 · 2021年4月18日

电子病历文本挖掘研究综述

专知会员服务

73+阅读 · 2021年3月27日

最新《图神经网络模型与应用》综述论文

最新《图神经网络模型与应用》综述论文

专知会员服务

296+阅读 · 2020年8月2日

基于改进卷积神经网络的短文本分类模型

基于改进卷积神经网络的短文本分类模型

专知会员服务

26+阅读 · 2020年7月22日

【ACL2020】基于图神经网络的文本分类新方法

【ACL2020】基于图神经网络的文本分类新方法

专知会员服务

69+阅读 · 2020年7月12日

基于多头注意力胶囊网络的文本分类模型

基于多头注意力胶囊网络的文本分类模型

专知会员服务

78+阅读 · 2020年5月24日

医疗知识图谱构建与应用

医疗知识图谱构建与应用

专知会员服务

390+阅读 · 2019年9月25日

相关资讯

赛尔原创@EMNLP 2021 | 基于稀疏子网络的领域迁移

赛尔原创@EMNLP 2021 | 基于稀疏子网络的领域迁移

哈工大SCIR

0+阅读 · 2022年4月1日

EMNLP 2021 | 以对比损失为微调目标，UMass提出更强大的短语表示模型

EMNLP 2021 | 以对比损失为微调目标，UMass提出更强大的短语表示模型

PaperWeekly

0+阅读 · 2021年11月15日

WWWJ | 基于多视图表示学习的专利分类

WWWJ | 基于多视图表示学习的专利分类

图与推荐

3+阅读 · 2021年9月15日

别用Attention了，用GNN来解释NLP模型吧

别用Attention了，用GNN来解释NLP模型吧

图与推荐

1+阅读 · 2021年3月10日

【ACL2020】基于图神经网络的文本分类新方法

【ACL2020】基于图神经网络的文本分类新方法

专知

22+阅读 · 2020年7月12日

【自然语言处理】清华刘知远55页自然语言处理PPT

【自然语言处理】清华刘知远55页自然语言处理PPT

产业智能官

19+阅读 · 2019年8月23日

挑战知识图谱、生成式对话系统、Bert模型的高阶NLP实战

挑战知识图谱、生成式对话系统、Bert模型的高阶NLP实战

AINLP

20+阅读 · 2019年5月29日

清华大学图神经网络综述：模型与应用

清华大学图神经网络综述：模型与应用

机器之心

76+阅读 · 2018年12月26日

图神经网络综述：模型与应用

图神经网络综述：模型与应用

PaperWeekly

198+阅读 · 2018年12月26日

深度文本匹配在智能客服中的应用

深度文本匹配在智能客服中的应用

AI100

18+阅读 · 2018年10月24日

相关基金

短文本情感分析关键技术研究

国家自然科学基金

9+阅读 · 2015年12月31日

视觉信息的局部特征表示及应用研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于图像稀疏特性的图像表示、编码与重建研究

国家自然科学基金

2+阅读 · 2014年12月31日

融合文本内容与结构信息的话题分析方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

汉语多层次语篇分析理论方法研究与应用

国家自然科学基金

0+阅读 · 2013年12月31日

高维结构性稀疏特征选择与图像语义理解机制研究

国家自然科学基金

0+阅读 · 2012年12月31日

面向文本信息安全的类别语义模型分类方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

面向复杂数据的稀疏流形学习方法研究

国家自然科学基金

1+阅读 · 2012年12月31日

稀疏信息处理的数学理论与方法

国家自然科学基金

0+阅读 · 2011年12月31日

面向Web文本的因果知识获取方法研究

国家自然科学基金

2+阅读 · 2011年12月31日

相关论文

Unsupervised Ranking and Aggregation of Label Descriptions for Zero-Shot Classifiers

Unsupervised Ranking and Aggregation of Label Descriptions for Zero-Shot Classifiers

Arxiv

0+阅读 · 2022年4月20日

Pre-training of Deep Protein Models with Molecular Dynamics Simulations for Drug Binding

Arxiv

1+阅读 · 2022年4月19日

Factual Error Correction for Abstractive Summaries Using Entity Retrieval

Arxiv

0+阅读 · 2022年4月18日

What If: Generating Code to Answer Simulation Questions

Arxiv

0+阅读 · 2022年4月16日

Performance and Construction of Polar Codes: The Perspective of Bit Error Probability

Arxiv

0+阅读 · 2022年4月15日

A Survey of Knowledge Enhanced Pre-trained Models

Arxiv

28+阅读 · 2021年10月1日

Interpretable Machine Learning: Fundamental Principles and 10 Grand Challenges

Arxiv

17+阅读 · 2021年7月10日

Graph Enhanced Representation Learning for News Recommendation

Arxiv

24+阅读 · 2020年3月31日

Learning Conceptual-Contexual Embeddings for Medical Text

Arxiv

27+阅读 · 2019年8月16日

From Knowledge Graph Embedding to Ontology Embedding: Region Based Representations of Relational Structures

Arxiv

10+阅读 · 2018年5月26日

微信扫码咨询专知VIP会员