题目: autoNLP: NLP Feature Recommendations for Text Analytics Applications

简介: NLP数据科学家通常在设计基于机器学习的文本分析应用程序时,会根据他们对相关问题的知识和经验,手动确定要使用哪些NLP功能。 这导致在要素工程过程中增加了工作量,并使跨语义相关的应用程序自动重用要素具有固有的难度。 在本文中,我们通过概述用于指定NLP功能的语言的结构来主张功能规范的标准化,并提出一种在应用程序中重用它们的方法,以增加识别最佳功能的可能性。

目录:

成为VIP会员查看完整内容
0
29

相关内容

自然语言处理(NLP)是语言学,计算机科学,信息工程和人工智能的一个子领域,与计算机和人类(自然)语言之间的相互作用有关,尤其是如何对计算机进行编程以处理和分析大量自然语言数据 。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

题目: Natural Language Processing and Query Expansion

简介:

大量知识资源的可用性刺激了开发和增强信息检索技术的大量工作。用户的信息需求以自然语言表达,成功的检索很大程度上取决于预期目的的有效沟通。自然语言查询包含多种语言功能,这些语言功能代表了预期的搜索目标。导致语义歧义和对查询的误解以及其他因素(例如,对搜索环境缺乏了解)的语言特征会影响用户准确表示其信息需求的能力,这是由概念意图差距造成的。后者直接影响返回的搜索结果的相关性,而这可能不会使用户满意,因此是影响信息检索系统有效性的主要问题。我们讨论的核心是通过手动或自动捕获有意义的术语,短语甚至潜在的表示形式来识别表征查询意图及其丰富特征的重要组成部分,以手动或自动捕获它们的预期含义。具体而言,我们讨论了实现丰富化的技术,尤其是那些利用从文档语料库中的术语相关性的统计处理或从诸如本体之类的外部知识源中收集的信息的技术。我们提出了基于通用语言的查询扩展框架的结构,并提出了基于模块的分解,涵盖了来自查询处理,信息检索,计算语言学和本体工程的主题问题。对于每个模块,我们都会根据所使用的技术回顾分类和分析的文献中的最新解决方案。

成为VIP会员查看完整内容
0
35

由于特征工程通常是特定于数据类型且依赖于应用程序的,本书包含专门介绍主要数据类型的特征工程的章节,如文本数据、图像数据、序列数据、时间序列数据、图形数据、流数据、软件工程数据、Twitter 数据和社交媒体数据。这些章节介绍了生成经过反复测试、手工制作的特定于域的功能以及自动通用功能生成方法(如 Word2Vec)的方法。

本书目录:

  1. 预览概述
  2. 文本数据特征工程 
  3. 视觉数据特征提取学习
  4. 基于特征的时序分析
  5. 数据特征流工程
  6. 序列特征生成与特征工程
  7. 图与网络特征生成
  8. 特征选择与评估
  9. 监督学习中的自动特征工程
  10. 基于模式的特征生成
  11. 深度学习特征表示
  12. 用于社交机器人检测的特征工程
  13. 用于软件分析的特征生成与工程
  14. Twitter应用特征工程

本书还包含有关特征选择、基于特征转换的自动方法、使用深度学习方法生成功能以及使用频繁和对比度模式生成特征的章节。有几章是关于在特定应用中使用特征工程的。

本书包含许多有用的特征工程概念和技术,这些概念和技术适用于多种方案:(a) 生成功能以表示没有要素时的数据,(b) 在(人们可能担心)存在时生成有效特征功能不够好/竞争力不够,(c) 在功能过多时选择功能,(d) 为特定类型的应用程序生成和选择有效功能,以及 (e) 了解与相关挑战以及需要处理的方法,各种数据类型。

成为VIP会员查看完整内容
0
93
小贴士
相关VIP内容
专知会员服务
77+阅读 · 2020年3月12日
新书《面向机器学习和数据分析的特征工程》,419页pdf
专知会员服务
93+阅读 · 2019年10月10日
相关资讯
万字长文概述NLP中的深度学习技术
七月在线实验室
4+阅读 · 2019年3月5日
文本分析与可视化
Python程序员
7+阅读 · 2019年2月28日
推荐 :一文带你读懂特征工程
数据分析
13+阅读 · 2018年8月26日
15款免费预测分析软件!收藏好,别丢了!
七月在线实验室
9+阅读 · 2018年2月27日
自然语言处理技术(NLP)在推荐系统中的应用
CSDN大数据
3+阅读 · 2017年6月29日
相关论文
A Survey on Bayesian Deep Learning
Hao Wang,Dit-Yan Yeung
46+阅读 · 2020年7月2日
Pan Li,Alexander Tuzhilin
5+阅读 · 2019年10月11日
Kevin Clark,Urvashi Khandelwal,Omer Levy,Christopher D. Manning
4+阅读 · 2019年6月11日
Yixin Cao,Xiang Wang,Xiangnan He,Zikun hu,Tat-Seng Chua
5+阅读 · 2019年2月17日
Antoine J. -P. Tixier
10+阅读 · 2018年8月30日
Reza Ghaeini,Xiaoli Z. Fern,Hamed Shahbazi,Prasad Tadepalli
4+阅读 · 2018年6月1日
Yongfeng Zhang,Qingyao Ai,Xu Chen,Pengfei Wang
21+阅读 · 2018年3月22日
Linyuan Gong,Ruyi Ji
8+阅读 · 2018年1月19日
Alexander Trott,Caiming Xiong,Richard Socher
3+阅读 · 2017年12月23日
Shuai Zhang,Lina Yao,Aixin Sun
4+阅读 · 2017年8月3日
Top