回顾 | 达观数据联合创始人张健:文本观点挖掘技术及其应用(含文字整理)

2018 年 3 月 30 日 机器学习研究会


本文为3月29日晚,达观数据联合创始人张健在将门技术社群,分享如何在海量的文本数据中提炼出有价值观点的内容的回顾。


主要内容包括结合实践经验,盘点观点挖掘的应用场景及价值、目前业界主流的观点挖掘技术以及该技术目前面临的挑战。

获取完整PDF+视频回顾>>关注“将门创投”(thejiangmen)微信公众号,回复“180330”获取下载链接。


以下为根据直播整理的文字内容:


一、什么是文本观点挖掘?


在简单介绍观点挖掘的基本概念之后,张健首先对“观点”的五个组成要素进行了强调:

1. 观点评价对象(客体);

2. 观点评价对象的属性。例如,我评价谁哪里哪里好,又哪里哪里不好,“哪里”就是属性;

3. 观点所蕴含的情感极性。包括正面、负面、中性等;

4. 观点的持有者。在考虑到处理问答、对话的流程,涉及到主体的识别;

5. 观点的时间。这对观点是有一定影响意义在的,因为随着时间变化,观点持有者也可能改变自己的观点。


结合自己的业务经验,张健罗列了观点挖掘可能涉及到的一些任务类型,具体而言:

  • 情感分类

    我们所收集到的一些观点文本,可能都存在一定的情感倾向性,觉得XX是好的,XX是不好的,这可以帮助分析文本的倾向性;

  • 观点抽取

    从一段文本中属于观点的文本内容抽取出来,主要是为了方便分析人员从文本中获取结构化的有用的信息;

  • 观点过滤

    主要是由于海量数据当中会存在大量无效的信息,这需要被清理掉,以免影响观点挖掘的处理效率和准确率;

  • 评价质量

    这并非评价好坏之分,而是对于分析人员来说,这些评价需要有足够的信息量,能够对销售决策更有帮助。这在电商场景当中最为常见;

  • 意图识别

    在很多场景下,都是可以根据观点来发现观点持有者真正的意图,例如可以发现这个观点持有者究竟想不想要购买商品。


二、为什么要做文本观点挖掘?




转自:将门创投

完整内容请点击“阅读原文”

登录查看更多
6

相关内容

观点挖掘(Opinion Mining),又称文本意见挖掘或情感分析,是对文本信息的主题、意见持有者、主客观性、情绪态度等情感信息的挖掘和分析,进而识别出主观性文本的情感趋向。
【清华大学】低资源语言:回顾综述和未来的挑战,14页pdf
最新《自然场景中文本检测与识别》综述论文,26页pdf
专知会员服务
69+阅读 · 2020年6月10日
专知会员服务
155+阅读 · 2020年4月21日
【中科院信工所】视听觉深度伪造检测技术研究综述
专知会员服务
40+阅读 · 2020年4月15日
【阿里技术干货】知识结构化在阿里小蜜中的应用
专知会员服务
96+阅读 · 2019年12月14日
 【中科院信工所】社交媒体情感分析,40页ppt
专知会员服务
99+阅读 · 2019年12月13日
 图像内容自动描述技术综述
专知会员服务
85+阅读 · 2019年11月17日
[综述]基于深度学习的开放领域对话系统研究综述
专知会员服务
78+阅读 · 2019年10月12日
爱奇艺视频人物识别技术及应用
QCon
7+阅读 · 2019年4月8日
已删除
将门创投
5+阅读 · 2019年3月29日
深度学习在金融文本情感分类中的应用
AI前线
36+阅读 · 2019年1月12日
专栏 | NLP概述和文本自动分类算法详解
机器之心
12+阅读 · 2018年7月24日
NLP概述和文本自动分类算法详解 | 公开课笔记
人工智能头条
5+阅读 · 2018年7月24日
达观数据NLP技术的应用实践和案例分析
数据挖掘入门与实战
10+阅读 · 2017年7月27日
自然语言处理技术(NLP)在推荐系统中的应用
CSDN大数据
4+阅读 · 2017年6月29日
Arxiv
3+阅读 · 2019年3月1日
Doubly Attentive Transformer Machine Translation
Arxiv
4+阅读 · 2018年7月30日
Arxiv
5+阅读 · 2018年5月28日
Arxiv
3+阅读 · 2018年3月28日
Arxiv
25+阅读 · 2018年1月24日
Arxiv
5+阅读 · 2018年1月16日
VIP会员
相关VIP内容
【清华大学】低资源语言:回顾综述和未来的挑战,14页pdf
最新《自然场景中文本检测与识别》综述论文,26页pdf
专知会员服务
69+阅读 · 2020年6月10日
专知会员服务
155+阅读 · 2020年4月21日
【中科院信工所】视听觉深度伪造检测技术研究综述
专知会员服务
40+阅读 · 2020年4月15日
【阿里技术干货】知识结构化在阿里小蜜中的应用
专知会员服务
96+阅读 · 2019年12月14日
 【中科院信工所】社交媒体情感分析,40页ppt
专知会员服务
99+阅读 · 2019年12月13日
 图像内容自动描述技术综述
专知会员服务
85+阅读 · 2019年11月17日
[综述]基于深度学习的开放领域对话系统研究综述
专知会员服务
78+阅读 · 2019年10月12日
相关资讯
爱奇艺视频人物识别技术及应用
QCon
7+阅读 · 2019年4月8日
已删除
将门创投
5+阅读 · 2019年3月29日
深度学习在金融文本情感分类中的应用
AI前线
36+阅读 · 2019年1月12日
专栏 | NLP概述和文本自动分类算法详解
机器之心
12+阅读 · 2018年7月24日
NLP概述和文本自动分类算法详解 | 公开课笔记
人工智能头条
5+阅读 · 2018年7月24日
达观数据NLP技术的应用实践和案例分析
数据挖掘入门与实战
10+阅读 · 2017年7月27日
自然语言处理技术(NLP)在推荐系统中的应用
CSDN大数据
4+阅读 · 2017年6月29日
相关论文
Top
微信扫码咨询专知VIP会员