项目名称: 面向企业的商品评论代表性意见提取策略研究

项目编号: No.71302158

项目类型: 青年科学基金项目

立项/批准年度: 2014

项目学科: 管理科学

项目作者: 任明

作者单位: 中国人民大学

项目金额: 19万元

中文摘要: 大量商品评论伴随着网络购物市场的繁荣和Web2.0应用的兴起而到来,它们反映着商品的口碑,不仅能够帮助顾客进行购物决策,也给企业了解顾客的意见开辟了新的途径。如何在大量的商品评论中提取代表性意见,已经引起了学术界和业界的广泛关注。目前商品评论通常是为了满足顾客的需求,根据热度、新鲜度、有用性等指标对评论进行排序,但这不一定能得到丰富多样的意见。本研究从企业的应用需求出发,目标是提取能尽可能多的覆盖意见总体的信息、有尽可能少的信息冗余的代表性意见集合。研究以信息抽取策略为主线,以意见挖掘和情感分析领域的方法为补充,增进对意见文本的理解,使得提取出的代表性意见能够有效的反映不同方面的意见。具体工作围绕四方面展开:(1)代表性意见提取的理论框架;(2)意见文本的表示;(3)代表性意见提取的方法;(4)代表性意见的验证。研究注重基于真实数据和用户实验进行验证,相关工作兼具理论创新意义和实践价值。

中文关键词: 代表性信息;信息提取;覆盖度;冗余度;在线评论

英文摘要: With the rapid growth of e-commerce and web2.0 applications, an enormous number of product reviews has emerged, which not only helps the consumers find the information on the products in decision making, but also enables the enterprises to listen to consumers and to improve their products. It has become meaningful to extract a small set of reviews, as reading through all the reviews is neither practical nor interesting. In practice, ranking criteria, such as hotness, freshness, usefulness, are widely used by many online information search services, to provide the highly-ranked ones to consumers, however, such an ordered list of reviews does not necessarily represent all different viewpoints (e.g., positive vs. negative) of the products. This study attempts to extract representative opinions in product reviews for enterprises, which covers the information content of the reviews as much as possible, and at the same time minimizes the redundancy. Then the extraction of representative opinions is formulated as an optimization problem based on an aggregator measure of coverage and redundancy. This study focuses on the following four aspects, i.e., the framework of extracting representative opinions, the formulation of opinions in terms of feature and opinion polarity, the algorithm and the evaluation of the approach.

英文关键词: Representative information;Information extraction;Coverage;Redundancy;Online reviews

成为VIP会员查看完整内容
0

相关内容

信息抽取也被称为事件抽取。与自动摘要相比,信息抽取更有目的性,并能将找到的信息以一定的框架展示。有时信息抽取也被用来完成自动摘要。
WSDM 2022 | 基于图神经网络的协同过滤设计空间研究
专知会员服务
36+阅读 · 2022年1月3日
基于强化学习的推荐研究综述
专知会员服务
83+阅读 · 2021年10月21日
专知会员服务
56+阅读 · 2021年8月12日
【WWW2021】自监督学习上下文嵌入的异构网络链接预测
专知会员服务
39+阅读 · 2021年2月10日
自动文本摘要研究综述
专知会员服务
67+阅读 · 2021年1月31日
基于知识图谱的推荐系统研究综述
专知会员服务
328+阅读 · 2020年8月10日
个性化商品搜索相关研究梳理
机器学习与推荐算法
0+阅读 · 2022年2月17日
推荐系统+图神经网络,预训练技术研究进展
图与推荐
3+阅读 · 2022年1月5日
CIKM 2021 | 自监督学习在社会化推荐系统中的应用
PaperWeekly
0+阅读 · 2021年11月14日
基于知识图谱的推荐系统总结
机器学习与推荐算法
4+阅读 · 2021年11月11日
SIGIR 2021 | 推荐系统中的多行为建模
PaperWeekly
1+阅读 · 2021年10月9日
一文梳理跨域推荐研究进展
机器学习与推荐算法
0+阅读 · 2021年8月30日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年2月28日
Arxiv
38+阅读 · 2020年12月2日
Adversarial Mutual Information for Text Generation
Arxiv
13+阅读 · 2020年6月30日
Arxiv
12+阅读 · 2020年6月20日
Arxiv
20+阅读 · 2019年11月23日
Domain Representation for Knowledge Graph Embedding
Arxiv
14+阅读 · 2019年9月11日
Arxiv
24+阅读 · 2018年10月24日
小贴士
相关VIP内容
WSDM 2022 | 基于图神经网络的协同过滤设计空间研究
专知会员服务
36+阅读 · 2022年1月3日
基于强化学习的推荐研究综述
专知会员服务
83+阅读 · 2021年10月21日
专知会员服务
56+阅读 · 2021年8月12日
【WWW2021】自监督学习上下文嵌入的异构网络链接预测
专知会员服务
39+阅读 · 2021年2月10日
自动文本摘要研究综述
专知会员服务
67+阅读 · 2021年1月31日
基于知识图谱的推荐系统研究综述
专知会员服务
328+阅读 · 2020年8月10日
相关资讯
个性化商品搜索相关研究梳理
机器学习与推荐算法
0+阅读 · 2022年2月17日
推荐系统+图神经网络,预训练技术研究进展
图与推荐
3+阅读 · 2022年1月5日
CIKM 2021 | 自监督学习在社会化推荐系统中的应用
PaperWeekly
0+阅读 · 2021年11月14日
基于知识图谱的推荐系统总结
机器学习与推荐算法
4+阅读 · 2021年11月11日
SIGIR 2021 | 推荐系统中的多行为建模
PaperWeekly
1+阅读 · 2021年10月9日
一文梳理跨域推荐研究进展
机器学习与推荐算法
0+阅读 · 2021年8月30日
相关基金
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年2月28日
相关论文
微信扫码咨询专知VIP会员