项目名称: 基于弱监督学习的网络社交用户兴趣识别方法研究

项目编号: No.61303103

项目类型: 青年科学基金项目

立项/批准年度: 2014

项目学科: 自动化技术、计算机技术

项目作者: 李岩

作者单位: 深圳职业技术学院

项目金额: 25万元

中文摘要: 网络社交用户兴趣的识别问题已经成为许多应用的重要基础问题。它可以形式化的映射为多类标文本分类问题,其研究难点是:在高噪音、小样本且类标空间分布复杂的条件下,如何使多类标分类算法能自动化构建和优化分类模型,从而使分类器得到良好的分类精度。围绕着这个核心问题,课题将重点研究基于弱监督学习的多类标聚类树分类模型,以及该模型下的关键算法:(1)多类标聚类树学习和模型优化算法,用于解决小样本、高噪音数据的单个分类模型的学习问题;(2)多混合分布条件下类标间依赖性学习算法,用于解决多类标之间复杂依赖性的学习问题;(3)基于多类标聚类树森林的集成学习算法,用于进一步解决高噪音、小样本条件下多个分类模型的融合学习问题。课题的创新在于:基于误差界估计的多类标聚类树构建与模型优化算法;基于内容属性与多类标聚类树拓扑结构信息融合的类标间依赖性学习方法;基于多类标聚类树森林的集成学习算法。

中文关键词: 多类标分类;聚类树;弱监督学习;;

英文摘要: How to identify the interests for each user in social networks is a fundamental problem in many real applications, which can be formulated as a problem of multi-label text classification. The big challenge of this problem lies in high noise in small training data sets, complex dependency and correlation among multiple labels, while the classification performance will highly depend on the effectiveness of mining these complex correlations and dependencies. This project will first propose a multi-label cluster tree classification model based on weak learning strategy, and then explore the following research issues: (1)multi-label cluster tree learning algorithm and its model optimization algorithm, to explore the problem of learning single classifier from small training data set with high noise; (2)learning various dependencies of label set from label space with multiple mixture distributions, to solve the problem of learning complex label dependencies; (3)ensemble learning algorithm based on multi-label cluster forest, to smoothly integrate multiple classifiers. The main innovations of this proposal are as follows: multi-label cluster tree learning algorithm and its model optimization algorithm based on error bound estimation; label dependency learning approach through the combination of content and topology info

英文关键词: multi-label classification;cluster tree;weak-supervised learning;;

成为VIP会员查看完整内容
0

相关内容

【WSDM2022】具有分层注意力的图嵌入
专知会员服务
36+阅读 · 2021年11月17日
基于强化学习的推荐研究综述
专知会员服务
84+阅读 · 2021年10月21日
专知会员服务
88+阅读 · 2021年9月4日
专知会员服务
17+阅读 · 2021年2月17日
专知会员服务
52+阅读 · 2020年12月19日
专知会员服务
26+阅读 · 2020年12月17日
专知会员服务
46+阅读 · 2020年11月13日
【CCL2020】基于深度学习的实体关系抽取研究综述
专知会员服务
53+阅读 · 2020年11月4日
基于机器学习的自动化网络流量分析
CCF计算机安全专委会
5+阅读 · 2022年4月8日
【速览】IJCV 2022 | 自适应干扰解耦学习的人脸表情识别方法(ADDL)
中国图象图形学学会CSIG
6+阅读 · 2022年2月15日
WSDM'22「微软」图学习如何用于会话推荐?
图与推荐
0+阅读 · 2022年1月18日
【博士论文】开放环境下的度量学习研究
专知
7+阅读 · 2021年12月4日
四种方法,用数据挖掘潜力用户
人人都是产品经理
0+阅读 · 2021年11月4日
WSDM2022 | 跨领域推荐中的个性化迁移用户兴趣偏好
机器学习与推荐算法
1+阅读 · 2021年11月3日
基于小样本学习的意图识别冷启动
PaperWeekly
10+阅读 · 2019年5月12日
【资源推荐】情感分析资源列表
专知
31+阅读 · 2019年3月20日
【推荐】伪标签学习导论 - 一种半监督学习方法
机器学习研究会
12+阅读 · 2017年10月5日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Exploring Visual Relationship for Image Captioning
Arxiv
15+阅读 · 2018年9月19日
Arxiv
19+阅读 · 2018年5月17日
小贴士
相关VIP内容
【WSDM2022】具有分层注意力的图嵌入
专知会员服务
36+阅读 · 2021年11月17日
基于强化学习的推荐研究综述
专知会员服务
84+阅读 · 2021年10月21日
专知会员服务
88+阅读 · 2021年9月4日
专知会员服务
17+阅读 · 2021年2月17日
专知会员服务
52+阅读 · 2020年12月19日
专知会员服务
26+阅读 · 2020年12月17日
专知会员服务
46+阅读 · 2020年11月13日
【CCL2020】基于深度学习的实体关系抽取研究综述
专知会员服务
53+阅读 · 2020年11月4日
相关资讯
基于机器学习的自动化网络流量分析
CCF计算机安全专委会
5+阅读 · 2022年4月8日
【速览】IJCV 2022 | 自适应干扰解耦学习的人脸表情识别方法(ADDL)
中国图象图形学学会CSIG
6+阅读 · 2022年2月15日
WSDM'22「微软」图学习如何用于会话推荐?
图与推荐
0+阅读 · 2022年1月18日
【博士论文】开放环境下的度量学习研究
专知
7+阅读 · 2021年12月4日
四种方法,用数据挖掘潜力用户
人人都是产品经理
0+阅读 · 2021年11月4日
WSDM2022 | 跨领域推荐中的个性化迁移用户兴趣偏好
机器学习与推荐算法
1+阅读 · 2021年11月3日
基于小样本学习的意图识别冷启动
PaperWeekly
10+阅读 · 2019年5月12日
【资源推荐】情感分析资源列表
专知
31+阅读 · 2019年3月20日
【推荐】伪标签学习导论 - 一种半监督学习方法
机器学习研究会
12+阅读 · 2017年10月5日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员