项目名称: 大规模垃圾邮件过滤中的集成化SVM增量学习机制研究
项目编号: No.60970081
项目类型: 面上项目
立项/批准年度: 2010
项目学科: 自动化技术、计算机技术
项目作者: 徐从富
作者单位: 浙江大学
项目金额: 31万元
中文摘要: 以大规模垃圾邮件过滤为研究背景,探索并提出一种新的兼顾识别率和效率的集成化SVM增量学习机制。主要研究内容包括:(1)利用目标跟踪原理与方法对SVM模型的支持向量和非支持向量的演变机制和规律进行跟踪和预测,并借鉴Core Vector Machine思想,尝试解决SVM增量算法中的效率问题;(2)探索AUC-maximization SVM的增量模型及算法,拟解决代价不对等问题,并进一步提高其效率;(3)引入Active Learning的思想,研究适应用户反馈延迟的SVM增量学习模型及算法。研究目标是,得到能够解决大规模垃圾邮件过滤的,具有高效、代价敏感和延迟适应等特点的增量学习机制、模型及算法。本研究可望对统计学习方法的基础理论、模型和算法有所促进,且为大规模垃圾邮件过滤、手机垃圾短信过滤、网络不良信息过滤等应用提供理论和技术支持。
中文关键词: 垃圾邮件过滤;SVM增量算法;组合多分类器;在线SVM;垃圾图片过滤
英文摘要:
英文关键词: Spam filtering;SVM incremental algorithm;Combining multiple classifiers;Online SVMs;Image spam filtering