垃圾邮件过滤的优化目标、建模及顺序回归研究 - 专知基金

会员服务 ·

0

垃圾邮件过滤 · 评价指标优化 · 排序模型 · 在线顺序回归学习 · 主动学习 ·

2009 年 12 月 31 日

垃圾邮件过滤的优化目标、建模及顺序回归研究

国家自然科学基金

国家自然科学基金委员会

项目名称： 垃圾邮件过滤的优化目标、建模及顺序回归研究

项目编号： No.60903083

项目类型： 青年科学基金项目

立项/批准年度： 2010

项目学科： 金属学与金属工艺

项目作者： 孙广路

作者单位： 哈尔滨理工大学

项目金额： 18万元

中文摘要： 垃圾邮件过滤是网络信息处理中的重要问题，基于机器学习方法的垃圾邮件过滤技术是目前的研究热点。现有研究一般将过滤问题视为二值分类问题进行解决，存在着模型优化目标和性能评价指标不一致的问题，导致模型优化结果产生偏差，过滤性能受到很大影响。本课题拟通过直接优化评价指标来提升过滤器性能，将垃圾邮件过滤问题转化成排序问题进行建模，探索基于顺序回归学习的垃圾邮件过滤新模型；拟提出在线顺序逻辑回归学习算法，解决顺序回归学习中的邮件得分偏移问题；综合应用TONE算法和重采样技术，拟提出参数权重更新算法，解决顺序回归学习中在线调整模型参数时的处理速度问题，满足垃圾邮件实时过滤的要求；拟提出基于字节级n元文法的特征提取方法，解决垃圾邮件信息伪装和隐藏的问题。本课题力争在垃圾邮件过滤的理论和方法上有所创新和突破，旨在大幅提高垃圾邮件过滤的性能，推动信息过滤技术的发展。本课题的研究具有重要的学术意义和实践意义。

中文关键词： 垃圾邮件过滤；评价指标优化；排序模型；在线顺序回归学习；主动学习

英文摘要：

英文关键词： Spam Filterinig；Indicator Optimization；Ranking Model；OnlineOrdinal Regression Model；Active Learning

成为VIP会员查看完整内容

0

相关内容

垃圾邮件过滤

垃圾邮件过滤

【ICLR2022】序列生成的目标侧数据增强

【ICLR2022】序列生成的目标侧数据增强

专知会员服务

23+阅读 · 2022年2月14日

EMNLP 2021 | 学习改写非自回归机器翻译的翻译结果

EMNLP 2021 | 学习改写非自回归机器翻译的翻译结果

专知会员服务

15+阅读 · 2021年12月25日

【NeurIPS2021】黑箱学习算法的信息理论泛化界

专知会员服务

23+阅读 · 2021年10月6日

不可错过！CMU最新《机器学习》2021课程，26讲从线性模型到强化学习

不可错过！CMU最新《机器学习》2021课程，26讲从线性模型到强化学习

专知会员服务

82+阅读 · 2021年9月25日

统计物理方法中的优化和机器学习

专知会员服务

50+阅读 · 2021年8月4日

【经典书】机器学习统计学，476页pdf

【经典书】机器学习统计学，476页pdf

专知会员服务

122+阅读 · 2021年7月19日

【字节跳动-李航】一种按序列进行对话状态跟踪的方法

【字节跳动-李航】一种按序列进行对话状态跟踪的方法

专知会员服务

30+阅读 · 2020年11月25日

【经典书】回归建模策略-线性模型、逻辑和有序回归应用，598页ppt，第二版

专知会员服务

53+阅读 · 2020年10月21日

【KDD2020】基于纳什强化学习的鲁棒垃圾邮件发送者检测

【KDD2020】基于纳什强化学习的鲁棒垃圾邮件发送者检测

专知会员服务

17+阅读 · 2020年8月16日

【推荐系统/计算广告/机器学习/CTR预估资料汇总】

【推荐系统/计算广告/机器学习/CTR预估资料汇总】

专知会员服务

88+阅读 · 2019年10月21日

去伪存真：因果约束下的图神经网络泛化

去伪存真：因果约束下的图神经网络泛化

PaperWeekly

0+阅读 · 2022年2月10日

EMNLP 2021 | 学习改写非自回归机器翻译的翻译结果

EMNLP 2021 | 学习改写非自回归机器翻译的翻译结果

专知

0+阅读 · 2021年12月25日

赛尔原创@EMNLP 2021 | 学习改写非自回归机器翻译的翻译结果

赛尔原创@EMNLP 2021 | 学习改写非自回归机器翻译的翻译结果

哈工大SCIR

0+阅读 · 2021年12月21日

目标检测中边界框的回归策略

目标检测中边界框的回归策略

极市平台

17+阅读 · 2019年9月8日

博客 | 回归类算法最全综述及逻辑回归重点讲解

博客 | 回归类算法最全综述及逻辑回归重点讲解

AI研习社

13+阅读 · 2018年11月29日

NIPS 2018 | 作为多目标优化的多任务学习：寻找帕累托最优解

NIPS 2018 | 作为多目标优化的多任务学习：寻找帕累托最优解

极市平台

20+阅读 · 2018年10月29日

目标跟踪算法分类

目标跟踪算法分类

算法与数据结构

20+阅读 · 2018年9月28日

文本分类又来了，用 Scikit-Learn 解决多类文本分类问题

文本分类又来了，用 Scikit-Learn 解决多类文本分类问题

AI研习社

14+阅读 · 2018年7月22日

已删除

将门创投

10+阅读 · 2018年5月2日

谷歌开源TFGAN：轻量级生成对抗网络工具库

谷歌开源TFGAN：轻量级生成对抗网络工具库

MOOC

12+阅读 · 2017年12月17日

支持增量式稀疏编码的在线协同目标跟踪研究

国家自然科学基金

0+阅读 · 2013年12月31日

多源空间线目标全局最优化与逻辑回归匹配方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

文本自动分类中样本重要性模型及应用研究

国家自然科学基金

0+阅读 · 2012年12月31日

面向进化多目标优化的局部自适应学习模型与算法研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于CSMA协议的无线网络控制系统的建模与优化

国家自然科学基金

0+阅读 · 2012年12月31日

复杂曲面零件修复中缺失形域曲面延拓算法与修复模型研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于特征建模优化与判别学习的Web spam识别技术研究

国家自然科学基金

0+阅读 · 2011年12月31日

云计算任务调度机制中多目标有向超图优化划分问题研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于目标的注意模型及在图像分割和目标检测中的应用

国家自然科学基金

1+阅读 · 2009年12月31日

垃圾邮件的不确定性机理研究

国家自然科学基金

0+阅读 · 2009年12月31日

A Unified Framework for Rank-based Evaluation Metrics for Link Prediction in Knowledge Graphs

Arxiv

0+阅读 · 2022年4月19日

Marginal log-linear models and mediation analysis

Arxiv

0+阅读 · 2022年4月18日

A combinatorial view of stochastic processes: White noise

Arxiv

0+阅读 · 2022年4月14日

Transformer Tracking

Arxiv

17+阅读 · 2021年3月29日

A Mathematical Introduction to Generative Adversarial Nets (GAN)

A Mathematical Introduction to Generative Adversarial Nets (GAN)

Arxiv

27+阅读 · 2020年9月1日

LayoutLM: Pre-training of Text and Layout for Document Image Understanding

LayoutLM: Pre-training of Text and Layout for Document Image Understanding

Arxiv

12+阅读 · 2020年2月19日

GAN Dissection: Visualizing and Understanding Generative Adversarial Networks

GAN Dissection: Visualizing and Understanding Generative Adversarial Networks

Arxiv

11+阅读 · 2018年12月8日

Bayesian Convolutional Neural Networks

Arxiv

19+阅读 · 2018年6月27日

Self-Attention with Relative Position Representations

Arxiv

14+阅读 · 2018年3月6日

Attention Is All You Need

Arxiv

27+阅读 · 2017年12月6日

阅读: 0 点赞: 0

小贴士

登录享主题订阅及个性化推荐

相关主题

垃圾邮件过滤

评价指标优化

在线顺序回归学习

热门VIP内容

开通专知VIP会员享更多权益服务

《乌克兰无人机产业：志愿者与政策在构建新兴无人机产业中的协同作用》最新报告

《人工智能辅助决策中的数据可视化：系统性综述》

人工智能驱动弹药制造现代化：美国陆军转型之路

《敏捷作战部署中枢纽-辐条基地选址优化研究》80页

相关VIP内容

【ICLR2022】序列生成的目标侧数据增强

【ICLR2022】序列生成的目标侧数据增强

专知会员服务

23+阅读 · 2022年2月14日

EMNLP 2021 | 学习改写非自回归机器翻译的翻译结果

EMNLP 2021 | 学习改写非自回归机器翻译的翻译结果

专知会员服务

15+阅读 · 2021年12月25日

【NeurIPS2021】黑箱学习算法的信息理论泛化界

专知会员服务

23+阅读 · 2021年10月6日

不可错过！CMU最新《机器学习》2021课程，26讲从线性模型到强化学习

不可错过！CMU最新《机器学习》2021课程，26讲从线性模型到强化学习

专知会员服务

82+阅读 · 2021年9月25日

统计物理方法中的优化和机器学习

专知会员服务

50+阅读 · 2021年8月4日

【经典书】机器学习统计学，476页pdf

【经典书】机器学习统计学，476页pdf

专知会员服务

122+阅读 · 2021年7月19日

【字节跳动-李航】一种按序列进行对话状态跟踪的方法

【字节跳动-李航】一种按序列进行对话状态跟踪的方法

专知会员服务

30+阅读 · 2020年11月25日

【经典书】回归建模策略-线性模型、逻辑和有序回归应用，598页ppt，第二版

专知会员服务

53+阅读 · 2020年10月21日

【KDD2020】基于纳什强化学习的鲁棒垃圾邮件发送者检测

【KDD2020】基于纳什强化学习的鲁棒垃圾邮件发送者检测

专知会员服务

17+阅读 · 2020年8月16日

【推荐系统/计算广告/机器学习/CTR预估资料汇总】

【推荐系统/计算广告/机器学习/CTR预估资料汇总】

专知会员服务

88+阅读 · 2019年10月21日

相关资讯

去伪存真：因果约束下的图神经网络泛化

去伪存真：因果约束下的图神经网络泛化

PaperWeekly

0+阅读 · 2022年2月10日

EMNLP 2021 | 学习改写非自回归机器翻译的翻译结果

EMNLP 2021 | 学习改写非自回归机器翻译的翻译结果

专知

0+阅读 · 2021年12月25日

赛尔原创@EMNLP 2021 | 学习改写非自回归机器翻译的翻译结果

赛尔原创@EMNLP 2021 | 学习改写非自回归机器翻译的翻译结果

哈工大SCIR

0+阅读 · 2021年12月21日

目标检测中边界框的回归策略

目标检测中边界框的回归策略

极市平台

17+阅读 · 2019年9月8日

博客 | 回归类算法最全综述及逻辑回归重点讲解

博客 | 回归类算法最全综述及逻辑回归重点讲解

AI研习社

13+阅读 · 2018年11月29日

NIPS 2018 | 作为多目标优化的多任务学习：寻找帕累托最优解

NIPS 2018 | 作为多目标优化的多任务学习：寻找帕累托最优解

极市平台

20+阅读 · 2018年10月29日

目标跟踪算法分类

目标跟踪算法分类

算法与数据结构

20+阅读 · 2018年9月28日

文本分类又来了，用 Scikit-Learn 解决多类文本分类问题

文本分类又来了，用 Scikit-Learn 解决多类文本分类问题

AI研习社

14+阅读 · 2018年7月22日

已删除

将门创投

10+阅读 · 2018年5月2日

谷歌开源TFGAN：轻量级生成对抗网络工具库

谷歌开源TFGAN：轻量级生成对抗网络工具库

MOOC

12+阅读 · 2017年12月17日

相关基金

支持增量式稀疏编码的在线协同目标跟踪研究

国家自然科学基金

0+阅读 · 2013年12月31日

多源空间线目标全局最优化与逻辑回归匹配方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

文本自动分类中样本重要性模型及应用研究

国家自然科学基金

0+阅读 · 2012年12月31日

面向进化多目标优化的局部自适应学习模型与算法研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于CSMA协议的无线网络控制系统的建模与优化

国家自然科学基金

0+阅读 · 2012年12月31日

复杂曲面零件修复中缺失形域曲面延拓算法与修复模型研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于特征建模优化与判别学习的Web spam识别技术研究

国家自然科学基金

0+阅读 · 2011年12月31日

云计算任务调度机制中多目标有向超图优化划分问题研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于目标的注意模型及在图像分割和目标检测中的应用

国家自然科学基金

1+阅读 · 2009年12月31日

垃圾邮件的不确定性机理研究

国家自然科学基金

0+阅读 · 2009年12月31日

相关论文

A Unified Framework for Rank-based Evaluation Metrics for Link Prediction in Knowledge Graphs

Arxiv

0+阅读 · 2022年4月19日

Marginal log-linear models and mediation analysis

Arxiv

0+阅读 · 2022年4月18日

A combinatorial view of stochastic processes: White noise

Arxiv

0+阅读 · 2022年4月14日

Transformer Tracking

Arxiv

17+阅读 · 2021年3月29日

A Mathematical Introduction to Generative Adversarial Nets (GAN)

A Mathematical Introduction to Generative Adversarial Nets (GAN)

Arxiv

27+阅读 · 2020年9月1日

LayoutLM: Pre-training of Text and Layout for Document Image Understanding

LayoutLM: Pre-training of Text and Layout for Document Image Understanding

Arxiv

12+阅读 · 2020年2月19日

GAN Dissection: Visualizing and Understanding Generative Adversarial Networks

GAN Dissection: Visualizing and Understanding Generative Adversarial Networks

Arxiv

11+阅读 · 2018年12月8日

Bayesian Convolutional Neural Networks

Arxiv

19+阅读 · 2018年6月27日

Self-Attention with Relative Position Representations

Arxiv

14+阅读 · 2018年3月6日

Attention Is All You Need

Arxiv

27+阅读 · 2017年12月6日

微信扫码咨询专知VIP会员