FCS 12(1) 文章 | 多层次的中文垃圾短信高效识别方法 - 专知

会员服务 ·

0

FCS 12(1) 文章 | 多层次的中文垃圾短信高效识别方法

2018 年 3 月 23 日 FCS 计算机科学前沿

导读

垃圾短信识别问题涉及到自然语言处理的许多方面，解决这一问题不仅可以提高用户体验移动生活的质量，还能有助于当前移动应用中出现的短文本(例如微信、微博)的分析研究工作。

针对垃圾短信具有稀疏性、变换性和实时性的特点，本文提出了三种在不同层次的垃圾短信识别方法：基于符号特征的识别、基于文本相似度的识别和基于模式匹配的识别。结合这些方法，文章得到了一种多层次的垃圾短信识别方法。为了丰富模式库，减少人力和时间消耗，文章提出了一种准模式学习方法，在模式匹配过程中利用准模式匹配结果。该方法可以从短信语料库中学习到许多有趣的新模式。文章最后进行了综合分析，表明本文提出的垃圾短信识别方法的准确率达到95.18%，召回率达95.51%。

文章精要

如需阅读本期推荐文章的全文，请点左下角的「阅读原文」链接。

Frontiers of Computer Science

期刊封面_icon.jpg Frontiers of Computer Science （FCS）是由教育部主管、高等教育出版社出版、SpringerNature 公司海外发行的英文学术期刊。本刊于 2007 年创刊，双月刊，全球发行。主要刊登计算机科学领域具有创新性的综述论文、研究论文等。本刊主编为李未院士，执行主编为熊璋教授和周志华教授。编委会及青年 AE 团队由国内外知名学者及优秀青年学者组成。本刊被 SCI、Ei、DBLP、INSPEC、SCOPUS 和中国科学引文数据库（CSCD）核心库等收录，为 CCF 推荐期刊；两次入选“中国科技期刊国际影响力提升计划”；入选“第4届中国国际化精品科技期刊”。

长按二维码关注Frontiers of Computer Science公众号

登录查看更多

1

相关内容

FCS

FCS：Frontiers of Computer Science。 Explanation：计算机科学前沿。 Publisher：Higher Education Press。 SIT： http://dblp.uni-trier.de/db/journals/fcsc/

基于深度学习的主题模型研究，中文综述，29页pdf，计算机学报

基于深度学习的主题模型研究，中文综述，29页pdf，计算机学报

专知会员服务

124+阅读 · 2020年5月20日

基于深度学习的手语识别综述

基于深度学习的手语识别综述

专知会员服务

47+阅读 · 2020年5月18日

面向司法案件的案情知识图谱自动构建

面向司法案件的案情知识图谱自动构建

专知会员服务

126+阅读 · 2020年4月17日

【哈工大】基于抽取的高考作文生成

【哈工大】基于抽取的高考作文生成

专知会员服务

37+阅读 · 2020年3月10日

【CAAI 2019】面向智慧教育的学生认知建模与学习路径推荐,中国科技大学教授|陈恩红

【CAAI 2019】面向智慧教育的学生认知建模与学习路径推荐,中国科技大学教授|陈恩红

专知会员服务

41+阅读 · 2019年12月1日

【CAAI 2019】基于知识智能的机器人技能学习，清华大学|孙富春

【CAAI 2019】基于知识智能的机器人技能学习，清华大学|孙富春

专知会员服务

43+阅读 · 2019年12月1日

【AAAI2020-清华大学】高效的异构协同过滤推荐（Efficient Heterogeneous Collaborative Filtering without Negative Sampling for Recommendation），张敏，马少平等

【AAAI2020-清华大学】高效的异构协同过滤推荐（Efficient Heterogeneous Collaborative Filtering without Negative Sampling for Recommendation），张敏，马少平等

专知会员服务

61+阅读 · 2019年11月22日

【BAAI北京智源大会】自然语言处理Knowledge-Guided NLP ，清华大学刘知远，附45页PDF

【BAAI北京智源大会】自然语言处理Knowledge-Guided NLP ，清华大学刘知远，附45页PDF

专知会员服务

84+阅读 · 2019年11月20日

【CCF优秀博士学位论文奖-2019】表示学习的高效算法，清华大学陈健飞

【CCF优秀博士学位论文奖-2019】表示学习的高效算法，清华大学陈健飞

专知会员服务

48+阅读 · 2019年11月8日

周志华教授：如何做研究与写论文？

周志华教授：如何做研究与写论文？

专知会员服务

159+阅读 · 2019年10月9日

【FCS优秀青年计算机科学家论坛】李宇峰：安全半监督学习综述

【FCS优秀青年计算机科学家论坛】李宇峰：安全半监督学习综述

FCS

6+阅读 · 2019年6月17日

基于联合视图合成和视差求精的双目立体匹配

基于联合视图合成和视差求精的双目立体匹配

FCS

6+阅读 · 2019年6月2日

跨多个异构数据源的实体对齐

跨多个异构数据源的实体对齐

FCS

15+阅读 · 2019年3月13日

基于统计关系学习的自动数据清洗

基于统计关系学习的自动数据清洗

FCS

7+阅读 · 2019年3月1日

基于差分隐私的地理社交网络发布

基于差分隐私的地理社交网络发布

FCS

9+阅读 · 2019年2月22日

卷积自适应降噪自动编码器

卷积自适应降噪自动编码器

FCS

8+阅读 · 2019年1月3日

基于样本选择的安全图半监督学习方法

基于样本选择的安全图半监督学习方法

FCS

7+阅读 · 2018年7月20日

FCS 12(2) 智慧城市与城市计算专栏 | 基于轨迹流的在线聚类分析

FCS 12(2) 智慧城市与城市计算专栏 | 基于轨迹流的在线聚类分析

FCS

6+阅读 · 2018年5月7日

FCS 12(1) 文章 | 知识图谱综述

FCS 12(1) 文章 | 知识图谱综述

FCS

8+阅读 · 2018年3月12日

FCS 11(6) 文章 | 图像检索基于颜色空间量化的聚类

FCS 11(6) 文章 | 图像检索基于颜色空间量化的聚类

FCS

7+阅读 · 2018年1月11日

FastSpeech: Fast, Robust and Controllable Text to Speech

FastSpeech: Fast, Robust and Controllable Text to Speech

Arxiv

3+阅读 · 2019年5月22日

Building Knowledge Graphs About Political Agents in the Age of Misinformation

Building Knowledge Graphs About Political Agents in the Age of Misinformation

Arxiv

5+阅读 · 2019年1月29日

Fast deep reinforcement learning using online adjustments from the past

Arxiv

3+阅读 · 2018年10月18日

Speeding-up Object Detection Training for Robotics with FALKON

Speeding-up Object Detection Training for Robotics with FALKON

Arxiv

6+阅读 · 2018年8月27日

Fast and Accurate, Convolutional Neural Network Based Approach for Object Detection from UAV

Fast and Accurate, Convolutional Neural Network Based Approach for Object Detection from UAV

Arxiv

6+阅读 · 2018年8月16日

Automatically Designing CNN Architectures for Medical Image Segmentation

Automatically Designing CNN Architectures for Medical Image Segmentation

Arxiv

10+阅读 · 2018年7月19日

SpectralLeader: Online Spectral Learning for Single Topic Models

Arxiv

4+阅读 · 2018年4月26日

Parallel Tracking and Verifying

Arxiv

8+阅读 · 2018年1月30日

Comparative Study of ECO and CFNet Trackers in Noisy Environment

Arxiv

5+阅读 · 2018年1月29日

DAiSEE: Towards User Engagement Recognition in the Wild

Arxiv

7+阅读 · 2017年12月15日

VIP会员

相关主题

自然语言处理

相关VIP内容

基于深度学习的主题模型研究，中文综述，29页pdf，计算机学报

基于深度学习的主题模型研究，中文综述，29页pdf，计算机学报

专知会员服务

124+阅读 · 2020年5月20日

基于深度学习的手语识别综述

基于深度学习的手语识别综述

专知会员服务

47+阅读 · 2020年5月18日

面向司法案件的案情知识图谱自动构建

面向司法案件的案情知识图谱自动构建

专知会员服务

126+阅读 · 2020年4月17日

【哈工大】基于抽取的高考作文生成

【哈工大】基于抽取的高考作文生成

专知会员服务

37+阅读 · 2020年3月10日

【CAAI 2019】面向智慧教育的学生认知建模与学习路径推荐,中国科技大学教授|陈恩红

【CAAI 2019】面向智慧教育的学生认知建模与学习路径推荐,中国科技大学教授|陈恩红

专知会员服务

41+阅读 · 2019年12月1日

【CAAI 2019】基于知识智能的机器人技能学习，清华大学|孙富春

【CAAI 2019】基于知识智能的机器人技能学习，清华大学|孙富春

专知会员服务

43+阅读 · 2019年12月1日

【AAAI2020-清华大学】高效的异构协同过滤推荐（Efficient Heterogeneous Collaborative Filtering without Negative Sampling for Recommendation），张敏，马少平等

【AAAI2020-清华大学】高效的异构协同过滤推荐（Efficient Heterogeneous Collaborative Filtering without Negative Sampling for Recommendation），张敏，马少平等

专知会员服务

61+阅读 · 2019年11月22日

【BAAI北京智源大会】自然语言处理Knowledge-Guided NLP ，清华大学刘知远，附45页PDF

【BAAI北京智源大会】自然语言处理Knowledge-Guided NLP ，清华大学刘知远，附45页PDF

专知会员服务

84+阅读 · 2019年11月20日

【CCF优秀博士学位论文奖-2019】表示学习的高效算法，清华大学陈健飞

【CCF优秀博士学位论文奖-2019】表示学习的高效算法，清华大学陈健飞

专知会员服务

48+阅读 · 2019年11月8日

周志华教授：如何做研究与写论文？

周志华教授：如何做研究与写论文？

专知会员服务

159+阅读 · 2019年10月9日

热门VIP内容

开通专知VIP会员享更多权益服务

《复杂工程系统模型驱动设计决策支持系统：早期设计阶段挑战》最新138页

《日本陆上自卫队2040年作战方式与未来作战研究》最新23页slides

人工智能作为战争武器

《后勤保障》最新23页

相关资讯

【FCS优秀青年计算机科学家论坛】李宇峰：安全半监督学习综述

【FCS优秀青年计算机科学家论坛】李宇峰：安全半监督学习综述

FCS

6+阅读 · 2019年6月17日

基于联合视图合成和视差求精的双目立体匹配

基于联合视图合成和视差求精的双目立体匹配

FCS

6+阅读 · 2019年6月2日

跨多个异构数据源的实体对齐

跨多个异构数据源的实体对齐

FCS

15+阅读 · 2019年3月13日

基于统计关系学习的自动数据清洗

基于统计关系学习的自动数据清洗

FCS

7+阅读 · 2019年3月1日

基于差分隐私的地理社交网络发布

基于差分隐私的地理社交网络发布

FCS

9+阅读 · 2019年2月22日

卷积自适应降噪自动编码器

卷积自适应降噪自动编码器

FCS

8+阅读 · 2019年1月3日

基于样本选择的安全图半监督学习方法

基于样本选择的安全图半监督学习方法

FCS

7+阅读 · 2018年7月20日

FCS 12(2) 智慧城市与城市计算专栏 | 基于轨迹流的在线聚类分析

FCS 12(2) 智慧城市与城市计算专栏 | 基于轨迹流的在线聚类分析

FCS

6+阅读 · 2018年5月7日

FCS 12(1) 文章 | 知识图谱综述

FCS 12(1) 文章 | 知识图谱综述

FCS

8+阅读 · 2018年3月12日

FCS 11(6) 文章 | 图像检索基于颜色空间量化的聚类

FCS 11(6) 文章 | 图像检索基于颜色空间量化的聚类

FCS

7+阅读 · 2018年1月11日

相关论文

FastSpeech: Fast, Robust and Controllable Text to Speech

FastSpeech: Fast, Robust and Controllable Text to Speech

Arxiv

3+阅读 · 2019年5月22日

Building Knowledge Graphs About Political Agents in the Age of Misinformation

Building Knowledge Graphs About Political Agents in the Age of Misinformation

Arxiv

5+阅读 · 2019年1月29日

Fast deep reinforcement learning using online adjustments from the past

Arxiv

3+阅读 · 2018年10月18日

Speeding-up Object Detection Training for Robotics with FALKON

Speeding-up Object Detection Training for Robotics with FALKON

Arxiv

6+阅读 · 2018年8月27日

Fast and Accurate, Convolutional Neural Network Based Approach for Object Detection from UAV

Fast and Accurate, Convolutional Neural Network Based Approach for Object Detection from UAV

Arxiv

6+阅读 · 2018年8月16日

Automatically Designing CNN Architectures for Medical Image Segmentation

Automatically Designing CNN Architectures for Medical Image Segmentation

Arxiv

10+阅读 · 2018年7月19日

SpectralLeader: Online Spectral Learning for Single Topic Models

Arxiv

4+阅读 · 2018年4月26日

Parallel Tracking and Verifying

Arxiv

8+阅读 · 2018年1月30日

Comparative Study of ECO and CFNet Trackers in Noisy Environment

Arxiv

5+阅读 · 2018年1月29日

DAiSEE: Towards User Engagement Recognition in the Wild

Arxiv

7+阅读 · 2017年12月15日

大家都在搜

CMU博士论文

无人机集群

久别重逢话双塔

国防科技创新

论文浅尝 - ICLR2020 | 通过神经逻辑归纳学习有效地解释

微信扫码咨询专知VIP会员