项目名称: 基于朴素贝叶斯算法的藏文垃圾短信过滤研究
项目编号: No.61262086
项目类型: 地区科学基金项目
立项/批准年度: 2012
项目学科: 自动化技术、计算机技术
项目作者: 拥措
作者单位: 西藏大学
项目金额: 43万元
中文摘要: 近年来藏文移动终端的研发和推广工作蓬勃发展,对藏文化的发展起到了深远的意义,但同时对信息安全带来了巨大挑战。本项目拟研究分析藏文垃圾短信,结合藏文自身的特点,把广泛适用于中文文本分类的朴素贝叶斯算法应用在藏文垃圾短信过滤研究上,通过收集真实藏文短信来建立藏文短信语料库,研究国内外常见藏文手机编码自动识别和转换、藏文短信自动分词和藏文垃圾短信特征项提取等关键技术,对贝叶斯分类模型进行了结果分析与评估,探索藏文垃圾短信过滤的有效方法。
中文关键词: 垃圾短信;藏文;朴素卑叶斯;短信过滤;特征提取
英文摘要: In recent years, The R & D and promotion of Tibetan mobile terminals are developping vigorously, it has played a far-reaching significance for the development of Tibetan culture, but at the same time this brought great challenges to information security.
英文关键词: SMS Spam;Tibetan;Native Bayesian;SMS Filtering;Feature Extraction