项目名称: 视频图像中不良文本的识别与过滤-维吾尔语系

项目编号: No.61163026

项目类型: 地区科学基金项目

立项/批准年度: 2012

项目学科: 计算机科学学科

项目作者: 哈力旦.阿布都热依木

作者单位: 新疆大学

项目金额: 48万元

中文摘要: 网络己成为一种人们获取信息和传递信息的重要手段,但随之而来的不良信息也越来越猖獗。打击不良信息的传播,保护青少年健康成长,对维护新疆的和平稳定发展有极其重要的意义。本项目在建立的视频图像中维吾尔文文本定位和提取的基本框架的基础上,首先构建图像文本语料库和基于切分策略的维吾尔文字识别模型, 针对识别的维吾尔文不良文本,利用tf-idf 特征提取方法抽取文本的词汇方面特征,采用统计量特征选择方法对抽取到的特征进行必要地取舍,并提取几个具有明显区分能力的结构特征,采用支持向量机、贝叶斯、神经网络等算法自动过滤掉不良文本。最终针对多种算法进行试验,选择适合维吾尔文本的多技术联合、分层过滤的方法,建立一套完整有效的视频图像中维吾尔文不良文本的过滤系统。该研究成果将为网络传输健康的维吾尔文信息提供坚实的保障,并鉴于维吾尔文与阿拉伯文极近的亲缘关系,可以推广应用到阿拉伯文信息过滤技术上。

中文关键词: 维吾尔文文本分类;文本过滤;关键帧提取;文字定位与识别;语料库设计

英文摘要:

英文关键词: uygur text classification;text filtering;key frame extraction;text location and recognition;corpus design

成为VIP会员查看完整内容
0

相关内容

【AAAI2022】上下文感知的词语替换与文本溯源
专知会员服务
17+阅读 · 2022年1月23日
首篇「多模态摘要」综述论文
专知会员服务
105+阅读 · 2021年9月14日
专知会员服务
25+阅读 · 2021年8月7日
专知会员服务
20+阅读 · 2021年7月19日
专知会员服务
69+阅读 · 2021年5月21日
专知会员服务
31+阅读 · 2021年5月8日
专知会员服务
39+阅读 · 2021年4月5日
专知会员服务
193+阅读 · 2020年10月14日
【干货】多文本人脸生成
中国图象图形学学会CSIG
2+阅读 · 2021年12月14日
英伟达给你工具,用Python识别车辆信息
机器之心
0+阅读 · 2021年12月8日
电子病历文本挖掘研究综述
专知
3+阅读 · 2021年3月27日
基于知识图谱的文本挖掘 - 超越文本挖掘
专知
38+阅读 · 2019年8月18日
深度学习在金融文本情感分类中的应用
AI前线
36+阅读 · 2019年1月12日
阿里健康夺冠中文电子病历实体识别评测任务
AI掘金志
40+阅读 · 2018年8月17日
特征工程的特征理解(一)
机器学习研究会
10+阅读 · 2017年10月23日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2022年4月19日
Chinese Idiom Paraphrasing
Arxiv
0+阅读 · 2022年4月15日
小贴士
相关VIP内容
【AAAI2022】上下文感知的词语替换与文本溯源
专知会员服务
17+阅读 · 2022年1月23日
首篇「多模态摘要」综述论文
专知会员服务
105+阅读 · 2021年9月14日
专知会员服务
25+阅读 · 2021年8月7日
专知会员服务
20+阅读 · 2021年7月19日
专知会员服务
69+阅读 · 2021年5月21日
专知会员服务
31+阅读 · 2021年5月8日
专知会员服务
39+阅读 · 2021年4月5日
专知会员服务
193+阅读 · 2020年10月14日
相关资讯
【干货】多文本人脸生成
中国图象图形学学会CSIG
2+阅读 · 2021年12月14日
英伟达给你工具,用Python识别车辆信息
机器之心
0+阅读 · 2021年12月8日
电子病历文本挖掘研究综述
专知
3+阅读 · 2021年3月27日
基于知识图谱的文本挖掘 - 超越文本挖掘
专知
38+阅读 · 2019年8月18日
深度学习在金融文本情感分类中的应用
AI前线
36+阅读 · 2019年1月12日
阿里健康夺冠中文电子病历实体识别评测任务
AI掘金志
40+阅读 · 2018年8月17日
特征工程的特征理解(一)
机器学习研究会
10+阅读 · 2017年10月23日
相关基金
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员