项目名称: 维吾尔文印刷文档图像中不良信息过滤关键技术研究

项目编号: No.61461049

项目类型: 地区科学基金项目

立项/批准年度: 2015

项目学科: 无线电电子学、电信技术

项目作者: 地里木拉提·吐尔逊

作者单位: 新疆大学

项目金额: 40万元

中文摘要: 面对迅速增长的WEB数据,如何搜集并从中发现信息,对信息进行分析和理解、提取、组织和处理、如何针对特定的需求获取最新的信息、如何区分有用的信息和不良有害信息、如何管理网络信息的传播逐渐成为当前信息科学与技术领域面临的一大挑战。尤其是境、内外三股势力将网络信息的传播方式作为内外勾结的主要渠道的今天,必须采用现代科技手段,加以监控不良信息的传播、定位和取证,这对我区民族团结、社会稳定、以及国家的长治久安具有重要的现实意义。本课题在充分调研中、英文不良信息监控技术的新理论、新方法和新技术的基础上,从维吾尔语语言文字特点出发,紧密结合实际应用需求,以理论研究和实证研究相结合的方法开展网页、微信、微博等诸多网络应用中出现的印刷体维吾尔文文档图像的获取,版面结构分析,复杂背景下的文档图像中文本区域定位与提取技术,以及在被分割的文本区域中搜索与匹配关键词语等关键技术研究。

中文关键词: 文档图像;不良信息过滤;信息内容安全;光学字符识别;印刷体维吾尔文

英文摘要: Facing with the rapid growth of WEB data, how to collect and extract the useful information, how to do the information analysis and understanding, extraction, organization and processing, how to access to the latest information according to specific requirements, how to distinguish the useful information and the sensitive harmful information, how to manage the information transmission procedure going through the internet has gradually become the major challenges in current information science and technology. Especially the inside or outside three forces take the network as the main information delivering path to extrange ideas, so we must use modern means of science and technology to positioning, forensics, and monitoring the spread of harmful information, and the results of those have the important practical significance to national unity, social stability. This project will take the full investigation of English and Chinese sensitive information monitoring technology, and on the basis of deep learning the new theory, new method and new technology, then combining the Uyghur language characteristics with actual application requirements, will conduct the research of new theory and new technology for collecting Uighur document images from network and preprocessing (document images extraction from webpages, document image structure analysis), key technologies for Uyghur text area localization and extraction from document images ,and variable template matching based keyword detection algorithms ect.

英文关键词: Document Image;Keyword Spotting;Information Content Security;OCR;Printed Uyghur script

成为VIP会员查看完整内容
0

相关内容

军事知识图谱构建技术
专知会员服务
125+阅读 · 2022年4月8日
基于深度学习的图异常检测技术综述
专知会员服务
83+阅读 · 2021年7月28日
专知会员服务
69+阅读 · 2021年3月29日
自动文本摘要研究综述
专知会员服务
67+阅读 · 2021年1月31日
专知会员服务
71+阅读 · 2020年12月12日
【博士论文】搜索引擎中的实体推荐关键技术研究
专知会员服务
44+阅读 · 2020年12月9日
【CIKM2020】神经贝叶斯信息处理,220页ppt,国立交通大学
专知会员服务
34+阅读 · 2020年10月26日
专知会员服务
195+阅读 · 2020年10月14日
专知会员服务
142+阅读 · 2020年9月6日
大数据安全技术研究进展
专知会员服务
92+阅读 · 2020年5月2日
视频隐私保护技术综述
专知
3+阅读 · 2022年1月19日
【动态】第二届CSIG图像图形技术挑战赛亚军团队介绍
中国图象图形学学会CSIG
1+阅读 · 2022年1月13日
图像描述生成研究进展
专知
1+阅读 · 2021年3月29日
微信看一看如何过滤广告文章?
微信AI
0+阅读 · 2021年3月29日
光学遥感图像目标检测算法综述
专知
8+阅读 · 2021年3月23日
多模态视觉语言表征学习研究综述
专知
27+阅读 · 2020年12月3日
基于知识图谱的文本挖掘 - 超越文本挖掘
专知
38+阅读 · 2019年8月18日
图像检索研究进展:浅层、深层特征及特征融合
中国计算机学会
122+阅读 · 2018年3月26日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
Arxiv
0+阅读 · 2022年4月20日
Arxiv
0+阅读 · 2022年4月18日
Chinese Idiom Paraphrasing
Arxiv
0+阅读 · 2022年4月15日
小贴士
相关VIP内容
军事知识图谱构建技术
专知会员服务
125+阅读 · 2022年4月8日
基于深度学习的图异常检测技术综述
专知会员服务
83+阅读 · 2021年7月28日
专知会员服务
69+阅读 · 2021年3月29日
自动文本摘要研究综述
专知会员服务
67+阅读 · 2021年1月31日
专知会员服务
71+阅读 · 2020年12月12日
【博士论文】搜索引擎中的实体推荐关键技术研究
专知会员服务
44+阅读 · 2020年12月9日
【CIKM2020】神经贝叶斯信息处理,220页ppt,国立交通大学
专知会员服务
34+阅读 · 2020年10月26日
专知会员服务
195+阅读 · 2020年10月14日
专知会员服务
142+阅读 · 2020年9月6日
大数据安全技术研究进展
专知会员服务
92+阅读 · 2020年5月2日
相关资讯
视频隐私保护技术综述
专知
3+阅读 · 2022年1月19日
【动态】第二届CSIG图像图形技术挑战赛亚军团队介绍
中国图象图形学学会CSIG
1+阅读 · 2022年1月13日
图像描述生成研究进展
专知
1+阅读 · 2021年3月29日
微信看一看如何过滤广告文章?
微信AI
0+阅读 · 2021年3月29日
光学遥感图像目标检测算法综述
专知
8+阅读 · 2021年3月23日
多模态视觉语言表征学习研究综述
专知
27+阅读 · 2020年12月3日
基于知识图谱的文本挖掘 - 超越文本挖掘
专知
38+阅读 · 2019年8月18日
图像检索研究进展:浅层、深层特征及特征融合
中国计算机学会
122+阅读 · 2018年3月26日
相关基金
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员