项目名称: 面向敏感网络图像过滤的原生数字图像文本提取关键技术研究

项目编号: No.61201424

项目类型: 青年科学基金项目

立项/批准年度: 2013

项目学科: 电子学与信息系统

项目作者: 王恺

作者单位: 南开大学

项目金额: 24万元

中文摘要: 原生数字图像是用计算机软件生成的图像。不良文本信息可以很容易地转为原生数字图像在网络传播,从而避过文本过滤技术。原生数字图像文本提取工作面临分辨率低、边缘柔化所引起的连通体生成困难这一问题,使得以往复杂图像文本提取研究中常用的基于连通体分析的方法失效。本课题拟构建多级优化模型,通过像素点级、连通体级、文字级的同步优化解决连通体生成困难问题;采用基于样本库的自适应学习解决优化模型的参数选取问题;利用彩色图像过分割等方法解决模型求解效率问题,并基于过分割结果融合及软决策方式解决超像素边界与文字边界的匹配问题。针对敏感网络图像过滤应用,将敏感关键词信息融入到优化模型中,以高召回率检测敏感图像,解决不良文本内容以图像方式在网络传播所带来的社会问题。

中文关键词: 文字信息;原生数字图像;文本分割;光学字符识别;基于内容的图像过滤

英文摘要: Born-digital images are generated directly on the computer. Harmful text transmitted online is easily converted into born-digital images to avoid text-based filtering. In previous studies on text extraction from complex images, component connector-based methods have been widely used. However, it is a difficult task for born-digital images to generate component connectors because born-digital images are inherently low-resolution for online transfer and often suffer from anti-aliasing. To solve this problem, a hierarchical optimization model, that allows integration of features computed at different levels of the quantization hierarchy, will be set up in this study. Parameters of the model will be automatically estimated by supervised training. To reduce the computational time for solving the hierarchical model, superpixels, that generated by over-segmentation of color images, will be considered as an alternative for pixels. Furthermore, techniques of using multiple segmentations or soft decision will be applied during over-segmentation to ensure that superpixels align well with the boundary of characters. Aiming at the application of content-based web image filtering, predefined keywords will be integrated into the hierarchical model, so that the images embedded with harmful text can be detected with high recall

英文关键词: text information;born-digital image;text segmentation;character recognition;content-based image filtering

成为VIP会员查看完整内容
0

相关内容

【SIGGRAPH 2022】域增强的任意图像风格对比迁移方法
专知会员服务
26+阅读 · 2022年4月20日
军事知识图谱构建技术
专知会员服务
127+阅读 · 2022年4月8日
6G物理层AI关键技术白皮书(2022)
专知会员服务
43+阅读 · 2022年3月21日
专知会员服务
11+阅读 · 2021年10月3日
专知会员服务
72+阅读 · 2021年5月21日
【博士论文】搜索引擎中的实体推荐关键技术研究
专知会员服务
45+阅读 · 2020年12月9日
深度学习目标检测方法综述
专知会员服务
276+阅读 · 2020年8月1日
【新书】自然语言处理表示学习技术,349页pdf,清华大学
专知会员服务
174+阅读 · 2020年7月11日
基于OpenCV的图像阴影去除
极市平台
1+阅读 · 2022年2月27日
综述:图像滤波常用算法实现及原理解析
极市平台
0+阅读 · 2022年1月29日
【数字孪生】数字孪生技术从概念到应用
产业智能官
91+阅读 · 2020年2月16日
基于二进制哈希编码快速学习的快速图像检索
极市平台
12+阅读 · 2018年5月17日
一文读懂图像压缩算法
七月在线实验室
17+阅读 · 2018年5月2日
图像检索研究进展:浅层、深层特征及特征融合
中国计算机学会
122+阅读 · 2018年3月26日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
小贴士
相关VIP内容
【SIGGRAPH 2022】域增强的任意图像风格对比迁移方法
专知会员服务
26+阅读 · 2022年4月20日
军事知识图谱构建技术
专知会员服务
127+阅读 · 2022年4月8日
6G物理层AI关键技术白皮书(2022)
专知会员服务
43+阅读 · 2022年3月21日
专知会员服务
11+阅读 · 2021年10月3日
专知会员服务
72+阅读 · 2021年5月21日
【博士论文】搜索引擎中的实体推荐关键技术研究
专知会员服务
45+阅读 · 2020年12月9日
深度学习目标检测方法综述
专知会员服务
276+阅读 · 2020年8月1日
【新书】自然语言处理表示学习技术,349页pdf,清华大学
专知会员服务
174+阅读 · 2020年7月11日
相关资讯
基于OpenCV的图像阴影去除
极市平台
1+阅读 · 2022年2月27日
综述:图像滤波常用算法实现及原理解析
极市平台
0+阅读 · 2022年1月29日
【数字孪生】数字孪生技术从概念到应用
产业智能官
91+阅读 · 2020年2月16日
基于二进制哈希编码快速学习的快速图像检索
极市平台
12+阅读 · 2018年5月17日
一文读懂图像压缩算法
七月在线实验室
17+阅读 · 2018年5月2日
图像检索研究进展:浅层、深层特征及特征融合
中国计算机学会
122+阅读 · 2018年3月26日
相关基金
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
微信扫码咨询专知VIP会员