Accurate layout analysis without subsequent text-line segmentation remains an ongoing challenge, especially when facing the Kangyur, a kind of historical Tibetan document featuring considerable touching components and mottled background. Aiming at identifying different regions in document images, layout analysis is indispensable for subsequent procedures such as character recognition. However, there was only a little research being carried out to perform line-level layout analysis which failed to deal with the Kangyur. To obtain the optimal results, a fine-grained sub-line level layout analysis approach is presented. Firstly, we introduced an accelerated method to build the dataset which is dynamic and reliable. Secondly, enhancement had been made to the SOLOv2 according to the characteristics of the Kangyur. Then, we fed the enhanced SOLOv2 with the prepared annotation file during the training phase. Once the network is trained, instances of the text line, sentence, and titles can be segmented and identified during the inference stage. The experimental results show that the proposed method delivers a decent 72.7% AP on our dataset. In general, this preliminary research provides insights into the fine-grained sub-line level layout analysis and testifies the SOLOv2-based approaches. We also believe that the proposed methods can be adopted on other language documents with various layouts.


翻译:准确的布局分析,而没有随后的文字线分割,仍然是一项持续的挑战,特别是在面临藏藏历史文件Kangyur时,这是一种藏藏历史文件,具有相当的触摸成分和扭曲的背景。为了在文件图像中辨别不同区域,布局分析对于随后的程序,例如字符识别等程序是必不可少的。然而,目前只进行了一些小研究,以进行线级布局分析,而未能处理Kangyur的布局分析。为了取得最佳结果,提出了细微细微的子线级布局分析方法。首先,我们采用了一种加速的方法,以构建动态和可靠的数据集。第二,根据Kangyur的特征对SOLov2进行了改进。然后,我们在培训阶段用已编写的说明文件向增强的SOLov2提供了强化的SOLov2。一旦网络培训,文字线、句和标题的一些实例可以在推断阶段进行分解和识别。实验结果显示,拟议的方法为我们数据集提供了适当的72.7% 总的来说,这一初步研究为精细的SOLO2版式版图提供了深刻的见解,我们还相信以各种方法。

0
下载
关闭预览

相关内容

专知会员服务
40+阅读 · 2021年9月14日
专知会员服务
55+阅读 · 2021年3月15日
专知会员服务
50+阅读 · 2021年1月19日
多标签学习的新趋势(2020 Survey)
专知会员服务
41+阅读 · 2020年12月6日
零样本文本分类,Zero-Shot Learning for Text Classification
专知会员服务
95+阅读 · 2020年5月31日
【Manning新书】现代Java实战,592页pdf
专知会员服务
99+阅读 · 2020年5月22日
开源书:PyTorch深度学习起步
专知会员服务
50+阅读 · 2019年10月11日
【论文笔记】通俗理解少样本文本分类 (Few-Shot Text Classification) (1)
深度学习自然语言处理
7+阅读 · 2020年4月8日
Transferring Knowledge across Learning Processes
CreateAMind
27+阅读 · 2019年5月18日
TorchSeg:基于pytorch的语义分割算法开源了
极市平台
20+阅读 · 2019年1月28日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
笔记 | Sentiment Analysis
黑龙江大学自然语言处理实验室
10+阅读 · 2018年5月6日
上百份文字的检测与识别资源,包含数据集、code和paper
数据挖掘入门与实战
17+阅读 · 2017年12月7日
【推荐】视频目标分割基础
机器学习研究会
9+阅读 · 2017年9月19日
Arxiv
8+阅读 · 2021年6月1日
An Analysis of Object Embeddings for Image Retrieval
Arxiv
4+阅读 · 2019年5月28日
VIP会员
相关VIP内容
Top
微信扫码咨询专知VIP会员