又一篇CVPR 2022论文被指抄袭，平安保险研究者控诉IBM苏黎世团队

会员服务 ·

又一篇CVPR 2022论文被指抄袭，平安保险研究者控诉IBM苏黎世团队

2022 年 6 月 28 日 机器之心

机器之心报道

编辑：张倩

「他们并不是照抄文本，而是剽窃想法。」

昨天，有人在 reddit 上发帖称，IBM 苏黎世研究中心剽窃了自己的论文，而且还被 CVPR 2022 接收了。

这位发帖者写道：

我叫 Xianbiao Qi，是一位有十多年研究经验的计算机视觉研究者。我写这个博客是为了投诉一个严重的案例：IBM 苏黎世研究中心的员工蓄意剽窃我们的论文。他们并不是照抄文本，而是剽窃想法。

Qi 提到的疑似被抄袭的论文题为「PingAn-VCGroup's Solution for ICDAR 2021 Competition on Scientific Literature Parsing Task B: Table Recognition to HTML（平安 VCGroup 为 ICDAR 2021 科学文献解析竞赛任务 B 提供的解决方案：HTML 表格识别）」，作者来自平安保险和平安科技，上传 arXiv 的时间是 2021 年 5 月份，2021 年 7 月份公布了代码，2021 年 9 月发布了 Tablemaster 预训练模型，2021 年 11 月发布了 tablemaster_mmocr docker 环境。论文中提到的竞赛是 2021 年 4 月结束的，由 IBM 的另一个团队主办。

论文链接：https://arxiv.org/pdf/2105.01848.pdf

如论文标题所述，这篇文章为 ICDAR 2021 科学文献解析竞赛任务 B（HTML 表格识别）提供了一套解决方案。具体来说，他们将表格内容识别分为四个子任务：表格结构识别、文本行检测、文本行识别和框分配。表格结构识别算法是基于一种鲁棒的图像文本识别算法 MASTER 定制的。PSENet 用于检测表图像中的每个文本行。文本行识别模型也建立在 MASTER 之上。最后，在框分配阶段，他们将 PSENet 检测到的文本框与通过表结构预测重构的结构项相关联，并将文本行的可识别内容填充到对应项中。

被指抄袭的 IBM 论文题为「TableFormer: Table Structure Understanding with Transformers（TableFormer：用 Transformer 理解表结构）」，上传 arXiv 的时间是 2022 年 3 月份，提交给 CVPR 的时间未知。

论文链接：https://arxiv.org/pdf/2203.01017.pdf

在这篇论文中，IBM 的研究人员提出了一种新的表结构识别模型，它从两个方面改进了最新的端到端深度学习模型（即来自 PubTabNet 的 encoder-dual-decoder）。首先，他们引入了一种新的目标检测解码器用于表格单元格。通过这种方式，他们可以直接从 PDF 源中获取编程式 PDF 的表格单元格内容，从而避免了定制 OCR 解码器的训练。这种架构上的改变带来了更精确的表格内容提取。其次，他们将 LSTM 解码器替换为基于 transformer 的解码器。

Qi 表示，IBM 的这篇论文剽窃了他们的方法论、预处理、后处理、可视效果、推理、系统级解决方案、代码、预训练模型等内容，但「为了不被抓住」，他们没有引用 Qi 等人的论文。