感觉比生活中手写文字擦除要难很多

项目

数据集

课程

比赛

模型库

活动

论坛

访问飞桨官网

项目

数据集

课程

比赛

模型库

活动

论坛

访问飞桨官网

时间女神发布于2021-12

１、观察了一下测试集得图片，手写文字分为黑色、红色，理论上红色文字的位置通过颜色就可以简单判断出来。

２、看了官方给的论文，基本上擦除的地方文字宽度很大，这种情况是擦除容易，填补较难；但是看这次比赛的话，文字很细，应该是属于准确擦除困难，填补反而简单的类型。

３、总结网上的论文做法，不管是一阶段还是二阶段模型，隐含的两个任务都是擦除文字区域，生成填补内容。

４、另外一个我觉得这个比赛的难点在于，跟现有论文的研究对象比（文字与背景容易区分），手写文字和印刷体文字的区分比较困难，也就是很难全部精确定位，或者出现误删的情况。

５、总结，直接套模型可能效果不会很好，需要针对试卷的手写文字调整架构。

全部评论(6)

时间女神

#2 回复于2021-12

而且图像真大

时间女神

#3 回复于2021-12

遇到困难：图像尺寸不统一，最小500多，最大5000多

解决办法1: 缩放（但是各个图片比例差太多，而且形状不一，容易失真）

解决办法2：裁剪（但是手写文字范围几乎涵盖整个图像，无法裁剪），也许可以对大的图像裁剪成一个一个小块（因为这个任务不需要使用整个图像的信息）

解决办法3：虽然全卷积网络输入和输出可以保持一致，但是网络在读取批量数据时，还是会保持维度统一，因此只能一个样本一个样本的训练，速度和收敛速度都会收到影响

解决办法4：将图片填充到同一个大小，但是还是有图片比例差太多的问题，可能会影响网络的预测效果，而且更加耗时。

目前来看，这个问题应该是首先要解决的一个难点，黑体部分是我觉得比较可能会work的。

时间女神

#4 回复于2021-12

时间女神 #3

遇到困难：图像尺寸不统一，最小500多，最大5000多解决办法1: 缩放（但是各个图片比例差太多，而且形状不一，容易失真）解决办法2：裁剪（但是手写文字范围几乎涵盖整个图像，无法裁剪），也许可以对大的图像裁剪成一个一个小块（因为这个任务不需要使用整个图像的信息）解决办法3：虽然全卷积网络输入和输出可以保持一致，但是网络在读取批量数据时，还是会保持维度统一，因此只能一个样本一个样本的训练，速度和收敛速度都会收到影响解决办法4：将图片填充到同一个大小，但是还是有图片比例差太多的问题，可能会影响网络的预测效果，而且更加耗时。目前来看，这个问题应该是首先要解决的一个难点，黑体部分是我觉得比较可能会work的。

展开

又查看了一遍数据集，发现图像越大的其实试卷的内容就越多，同样多的内容占据同样大小的图像块，所以将大图像裁剪成小块是一种可行的办法。

freehorse518

#5 回复于2022-05

这个确实有一些难度，但是看了你的文章，做得很好了。

李长安

#6 回复于2022-09

大佬厉害

sanshizi

#7 回复于2024-03

是否可以通过阅读试卷内容, 重建试卷, 文本内容, 图像生成, 最终再排版