感觉比生活中手写文字擦除要难很多
收藏
快速回复
感觉比生活中手写文字擦除要难很多
收藏
快速回复

1、观察了一下测试集得图片,手写文字分为黑色、红色,理论上红色文字的位置通过颜色就可以简单判断出来。

 

2、看了官方给的论文,基本上擦除的地方文字宽度很大,这种情况是擦除容易,填补较难;但是看这次比赛的话,文字很细,应该是属于准确擦除困难,填补反而简单的类型。

3、总结网上的论文做法,不管是一阶段还是二阶段模型,隐含的两个任务都是擦除文字区域,生成填补内容。

4、另外一个我觉得这个比赛的难点在于,跟现有论文的研究对象比(文字与背景容易区分),手写文字和印刷体文字的区分比较困难,也就是很难全部精确定位,或者出现误删的情况。

5、总结,直接套模型可能效果不会很好,需要针对试卷的手写文字调整架构。

2
收藏
回复
全部评论(6)
时间顺序
时间女神
#2 回复于2021-12

而且图像真

1
回复
时间女神
#3 回复于2021-12

遇到困难:图像尺寸不统一,最小500多,最大5000多

解决办法1:  缩放(但是各个图片比例差太多,而且形状不一,容易失真)

解决办法2:裁剪(但是手写文字范围几乎涵盖整个图像,无法裁剪),也许可以对大的图像裁剪成一个一个小块(因为这个任务不需要使用整个图像的信息)

解决办法3:虽然全卷积网络输入和输出可以保持一致,但是网络在读取批量数据时,还是会保持维度统一,因此只能一个样本一个样本的训练,速度和收敛速度都会收到影响

解决办法4:将图片填充到同一个大小,但是还是有图片比例差太多的问题,可能会影响网络的预测效果,而且更加耗时。

目前来看,这个问题应该是首先要解决的一个难点,黑体部分是我觉得比较可能会work的。

0
回复
时间女神
#4 回复于2021-12
遇到困难:图像尺寸不统一,最小500多,最大5000多 解决办法1:  缩放(但是各个图片比例差太多,而且形状不一,容易失真) 解决办法2:裁剪(但是手写文字范围几乎涵盖整个图像,无法裁剪),也许可以对大的图像裁剪成一个一个小块(因为这个任务不需要使用整个图像的信息) 解决办法3:虽然全卷积网络输入和输出可以保持一致,但是网络在读取批量数据时,还是会保持维度统一,因此只能一个样本一个样本的训练,速度和收敛速度都会收到影响 解决办法4:将图片填充到同一个大小,但是还是有图片比例差太多的问题,可能会影响网络的预测效果,而且更加耗时。 目前来看,这个问题应该是首先要解决的一个难点,黑体部分是我觉得比较可能会work的。
展开

又查看了一遍数据集,发现图像越大的其实试卷的内容就越多,同样多的内容占据同样大小的图像块,所以将大图像裁剪成小块是一种可行的办法。

2
回复
f
freehorse518
#5 回复于2022-05

这个确实有一些难度,但是看了你的文章,做得很好了。

0
回复
李长安
#6 回复于2022-09

大佬厉害

0
回复
s
sanshizi
#7 回复于2024-03

是否可以通过阅读试卷内容, 重建试卷, 文本内容, 图像生成, 最终再排版

0
回复
在@后输入用户全名并按空格结束,可艾特全站任一用户