PGNet数据集处理的问题

项目

数据集

课程

比赛

模型库

活动

论坛

访问飞桨官网

项目

数据集

课程

比赛

模型库

活动

论坛

访问飞桨官网

o okk270 发布于2022-12

在利用PaddlePaddleOCR训练PGNet的时候，一直训练不出来。发现可能是数据集处理的问题

项目链接：https://aistudio.baidu.com/aistudio/projectdetail/1798439?channelType=0&channel=0

这个项目中从数据集/PaddleOCR/train_data/total_text/train/poly中处理txt文件时，将txt文件中每行的文本坐标转换为shape[1]=2的二维数组，之后一整个txt的文本坐标存放在list中（text_polys)，再转换为array。这样的话一个txt的文件的text_polys应该是一个一维array

但是在ppcor/data/imaug/pg_process.py里面频繁使用text_polys[:,:,0]和text_polys[:,:,1]，结果导致训练一直报错IndexERROR。

如何解决啊。愁

0

收藏

回复

提issue

需求/bug反馈？一键提issue告诉我们

提pr

发现bug？如果您知道修复办法，欢迎提pr直接参与建设飞桨~