首页 Paddle框架 帖子详情
PGNet数据集处理的问题
收藏
快速回复
Paddle框架 问答模型训练深度学习 419 0
PGNet数据集处理的问题
收藏
快速回复
Paddle框架 问答模型训练深度学习 419 0

在利用PaddlePaddleOCR训练PGNet的时候,一直训练不出来。发现可能是数据集处理的问题

项目链接:https://aistudio.baidu.com/aistudio/projectdetail/1798439?channelType=0&channel=0

这个项目中从数据集/PaddleOCR/train_data/total_text/train/poly中处理txt文件时,将txt文件中每行的文本坐标转换为shape[1]=2的二维数组,之后一整个txt的文本坐标存放在list中(text_polys),再转换为array。这样的话一个txt的文件的text_polys应该是一个一维array

但是在ppcor/data/imaug/pg_process.py里面频繁使用text_polys[:,:,0]和text_polys[:,:,1],结果导致训练一直报错IndexERROR。

如何解决啊。愁

0
收藏
回复
需求/bug反馈?一键提issue告诉我们
发现bug?如果您知道修复办法,欢迎提pr直接参与建设飞桨~
在@后输入用户全名并按空格结束,可艾特全站任一用户