ocr不定尺寸图片识别问题请教
收藏
各位老师:
我用/models/ocr_recognition训练了模型,并且可以正确识别任意文字(使用与训练数据相同尺寸的图片),但是当我使用任意尺寸的图片时,例如700x68,就无法正确识别。
我看到ctc_reader代码里有个DATA_SHAPE = [1, 48, 512],不知是否与此有关?我将其改成[1,68,700]运行:
env CUDA_VISIBLE_DEVICE=0 python infer.py --model_path="models/model_330000" --input_images_list="/home/dataset/predict.list" --input_images_dir="/home/dataset/predict_images"
后直接报错:
paddle.fluid.core.EnforceNotMet: enforce x_mat_dims[1] == y_mat_dims[0] failed, 1152 != 768
First matrix's width must be equal with second matrix's height. at [/paddle/paddle/fluid/operators/mul_op.cc:59]
请问如何可以识别不定尺寸图片的文字?非常感谢!
0
收藏
请登录后评论
整个DATA_SHAPE 是如图图像的形状,前面是通道数,比如是灰度图,就是1,彩色图就是3,看报错,应该是你的图像大小不对吧。要先统一大小。注意宽高