首页 PaddleOCR 帖子详情
ocr不定尺寸图片识别问题请教
收藏
快速回复
PaddleOCR 问答OCR 2296 1
ocr不定尺寸图片识别问题请教
收藏
快速回复
PaddleOCR 问答OCR 2296 1

各位老师:

我用/models/ocr_recognition训练了模型,并且可以正确识别任意文字(使用与训练数据相同尺寸的图片),但是当我使用任意尺寸的图片时,例如700x68,就无法正确识别。

我看到ctc_reader代码里有个DATA_SHAPE = [1, 48, 512],不知是否与此有关?我将其改成[1,68,700]运行:
env CUDA_VISIBLE_DEVICE=0 python infer.py --model_path="models/model_330000" --input_images_list="/home/dataset/predict.list" --input_images_dir="/home/dataset/predict_images"

后直接报错:

paddle.fluid.core.EnforceNotMet: enforce x_mat_dims[1] == y_mat_dims[0] failed, 1152 != 768
First matrix's width must be equal with second matrix's height. at [/paddle/paddle/fluid/operators/mul_op.cc:59]

请问如何可以识别不定尺寸图片的文字?非常感谢!

0
收藏
回复
全部评论(1)
时间顺序
夜雨飘零1
#2 回复于2018-07

整个DATA_SHAPE 是如图图像的形状,前面是通道数,比如是灰度图,就是1,彩色图就是3,看报错,应该是你的图像大小不对吧。要先统一大小。注意宽高

0
回复
需求/bug反馈?一键提issue告诉我们
发现bug?如果您知道修复办法,欢迎提pr直接参与建设飞桨~
在@后输入用户全名并按空格结束,可艾特全站任一用户