首页 PaddleHub 帖子详情
paddlehub ocr 识别内存问题
收藏
快速回复
PaddleHub 问答离线运行 778 2
paddlehub ocr 识别内存问题
收藏
快速回复
PaddleHub 问答离线运行 778 2

识别十几张内存占用十几G

 

内部方法

 

self.hub=hub.Module(name='chinese_ocr_db_crnn_mobile')

self.hub.recognize_text(images=images)

0
收藏
回复
全部评论(2)
时间顺序
FutureSI
#2 回复于2021-12

用内部方法是不是要配合相应的预处理,后处理呢

ocr 模型一般都不大、挺快的

0
回复
DeepGeGe
#3 回复于2021-12

我前一阵子也使用了paddlehub ocr,而且还发现了他的一个BUG,然后去提交了个pr,成了paddlehub的contributor。
paddlehub ocr的文字处理内部逻辑是:
1. 使用DB算法对一张图片框选文本位置,每一行文字生成一张小图片;

2. 分别将小图片送到模型中去识别。

我使用的方法如下:

# 这里将模型下载下载,然后用directory参数指定了模型目录
ocr = hub.Module(directory=current_dir + '/hub_models_quick/chinese_ocr_db_crnn_mobile')
result = ocr.recognize_text(images=[img])

在使用时候没有发现内存占用那么大的情况。或者你可以试一试一次一张图片。

 

1
回复
需求/bug反馈?一键提issue告诉我们
发现bug?如果您知道修复办法,欢迎提pr直接参与建设飞桨~
在@后输入用户全名并按空格结束,可艾特全站任一用户