paddlehub ocr 识别内存问题

项目

数据集

课程

比赛

模型库

活动

论坛

访问飞桨官网

项目

数据集

课程

比赛

模型库

活动

论坛

访问飞桨官网

零零度人心发布于2021-12

识别十几张内存占用十几G

内部方法

self.hub=hub.Module(name='chinese_ocr_db_crnn_mobile')

self.hub.recognize_text(images=images)

全部评论(2)

FutureSI

#2 回复于2021-12

用内部方法是不是要配合相应的预处理，后处理呢

ocr 模型一般都不大、挺快的

DeepGeGe

#3 回复于2021-12

我前一阵子也使用了paddlehub ocr，而且还发现了他的一个BUG，然后去提交了个pr，成了paddlehub的contributor。
paddlehub ocr的文字处理内部逻辑是：
1. 使用DB算法对一张图片框选文本位置，每一行文字生成一张小图片；

2. 分别将小图片送到模型中去识别。

我使用的方法如下：

# 这里将模型下载下载，然后用directory参数指定了模型目录
ocr = hub.Module(directory=current_dir + '/hub_models_quick/chinese_ocr_db_crnn_mobile')
result = ocr.recognize_text(images=[img])

在使用时候没有发现内存占用那么大的情况。或者你可以试一试一次一张图片。

提issue

需求/bug反馈？一键提issue告诉我们

提pr

发现bug？如果您知道修复办法，欢迎提pr直接参与建设飞桨~