paddleOCR识别下划线问题

项目

数据集

课程

比赛

模型库

活动

论坛

访问飞桨官网

项目

数据集

课程

比赛

模型库

活动

论坛

访问飞桨官网

老狼Max 发布于2021-12

各位大佬，

因为业务需要需要识别设备上的一些菜单参数。直接使用paddle训练好的好的模型：ch_ppocr_mobile_v2.0 用于检测和识别

大部分字符可以识别出来，但是下划线不行，如下图，这个需要但是设置吗什么参数之类的才能识别出来吗？还是要准备相关的数据进行训练才能提高识别精度？

全部评论(5)

DeepGeGe

#2 回复于2021-12

这个看起来是文本检测模型的问题，比如下面g识别成a貌似也是检测不全。

在实际OCR流程时，会检测文本，然后将检测出来的文本区域形成一个小图片，再送入识别模型。

因此，可以更改源代码，在生成文本区域的小图片时候，人为地向下适当第扩大一下图片，不过这种方法涉及到改源码，会有一点点麻烦。

最后可以去paddleOCR的github上提一下issue，看看这个套件的开发人员怎么说。

时间女神

#3 回复于2021-12

可以使用硬编码识别下划线

dm412843abc

#4 回复于2021-12

应该对图像预处理，去下划线

羊毛

#5 回复于2021-12

看起来是文本检测的范围比较小，在配置文件调整该参数unclip_ratio

stivenssss

#6 回复于2021-12

首先确认一下字典里是否有下划线

提issue

需求/bug反馈？一键提issue告诉我们

提pr

发现bug？如果您知道修复办法，欢迎提pr直接参与建设飞桨~