paddleOCR识别下划线问题
收藏
各位大佬,
因为业务需要需要识别设备上的一些菜单参数。直接使用paddle训练好的好的模型:ch_ppocr_mobile_v2.0 用于检测和识别
大部分字符可以识别出来,但是下划线不行,如下图,这个需要但是设置吗什么参数之类的才能识别出来吗?还是要准备相关的数据进行训练才能提高识别精度?
0
收藏
请登录后评论
这个看起来是文本检测模型的问题,比如下面g识别成a貌似也是检测不全。
在实际OCR流程时,会检测文本,然后将检测出来的文本区域形成一个小图片,再送入识别模型。
因此,可以更改源代码,在生成文本区域的小图片时候,人为地向下适当第扩大一下图片,不过这种方法涉及到改源码,会有一点点麻烦。
最后可以去paddleOCR的github上提一下issue,看看这个套件的开发人员怎么说。
可以使用硬编码识别下划线
应该对图像预处理,去下划线
看起来是文本检测的范围比较小,在配置文件调整该参数unclip_ratio
首先确认一下字典里是否有下划线