PPOCRLabel自动标注中文字符

项目

数据集

课程

比赛

模型库

活动

论坛

访问飞桨官网

项目

数据集

课程

比赛

模型库

活动

论坛

访问飞桨官网

青青山Demo 发布于2022-07

使用PPOCRLabel的自动标注功能，对于中文字符，可以正确框选，但是内容显示不对应，是因为编码格式问题还是识别错误，需要手动改正？

深渊上的坑

已解决

4# 回复于2022-08

听说最近也在弄这个场景，不知道是不是因为原来的数据集，文字一般是横的（哪怕倾斜也是横的）……

全部评论(6)

青

青山Demo

#2 回复于2022-07

对英文和数字都可以正确识别但是对中文字符就不能显示文字，右侧的文本内容需要我改为对应框中的中文吗？

深渊上的坑

#3 回复于2022-08

应该是对竖排中文字符识别不到位导致的

深渊上的坑

#4 回复于2022-08

听说最近也在弄这个场景，不知道是不是因为原来的数据集，文字一般是横的（哪怕倾斜也是横的）……

深渊上的坑

#5 回复于2022-08

所以猜测是预训练模型的问题……

xietao201314

#6 回复于2023-03

汉字少笔画了怎么标注出来

青

青山Demo

#7 回复于2023-03

xietao201314 #6

汉字少笔画了怎么标注出来

具体看你想让模型最终识别时认为这个少笔画的汉字是什么了。

如果还想把它当作正常汉字识别就正常标注就行，如果你不想让模型识别这种少笔画的汉字就不要标注。

或者你想让模型告诉你这个字少了笔画，那么你需要设定一个特定的标签类别，这个标签类别要确保他不会与其他字符类别有冲突。

在结果处理时将其转换为一种提示告知你这个字少了一个笔画。

（标注时你可以理解为对字符进行分类）

提issue

需求/bug反馈？一键提issue告诉我们

提pr

发现bug？如果您知道修复办法，欢迎提pr直接参与建设飞桨~