使用PPOCRLabel的自动标注功能,对于中文字符,可以正确框选,但是内容显示不对应,是因为编码格式问题还是识别错误,需要手动改正?
对英文和数字都可以正确识别但是对中文字符就不能显示文字 ,右侧的文本内容需要我改为对应框中的中文吗?
应该是对竖排中文字符识别不到位导致的
听说最近也在弄这个场景,不知道是不是因为原来的数据集,文字一般是横的(哪怕倾斜也是横的)……
所以猜测是预训练模型的问题……
汉字少笔画了怎么标注出来
具体看你想让模型最终识别时认为这个少笔画的汉字是什么了。
如果还想把它当作正常汉字识别就正常标注就行,如果你不想让模型识别这种少笔画的汉字就不要标注。
或者你想让模型告诉你这个字少了笔画,那么你需要设定一个特定的标签类别,这个标签类别要确保他不会与其他字符类别有冲突。
在结果处理时将其转换为一种提示告知你这个字少了一个笔画。
(标注时你可以理解为对字符进行分类)
对英文和数字都可以正确识别但是对中文字符就不能显示文字 ,右侧的文本内容需要我改为对应框中的中文吗?
应该是对竖排中文字符识别不到位导致的
听说最近也在弄这个场景,不知道是不是因为原来的数据集,文字一般是横的(哪怕倾斜也是横的)……
所以猜测是预训练模型的问题……
汉字少笔画了怎么标注出来
具体看你想让模型最终识别时认为这个少笔画的汉字是什么了。
如果还想把它当作正常汉字识别就正常标注就行,如果你不想让模型识别这种少笔画的汉字就不要标注。
或者你想让模型告诉你这个字少了笔画,那么你需要设定一个特定的标签类别,这个标签类别要确保他不会与其他字符类别有冲突。
在结果处理时将其转换为一种提示告知你这个字少了一个笔画。
(标注时你可以理解为对字符进行分类)