目标检测如何识别题目、选项、答案、解析?
收藏
一、需求描述
预期实现在课本页图片中识别出题目、ABCD选项、答案、解析这几部分,然后获得目标所在位置,利用python截图库+ O CR来识别这些目标。
二、当前问题
利用目标检测模型训练效果不尽人意,不知道是标注数据集的问题,还是模型训练配置的问题,我有点python基础,深度学习还真是一窍不通,哈哈哈,有没有大佬指点一下
0
收藏
请登录后评论
首先还是需要准确理解业务需求,然后选择合适的模型,针对业务和模型再制作相应的数据集,当然数据集可能需要多次试验调整
用ppocr做一下试试呢?
可以利用PaddleOCR的版面分析试试
不过估计还是要微调的
嗯嗯
学习了
您好,请问您指的微调指的什么呢?是模型优化吗?