首页 炼丹房 帖子详情
目标检测如何识别题目、选项、答案、解析?
收藏
快速回复
炼丹房 问答头脑风暴新手上路 1031 7
目标检测如何识别题目、选项、答案、解析?
收藏
快速回复
炼丹房 问答头脑风暴新手上路 1031 7

一、需求描述

       预期实现在课本页图片中识别出题目、ABCD选项、答案、解析这几部分,然后获得目标所在位置,利用python截图库+ O CR来识别这些目标。

二、当前问题

      利用目标检测模型训练效果不尽人意,不知道是标注数据集的问题,还是模型训练配置的问题,我有点python基础,深度学习还真是一窍不通,哈哈哈,有没有大佬指点一下

0
收藏
回复
全部评论(7)
时间顺序
beyondyourself
#2 回复于2022-08

首先还是需要准确理解业务需求,然后选择合适的模型,针对业务和模型再制作相应的数据集,当然数据集可能需要多次试验调整

0
回复
李长安
#3 回复于2022-08

用ppocr做一下试试呢?

0
回复
Dream拒杰
#4 回复于2022-08

可以利用PaddleOCR的版面分析试试

0
回复
深渊上的坑
#5 回复于2022-08
可以利用PaddleOCR的版面分析试试

不过估计还是要微调的

0
回复
Dream拒杰
#6 回复于2022-08
不过估计还是要微调的

嗯嗯

 

0
回复
fi_Past
#7 回复于2022-09

学习了

0
回复
m
mesli
#8 回复于2024-02
不过估计还是要微调的

您好,请问您指的微调指的什么呢?是模型优化吗?

0
回复
在@后输入用户全名并按空格结束,可艾特全站任一用户