目标检测如何识别题目、选项、答案、解析？

项目

数据集

课程

比赛

模型库

活动

论坛

访问飞桨官网

项目

数据集

课程

比赛

模型库

活动

论坛

访问飞桨官网

B Bubble_x 发布于2022-08

一、需求描述

预期实现在课本页图片中识别出题目、ABCD选项、答案、解析这几部分，然后获得目标所在位置，利用python截图库+ O CR来识别这些目标。

二、当前问题

利用目标检测模型训练效果不尽人意，不知道是标注数据集的问题，还是模型训练配置的问题，我有点python基础，深度学习还真是一窍不通，哈哈哈，有没有大佬指点一下

全部评论(7)

beyondyourself

#2 回复于2022-08

首先还是需要准确理解业务需求，然后选择合适的模型，针对业务和模型再制作相应的数据集，当然数据集可能需要多次试验调整

李长安

#3 回复于2022-08

用ppocr做一下试试呢？

Dream拒杰

#4 回复于2022-08

可以利用PaddleOCR的版面分析试试

深渊上的坑

#5 回复于2022-08

Dream拒杰 #4

可以利用PaddleOCR的版面分析试试

不过估计还是要微调的

Dream拒杰

#6 回复于2022-08

深渊上的坑 #5

不过估计还是要微调的

嗯嗯

fi_Past

#7 回复于2022-09

学习了

mesli

#8 回复于2024-02

深渊上的坑 #5

不过估计还是要微调的

您好，请问您指的微调指的什么呢？是模型优化吗？