OCR产业应用实战：多类别电表读数识别方案详解

首页版块访问AI主站注册发帖

精

官

用户已被禁言发布于2022-03 浏览:4141 回复:4

OCR产业应用实战：多类别电表读数识别方案详解

快速回复

最后编辑于2022-04

我国电力行业发展迅速，电表作为测电设备经历了普通电表、预付费电表和智能电表三个阶段的发展。在产业场景中，表的种类多达十几种，过去依赖人工抄表，成本很高。如果能够采集到大量电表图片，借助人工智能技术批量检测和识别，将会大幅提升效率。
本次飞桨产业实践范例库开源电表读数识别场景应用，提供了从数据准备、技术方案、模型训练优化，到模型部署的全流程可复用方案，降低产业落地门槛。

⭐项目链接⭐
https://github.com/PaddlePaddle/awesome-DeepLearning
所有源码及教程均已开源，欢迎大家使用，star鼓励~

基于深度学习技术，实现电表读数识别

本场景要解决多类别电表识别任务，从技术上需要对多种类别的电表表数和表号进行检测再识别，从数据到模型面临着多重问题。

项目难点：

在数据方面，电表种类多、数据少、拍摄角度多样且部分数据反光严重。
如何从零标注电表数据，选择何种标注软件能够最快速度构建数据集？
技术路线的选择也面临多方面的问题，例如是通过文字检测来反向微调，还是通过目标检测从零训练？

本项目将一一解决这些难点。

项目方案：
基于上述难点，飞桨开发者技术专家不断进行尝试，最终选用了飞桨文字识别套件PaddleOCR中的PP-OCR模型进行了微调与优化，其检测部分基于DB的分割方法实现，直接解决了电表数据中的倾斜问题，通过再造数据集来扩充识别数据集，训练识别模型。PP-OCR模型经过大量实验，其泛化性也足以支撑复杂垂类场景下的效果。

在数据标注工具上，使用PPOCRLabel实现半自动标注，内嵌PP-OCR模型，一键实现机器自动标注，且具有便捷的修改体验。支持四点框、矩形框标注模式，导出格式可直接用于PaddleOCR训练，标注效率显著提升。

方案优化：
在优化方面，首先对PP-OCR模型的检测部分进行初步微调，然后通过对数据的进一步分析，发现原始图像分辨率较大，进而调整EastRandomCropData的尺寸，放大输入模型前的图像尺度。通过CopyPaste数据增强解决数据量小的问题，并且根据实际情况调小学习率。

项目效果：
最终在评测数据集上从原先的Hmeans=0.3优化到0.85。除此之外，本项目也尝试了一部分目标检测算法。具体的优化过程和详细解释，欢迎大家关注直播！

微调前后对比

部署方面使用飞桨原生推理库Paddle Inference完成，满足用户批量预测、数据安全性高、延迟低的需求，快速在本地完成部署方案。

产业实践范例教程，助力企业跨越AI落地鸿沟

飞桨产业实践范例，致力于加速AI在产业落地的前进路径，减少理论技术与产业应用的差距。范例来源于产业真实业务场景，通过完整的代码实现，提供从数据准备到模型部署的方案过程解析，堪称产业落地的“自动导航”。

真实产业场景：与实际具有AI应用的企业合作共建，选取企业高频需求的AI应用场景如智慧城市-安全帽检测、智能制造-表计读数等；
完整代码实现：提供可一键运行的代码，在“AI Studio一站式开发平台”上使用免费算力一键Notebook运行；
详细过程解析：深度解析从数据准备和处理、模型选择、模型优化和部署的AI落地全流程，共享可复用的模型调参和优化经验；
直达项目落地：百度高工手把手教用户进行全流程代码实践，轻松直达项目POC阶段。

精彩课程预告

为了让小伙伴们更便捷地应用电表读数范例教程，我们邀请了飞桨开发者技术专家于3月3日20:30-21:00为大家深度解析从数据准备、方案设计到模型优化部署的开发全流程，手把手教大家进行代码实践。
欢迎小伙伴们扫码进群，免费获取直播课和回放视频链接，更有机会获得覆盖智慧城市、工业制造、金融、互联网等行业的飞桨产业实践范例手册！也欢迎感兴趣的企业和开发者与我们联系，交流技术探讨合作。

扫码报名直播课，加入技术交流群

平台资讯

个赞

共4条回复最后由用户已被禁言回复于2022-04

#5baby我是耿耿回复于2022-03

很实用啊。

#4头头不可一世回复于2022-03

可以的。学习一下很不错。。。

#31虚空藏1回复于2022-03

非常想学习

#2用户已被禁言回复于2022-03

非常想学习

快速回复

小编推荐

【开奖啦】投稿赢大奖-奇思妙想+AI技术=？

用户已被禁言 55回复

百度AI社区开发者联盟集结！！

用户已被禁言 9回复

社区积分商城上线啦～

用户已被禁言 25回复

TOP

操作指南

常见问答

平台公告

经验交流

技术专区

文字识别

人脸识别

语音技术

PaddlePaddle

EasyDL

BML

EasyData

AI Studio

UNIT

人体分析

图像搜索

图像识别

内容审核

自然语言处理

机器人视觉

视频技术

增强现实

知识图谱

智能创作

智能呼叫中心

文心

EdgeBoard

DuerOS

EasyEdge

度目硬件

百度AI市场

Doris

AI赛事

百度之星大赛

AI Studio人工智能竞赛

语言与智能技术竞赛

千言数据集

集思广益

共享工具

头脑风暴

成果展示

智能客服