【今日直播预告】
工业OCR:一招搞定工业常见数码管、PCB字符识别
分享嘉宾:晓婷 百度高级研发工程师/ 涛涛 百度高级研发工程师
直播时间:5月26日 18:30-20:00
报名通道已开启:https://wx566b3770e2bd0b56.mp.weixinhost.com/addon/app-commonapply/index?form_id=596420954981120&channel_id=1516033054248947882
工业常见PCB、数码管字符识别难?这个OCR工具你值得拥有!
工业常见PCB、数码管字符识别难?PaddleOCR一招就够了!
背景:我国作为制造业大国,智能制造升级需求旺盛。近年,、相关部委近年围绕智能制造接连推出政策,促进产业向强向优升级。以人工智能、5G、大数据为主的技术在制造升级的过程中扮演关键作用,例如,。在智能装备制造的感知层面,以深度学习为基础的目标检测、文字识别、语义分割等技术在工业制造的各场景中应用广泛。
文字识别技术(OCR)在制造业中的应用场景大多分布在产品追溯、智能监控、仓储物流、缺陷检测等,通过算法自动批量完成图片信息中的文字提取,降低企业人力重复手动录入信息的重复劳动的人力成本,、增加生产效率。
图1 OCR应用场景全景图
在这些场景中,图片的获取方式往往通过对真实场景拍照,属于自然场景下的文字识别技术,其特点在于文字形态和设备类型涉猎广泛,面临的问题包括:
这些场景属于自然场景下的文字识别技术的应用范畴,图片的获取方式往往通过对真实场景拍照,特点在于文字形态和设备类型涉猎广泛,面临的问题包括:
- 自然场景下文字形态丰富多样,透视变换、模糊、光照、干扰问题多;
- 一些场景中设备器材、文字排列类型丰富,对模型泛化性要求高;
- 实际采集数据受限于设备或场景,数据量有限;
- 垂类数据集中缺乏针对性的模型调优技巧。
图2 电表场景下的数据出现遮挡、光照不足、类型多样、模糊等问题
解决方案:办法
飞桨文字识别开发套件PaddleOCR针对自然场景下的OCR任务提供面向产业级的超轻量通用OCR系统PP-OCRv3,经过海量数据训练,达到产业级SOTA效果,在垂类场景中泛化性好。同时,PaddleOCR配套数据合成、标注及与22种训练部署方式,打造全流程开发体验,助力产业界快速落地OCR应用。
图3 PP-OCRv3效果动图
图4 PaddleOCR全景图
项目地址:https://github.com/PaddlePaddle/PaddleOCR
场景1:PCB质量监控中的小尺度文字识别
印刷电路板(PCB)是电子产品中的核心器件,对于板件质量的测试与监控是生产中必不可少的环节。在一些场景中,通过PCB中信号灯颜色和文字组合可以定位PCB局部模块质量问题,这其中裁剪出的PCB图片宽高比例较小,文字区域整体面积也较小。针对本场景,PaddleOCR基于全新 PP-OCRv3通过合成数据、微调以及其他场景适配方法完成小字符文本识别任务,满足企业上线要求。
图5 PCB小尺度文本识别示意图
场景2:光功率计数码管字符识别
光功率计是测量光纤系统中的光功率仪器,通信公司会留存大量光功率计图片并记录功率计数值。通常,光功率计的字符以数码管形式呈现,与一般文字的形态有所差异。PaddleOCR基于PaddleOCR基于PP-OCRv3的识别模型 和顶会算法SVTR_Tiny SVTR两分别个策略在本场景数据上微调进行微调与对比训练,择其最优,最终实现带来针对数码管字符的识别模型,最终识别精度满足生产需求。
图6 手持光功率计(左)与OCR识别效果(右)
飞桨携手产业合作伙伴,聚焦智能制造八大核心主题,硬核打造工业高价值深度学习系列课程。联合多位百度技术专家与行业专家,围绕智能工业质检、产区安防、设备预测性维护等热门赛道,直击制造业转型真实痛点,深度剖析技术难点及落地方案,深度讲解如何降低AI开发和应用门槛,共同解码制造业数智化的新变革。
5月24日-6月8日,一场连续三周的AI产业系列课程,带你开启智能制造的“通关”之旅。
更多内容可参考以下链接:
飞桨官网:https://www.paddlepaddle.org.cn
PaddleOCR项目地址:
Github:https://github.com/PaddlePaddle/PaddleOCR
Gitee:https://gitee.com/PaddlePaddle/PaddleOCR
注:上述图片均来源于网络