自定义模板OCR升级

首页版块访问AI主站注册发帖

自定义模板OCR升级

笔墨哥发布于2018-06 浏览:5698 回复:8

自定义模板OCR升级

快速回复

最后编辑于2022-04

前期百度推出了自定义模板文字识别（http://ai.baidu.com/tech/ocr/iocr ）可以通过快至15分钟的模板制作，实现结构化的文字内容提取和输入，解决了大部分模板的结构化文字识别问题。但部分客户仍需要投入人力分类指定具体使用的模板。

为了进一步节省人力成本，百度自定义模板文字识别新增自动分类功能，能针对票据、卡证自动分类匹配并调用对应模板一步完成结构化识别。

在企业报销等场景中涉及大量各式发票的结构化识别，之前需要人工分类票据的工作，现可以交由自定义模板的自动分类功能实现，准确率高至99%，一步完成分类+结构化，省时省力！

操作步骤：当创建完文字识别（http://ai.baidu.com/tech/ocr/iocr ）模板之后，按照下面5步即可实现文字识别模板自动分类功能：

1.分类器管理页面新建分类器

2.选择参与分类的模板

3.上传对应模板的训练集

4.训练完成后测试效果并发布

5.通过API/SDK调用该服务（具体文档参见：http://ai.baidu.com/docs#/OCR-API/8b83b775 ）

以下为分步的详细操作指导：

1. 分类器管理页面新建分类器

点击“分类器管理”标签进入管理页面，点击“创建分类器”后输入分类器名称和该分类器的应用场景/功能描述后点击确定进入编辑页面。

2.选择参与分类的模板

需要分类的模板分为“我的模板”和“系统模板”，“我的模板”是指您在自定义模板文字识别中手动创建的模板，“系统模板”指百度官网预置的模板（包含了：身份证正面、身份证反面、银行卡、驾驶证、行驶证、车牌、营业执照、护照、增值税发票）。客户可以根据业务需要添加模板参与分类。

3.上传对应模板的训练集

参与分类的如果是百度预置的模板您无需上传训练集，如果参与分类的是您自己制作的模板则需要您准备30到100张同模板的票据打包成ZIP包以后点击“编辑训练集”上传该训练集。当所有的自定义模板都已经上传了符合要求（30到100张、同模板）的训练集后点击“开始训练”。您可以在分类器管理页面查看预计完成的时间并通过刷新查看当前状态。

4.训练完成后测试效果并发布

当您的分类器训练完成后您可以在分类器管理页面点击“测试”上传图片进行分类测试，如果测试结果没有问题点击“发布”即可通过API调用该接口，如果对分类结果不满意，建议检查训练集数据中是否包含了较多噪声数据，或尝试增加训练集内的图片数量。

5. 通过API/SDK调用服务

如果针对第4步的测试结果没有问题点击“发布”即可通过API调用该接口，参数classifierId指定某个已发布的分类器，即可实现该分类器中任意模板的自动识别。具体调用文档参见：http://ai.baidu.com/docs#/OCR-API/8b83b775。

其他

个赞

共8条回复最后由用户已被禁言回复于2022-04

#9阿奴波仔回复于2019-04

对#7 jsdhgfuey回复

链接打不开啊

你好，已经修复链接无法访问的问题。谢谢反馈

#8阿奴波仔回复于2019-04

对#7 jsdhgfuey回复

链接打不开啊

不好意思，第一个链接失效了，我去问一下什么情况

#7jsdhgfuey回复于2019-04

链接打不开啊

#6用户已被禁言回复于2018-07

说的很详细，今后遇到这类技术一定可以借鉴的

#5陪伴小时光回复于2018-07

测试过好像识别后的英文都是大写，空格和换行符无法识别的问题，希望可以得到解决

#4阿奴波仔回复于2018-07

对#3 如何世代为天子回复

都可以调用吗

可以调用呀

#3如何世代为天子回复于2018-07

都可以调用吗

#2yun元冬回复于2018-07

特别详细呀，升级后更好用了

快速回复

小编推荐

火车票识别和出租车票识别正式商用

用户已被禁言 10回复

【案例】美匣科技：OCR技术为签证办理增质提效

用户已被禁言 6回复

如何快速开通邀测接口权限

用户已被禁言 21回复

【百度大脑新品体验】车牌识别

wangwei8638 25回复

TOP

操作指南

常见问答

平台公告

经验交流

技术专区

文字识别

人脸识别

语音技术

PaddlePaddle

EasyDL

BML

EasyData

AI Studio

UNIT

人体分析

图像搜索

图像识别

内容审核

自然语言处理

机器人视觉

视频技术

增强现实

知识图谱

智能创作

智能呼叫中心

文心

EdgeBoard

DuerOS

EasyEdge

度目硬件

百度AI市场

Doris

AI赛事

百度之星大赛

AI Studio人工智能竞赛

语言与智能技术竞赛

千言数据集

集思广益

共享工具

头脑风暴

成果展示

智能客服