前期百度推出了自定义模板文字识别(http://ai.baidu.com/tech/ocr/iocr ) 可以通过快至15分钟的模板制作,实现结构化的文字内容提取和输入,解决了大部分模板的结构化文字识别问题。但部分客户仍需要投入人力分类指定具体使用的模板。
为了进一步节省人力成本,百度自定义模板文字识别新增自动分类功能,能针对票据、卡证自动分类匹配并调用对应模板一步完成结构化识别。
在企业报销等场景中涉及大量各式发票的结构化识别,之前需要人工分类票据的工作,现可以交由自定义模板的自动分类功能实现,准确率高至99%,一步完成分类+结构化,省时省力!
操作步骤:当创建完文字识别(http://ai.baidu.com/tech/ocr/iocr ) 模板之后,按照下面5步即可实现文字识别模板自动分类功能:
1.分类器管理页面新建分类器
2.选择参与分类的模板
3.上传对应模板的训练集
4.训练完成后测试效果并发布
5.通过API/SDK调用该服务(具体文档参见:http://ai.baidu.com/docs#/OCR-API/8b83b775 )
以下为分步的详细操作指导:
1. 分类器管理页面新建分类器
点击“分类器管理”标签进入管理页面,点击“创建分类器”后输入分类器名称和该分类器的应用场景/功能描述后点击确定进入编辑页面。
2.选择参与分类的模板
需要分类的模板分为“我的模板”和“系统模板”,“我的模板”是指您在自定义模板文字识别中手动创建的模板,“系统模板”指百度官网预置的模板(包含了:身份证正面、身份证反面、银行卡、驾驶证、行驶证、车牌、营业执照、护照、增值税发票)。客户可以根据业务需要添加模板参与分类。
3.上传对应模板的训练集
参与分类的如果是百度预置的模板您无需上传训练集,如果参与分类的是您自己制作的模板则需要您准备30到100张同模板的票据打包成ZIP包以后点击“编辑训练集”上传该训练集。当所有的自定义模板都已经上传了符合要求(30到100张、同模板)的训练集后点击“开始训练”。您可以在分类器管理页面查看预计完成的时间并通过刷新查看当前状态。
4.训练完成后测试效果并发布
当您的分类器训练完成后您可以在分类器管理页面点击“测试”上传图片进行分类测试,如果测试结果没有问题点击“发布”即可通过API调用该接口,如果对分类结果不满意,建议检查训练集数据中是否包含了较多噪声数据,或尝试增加训练集内的图片数量。
5. 通过API/SDK调用服务
如果针对第4步的测试结果没有问题点击“发布”即可通过API调用该接口,参数classifierId指定某个已发布的分类器,即可实现该分类器中任意模板的自动识别。具体调用文档参见:http://ai.baidu.com/docs#/OCR-API/8b83b775。
你好,已经修复链接无法访问的问题。谢谢反馈
不好意思,第一个链接失效了,我去问一下什么情况
链接打不开啊
说的很详细,今后遇到这类技术一定可以借鉴的
测试过好像识别后的英文都是大写,空格和换行符无法识别的问题,希望可以得到解决
可以调用呀
都可以调用吗
特别详细呀,升级后更好用了