【自定义模板文字识别】操作教程,解决模板匹配不上

首页版块访问AI主站注册发帖

爱小妞宝发布于2018-07 浏览:9723 回复:4

【自定义模板文字识别】操作教程,解决模板匹配不上

快速回复

最后编辑于2022-04

【自定义模板文字识别】操作教程

第1步：获取接口权限第2步：模板制作第3步：分类器管理：模板训练第4步：接口调用

提示：建议使用chrome浏览器（版本号58以上）

1.获取接口权限

步骤见网址:http://ai.baidu.com/forum/topic/show/867951

【只要10分钟快速掌握文字识别】教程：《第一步：获取接口权限》

2.模板制作

2.1进入：http://ai.baidu.com/tech/ocr/iocr，点击，“立即使用“。

2.2点击“创建模板“

2.3点击“点击选择图片”，在电脑里选择《模板图片》，双击选择的图片，完成图片上传。点击“下一步”。

注：上传最优图片要求：

a 单字像素16*16-60*60之间

b 图片大小在200-800kb之间

判断图片是否符合标准有2种方式,任选其一：

（1）在电脑“画图”工具中可查看，点击“画图”工具中，”选择“，框住单字，查看是否符合标准

（2）或，在“普通票据识别”demo中，上传图片，能够识别，则该图片符合要求。

图片大小：200-800kb
单字像素：16*16-60*60

2.4 进入“编辑模板”页面。需要完成4步：

（1）基本信息：填写模板名称。

（2）点击“框选参照字段”。

点击“工具栏”右侧第1个图标，框选参照字段。图中橘色框住的是选的12个参照字段。

注：参照字段要求：同位置同字，清晰，分散，简单，唯一，8个以上，

四不：不选特殊字符（最好只选字，数字等），不选难识别的容易出错的，不选会变化的，不选跨行的

a 每1个参照字段只能在一行。即每1个橘色框中的字不跨行。

b确保每1个参照字段，在后期需要识别的图片中在同一位置有同一个字段（文字完全相同）。

图片中会变化的字不作为参照字段。

例如：模板里“检验科报告单”，后期需识别图片中还有别的科室报告单，那么“检验科”，不能作为参照字段。

c字段尽量分散在四周，边缘最好。

d 参照字段在图片中唯一。

e 清晰，简单。

f 至少4个，8个以上最佳。

（3）点击“框选识别区”。

点击“工具栏”右边的第2个图标。需识别：项目，结果，参考范围，共3列的内容，输入“3”，点击“插入”。

将出现的“表格识别区”，覆盖需识别的3列内容（不包括表头：项目，结果，参考范围）。

点击“表格识别区”，出现如图列间的“小白点”，调整列宽。

在右侧输入，“表格名”，“列名”：项目，结果，参考范围。

（4）点击“测试发布”后，点击“保存”，点击“试一试”，上传需要识别的图片。

若可以识别，模板设置成功，点击“立即发布”。

出现页面“模板已发布成功”。

3.创建“分类管理器”

3.1 点击上图中“分类器管理”。

点击右上角“创建分类器”，输入“分类器名称”，“功能描述”，点击“确定”。

3.2 进入编辑分类器页面。

点击“添加系统模版”，选择“车牌”，“银行卡”，点击“确定”。（根据业务需要选择模板，可添加自选模板训练，见http://ai.baidu.com/docs#/OCR-API/4cf952fc）

点击“开始训练”。

3.3 训练完成后，点击“测试”。测试效果。

点击“发布”，分类器新建完毕。（关注分类器ID,之后调用，第4步调用中，body下需填写。）

4.接口的调用：含分类器的自定义模板

4.1 下载postman：

步骤见http://ai.baidu.com/forum/topic/show/867951，《第二步：下载postman》

4.2在postman上快速进行接口请求。

具体如下：

（1）将请求格式切换为“post”

（2）输入iocr请求地址:

https://aip.baidubce.com/rest/2.0/solution/v1/iocr/recognise?access_token=【获取的access-token】

（3）修改请求头（header）

Key栏输入：Content-Type

Value栏输入：application/x-www-form-urlencoded

（4）点击body，在key和value中分别输入参数1,参数2。

（以下3个参数选2个，用到分类器填写第1，2个参数；用模板，填写第1,3参数）

分别是：

参数1： image=图片的base64转码后的结果，（转码工具：https://tool.css-js.com/base64.html，取消默认“包含头”选项或使用：http://imgbase64.duoshitong.com，转码后去掉“data:image/*;base64,”）

参数2：classifierId=1（需要使用的分类器的ID，点击“分类器管理”可以找到）

参数3：templateSign=0001（模板ID: 指定后期上传的图片用哪个模板来进行识别）

（5）开始请求

点击右上角蓝色“send”，请求成功，直接在下方返回值区域中获得结果：

附录1：使用postman获取AccessToken

在Postman中将请求方式更换为GET，在后面请求栏输入（中括号内的和中括号都要被替换！）：https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id=【API KEY】&client_secret=【SECRET KEY】

文字识别

文档

其他

个赞

共4条回复最后由用户已被禁言回复于2022-04

#6liguanghui2588回复于2019-04

自定义模板这块非常详细

#5摩羯Benefiting回复于2018-11

补充得这么细

#415029288076回复于2018-09

好东西

#2爱小妞宝回复于2018-07

分类器训练：图片数量规模30张以上，图片的质量，作为训练集的，需要保证清晰，一致的类别。

快速回复

小编推荐

火车票识别和出租车票识别正式商用

用户已被禁言 10回复

【案例】美匣科技：OCR技术为签证办理增质提效

用户已被禁言 6回复

如何快速开通邀测接口权限

用户已被禁言 21回复

【百度大脑新品体验】车牌识别

wangwei8638 25回复

TOP

操作指南

常见问答

平台公告

经验交流

技术专区

文字识别

人脸识别

语音技术

PaddlePaddle

EasyDL

BML

EasyData

AI Studio

UNIT

人体分析

图像搜索

图像识别

内容审核

自然语言处理

机器人视觉

视频技术

增强现实

知识图谱

智能创作

智能呼叫中心

文心

EdgeBoard

DuerOS

EasyEdge

度目硬件

百度AI市场

Doris

AI赛事

百度之星大赛

AI Studio人工智能竞赛

语言与智能技术竞赛

千言数据集

集思广益

共享工具

头脑风暴

成果展示

智能客服