【自定义模板文字识别】操作教程,解决模板匹配不上
爱小妞宝 发布于2018-07 浏览:8955 回复:4
4
收藏
最后编辑于2022-04

【自定义模板文字识别】操作教程

第1步: 获取接口权限        第2步:模板制作        第3步:分类器管理:模板训练       第4步:接口调用

提示:建议使用chrome浏览器(版本号58以上)

1.获取接口权限

步骤见网址:http://ai.baidu.com/forum/topic/show/867951

【只要10分钟 快速掌握文字识别】 教程: 《 第一步:获取接口权限

2.模板制作

2.1进入:http://ai.baidu.com/tech/ocr/iocr,点击,“立即使用“。

2.2点击“创建模板“

2.3点击“点击选择图片”,在电脑里选择《模板图片》,双击选择的图片,完成图片上传。点击“下一步”

注:上传最优图片要求:

a 单字像素16*16-60*60之间

b 图片大小在200-800kb之间

判断图片是否符合标准有2种方式,任选其一:

(1)在电脑“画图”工具中可查看,点击“画图”工具中,”选择“,框住单字,查看是否符合标准

(2)或,在“普通票据识别”demo中,上传图片,能够识别,则该图片符合要求。

图片大小:200-800kb
单字像素:16*16-60*60

 

2.4 进入“编辑模板”页面。需要完成4步

(1)基本信息:填写模板名称。

(2)点击“框选参照字段”

点击“工具栏”右侧第1个图标,框选参照字段。图中橘色框住的是选的12个参照字段。

注:参照字段要求:同位置同字,清晰,分散,简单,唯一,8个以上,

     四不:不选特殊字符(最好只选字,数字等),不选难识别的容易出错的,不选会变化的,不选跨行的

a 每1个参照字段只能在一行。即每1个橘色框中的字不跨行。

b确保每1个参照字段,在后期需要识别的图片中在同一位置有同一个字段(文字完全相同)

图片中会变化的字不作为参照字段

例如:模板里“检验科报告单”,后期需识别图片中还有别的科室报告单,那么“检验科”,不能作为参照字段。

c字段尽量分散在四周,边缘最好。

d 参照字段在图片中唯一

e 清晰,简单

f 至少4个,8个以上最佳。
 

(3)点击“框选识别区”。

点击“工具栏”右边的第2个图标。需识别:项目,结果,参考范围,共3列的内容,输入“3”,点击“插入”。

将出现的“表格识别区”,覆盖需识别的3列内容(不包括表头:项目,结果,参考范围)。

点击“表格识别区”,出现如图列间的“小白点”,调整列宽

在右侧输入,“表格名”,“列名”:项目,结果,参考范围。

(4)点击“测试发布”后,点击“保存”,点击“试一试”,上传需要识别的图片。

若可以识别,模板设置成功,点击“立即发布”。

出现页面“模板已发布成功”。

3.创建“分类管理器”

3.1 点击上图中“分类器管理”

点击右上角“创建分类器”,输入“分类器名称”,“功能描述”,点击“确定”。

3.2 进入编辑分类器页面。

点击“添加系统模版”,选择“车牌”,“银行卡”,点击“确定”。(根据业务需要选择模板,可添加自选模板训练,见http://ai.baidu.com/docs#/OCR-API/4cf952fc)

点击“开始训练”

3.3 训练完成后,点击“测试”。测试效果。

点击“发布”,分类器新建完毕。(关注分类器ID,之后调用,第4步调用中,body下需填写。)

4.接口的调用:含分类器的自定义模板

4.1 下载postman:

步骤见http://ai.baidu.com/forum/topic/show/867951,《第二步:下载postman》

4.2在postman上快速进行接口请求。

具体如下:

(1) 将请求格式切换为“post”

(2) 输入iocr请求地址:

https://aip.baidubce.com/rest/2.0/solution/v1/iocr/recognise?access_token=【获取的access-token】


(3) 修改请求头(header)

Key栏输入:Content-Type

Value栏输入:application/x-www-form-urlencoded



(4) 点击body,在key和value中分别输入参数1,参数2

(以下3个参数选2个,用到分类器填写第1,2个参数用模板,填写第1,3参数

分别是:

  参数1: image=图片的base64转码后的结果,(转码工具:https://tool.css-js.com/base64.html,取消默认“包含头”选项或使用:http://imgbase64.duoshitong.com,转码后去掉“data:image/*;base64,”)

 参数2:classifierId=1(需要使用的分类器的ID,点击“分类器管理”可以找到)

 参数3:templateSign=0001(模板ID: 指定后期上传的图片用哪个模板来进行识别)


(5)开始请求

点击右上角蓝色“send”,请求成功,直接在下方返回值区域中获得结果:

附录1:使用postman获取AccessToken

在Postman中将请求方式更换为GET,在后面请求栏输入(中括号内的和中括号都要被替换!):https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id=【API KEY】&client_secret=【SECRET KEY】



收藏
点赞
4
个赞
共4条回复 最后由用户已被禁言回复于2022-04
#6liguanghui2588回复于2019-04

自定义模板这块非常详细

0
#5摩羯Benefiting回复于2018-11

补充得这么细

0
1
#415029288076回复于2018-09

好东西

0
#2爱小妞宝回复于2018-07

分类器训练:图片数量规模30张以上,图片的质量,作为训练集的,需要保证清晰,一致的类别。

0
TOP
切换版块