1.功能描述:
支持对户口本内常住人口登记卡的全部 22 个字段进行结构化识别,包括户号、姓名、与户主关系、性别、出生地、民族、出生日期、身份证号、本市县其他住址、曾用名、籍贯、宗教信仰、身高、血型、文化程度、婚姻状况、兵役状况、服务处所、职业、何时由何地迁往本市、何时由何地迁往本址、登记日期
2.平台接入
具体接入方式比较简单,可以参考我的另一个帖子,这里就不重复了:
http://ai.baidu.com/forum/topic/show/943327
3.调用攻略(Python3)及评测
3.1首先认证授权:
在开始调用任何API之前需要先进行认证授权,具体的说明请参考:
http://ai.baidu.com/docs#/Auth/top
具体Python3代码如下:
# -*- coding: utf-8 -*- #!/usr/bin/env python import urllib import base64 import json #client_id 为官网获取的AK, client_secret 为官网获取的SK client_id =【百度云应用的AK】 client_secret =【百度云应用的SK】 #获取token def get_token(): host = 'https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id=' + client_id + '&client_secret=' + client_secret request = urllib.request.Request(host) request.add_header('Content-Type', 'application/json; charset=UTF-8') response = urllib.request.urlopen(request) token_content = response.read() if token_content: token_info = json.loads(token_content) token_key = token_info['access_token'] return token_key
3.2接口调用:
详细说明请参考: https://ai.baidu.com/ai-doc/OCR/ak3h7xzk7
说明的比较清晰,这里就不重复了。
大家需要注意的是:
API访问URL:https://aip.baidubce.com/rest/2.0/ocr/v1/household_register
输入参数image和url二选一
image:图像数据,base64编码后进行urlencode,要求base64编码和urlencode后大小不超过4M,最短边至少15px,最长边最大4096px,支持jpg/jpeg/png/bmp格式
url:图片完整URL,URL长度不超过1024字节,URL对应的图片base64编码后大小不超过4M,最短边至少15px,最长边最大4096px,支持jpg/jpeg/png/bmp格式,当image字段存在时url字段失效。请注意关闭URL防盗链
返回示例
{
"log_id": 1301870459,
"words_result": {
"BirthAddress": {
"words": "河南洛阳市郊区"
},
"Birthday": {
"words": "2016-07-28"
},
"CardNo": {
"words": "410311201607282825"
},
"Name": {
"words": "孙翌晨"
},
"Nation": {
"words": "汉族"
},
"Relationship": {
"words": "户主"
},
"Sex": {
"words": "男"
},
},
"words_result_num": 7
}
Python3调用代码如下:
#调用百度户口本识别接口 def household_register(filename): request_url = "https://aip.baidubce.com/rest/2.0/ocr/v1/household_register" # 二进制方式打开图片文件 f = open(filename, 'rb') img = base64.b64encode(f.read()) params = dict() params['image'] = img params = urllib.parse.urlencode(params).encode("utf-8") access_token = get_token() begin = time.perf_counter() request_url = request_url + "?access_token=" + access_token request = urllib.request.Request(url=request_url, data=params) request.add_header('Content-Type', 'application/x-www-form-urlencoded') response = urllib.request.urlopen(request) content = response.read() end = time.perf_counter() print('处理时长:'+'%.2f'%(end-begin)+'秒') if content: #print(content) content=content.decode('utf-8') #print(content) data = json.loads(content) #print(data) words_result=data['words_result'] print ("识别结果") for item in words_result: print (item,':',words_result[item]['words'])
4.功能评测(图片来自网络):
具体效果如下:
处理时长:5.05秒
识别结果
Nation : 汉族
......
Height : 170厘米
WorkAddress : 无
Hometown : 四川省
5.测试结论和建议
测试下来,整体识别效果不错。户口本的很准确,速度也很快,用起来非常的方便。可以用于:
身份信息登记
使用户口本识别技术,对户口本上的姓名、性别、出生地、出生日期、身份证号等信息进行识别,可应用于新生儿建档、户口迁移、个人信贷申请、社会救济金申请等政务办理场景,使政务部门能够快速提取申请人身份信息完成核验和登记,提升办事效率
亲属关系登记
使用户口本识别技术,对户口本上的姓名、与户主关系、身份证号等信息进行识别,可应用于婚姻登记、遗产继承、子女入学登记等需证明亲属关系的民政业务办理场景,使政务部门能够快速提取申请人身份信息及关系完成登记,提升办事效率
嗯,修改成代码块了
有的代码没有用代码块。