百度iOCR:5分钟定制识别模板,一步完成票据结构化
OCR 技术是目前应用最为广泛的 AI 技术之一,但通用模板无法满足用户的特定格式文件的结构化文字识别需求。
自定义模板文字识别(以下简称 iOCR)是百度推出的内容结构化工具。 不需要算法编程、不需要大量训练数据,通过4步简单的图形化操作,5分钟即可定制特定样式票据、卡证的识别模板,建立起键值的对应关系,配合新增的模板自动分类功能,让模型自动分类票据,一步完成非结构化到结构化的转换,实现自动化的数据录入。
iOCR 特别适用于多种格式的医疗单据识别、金融票据识别、供应链录入系统中各类单据识别,各类非通用证件的结构化识别。例如:外贸单据、房产证、机票。新增的识别区属性选择,能够提高对金额、日期、符号/字母/数字混合等字段的识别率。
iOCR 有哪些技术特色?
a) 场景多样:
iOCR 能根据您的需求,针对任何文档来制作模板,真正实现全场景适配。
b) 简单易用:
图形化的模板制作页面,通过简单的框选,5分钟即可完成模板的制作。
c) 稳定高效:
依托百度云提供24小时云端高稳定服务,宕机率低,故障恢复快,单图秒级响应,服务可用性高达99.95%。
典型案例
目前,iOCR 已在大连税务局、奇瑞商用车、中华会计网校和云量互动等多家企事业单位中成功应用,为企事业单位的快速发展提供了更大的技术支持。
案例1 iOCR 助推车辆购置税智能化征管改革
新购车辆缴纳车辆购置税,需提供车辆合格证、车辆统一销售发票、车主身份信息等资料,人工识别比对或人工录入都存在数据输入错误或比对不准确的技术风险和人为因素,不便于纳税人自主缴税。
大连市税务局为新购车辆缴纳购置税用户提供手机端缴税的业务,通过百度自定义模板 OCR,将车辆合格证、车辆统一销售发票通过手机拍摄原件照片后进行结构化内容抓取,并与税务相关系统进行相应的数据比对验证,保障手机端办税的合法性、安全性、有效性。
同时提高纳税人的操作便捷性,降低纳税人手工输入的操作成本,降低错误率,一站式完成车辆购置税缴纳业务,纳税人不用跑腿,手机端3分钟完成缴税。不光实现了办税无纸化,同时降低了税务局车辆购置税窗口业务压力50%以上。
案例2 iOCR 助力新能源汽车自动申请国补
新能源汽车国家补贴的申报,需要填报购车用户的行驶证和购车发票等资料,利用百度 OCR 解决方案中的行驶证、通用发票和自定义模板的功能,快速批量的从证件、发票中提取所需字段信息。原来需要4个业务人员,每天可以整理400-500张发票,现在只需要一个人,负责识别结果的检查和校正,每天可以整理400张以上证件和发票信息,人员劳效提升3倍以上。
票据结构化也速度很快
票据必须是正规的发票才能识别么,这个没有测试过,下次又机会试一试这个接口