【只要10分钟 快速掌握文字识别】
视频版教程:https://abcxueyuan.baidu.com/#/course_detail?id=15431&courseId=15431
文字版教程:
1.获取接口权限 2.下载接口调用工具 3.进行接口调用
具体步骤如下:
1.获取接口权限
1.1 登录网址:ai.baidu.com
1.2 点击右上角“控制台”,选:文字识别
1.3 输入你的百度账号后,点击登录
1.4 点击“创建应用”(如果您已经在此处创建过应用,则直接点击管理应用,并直接跳转到1.6步)
图1.4.1创建应用
1.5 点击“创建应用”后
A 输入应用名 ------B 文字识别包名:不需要(本教程只针对API调用,不涉及移动端SDK所以选择“不需要”)
---- C 填写应用描述 ------D 点击“立即创建”。
创建后,点击“返回应用列表”
图1.5.A 输入应用名
图1.5.B、C
图1.5.D 创建应用完毕
1.6 获取密钥
点击“返回创建应用列表”后,页面出现平台分配的密钥:API Key、Secret Key(即AK、SK)。
使用这两个密钥获取Access Token,调用接口(参见1.7)
图1.6.获取密钥
1.7 获取Access Token
OCR在线接口主要针对HTTP API调用者,调用API时需在URL中需带上Access Token参数。
获取Access Token的流程如下:
A、mac电脑,将示例代码复制到“终端”上(用1.6获取的2个密钥分别替换示例代码红色部分)。
示例代码如下(中括号内的和中括号都要被替换!):
curl -i -k 'https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id=【API Key】&client_secret=【Seceret Key】'
B、非Mac电脑,操作流程和示例代码参考:http://ai.baidu.com/docs#/Auth/top或参见附录1使用postman获取
保存获取到的Access Token。
2.下载接口调用工具
2.1 下载接口调用工具—Postman
下载地址如下:
Mac地址:https://app.getpostman.com/app/download/osx64?utm_source=site&utm_medium=apps&utm_campaign=macapp
Windows地址:https://www.getpostman.com/downloads/
2.2 postman安装教程
(1) 双击安装包
(2) 初次登录无账号,可点击图示最下方蓝色字体部分,直接进入postman主界面。
图2.2.1点击蓝色字体
图2.2.2 postman主界面
3.进行接口调用
3.1 接口调用
在postman上快速进行接口请求。
具体如下:
(1) 将请求格式切换为“post”
(2) 输入请求地址(以通用文字识别高精度含位置版为例):
https://aip.baidubce.com/rest/2.0/ocr/v1/accurate?access_token=【获取的access-token】
图3.1.1 请求格式和请求地址
(3) 修改请求头(header)
Key栏输入:Content-Type
Value栏输入:application/x-www-form-urlencoded
图3.1.2 修改请求头
(4) 点击body,
选择“x-www-form-urlencoded”,在key和value中分别输入1个请求参数。
分别是:
image=图片的base64转码后的结果,(转码工具:https://tool.css-js.com/base64.html,取消默认“包含头”选项或使用: http://imgbase64.duoshitong.com,转码后去掉“data:image/*;base64,”)
图3.1.3 输入参数
图3.1.4 base64 转换
3.2 开始请求
点击右上角蓝色“send”,请求成功,直接在下方返回值区域中获得结果:
附录1:使用postman获取AccessToken
在Postman中将请求方式更换为GET,在后面请求栏输入(中括号内的和中括号都要被替换!):https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id=【API KEY】&client_secret=【SECRET KEY】
文字识别包名,我的为啥没有不需要选项,该怎么填包名和签名呢?
大佬们,无法打开源文件"access_token.h"怎么解决
科技的力量
科技的力量
发不了帖子 想问问
能不能支持POST跨域???
本意gba.nenge.net用户可以填写自己的API,密匙去玩游戏使用翻译,可以无视语言问题.但是POST提交就要跨域了.
另外建议签免可以使用明文密匙,
在多功能模拟器RetroArch是支持AI翻译的,像这个"http://ztranslate.net/service?api_key=API_KEY" POST =>"{image:base64 data}"
另外使用MD5又不能跨域有点自欺欺人的感觉. 如果服务器使用,那么密匙根本不会泄露,鉴权也是多余的.
而跨域翻译[客户端发起翻译要求]才担心密匙泄露吧....但是WEB客户端并不能发起跨域请求.至于APP客户端,稍微加密或者服务器转发都无需担心密匙泄露.
如何将一张有10个数字的图片在100ms内识别出来
碰到一个问题:手机拍照后直接提交识别,无法识别出文字(图片2~4M),如果把图片发送到微信,再保存到相册,最后再提交识别可以识别出来(200k左右)。我猜测是图片大小原因使得ocr识别失准,于是再后台对图片处理,处理后大小为850k(原2.6M),结果还是不行。我把这两种方式的图片到保存到本地查看,图片可以打开,格式正确,图片显示也一样。求教发送问题的原因。(拍摄图片的手机为ios 11)
好复杂,我只是想要文字识别而已
可以在这里看下:https://ai.baidu.com/ai-doc/OCR/skruaza7j,也可以看下视频版。里面都是新版的postman。
图片不清。根本没办法应付POSTMAN改版后的情况。现在的POST改版了。没有找到这些东西
这个在你的控制台把
不熟悉postman。如果使用VScode的话,下载一个postcode插件就可以用了
pdf不是图片格式的啊,转成图片试一试
通用文字识别支持离线吗
太麻烦了,开发成产品再来卖吧,这不是产品
用python调用识别pdf上的文字会出错,但用png格式的就不会...
AK和SK哪里获取呢
AK和SK哪里获取呢
这谁看得懂
最近正在使用PaddleOCR