python3调用识别REST-API报3301错误

首页版块访问AI主站注册发帖

ighack 发布于2017-04 浏览:2199 回复:5

python3调用识别REST-API报3301错误

快速回复

我使用的服务是：识别-REST_API

调用的接口是：http://vop.baidu.com/server_api

参数设置情况：

stt_para = {'format':'wav', 'rate':8000, 'channel':1, 'cuid':'7C-E9-D3-11-1E-69', 'token':'24.1d33d3ebea11d4********64.282335-1335399','len':speech_len ,'speech':speech}

开发平台和机型：windows,python3.6

复现步骤、现象及其他描述：

import requests
import base64
import json

#tok = requests.get(tokurl)

tts_url = 'http://tsn.baidu.com/text2audio'
tts_para = {'tex':'你好凯文','lan':'zh','tok':'24.1d33d3ebea*********63664.282335-1335399','ctp':1,'cuid':'0A-00-27-00-00-12'}
tts_data = requests.post(tts_url, data=tts_para)

with open('hello.wav', 'wb') as f:
f.write(tts_data.content)

input()

stt_url = 'http://vop.baidu.com/server_api'
headers = {'content-type': 'application/json;charset=utf-8'}
with open('hello.wav','rb') as f:
bdata = f.read()
_speech = base64.b64encode(bdata)
speech = _speech.decode() #这一步是为了转成字符串，不然会报TypeError: Object of type 'bytes' is not JSON serializable
speech_len = len(bdata)
stt_para = {'format':'wav', 'rate':8000, 'channel':1, 'cuid':'7C-E9-D3-11-1E-69', 'token':'24.1d33d3ebea11d4***********64.282335-1335399','len':speech_len ,'speech':speech}
stt_data = requests.post(stt_url, data=json.dumps(stt_para),headers=headers)
input()

合成语间没问题，但用这个合成的语音去识别老是报3301

{"err_msg":"recognition error.","err_no":3301,"sn":"883003405861493389441"}

识别-REST_API

个赞

共5条回复最后由用户已被禁言回复于2022-04

#6xie_yongkang回复于2017-05

ighack：

回复xie_yongkang：

没什么我就是想测试一下语音识别的功能。看一下我的写的代码有没有什么问题，我拿科大飞讯合成的语音是没有问题。证明我的代码写的没问题。

回复ighack：您好, 感谢您的使用,两边的接口输入和返回格式有差异, 百度语音合成的rest api返回的是mp3格式。按照您所描述的设想, 经过转码成8/16kHz的PCM后, 调用百度语音识别的rest api, 同样可以正确识别, 谢谢。

#5ighack回复于2017-05

xie_yongkang：

您好, 能了解一下把语音合成的结果再作为语音识别的输入的实际场景是什么吗? 另外, 识别返回的是mp3格式需要转换后才能作为语音识别的输入(8/16kHz的pcm), 谢谢

回复xie_yongkang：

没什么我就是想测试一下语音识别的功能。看一下我的写的代码有没有什么问题，我拿科大飞讯合成的语音是没有问题。证明我的代码写的没问题。

#4xie_yongkang回复于2017-05

#3ighack回复于2017-04

还有人没人啊

#2ighack回复于2017-04

audio = speech

with open('hello-stt.wav','wb') as f:
baudio = audio.encode()
_data = base64.b64decode(baudio)
f.write(_data)
input()

我把上面的数据反向解析一下。重新在生成文件，是没有问题的。不知道为什么百度不识别

快速回复

小编推荐

百度大脑语音方向服务全面升级！

用户已被禁言 235.9K回复

语音识别「极速版」升级，支持小程序接入

用户已被禁言 1.6K回复

第三期【百度大脑新品体验】语音问答机器人小程序

wangwei8638 259.3K回复

TOP

操作指南

常见问答

平台公告

经验交流

技术专区

文字识别

人脸识别

语音技术

PaddlePaddle

EasyDL

BML

EasyData

AI Studio

UNIT

人体分析

图像搜索

图像识别

内容审核

自然语言处理

机器人视觉

视频技术

增强现实

知识图谱

智能创作

智能呼叫中心

文心

EdgeBoard

DuerOS

EasyEdge

度目硬件

百度AI市场

Doris

AI赛事

百度之星大赛

AI Studio人工智能竞赛

语言与智能技术竞赛

千言数据集

集思广益

共享工具

头脑风暴

成果展示

智能客服