调用语音识别接口识别失败，偶尔成功，请求协助

首页版块访问AI主站注册发帖

AvengerBevis 发布于2018-01 浏览:2966 回复:6

调用语音识别接口识别失败，偶尔成功，请求协助

快速回复

音频文件： https://mindflow-files.workbene.com/RackMultipart20180103-19214-wqln90.wav

是由小程序录音为 mp3 通过如下命令转为 wav 的：

ffmpeg -y -i audio.mp3 -acodec pcm_u8 -ar 16000 audio.wav

转成功后通过 ruby 调用识别接口，参数如下：
{
format: 'wav',
rate: 16000,
channel: 1,
lan: :zh,
cuid: 'someone',
token: 'token',
speech: Base64.strict_encode64(file_content),
len: file_content.length
}

得到返回结果为：

{ "err_msg": json param speech error."，"err_no": 3300 }

但同样的小程序生成的 mp3 按照相同流程，偶尔可以识别成功，且 5 秒内的识别结果大都准确，20 秒以上的，只能识别不到 10 秒的内容，并且存在识别错误。请协助解决。非常感谢。

识别-REST_API

个赞

共6条回复最后由用户已被禁言回复于2022-04

#7laodiefengye回复于2019-01

请问解决了吗？

#6chenxiaoyu3回复于2018-01

请提供一下识别错误的长语音的音频文件

#5fujiayi1984回复于2018-01

看你一个问了3个独立的问题

0. 先测试5 秒内的音频，比如官方提供的音频文件，跑通api。

1. { "err_msg": json param speech error."，"err_no": 3300 } ，确认len和speech是否一致。

2. 20 秒以上的，只能识别不到 10 秒的内容，请给出原始音频，测试结果及期望结果

3 . 大都准确，请给出不准确的。要求同上

最后 pcm_u8这个参数不知道哪里来的，具体看下我们的rest api文档

#4荒墨丶迷失回复于2018-01

正在帮你召唤大神~ 请稍等

#3AvengerBevis回复于2018-01

长语音识别成功但内容错误举例：

语音内容：“今天天气不错，挺风和日丽的，我们下午没有课，这的确挺爽的。。”
识别结果：“嗯，不” 或者 “哦哦哦哦哦哦哦”

短语音识别成功内容也正确：

语音内容：“这是一个测试”
识别结果：“这是一个测试。”

#2AvengerBevis回复于2018-01

另外，我看到有帖子回复说可以联系邮箱 voice_feedback@baidu.com，发了邮件大约一天没有回复，希望能提到回复效率。

快速回复

小编推荐

百度大脑语音方向服务全面升级！

用户已被禁言 235.9K回复

语音识别「极速版」升级，支持小程序接入

用户已被禁言 1.6K回复

第三期【百度大脑新品体验】语音问答机器人小程序

wangwei8638 259.3K回复

TOP

操作指南

常见问答

平台公告

经验交流

技术专区

文字识别

人脸识别

语音技术

PaddlePaddle

EasyDL

BML

EasyData

AI Studio

UNIT

人体分析

图像搜索

图像识别

内容审核

自然语言处理

机器人视觉

视频技术

增强现实

知识图谱

智能创作

智能呼叫中心

文心

EdgeBoard

DuerOS

EasyEdge

度目硬件

百度AI市场

Doris

AI赛事

百度之星大赛

AI Studio人工智能竞赛

语言与智能技术竞赛

千言数据集

集思广益

共享工具

头脑风暴

成果展示

智能客服