语音识别结果和期望不符而且随机

首页版块访问AI主站注册发帖

语音识别结果和期望不符而且随机

浼藉攼馃崜发布于2019-04 浏览:1779 回复:6

语音识别结果和期望不符而且随机

快速回复

我用的是wav文件,只把样例中的API_KEY和SECRET_KEY 和所要识别的文件和识别文件的格式改为wav,其他没有做改动，运行的是asrjson.py，结果与期望不符而且多次尝试结果还不一样。

我是什么地方没有修改吗？

求助

技术问答

语音识别

在线

个赞

共6条回复最后由用户已被禁言回复于2022-04

#7用户已被禁言回复于2019-05

对#5 FCE_Carlife回复

2018年12月开发的，请问这个文档已更新为16K的这个文档指的是哪个？有没有开发指导文档

展开

这个是api的，官方demo在这里，https://github.com/Baidu-AIP/speech-demo android 在sdk里。

#6用户已被禁言回复于2019-05

对#5 FCE_Carlife回复

2018年12月开发的，请问这个文档已更新为16K的这个文档指的是哪个？有没有开发指导文档

展开

https://ai.baidu.com/docs#/FAQ/top

#5FCE_Carlife回复于2019-05

对#4 用户已被禁言回复

之前是多久？8K是老接口，以前有，但目前文档已更新为16K，之后8k接口会关闭，建议尽快更新为16K。

展开

2018年12月开发的，请问这个文档已更新为16K的这个文档指的是哪个？有没有开发指导文档

#4用户已被禁言回复于2019-05

对#3 FCE_Carlife回复

语音识别的语音输入为8k采样率，是否会影响语音识别率和搜索模型下的词库应用？之前提交工单，百度回复是不影响，所以已经开发结束，但是发现声音较小时候识别不到，不知道是否这个采样率问题

展开

之前是多久？8K是老接口，以前有，但目前文档已更新为16K，之后8k接口会关闭，建议尽快更新为16K。

#3FCE_Carlife回复于2019-05

语音识别的语音输入为8k采样率，是否会影响语音识别率和搜索模型下的词库应用？

之前提交工单，百度回复是不影响，所以已经开发结束，但是发现声音较小时候识别不到，不知道是否这个采样率问题

#2用户已被禁言回复于2019-04

检查下音频文件的格式。格式支持：pcm（不压缩）、wav（不压缩，pcm编码）、amr（压缩格式）。推荐pcm 采样率：16000 固定值。编码：16bit 位深的单声道。

可以用官网的音频文件测试下效果。https://ai.baidu.com/docs#/ASR-API/top

快速回复

小编推荐

百度大脑语音方向服务全面升级！

用户已被禁言 235.9K回复

语音识别「极速版」升级，支持小程序接入

用户已被禁言 1.6K回复

第三期【百度大脑新品体验】语音问答机器人小程序

wangwei8638 259.3K回复

TOP

操作指南

常见问答

平台公告

经验交流

技术专区

文字识别

人脸识别

语音技术

PaddlePaddle

EasyDL

BML

EasyData

AI Studio

UNIT

人体分析

图像搜索

图像识别

内容审核

自然语言处理

机器人视觉

视频技术

增强现实

知识图谱

智能创作

智能呼叫中心

文心

EdgeBoard

DuerOS

EasyEdge

度目硬件

百度AI市场

Doris

AI赛事

百度之星大赛

AI Studio人工智能竞赛

语言与智能技术竞赛

千言数据集

集思广益

共享工具

头脑风暴

成果展示

智能客服