我用的是wav文件,只把样例中的API_KEY和SECRET_KEY 和所要识别的文件和识别文件的格式改为wav,其他没有做改动,运行的是asrjson.py,结果与期望不符而且多次尝试结果还不一样。
我是什么地方没有修改吗?
求助
收藏
点赞
0
个赞
请登录后评论
TOP
切换版块
这个是api的,官方demo在这里,https://github.com/Baidu-AIP/speech-demo android 在sdk里。
https://ai.baidu.com/docs#/FAQ/top
2018年12月开发的,请问这个文档已更新为16K的这个文档指的是哪个?有没有开发指导文档
之前是多久?8K是老接口,以前有,但目前文档已更新为16K,之后8k接口会关闭,建议尽快更新为16K。
语音识别的语音输入为8k采样率,是否会影响语音识别率和搜索模型下的词库应用?
之前提交工单,百度回复是不影响,所以已经开发结束,但是发现声音较小时候识别不到 ,不知道是否这个采样率问题
检查下音频文件的格式。格式支持:pcm(不压缩)、wav(不压缩,pcm编码)、amr(压缩格式)。推荐pcm 采样率 :16000 固定值。 编码:16bit 位深的单声道。
可以用官网的音频文件测试下效果。https://ai.baidu.com/docs#/ASR-API/top