我使用的服务是:语音识别
调用的接口是:rest Apid
我测试过百度的语音识别,除了pcm 8k 16位深 语音识别成功外,其他格式包括:opus,speex,x-flac ,pcm 16k ,wav 16k 全部失败,真是绝望。pcm 8k 清晰度不够好,提高到16k,结果就失败,原因不得而知,猜测是文件太大,就使用压缩格式吧,结果上面的其他格式却无一成功,真是让人沮丧。真是怀疑百度提供的指导资料是否已经过时的?忽悠人的吗?
收藏
点赞
0
个赞
请登录后评论
TOP
切换版块
402168:
你好,pcm文件在此:https://pan.baidu.com/s/1kVJoKlh 只要是8k,就能识别,16k就返回识别错误。16k转成其他播放格式能播放。请检测,谢谢。
回复402168:您好,根据您的反馈, 对您提供的三个16kHz的pcm进行了rest api中语音合成的调用, 都能识别。请看一下是否是调用代码或参数设置的问题, 谢谢。
{"corpus_no":"6413902433841657479","err_msg":"success.","err_no":0,"result":["百度语音识别,请赐是白电,"],"sn":"935734228571493353032"}
array(5) {
["corpus_no"]=>
string(19) "6413902433841657479"
["err_msg"]=>
string(8) "success."
["err_no"]=>
int(0)
["result"]=>
array(1) {
[0]=>
string(39) "百度语音识别,请赐是白电,"
}
["sn"]=>
string(21) "935734228571493353032"
}
{"corpus_no":"6413912269217850209","err_msg":"success.","err_no":0,"result":["今天的天气很好很好,"],"sn":"28611325871493355321"}
array(5) {
["corpus_no"]=>
string(19) "6413912269217850209"
["err_msg"]=>
string(8) "success."
["err_no"]=>
int(0)
["result"]=>
array(1) {
[0]=>
string(30) "今天的天气很好很好,"
}
["sn"]=>
string(20) "28611325871493355321"
}
{"corpus_no":"6413912420519336146","err_msg":"success.","err_no":0,"result":["百度语音,请测试百度语言,请测试,"],"sn":"657238044121493355356"}
array(5) {
["corpus_no"]=>
string(19) "6413912420519336146"
["err_msg"]=>
string(8) "success."
["err_no"]=>
int(0)
["result"]=>
array(1) {
[0]=>
string(51) "百度语音,请测试百度语言,请测试,"
}
["sn"]=>
string(21) "657238044121493355356"
}
你好,pcm文件在此:https://pan.baidu.com/s/1kVJoKlh 只要是8k,就能识别,16k就返回识别错误。16k转成其他播放格式能播放。请检测,谢谢。
fujiayi1984:
请您提供下 调用成功8k的16位pcm文件 及 这个调用成功的8k pcm文件转换成的的16位 16K pcm文件。
可以上传到百度网盘分享,谢谢
回复fujiayi1984:
请您提供下 调用成功8k的pcm文件 及 这个调用成功的8k pcm文件转换成的16K的pcm文件。
可以上传到百度网盘分享,谢谢