我使用的服务是:语音识别
调用的接口是:第二种上传方式,语音数据直接放在 HTTP-BODY 中
参数设置情况:'lan': 'zh','Content-length:6734', 'Content-Type:audio/speex;rate=8000'
开发平台和机型:Ubuntu16.10,Python3,笔记本
SDK版本号:REST API 1.2
代码或日志截图(上传截图能帮助您更快解决问题):返回错误,(3301, 'recognition error.')
复现步骤、现象及其他描述:
1. 使用ffmpeg将demo里的test.pcm转换为test.wav,可以成功识别
2. 使用ffmpeg将test.wav转换为speex格式的test.spx,无法识别。转换命令如下:
ffmpeg -i test.wav -f spx -ac 1 test.spx
转换日志:
Guessed Channel Layout for Input Stream #0.0 : mono
Input #0, wav:
Duration: N/A, bitrate: 128 kb/s
Stream #0:0: Audio: pcm_s16le ([1][0][0][0] / 0x0001), 8000 Hz, 1 channels, s16, 128 kb/s
Output #0, spx:
Metadata:
encoder : Lavf57.25.100
Stream #0:0: Audio: speex (libspeex), 8000 Hz, mono, s16, 15 kb/s
Metadata:
encoder : Lavc57.24.102 libspeex
Stream mapping:
Stream #0:0 -> #0:0 (pcm_s16le (native) -> speex (libspeex))
size= 7kB time=00:00:03.29 bitrate= 16.3kbits/s speed= 114x
video:0kB audio:6kB subtitle:0kB other streams:0kB global headers:0kB muxing overhead: 7.400319%
[libspeex @ 0x5621e1387b80] 1 frames left in the queue on closing
xie_yongkang:
您好, 请参考开发文档, 目前rest api仅支持8kHz和16kHz的pcm, 谢谢
回复xie_yongkang:
您好, 请参考开发文档, 目前rest api仅支持8kHz和16kHz的pcm, 谢谢