Restful接口只能识别wav格式,其他压缩格式均返回3301识别错误
HifLinux 发布于2017-04 浏览:2778 回复:3
0
收藏

我使用的服务是:语音识别

调用的接口是:第二种上传方式,语音数据直接放在 HTTP-BODY 中

参数设置情况:'lan': 'zh','Content-length:6734', 'Content-Type:audio/speex;rate=8000'

开发平台和机型:Ubuntu16.10,Python3,笔记本

SDK版本号:REST API 1.2

代码或日志截图(上传截图能帮助您更快解决问题):返回错误,(3301, 'recognition error.')

复现步骤、现象及其他描述:

1. 使用ffmpeg将demo里的test.pcm转换为test.wav,可以成功识别

2. 使用ffmpeg将test.wav转换为speex格式的test.spx,无法识别。转换命令如下:

ffmpeg -i test.wav -f spx -ac 1 test.spx 

转换日志:

Guessed Channel Layout for  Input Stream #0.0 : mono
Input #0, wav:
  Duration: N/A, bitrate: 128 kb/s
    Stream #0:0: Audio: pcm_s16le ([1][0][0][0] / 0x0001), 8000 Hz, 1 channels, s16, 128 kb/s
Output #0, spx:
  Metadata:
    encoder         : Lavf57.25.100
    Stream #0:0: Audio: speex (libspeex), 8000 Hz, mono, s16, 15 kb/s
    Metadata:
      encoder         : Lavc57.24.102 libspeex
Stream mapping:
  Stream #0:0 -> #0:0 (pcm_s16le (native) -> speex (libspeex))
size=       7kB time=00:00:03.29 bitrate=  16.3kbits/s speed= 114x    
video:0kB audio:6kB subtitle:0kB other streams:0kB global headers:0kB muxing overhead: 7.400319%
[libspeex @ 0x5621e1387b80] 1 frames left in the queue on closing

收藏
点赞
0
个赞
共3条回复 最后由用户已被禁言回复于2022-04
#4nickms回复于2017-05
  • 您好,原始语音的录音格式目前只支持评测 8k/16k 采样率 16bit 位深的单声道语音
  • 压缩格式支持:pcm(不压缩)、wav、opus、amr


0
#3fujiayi1984回复于2017-04

xie_yongkang:

您好, 请参考开发文档, 目前rest api仅支持8kHz和16kHz的pcm, 谢谢

回复xie_yongkang:

  • 原始语音的录音格式目前只支持评测 8k/16k 采样率 16bit 位深的单声道语音
  • 压缩格式支持:pcm(不压缩)、wav、opus、speex、amr


0
#2xie_yongkang回复于2017-04

您好, 请参考开发文档, 目前rest api仅支持8kHz和16kHz的pcm, 谢谢

0
TOP
切换版块