使用REST_API,识别wav格式音频,能输出识别数据,但是识别效果差(几乎不能正确识别发音)
188*****037 发布于2017-02 浏览:1735 回复:2
0
收藏

使用rest_api在windows7平台上进行语音识别开发,自己录制一段音频文件,格式为wav格式,语音能正确播放且清晰。通过rest_api进行识别,程序能够正常运行,但是语音识别结果错误(例如:语音为“李四”,识别结果为“嗯”)

看到官方文档上说的是“

  • 原始语音的录音格式目前只支持评测 8k/16k 采样率 16bit 位深的单声道语音
  • 压缩格式支持:pcm(不压缩)、wav、opus、speex、amr

问题一:wav格式的音频要不要求8k/16k 采样率 16bit 位深的单声道语音???

问题二:对于自己录制的语言,是不是只能用pcm格式???

收藏
点赞
0
个赞
共2条回复 最后由用户已被禁言回复于2022-04
#2nickms回复于2017-02

回复188*****037:

一:wav格式的音频也同样要求8k/16k 采样率 16bit 位深的单声道语音;

二:对于自己录制的语言,没有要求只能用pcm格式;

此外,speex不再支持,支持的格式为pcm(不压缩)、wav、opus、amr,后续我们会更新一下文档


0
TOP
切换版块