使用REST_API,识别wav格式音频,能输出识别数据,但是识别效果差(几乎不能正确识别发音)
188*****037 发布于2017-02 浏览:1572 回复:2
0
收藏

使用rest_api在windows7平台上进行语音识别开发,自己录制一段音频文件,格式为wav格式,语音能正确播放且清晰。通过rest_api进行识别,程序能够正常运行,但是语音识别结果错误(例如:语音为“李四”,识别结果为“嗯”)

看到官方文档上说的是“

  • 原始语音的录音格式目前只支持评测 8k/16k 采样率 16bit 位深的单声道语音
  • 压缩格式支持:pcm(不压缩)、wav、opus、speex、amr

问题一:wav格式的音频要不要求8k/16k 采样率 16bit 位深的单声道语音???

问题二:对于自己录制的语言,是不是只能用pcm格式???

收藏
点赞
0
个赞
共2条回复 最后由用户已被禁言回复于2022-04
#20用户已被禁言回复于2022-04

https://quanmin.baidu.com/wise/growth/querypage?keyword=%E7%BC%85%E7%94%B8%E6%9E%9C%E5%8D%9A%E4%B8%9C%E6%96%B9%E8%A2%AB%E6%8A%A2%E5%9B%BE%E7%89%87%E7%BD%91%E5%9D%80TL262%C2%B7C%EF%BC%AFM%E6%8A%9A%E9%A1%BA%E7%84%A6%E7%82%B9%EF%BC%B0%EF%BC%94.htm https://s.co188.com/front/forum?keyword=%C3%E5%B5%E9%B6%C4%B3%A1%F6%CE%CA%A4%D3%E9%C0%D6%D6%B1%D3%AA%BF%AA%BB%A7%3AB2024.CN%B9%F3%D1%F4%D2%C6%B6%AF%A3%AF%A3%DE%A3%F1&fid=3&catalog_name=&order_type=0&publish_time=0&reply_num=0&s_phrase=false http://house.china.com.cn/sousou/%25101%253D%252C%2520%25C3%25E5%25B5%25E9%25D0%25A1%25C3%25CF%25C0%25AD%25C1%25FA%25D4%25B4%25B9%25FA%25BC%25CA%25B6%25C4%25B3%25A1%25B9%25D9%25CD%25F8TL262%25A1%25A4%25A3%25C3%25A3%25CF%25A3%25CD%252C%25D5%25F2%25BD%25AD%25BD%25BB%25CD%25A8%25A3%25E1%25A3%25E5_1s.htm https://www.douguo.com/search/user/%E7%BC%85%E7%94%B8%E8%85%BE%E9%BE%99%E5%9B%BD%E9%99%85ag%E7%9C%9F%E4%BA%BA%E8%A7%86%E8%AE%AF%E9%BE%99%E8%99%8E%E5%BE%AE%E4%BF%A1%E5%BC%80%E6%88%B7%E7%94%B5%E8%AF%9D%E3%80%90%E5%AE%98%E7%BD%91%E2%86%92TL262%C2%B7%EF%BC%A3%EF%BC%AF%EF%BC%AD%E3%80%91%E5%AE%81%E6%B3%A2%E4%BC%81%E4%B8%9A%EF%BC%B2%EF%BC%A7 http://xy.iqiyi.com/so/q_%E9%BE%99%E8%85%BE%E5%A8%B1%E4%B9%90%E8%8B%B9%E6%9E%9C%E5%AE%98%E6%96%B9%E7%BD%91%E5%9D%80B2024%C2%B7CN%E9%9D%92%E5%B2%9B%E4%BA%BA%E6%89%8D%E7%BD%91%EF%BD%91%EF%BC%A1?source=related

0
#2nickms回复于2017-02

回复188*****037:

一:wav格式的音频也同样要求8k/16k 采样率 16bit 位深的单声道语音;

二:对于自己录制的语言,没有要求只能用pcm格式;

此外,speex不再支持,支持的格式为pcm(不压缩)、wav、opus、amr,后续我们会更新一下文档


0
TOP
切换版块