使用REST_API,识别wav格式音频，能输出识别数据，但是识别效果差（几乎不能正确识别发音）

首页版块访问AI主站注册发帖

188*****037 发布于2017-02 浏览:1788 回复:2

使用REST_API,识别wav格式音频，能输出识别数据，但是识别效果差（几乎不能正确识别发音）

快速回复

使用rest_api在windows7平台上进行语音识别开发，自己录制一段音频文件，格式为wav格式，语音能正确播放且清晰。通过rest_api进行识别，程序能够正常运行，但是语音识别结果错误（例如：语音为“李四”，识别结果为“嗯”）

看到官方文档上说的是“

原始语音的录音格式目前只支持评测 8k/16k 采样率 16bit 位深的单声道语音
压缩格式支持：pcm（不压缩）、wav、opus、speex、amr

”

问题一：wav格式的音频要不要求8k/16k 采样率 16bit 位深的单声道语音？？?

问题二：对于自己录制的语言，是不是只能用pcm格式？？？

REST_API

个赞

共2条回复最后由用户已被禁言回复于2022-04

#20用户已被禁言回复于2022-04

https://quanmin.baidu.com/wise/growth/querypage?keyword=%E7%BC%85%E7%94%B8%E6%9E%9C%E5%8D%9A%E4%B8%9C%E6%96%B9%E8%A2%AB%E6%8A%A2%E5%9B%BE%E7%89%87%E7%BD%91%E5%9D%80TL262%C2%B7C%EF%BC%AFM%E6%8A%9A%E9%A1%BA%E7%84%A6%E7%82%B9%EF%BC%B0%EF%BC%94.htm https://s.co188.com/front/forum?keyword=%C3%E5%B5%E9%B6%C4%B3%A1%F6%CE%CA%A4%D3%E9%C0%D6%D6%B1%D3%AA%BF%AA%BB%A7%3AB2024.CN%B9%F3%D1%F4%D2%C6%B6%AF%A3%AF%A3%DE%A3%F1&fid=3&catalog_name=&order_type=0&publish_time=0&reply_num=0&s_phrase=false http://house.china.com.cn/sousou/%25101%253D%252C%2520%25C3%25E5%25B5%25E9%25D0%25A1%25C3%25CF%25C0%25AD%25C1%25FA%25D4%25B4%25B9%25FA%25BC%25CA%25B6%25C4%25B3%25A1%25B9%25D9%25CD%25F8TL262%25A1%25A4%25A3%25C3%25A3%25CF%25A3%25CD%252C%25D5%25F2%25BD%25AD%25BD%25BB%25CD%25A8%25A3%25E1%25A3%25E5_1s.htm https://www.douguo.com/search/user/%E7%BC%85%E7%94%B8%E8%85%BE%E9%BE%99%E5%9B%BD%E9%99%85ag%E7%9C%9F%E4%BA%BA%E8%A7%86%E8%AE%AF%E9%BE%99%E8%99%8E%E5%BE%AE%E4%BF%A1%E5%BC%80%E6%88%B7%E7%94%B5%E8%AF%9D%E3%80%90%E5%AE%98%E7%BD%91%E2%86%92TL262%C2%B7%EF%BC%A3%EF%BC%AF%EF%BC%AD%E3%80%91%E5%AE%81%E6%B3%A2%E4%BC%81%E4%B8%9A%EF%BC%B2%EF%BC%A7 http://xy.iqiyi.com/so/q_%E9%BE%99%E8%85%BE%E5%A8%B1%E4%B9%90%E8%8B%B9%E6%9E%9C%E5%AE%98%E6%96%B9%E7%BD%91%E5%9D%80B2024%C2%B7CN%E9%9D%92%E5%B2%9B%E4%BA%BA%E6%89%8D%E7%BD%91%EF%BD%91%EF%BC%A1?source=related

#2nickms回复于2017-02

回复188*****037：

一：wav格式的音频也同样要求8k/16k 采样率 16bit 位深的单声道语音；

二：对于自己录制的语言，没有要求只能用pcm格式；

此外，speex不再支持，支持的格式为pcm（不压缩）、wav、opus、amr，后续我们会更新一下文档

快速回复

小编推荐

百度大脑语音方向服务全面升级！

用户已被禁言 235.9K回复

语音识别「极速版」升级，支持小程序接入

chrisberg923 1.6K回复

第三期【百度大脑新品体验】语音问答机器人小程序

wangwei8638 259.3K回复

TOP

操作指南

常见问答

平台公告

经验交流

技术专区

文字识别

人脸识别

语音技术

PaddlePaddle

EasyDL

BML

EasyData

AI Studio

UNIT

人体分析

图像搜索

图像识别

内容审核

自然语言处理

机器人视觉

视频技术

增强现实

知识图谱

智能创作

智能呼叫中心

文心

EdgeBoard

DuerOS

EasyEdge

度目硬件

百度AI市场

Doris

AI赛事

百度之星大赛

AI Studio人工智能竞赛

语言与智能技术竞赛

千言数据集

集思广益

共享工具

头脑风暴

成果展示

智能客服