长语音识别对语音文件如格式、采样率、编码的要求
lj_hubei 发布于2018-01 浏览:3194 回复:1
0
收藏

长语音识别是只支持在线识别模式吗,对语音文件如格式、采样率、编码的支持是怎样的?

 

技术文档中只看到REST-API对语音格式的支持,http://ai.baidu.com/docs/#/ASR-API/top

格式支持:cm(不压缩)、wav(不压缩,pcm编码)、amr(压缩格式)。推荐pcm 采样率 :8k 或者 16k 。推荐16K。 编码:16bit 位深的单声道。

收藏
点赞
0
个赞
共1条回复 最后由用户已被禁言回复于2022-04
#2卡农LLLL回复于2018-01

有离线的.

离线命令词: 断网时激活,只能识别预定义的短语。联网时,强制使用在线识别。固定短语的语法需要在官网预定义并下载为baidu_speech_grammar.bsg文件

没有纯离线的方案

0
TOP
切换版块