长语音识别是只支持在线识别模式吗,对语音文件如格式、采样率、编码的支持是怎样的?
技术文档中只看到REST-API对语音格式的支持,http://ai.baidu.com/docs/#/ASR-API/top
格式支持:cm(不压缩)、wav(不压缩,pcm编码)、amr(压缩格式)。推荐pcm 采样率 :8k 或者 16k 。推荐16K。 编码:16bit 位深的单声道。
收藏
点赞
0
个赞
请登录后评论
TOP
切换版块
有离线的.
离线命令词: 断网时激活,只能识别预定义的短语。联网时,强制使用在线识别。固定短语的语法需要在官网预定义并下载为baidu_speech_grammar.bsg文件
没有纯离线的方案