长语音识别对语音文件如格式、采样率、编码的要求

首页版块访问AI主站注册发帖

lj_hubei 发布于2018-01 浏览:4032 回复:1

长语音识别对语音文件如格式、采样率、编码的要求

快速回复

长语音识别是只支持在线识别模式吗，对语音文件如格式、采样率、编码的支持是怎样的？

技术文档中只看到REST-API对语音格式的支持，http://ai.baidu.com/docs/#/ASR-API/top

格式支持：cm（不压缩）、wav（不压缩，pcm编码）、amr（压缩格式）。推荐pcm 采样率：8k 或者 16k 。推荐16K。编码：16bit 位深的单声道。

识别-Android

语音识别

个赞

共1条回复最后由用户已被禁言回复于2022-04

#2卡农LLLL回复于2018-01

有离线的.

离线命令词：断网时激活，只能识别预定义的短语。联网时，强制使用在线识别。固定短语的语法需要在官网预定义并下载为baidu_speech_grammar.bsg文件

没有纯离线的方案

快速回复

小编推荐

百度大脑语音方向服务全面升级！

用户已被禁言 235.9K回复

语音识别「极速版」升级，支持小程序接入

用户已被禁言 1.6K回复

第三期【百度大脑新品体验】语音问答机器人小程序

wangwei8638 259.3K回复

TOP

操作指南

常见问答

平台公告

经验交流

技术专区

文字识别

人脸识别

语音技术

PaddlePaddle

EasyDL

BML

EasyData

AI Studio

UNIT

人体分析

图像搜索

图像识别

内容审核

自然语言处理

机器人视觉

视频技术

增强现实

知识图谱

智能创作

智能呼叫中心

文心

EdgeBoard

DuerOS

EasyEdge

度目硬件

百度AI市场

Doris

AI赛事

百度之星大赛

AI Studio人工智能竞赛

语言与智能技术竞赛

千言数据集

集思广益

共享工具

头脑风暴

成果展示

智能客服