请问识别到语音后是否可以尽快返回识别结果，假设上传的15s数据中只有2~4s有语音，其他都是静音（或低的噪音），能否不用等15s数据传完就返回识别结果？

首页版块访问AI主站注册发帖

szk18603059681 发布于2016-11 浏览:1400 回复:4

快速回复

我使用的服务是：REST

调用的接口是：REST_API

参数设置情况：8k，16bit

开发平台和机型：arm

SDK版本号：

代码或日志截图（上传截图能帮助您更快解决问题）：

复现步骤、现象及其他描述：

语音识别

在线

识别-REST_API

个赞

共4条回复最后由用户已被禁言回复于2022-04

#5xieymxj回复于2016-12

W_维生素Q_W：

自行实现VAD的话，有一个切割点的问题，比如连续语音超过1分钟了，不得不截断，这样就会导致部分语素识别出问题啊

回复W_维生素Q_W：恩，这个确实存在问题，因为切分算法一般都是由用户停顿导致的。

#4W_维生素Q_W回复于2016-12

自行实现VAD的话，有一个切割点的问题，比如连续语音超过1分钟了，不得不截断，这样就会导致部分语素识别出问题啊

#3xieymxj回复于2016-11

如果您使用我们的SDK，里面会包含一个端点检测的模块，用于静音判断，理论上只会传输有音频的部分数据。这个算法模块在API接口里面也有，但是无论如何你都要上传全部语音了。

您可以自己实现端点检测的算法，效果只能由您来保证了。否则可以考虑使用我们的SDK。

#2szk18603059681回复于2016-11

有人知道么？

快速回复

小编推荐

百度大脑语音方向服务全面升级！

用户已被禁言 235.9K回复

语音识别「极速版」升级，支持小程序接入

用户已被禁言 1.6K回复

第三期【百度大脑新品体验】语音问答机器人小程序

wangwei8638 259.3K回复

TOP

操作指南

常见问答

平台公告

经验交流

技术专区

文字识别

人脸识别

语音技术

PaddlePaddle

EasyDL

BML

EasyData

AI Studio

UNIT

人体分析

图像搜索

图像识别

内容审核

自然语言处理

机器人视觉

视频技术

增强现实

知识图谱

智能创作

智能呼叫中心

文心

EdgeBoard

DuerOS

EasyEdge

度目硬件

百度AI市场

Doris

AI赛事

百度之星大赛

AI Studio人工智能竞赛

语言与智能技术竞赛

千言数据集

集思广益

共享工具

头脑风暴

成果展示

智能客服