语音识别REST API识别率非常低！

首页版块访问AI主站注册发帖

语音识别REST API识别率非常低！

gsu6tayfgc 发布于2017-02 浏览:2252 回复:7

语音识别REST API识别率非常低！

快速回复

header("Content-type: text/html; charset=utf-8");

define('AUDIO_FILE', "./aaa.wav");

$url = "http://vop.baidu.com/server_api";

//put your params here

$cuid = "这里是MAC地址";

$apiKey = "APIKEY!!!!!!!!!!";

$secretKey = "SECRETKEY!!!!!!!!!!!!!!!!!!!";

$auth_url = "http://openapi.baidu.com/oauth/2.0/token?grant_type=client_credentials&client_id=".$apiKey."&client_secret=".$secretKey;

$ch = curl_init();

curl_setopt($ch, CURLOPT_URL, $auth_url);

curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);

curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, 5);

$response = curl_exec($ch);

if(curl_errno($ch))

{

print curl_error($ch);

}

curl_close($ch);

$response = json_decode($response, true);

$token = $response['access_token'];

var_dump($token);

$audio = file_get_contents(AUDIO_FILE);

$base_data = base64_encode($audio);

$array = array(

"format" => "wav",

"rate" => 8000,

"channel" => 1,

"lan" => "zh",

"token" => $token,

"cuid"=> $cuid,

//"url" => "http://www.xxx.com/sample.pcm",

//"callback" => "http://www.xxx.com/audio/callback",

"len" => filesize(AUDIO_FILE),

"speech" => $base_data,

);

$json_array = json_encode($array);

$content_len = "Content-Length: ".strlen($json_array);

$header = array ($content_len, 'Content-Type: application/json; charset=utf-8');

$ch = curl_init();

curl_setopt($ch, CURLOPT_URL, $url);

curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);

curl_setopt($ch, CURLOPT_HTTPHEADER, $header);

curl_setopt($ch, CURLOPT_POST, 1);

curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, 30);

curl_setopt($ch, CURLOPT_TIMEOUT, 30);

curl_setopt($ch, CURLOPT_POSTFIELDS, $json_array);

$response = curl_exec($ch);

if(curl_errno($ch))

{

print curl_error($ch);

}

curl_close($ch);

echo $response;

$response = json_decode($response, true);

var_dump($response);

这是我的代码基本上就是百度官方的样板改了一下格式路径（顺便吐槽一下官方的$auth_url里面地址都是错的）

用样板的test.pcm是正常的

可是用自己的音频就不正常了我是按照百度的要求压制的音频

wav格式 16bit 16K的采样率单声道 60秒之内

但是识别出来的东西完全不能用

{"corpus_no":"6389828892940933490","err_msg":"success.","err_no":0,"result":["点啊恩撑死想你时你是女神真是，日语ｎ，是雪儿，嗯，嗯嗯嗯嗯五，ｎ久没，和我与继母，除，与，嗯嗯嗯同意的，你是英雄与美女，求美女，风雪无阻，种子，嗯嗯，嗯，嗯啊你说不行么嗯嗯，嗯嗯嗯，恩格尔，嗯，呢，"],"sn":"48699572061487747973"}

跪求指点我是哪里搞错了万分感谢！！！

语音识别

REST_API

识别-REST_API

个赞

共7条回复最后由用户已被禁言回复于2022-04

#8用户已被禁言回复于2020-01

对#7 okjianghua666回复

官方样例不报错，没问题

说明你的工程没有问题，可以将报错的音频反馈至官方QQ群：588369236。群管理员会协助你排查音频错误原因。

#7okjianghua666回复于2020-01

官方样例不报错，没问题

#6用户已被禁言回复于2020-01

对#5 okjianghua666回复

[图片]这是我的音频格式，大神看看哪里不对吗

官方示例音频测试会报错吗？

#5okjianghua666回复于2020-01

这是我的音频格式，大神看看哪里不对吗

#4用户已被禁言回复于2020-01

对#3 okjianghua666回复

遇到同样问题

题主的问题是采用率错误，格式要求16K，音频是8K的。可以检查一下，也可以测试官方示例音频看能否正确识别。

#3okjianghua666回复于2020-01

遇到同样问题

#2nickms回复于2017-02

已回复邮件，是由于采样率设置有误

快速回复

小编推荐

百度大脑语音方向服务全面升级！

用户已被禁言 235.9K回复

语音识别「极速版」升级，支持小程序接入

用户已被禁言 1.6K回复

第三期【百度大脑新品体验】语音问答机器人小程序

wangwei8638 259.3K回复

TOP

操作指南

常见问答

平台公告

经验交流

技术专区

文字识别

人脸识别

语音技术

PaddlePaddle

EasyDL

BML

EasyData

AI Studio

UNIT

人体分析

图像搜索

图像识别

内容审核

自然语言处理

机器人视觉

视频技术

增强现实

知识图谱

智能创作

智能呼叫中心

文心

EdgeBoard

DuerOS

EasyEdge

度目硬件

百度AI市场

Doris

AI赛事

百度之星大赛

AI Studio人工智能竞赛

语言与智能技术竞赛

千言数据集

集思广益

共享工具

头脑风暴

成果展示

智能客服