在使用百度语音识别的过程中,使用手机录音m4a格式,转换成flac格式,使用播放器可以清晰听清楚具体的语音,但是识别的过程中识别率几乎为0,不知道哪里出了问题?
一段两秒的语音“好的”识别成“嗯”
好的.flac
{
"result": ["嗯,"],
"err_msg": "success.",
"sn": "15773473431474167681",
"err_no": 0,
"corpus_no": "6331501982909681555"
}
使用的是Sample中的代码,麻烦帮忙解答下,谢谢!
JSONObject params = new JSONObject();params.put("format", "x-flac");
params.put("rate", 8000);
params.put("channel", "1");
params.put("token", token);
params.put("cuid", cuid);
params.put("len", file.length());
params.put("speech", DatatypeConverter.printBase64Binary(loadFile(file)));
// add request header
conn.setRequestMethod("POST");
conn.setRequestProperty("Content-Type", "application/json; charset=utf-8");
收藏
点赞
0
个赞
请登录后评论
TOP
切换版块
建议使用8K和16K采样率的PCM
我这也是识别出一堆奇怪的文字
参数上没有问题,可能还是格式转换的问题,我们x-flac格式只支持特定格式,建议使用其他格式进行识别。
我之前使用http://online-audio-converter.com/ 这个插件将m4a转换成amr,一直报识别错误,也不清楚哪里出了问题。后来转换成flac格式,难道说flac和x-flac不一样?但是也没看到x-flac这种格式啊。有没有一些转格式的工具呢?
http://yuyin.baidu.com/bbs/q/2297