期望识别结果与实际识别结果相差非常大,基本是由于音频文件不符合要求的格式而造成的。确保音频符合 采样率 :16000 固定值。 编码:16bit 位深的单声道
也可以测试 http://speech-doc.gz.bcebos.com/rest-api-asr/public_audio/16k.pcm
准确度太差了把,我把m4a的文件转成wav的测试根本啥都解析不出来
http://speech-doc.gz.bcebos.com/rest-api-asr/public_audio/16k.pcm
对头
http://ai.baidu.com/docs#/ASR-API/top 文档里有
期望识别结果与实际识别结果相差非常大,基本是由于音频文件不符合要求的格式而造成的。确保音频符合 采样率 :16000 固定值。 编码:16bit 位深的单声道
也可以测试 http://speech-doc.gz.bcebos.com/rest-api-asr/public_audio/16k.pcm
准确度太差了把,我把m4a的文件转成wav的测试根本啥都解析不出来
http://speech-doc.gz.bcebos.com/rest-api-asr/public_audio/16k.pcm
对头
http://ai.baidu.com/docs#/ASR-API/top 文档里有