语音识别辅助工具上线:音频转码、拼音相似度比较
牛叉的小飞 发布于2018-03 浏览:5839 回复:1
1
收藏

语音识别正式上线辅助工具模块【音频转码】【拼音相似度比较】,方便您可以更方便地接入语音识别服务,并提高语音识别效果,欢迎使用!

1.音频文件转码

在使用百度语音识别接口时,建议的音频格式为:pcm文件、16bit 位深的单声道、采样率16K。如果上传其它格式,则会在服务器端转码成pcm,调用接口的耗时会增加。

为方便用户对音频文件进行转化,我们提供了音频文件转码小工具,让用户方便获取合适的音频文件,从而提高识别效率。

【开发帮助文档】http://ai.baidu.com/docs#/ASR-Tool/1f9b114d

2.拼音相似度比较

为提高通讯录、歌曲名称等专有名词的语音识别准确率,我们提供了拼音相似度比较的工具。通过模糊匹配方法,在一组候选词中找出与搜索词读音最为接近的词组。

以通讯录为例,将通讯录中的联系人作为一组候选词,如:"张三",  "张散", "张丹", "张成", "李四", "李奎"等;当用户的搜索词被识别为“张山”时,我们发现“张三”的发音与之最为相似,因此,可以将搜索结果调整为“张三”。

【开发帮助文档】http://ai.baidu.com/docs#/ASR-Tool/e83a09f2

【成功案例参考】

智能设备行业案例:智伴-语音技术让孩子拥有"智能伙伴"

视频行业案例:语音识别助爱奇艺优化搜索体验

游戏行业案例:语音识别提升逍遥西游万家在线交流沉浸感

收藏
点赞
1
个赞
共1条回复 最后由用户已被禁言回复于2022-04
#2卡农LLLL回复于2018-03

貌似是restapi的吧.

0
TOP
切换版块