语音技术不限量免费 助力开启语音交互时代
笔墨哥 发布于2018-06 浏览:2092 回复:2
1
收藏

百度语音技术,提供国际领先的语音识别、语音合成技术,帮助各行业实现语音和文本之间的相互转换,免费额度再升级,赋能开发者,开启语音交互新时代。

 

【无限次免费调用】

语音识别:原免费调用量5万次/天,现升级为无限次免费调用,默认每个应用10QPS并发;

语音合成:原免费调用量20万次/天,现升级为无限次免费调用,默认每个应用100QPS并发。

您若有高并发业务(识别>10QPS,合成>100QPS)需求,可在控制台—>应用列表—>应用详情页,提交申请。

老用户的QPS,已根据历史使用情况进行了自动配置,可放心使用,可在控制台对应的应用详情页查看。

 

【百度语音技术简介】

语音识别

http://ai.baidu.com/tech/speech

多语言:普通话、四川话、粤语、英语
支持长语音识别:不限时长
支持远场语音识别
自定义词库:提高专有场景/专有名词识别率
离线命令词:断网时可识别常用词/句
 

语音合成

http://ai.baidu.com/tech/speech/tts

多发音人:普通男/女声,情感发音人(软萌、武侠气质音色可选)
音量、音调、语速可调,获得个性化声音体验
多音字可标注,灵活满足业务需求
支持离在线合成,断网时也可继续使用
 

【应用场景】

泛阅读

有声朗读:新闻、小说等内容以语音的形式播放给用户;
语音指令:通过语音控制翻页、内容查询等操作。
 

视频直播

语音质检:将主播或视频中的音频进行识别后,对文字进行内容审核;
实时字幕:将视频中的语音实时地转为文字,生成字幕;
合成配音:将视频的旁白通过语音合成,制作配音。
 

游戏

语音播报:NPC、剧情等内容通过语音进行播报;
语音控制:语音操纵游戏角色动作行为;
语音交流:可将聊天终端文字和语音相互转换,提供更流畅的游戏体验。
 

交通出行

语音下单:通过语音完成下单操作,提升操作体验与业务效率;
订单播报:在新增或完成订单时,通过语音播放方式将订单信息及时同步服务人员;
语音导航:通过语音搜索目的地,在行驶过程中用语音向用户提示形式线路。
 

智能硬件

语音交互:通过语音搜索问题,并用语音播报结果;
语音操控设备:识别语音指令,操纵设备。
 

搜索输入

语音搜索:通过语音命令快速发起搜索,让搜索更快捷、更智能;
语音输入:通过语音代替文字输入、提升输入功率。


除了通用的语音识别外,我们还提供了呼叫中心的相关语音技术,点击了解详情http://ai.baidu.com/tech/bicc

更多应用场景,等待您的开发。近期,我们还将推出更多的语音技术,敬请期待。

 

内容来源:百度AI开放平台

收藏
点赞
1
个赞
共2条回复 最后由用户已被禁言回复于2022-04
#4hefeitest回复于2018-07

输入法都用语音识别了,以后各种输入文字的地方都可以用语音识别

0
#2人间月天回复于2018-06

语音识别在某些领域的优势很明显,估计以后的应用也一会越来越广泛

期待多语言混合识别方面能再完善一些

0
TOP
切换版块