1.功能描述:
语音合成:基于业界领先的深度神经网络技术,提供高度拟人、流畅自然的语音合成服务,让您的应用、设备开口说话,更具个性
2.特色优势
支持多语言多音色
支持中文、英文、中英文混读合成,提供基础音库和精品音库共9种发音人供您选择,让您的应用拥有个性化的声音
丰富的场景应用
支持纯在线、纯离线、离在线融合三种应用方式,支持在有网、无网、弱网环境下的合成播报,满足不同的场景需求
方便快捷的集成方式
提供REST API接口,方便可发起网络请求的设备进行合成;提供Android、iOS SDK,轻巧简便,便于手机、智能硬件快速集成
3.调用攻略(Python3)及评测
3.1API(Python)说明:
请严格按照文档里描述的参数进行开发。请注意以下几个问题:
1.合成文本长度必须小于1024字节,如果本文长度较长,可以采用多次请求的方式。切忌文本长度超过限制。
2.新创建语音合成应用不限制每日调用量,但有QPS限额。详细限额数据可在控制台中查看。完成个人实名认证及企业认证可提高QPS限额。若需更大QPS可进一步商务合作咨询。
3.必填字段中,严格按照文档描述中内容填写。
配置AipSpeech
如果用户需要配置AipSpeech的网络请求参数(一般不需要配置),可以在构造AipSpeech之后调用接口设置参数,目前只支持以下参数:
接口 说明
setConnectionTimeoutInMillis 建立连接的超时时间(单位:毫秒
setSocketTimeoutInMillis 通过打开的连接传输数据的超时时间(单位:毫秒)
3.2 接口说明
语音合成接口描述
基于该接口,开发者可以轻松的获取语音合成能力
输入参数:
返回样例:
// 成功返回二进制文件流
// 失败返回
{
"err_no":500,
"err_msg":"notsupport.",
"sn":"abcdefgh",
"idx":1
}
错误信息
若请求错误,服务器将返回的JSON文本包含以下参数:
error_code:错误码。
error_msg:错误描述信息,帮助理解和解决发生的错误。
错误码 含义
500 不支持的输入
501 输入参数不正确
502 token验证失败
503 合成后端错误
3.3 代码实现
Python3调用代码如下:
from aip import AipSpeech
APP_ID = '你的 App ID'
API_KEY = '你的 Api Key'
SECRET_KEY = '你的 Secret Key'
def doc2speech(content,resultfile):
client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)
result = client.synthesis(content, 'zh', 1, {
'vol': 5,
})
# 识别正确返回语音二进制 错误则返回dict 参照下面错误码
if not isinstance(result, dict):
with open(resultfile, 'wb') as f:
f.write(result)
doc2speech('测试百度语音功能','../voc/voc1.mp3')
4.功能评测
选用不同的数据对效果进行测试,发现生成速度很快,效果很好。可以应用于:
泛阅读:通过阅读类APP阅读小说或新闻时,使用语音合成技术为用户提供多种发音人的朗读功能,释放双手和双眼,获得更极致的阅读体验
订单播报:可应用于打车软件、餐饮叫号、排队软件等场景,通过语音合成进行订单播报,让您便捷获得通知信息
智能硬件:可集成到儿童故事机、智能机器人、平板设备等智能硬件设备,使用户与设备的交互更自然、更亲切
等场景。
5 应用案例
应用语音合成功能对我以前写的人群流量方案进行升级,原文章链接如下:
https://ai.baidu.com/forum/topic/show/953160
原方案在发现过于拥挤后生成警告信息发给工作人员,由工作人员来进行疏散,需要比较长的时间周期。升级后直接对于过于拥挤的时候,除了发布警告信息给工作人员之外,还通过语音合成生成警告信息,通过园区的广播,直接指导人们离开过于拥挤的地方,降低危险性。
修改后的方案如图所示:
例如对于案例中,设置的是:区域1一个人也不应该有(因为禁止游泳),区域2报警阈值650,区域3报警阈值200.
那么在分析后就会触发针对区域2的报警广播,“附近人员过多,最大650人,现已733人,请启动限流疏散措施”。
自动识别,自动告警
是啊,这就是针对实际问题设计的
百度的功能的确强大
图像+语音全智能服务
未来可以智能预警了
智能城市对我们的生活越来越重要了
公共预警以后的应用会很广
这次的案例真的很实用
又有新的作品发表了,赞
谢谢哈
我给你点个赞