【语音月】语音合成升级人群流量监控方案

首页版块访问AI主站注册发帖

【语音月】语音合成升级人群流量监控方案

才能我浪费99 发布于2019-11 浏览:2980 回复:11

【语音月】语音合成升级人群流量监控方案

快速回复

最后编辑于2022-04

1.功能描述：

语音合成：基于业界领先的深度神经网络技术，提供高度拟人、流畅自然的语音合成服务，让您的应用、设备开口说话，更具个性

2.特色优势

支持多语言多音色
支持中文、英文、中英文混读合成，提供基础音库和精品音库共9种发音人供您选择，让您的应用拥有个性化的声音

丰富的场景应用
支持纯在线、纯离线、离在线融合三种应用方式，支持在有网、无网、弱网环境下的合成播报，满足不同的场景需求

方便快捷的集成方式
提供REST API接口，方便可发起网络请求的设备进行合成；提供Android、iOS SDK，轻巧简便，便于手机、智能硬件快速集成

3.调用攻略（Python3）及评测

3.1API(Python)说明：
请严格按照文档里描述的参数进行开发。请注意以下几个问题：
1.合成文本长度必须小于1024字节，如果本文长度较长，可以采用多次请求的方式。切忌文本长度超过限制。
2.新创建语音合成应用不限制每日调用量，但有QPS限额。详细限额数据可在控制台中查看。完成个人实名认证及企业认证可提高QPS限额。若需更大QPS可进一步商务合作咨询。
3.必填字段中，严格按照文档描述中内容填写。

配置AipSpeech
如果用户需要配置AipSpeech的网络请求参数(一般不需要配置)，可以在构造AipSpeech之后调用接口设置参数，目前只支持以下参数：

接口说明
setConnectionTimeoutInMillis 建立连接的超时时间（单位：毫秒
setSocketTimeoutInMillis 通过打开的连接传输数据的超时时间（单位：毫秒）

3.2 接口说明
语音合成接口描述
基于该接口，开发者可以轻松的获取语音合成能力

输入参数：

返回样例：

// 成功返回二进制文件流
// 失败返回
{
"err_no":500,
"err_msg":"notsupport.",
"sn":"abcdefgh",
"idx":1
}
错误信息
若请求错误，服务器将返回的JSON文本包含以下参数：

error_code：错误码。
error_msg：错误描述信息，帮助理解和解决发生的错误。

错误码含义
500 不支持的输入
501 输入参数不正确
502 token验证失败
503 合成后端错误

3.3 代码实现

Python3调用代码如下：

from aip import AipSpeech

APP_ID = '你的 App ID'
API_KEY = '你的 Api Key'
SECRET_KEY = '你的 Secret Key'

def doc2speech(content,resultfile):
    client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)
    
    result  = client.synthesis(content, 'zh', 1, {
        'vol': 5,
    })
    
    # 识别正确返回语音二进制 错误则返回dict 参照下面错误码
    if not isinstance(result, dict):
        with open(resultfile, 'wb') as f:
            f.write(result)

doc2speech('测试百度语音功能','../voc/voc1.mp3')

4.功能评测

选用不同的数据对效果进行测试，发现生成速度很快，效果很好。可以应用于：
泛阅读：通过阅读类APP阅读小说或新闻时，使用语音合成技术为用户提供多种发音人的朗读功能，释放双手和双眼，获得更极致的阅读体验
订单播报：可应用于打车软件、餐饮叫号、排队软件等场景，通过语音合成进行订单播报，让您便捷获得通知信息
智能硬件：可集成到儿童故事机、智能机器人、平板设备等智能硬件设备，使用户与设备的交互更自然、更亲切
等场景。

5 应用案例

应用语音合成功能对我以前写的人群流量方案进行升级，原文章链接如下：
https://ai.baidu.com/forum/topic/show/953160
原方案在发现过于拥挤后生成警告信息发给工作人员，由工作人员来进行疏散，需要比较长的时间周期。升级后直接对于过于拥挤的时候，除了发布警告信息给工作人员之外，还通过语音合成生成警告信息，通过园区的广播，直接指导人们离开过于拥挤的地方，降低危险性。

修改后的方案如图所示：

例如对于案例中，设置的是：区域1一个人也不应该有（因为禁止游泳），区域2报警阈值650，区域3报警阈值200.

那么在分析后就会触发针对区域2的报警广播，“附近人员过多，最大650人，现已733人，请启动限流疏散措施”。

热门活动

个赞

共11条回复最后由用户已被禁言回复于2022-04

#12才能我浪费99回复于2019-12

对#9 worddict回复

图像+语音全智能服务

自动识别，自动告警

#11才能我浪费99回复于2019-12

对#5 小雨青青润无声回复

这次的案例真的很实用

是啊，这就是针对实际问题设计的

#10worddict回复于2019-11

百度的功能的确强大

#9worddict回复于2019-11

图像+语音全智能服务

#8worddict回复于2019-11

对#6 风搅火回复

公共预警以后的应用会很广

未来可以智能预警了

#7风搅火回复于2019-11

智能城市对我们的生活越来越重要了

#6风搅火回复于2019-11

公共预警以后的应用会很广

#5小雨青青润无声回复于2019-11

这次的案例真的很实用

#4小雨青青润无声回复于2019-11

又有新的作品发表了，赞

#3才能我浪费99回复于2019-11

对#2 134******14回复

我给你点个赞

谢谢哈

#2134******14回复于2019-11

我给你点个赞

快速回复

小编推荐

【征稿计划第二期】评测报告、使用攻略、行业案例

用户已被禁言 14回复

Baidu Create 2019 | 百度大脑

用户已被禁言 6回复

【颁奖】第三期百度大脑新品体验师

用户已被禁言 19回复

【四月评测】远场语音识别套件

goJhou 17回复

TOP

操作指南

常见问答

平台公告

经验交流

技术专区

文字识别

人脸识别

语音技术

PaddlePaddle

EasyDL

BML

EasyData

AI Studio

UNIT

人体分析

图像搜索

图像识别

内容审核

自然语言处理

机器人视觉

视频技术

增强现实

知识图谱

智能创作

智能呼叫中心

文心

EdgeBoard

DuerOS

EasyEdge

度目硬件

百度AI市场

Doris

AI赛事

百度之星大赛

AI Studio人工智能竞赛

语言与智能技术竞赛

千言数据集

集思广益

共享工具

头脑风暴

成果展示

智能客服