百度AI开发者社区

语音合成可以个性化自己产品的语音音色吗？

/forum/topic/show/864873 2018-05-21

现在的在线语音合成有几个选择，如果是自己的产品想要自己独特的音色，可以叫人录然后百度提供特定服务产生另外一种声音吗？要跟百度官方的那几种选择一样，可以说出任何普通话。 ...

Android vivo x6 语音合成不好用

/forum/topic/show/495074 2016-10-12

我使用的服务是：百度语音在线合成调用的接口是： mSpeechSynthesizer.speak(text); 参数设置情况...

是否只支持在国内使用？

/forum/topic/show/494836 2016-08-21

在美国、香港等地是否有支持语音合成的服务器？是不是在国外会直接走离线的模式进行语音合成？假如在国外在线合成，是不是又较长的网络延迟？延迟的时间有没有经验值？谢谢！...

一个小白的入门问题

/forum/topic/show/941918 2019-01-02

各位大侠，最近公司想用百度的语音合成TTS技术，我在http://ai.baidu.com/sdk#asr里面找到“离在线融合SDK...

【restapi】【标准女声】[客]发音不准确

/forum/topic/show/863998 2018-04-03

【restapi】【标准女声】【在线】【其他，“客”发音不准确】文本：请客户经理做好接待准备描述：“客”发音类似...

6.0以上系统手机锁屏一段时间后停止语音合成

/forum/topic/show/865330 2018-06-08

手机连接wifi，应用设置在线语音合成，将应用置于后台，手机锁屏，一段时间后，语音合成停止，查出来原因是app内检测到网络断开了除了Android Doze设置不优化电量还有没有其他方案？...

语音识别前可否对声音进行处理

/forum/topic/show/959098 2020-04-22

唤醒之后，在线的语音识别之前，录得声音，可否我们进行声音的降噪处理和回声消除再上传音频。我看SDK没有提供这两种能力，所以在音频流上传之前，我们能否自己研发加入这种能力？...

CVPR2022 -- MetaFormer is Actually What You Need for Vision快速体验

/paddle/forum/topic/show/994401 2022-04-03

paddleclas完成组网，在线体验MetaFormer的强大效果。链接：https://aistudio.baidu.com/aistudio/projectdetail/3733873?shared=1...

求救求救

/paddle/forum/topic/show/4192795 2023-11-14

我在在线环境中安装模型之后，试运行，识别率很高，但是在自己本地安装之后，一个都识别不出来，错误率极高，有大佬知道是什么原因吗？ ...

全新上线！EasyDL定制化声音识别全面开放

/forum/topic/show/870093 2018-07-26

EasyDL全面开放新能力：定制声音分类。无需深度学习基础，每个人都可以定制模型，识别出当前音频是哪种声音，或者是什么状态/场景的声音...

【首发】活体检测新增合成人脸图甄别能力

/forum/topic/show/958859 2020-04-09

及篡改很难通过肉眼辨别真伪，且人脸数据涉及到用户肖像/隐私等个人信息，篡改人脸数据对用户的个人信息安全造成威胁，当中风险一直困扰着企业管理者...

中文场景文字识别大赛官方基线正式发布

/paddle/forum/topic/show/954047 2019-07-26

/train.py 使用过程中如有任何疑问，欢迎加入本次大赛官方QQ群在线讨论（871326661）。赛题介绍近年来，中文...

百度PARL：强化学习控制的流畅行走

/paddle/forum/topic/show/956742 2019-11-08

中取得优异表现、蝉联冠军的主要因素是在于训练机制、通用算法库、迭代效率三个方面长足的技术积累。首先，百度构建了「课程学习」的训练机制，先从...

AI达人创造营课程笔记Lesson_3：深度学习模型训练和关键参数调优详解

/paddle/forum/topic/show/989758 2021-07-30

任务的难度更高。这里说的场景任务包括但不限于目标检测、图像分割、文本生成、语音合成、强化学习等。 - [PaddleX模型库](https...

使用PaddleNLP打造精准文献检索系统

/forum/topic/show/990731 2021-09-14

数据库中的文献预先通过 Sentence-BERT 计算得到文献向量后，通过开源向量数据库 Milvus 建立索引库，快速召回相似向量，减少了...

基于PaddleSpeech搭建多人语音识别

/paddle/forum/topic/show/1917212 2023-01-31

怎么基于PaddleSpeech单个人语音识别扩展到多个人声识别？

【新】EasyDL如何开通付费功能

/forum/topic/show/943901 2019-05-21

艾瑞巴蒂 EasyDL可以在线充值购买额度啦～再也不用担心超过免费限额而失败啦～ Step 1 登录EasyDL首页...

OCR医疗发票识别正式商用单次调用低至0.35元

/forum/topic/show/990507 2021-08-30

结构化识别全国各地门诊、住院发票（含全国统一发票和电子票）的所有关键字段，包括发票号、姓名、性别、社保卡号、金额大/小写、收款单位、省市...

5分钟"调教"一只机器狗飞桨已经简单到这地步了

/forum/topic/show/992834 2021-12-15

”的奥义之一。这次飞桨公布了新版全景图，值得一提的是，其中的产业级模型库新增了百度刚刚新发布的产业级知识增强文心大模型，多年积累，让大模型...

迁移学习核心技术开发与应用进修

/paddle/forum/topic/show/1780483 2022-08-01

），显卡驱动安装（512.54），CUDA Toolkit（10.1）和cuDNN加速库（7.6.4），VS Code编辑器安装，Jupyter...