首页 版块 访问AI主站 注册 发帖
操作指南:
技术专区:
AI赛事:
集思广益:
语音合成可以个性化自己产品的语音音色吗?
现在的在线语音合成有几个选择,如果是自己的产品想要自己独特的音色,可以叫人录然后百度提供特定服务产生另外一种声音吗?要跟百度官方的那几种选择一样,可以说出任何普通话。   ...
Android vivo x6 语音合成 不好用
我使用的服务是:  百度语音在线合成 调用的接口是:   mSpeechSynthesizer.speak(text); 参数设置情况...
是否只支持在国内使用?
在美国、香港等地是否有支持 语音合成的服务器? 是不是在国外会直接走离线的模式进行语音合成? 假如在国外在线合成,是不是又较长的网络延迟?延迟的时间有没有经验值?谢谢!...
一个小白的入门问题
各位大侠,最近公司想用百度的语音合成TTS技术,我在http://ai.baidu.com/sdk#asr里面找到“离在线融合SDK...
【restapi】【标准女声】[客]发音不准确
【restapi】【标准女声】【在线】【其他,“客”发音不准确】 文本:请客户经理做好接待准备 描述:“客”发音类似...
6.0以上系统手机 锁屏一段时间后停止语音合成
手机连接wifi,应用设置在线语音合成,将应用置于后台,手机锁屏,一段时间后,语音合成停止,查出来原因是app内检测到网络断开了 除了Android Doze设置不优化电量 还有没有其他方案?...
语音识别前可否对声音进行处理
唤醒之后,在线的语音识别之前,录得声音,可否我们进行声音的降噪处理和回声消除再上传音频。我看SDK没有提供这两种能力,所以在音频流上传之前,我们能否自己研发加入这种能力?...
CVPR2022 -- MetaFormer is Actually What You Need for Vision快速体验
paddleclas完成组网,在线体验MetaFormer的强大效果。 链接:https://aistudio.baidu.com/aistudio/projectdetail/3733873?shared=1...
求救求救
我在在线环境中安装模型之后,试运行,识别率很高,但是在自己本地安装之后,一个都识别不出来,错误率极高,有大佬知道是什么原因吗? ...
全新上线!EasyDL定制化声音识别全面开放
EasyDL全面开放新能力:定制声音分类。无需深度学习基础,每个人都可以定制模型,识别出当前音频是哪种声音,或者是什么状态/场景的声音...
【首发】活体检测新增合成人脸图甄别能力
及篡改很难通过肉眼辨别真伪,且人脸数据涉及到用户肖像/隐私等个人信息,篡改人脸数据对用户的个人信息安全造成威胁,当中风险一直困扰着企业管理者...
中文场景文字识别大赛官方基线正式发布
/train.py   使用过程中如有任何疑问,欢迎加入本次大赛官方QQ群在线讨论(871326661)。   赛题介绍 近年来,中文...
百度PARL:强化学习控制的流畅行走
中取得优异表现、蝉联冠军的主要因素是在于训练机制、通用算法、迭代效率三个方面长足的技术积累。 首先,百度构建了「课程学习」的训练机制,先从...
AI达人创造营课程笔记Lesson_3:深度学习模型训练和关键参数调优详解
任务的难度更高。这里说的场景任务包括但不限于目标检测、图像分割、文本生成、语音合成、强化学习等。 - [PaddleX模型](https...
使用PaddleNLP打造精准文献检索系统
数据中的文献预先通过 Sentence-BERT 计算得到文献向量后,通过开源向量数据 Milvus 建立索引,快速召回相似向量,减少了...
基于PaddleSpeech搭建多人语音识别
怎么基于PaddleSpeech单个人语音识别扩展到多个人声识别?
【新】EasyDL如何开通付费功能
艾瑞巴蒂 EasyDL可以在线充值购买额度啦~再也不用担心超过免费限额而失败啦~ Step 1 登录EasyDL首页...
OCR医疗发票识别正式商用单次调用低至0.35元
结构化识别全国各地门诊、住院发票(含全国统一发票和电子票)的所有关键字段,包括发票号、姓名、性别、社保卡号、金额大/小写、收款单位、省市...
5分钟"调教"一只机器狗 飞桨已经简单到这地步了
”的奥义之一。 这次飞桨公布了新版全景图,值得一提的是,其中的产业级模型新增了百度刚刚新发布的产业级知识增强文心大模型,多年积累,让大模型...
迁移学习核心技术开发与应用进修
),显卡驱动安装(512.54),CUDA Toolkit(10.1)和cuDNN加速(7.6.4),VS Code编辑器安装,Jupyter...
切换版块
智能客服