百度AI开发者社区

图像分割前的图像标注，从图像层面看原理是什么？

/paddle/forum/topic/show/993300 2022-01-14

图像分割前的图像标注，从图像层面看原理是什么？如题目所示

iOS语音合成和音乐播放功能之前会有冲突该怎么解决

/forum/topic/show/494776 2016-08-12

音乐播放器播放音乐了语音合成就没有声音了，我查看了是正常走的代码而且也正常调用了setCategory方法，但是不会出现声音，程序回到前台...

【请教】项目启动后显存默认被占用约3G，是什么情况？

/paddle/forum/topic/show/1912490 2022-10-27

遇到过好几次这种情况，包括单卡32GV100和A100的环境，项目启动后显示显存被占用了3.2G，不知道是什么情况？有时候模型训练正好...

轻松掌握:三分快,三大小倍.投方案是什么

/paddle/forum/topic/show/4174313 2023-10-27

三分快,三大小倍.投方案是什么【 +藤汛óó：《9462194》《罔：29hf点cc》fwsngj秋天是一个丰收的季节,秋天果子熟了。农民...

如何实现对语音的打分？

/forum/topic/show/987734 2021-04-04

又分为两种情况： 1、评分完全有AI系统自主判断，没有任何参照。 2、上传对应文本的标准真人发音，以此为参照，AI给出用户发音的评分。请问百度的语音处理服务有没有这样的服务，我翻了一遍没找到，如何实现这样的功能？ ...

语音合成和语音识别同时进行，导致识别不准确

/forum/topic/show/496184 2017-08-09

截图能帮助您更快解决问题）：复现步骤、现象及其他描述：在进行语音合成（例如：读一段文字），这个时候启用语音识别，把合成的声音和人说的声音混一起了，这种情况如何处理呢...

Parakeet TTS 旋律问题

/paddle/forum/topic/show/991456 2021-11-07

话说前面有可以克隆声音的模型(个人用tacotron2),那我在想,能不能有个在tts更上一层楼的操作,让输出的声音有旋律,但是在...

大数据、深度学习和知识图谱线上直播

/forum/topic/show/957812 2020-02-19

语音合成如果想指定某个字的发音，怎么实现？

/forum/topic/show/492084 2017-10-15

可以自主标音么？

请问最新版本的语音识别sdk有做降噪相关的处理吗

/forum/topic/show/942316 2019-02-14

在录音完成后的识别过程中，稍远距离或者有轻微杂音就提示音频质量有问题

BDS_ASR_PLAY_TONE

/forum/topic/show/942585 2019-03-10

BDS_ASR_PLAY_TONE 设置参数为@(EVRPlayToneAll)，但是没有提示音，这是怎么回事呢？

显存占满，GPU利用率为0？是什么情况，如何解决？

/paddle/forum/topic/show/1729475 2022-05-21

，还是分配的资源的问题。训练的很慢，这可能是因为Decoder变成了多个。但是我也怀疑，这个分配的卡有点问题，上图显存小了很多，然后电源是ERR。这会是什么情况呢？...

stylegan中AdaIN的作用是什么？这一步对于原图像有什么效果？

/paddle/forum/topic/show/990319 2021-08-17

stylegan中AdaIN的作用是什么？为什么要有这一步？这一步对于原图像有什么效果？我今年刚读研一，希望各位大佬回答的基础一下，详细一下！谢谢...

【回看】百度大脑公开课信息服务专场

/forum/topic/show/940540 2018-11-09

11月9日“百度大脑AI技术实战与场景解析公开课—信息服务专场“，无法到现场的同学欢迎围观直播 https://www.itdks.com/eventlist/detail/2804 ...

【立即回看】百度大脑行业创新技术公开课！

/forum/topic/show/892725 2018-10-19

百度大脑行业创新论坛技术实战公开课已经开始，欢迎不能到场的同学观看直播，既学到手！链接：http://www.itdks.com/eventlist/detail/2725 ...

Android SDK 有没有设置单声道的接口

/forum/topic/show/595961 2018-03-23

我发现Android SDK的语音识别录出来的音都是立体声，有没有设置单声道的接口啊？谢谢！！

如何编码为pcm 或 wav

/forum/topic/show/492893 2015-06-25

请教个问题，获取到的采样声音是 float[] 数组，这样的如何编码为pcm 或 wav啊？(不懂编码)

关于Mummy语音识别的疑问

/forum/topic/show/957034 2019-12-10

测试接口（英语模式下）的时候，多人分别输入mummy语音（包括百度翻译的发音），接口始终返回“mami”。不知为何？ ...

拼音读音识别判定

/forum/topic/show/967456 2020-10-10

有没有关于拼音读音识别判定以及拼音手写输入识别判定的第三方的接口

VAD断句时间可以设置吗

/forum/topic/show/956291 2019-10-09

再对接智能呼叫中心，实时语音识别 LinuxSDK 时，发觉断句太快，这个静音检测断句时间可以设置吗？