首页 版块 访问AI主站 注册 发帖
操作指南:
技术专区:
AI赛事:
集思广益:
图像分割前的图像标注,从图像层面看原理是什么
图像分割前的图像标注,从图像层面看原理是什么?如题目所示
iOS语音合成和音乐播放功能之前会有冲突 该怎么解决
音乐播放器播放音乐了  语音合成就没有声了,我查看了是正常走的代码而且也正常调用了setCategory方法,但是不会出现声,程序回到前台...
【请教】项目启动后显存默认被占用约3G,是什么情况?
遇到过好几次这种情况,包括单卡32GV100和A100的环境,项目启动后显示显存被占用了3.2G,不知道是什么情况? 有时候模型训练正好...
轻松掌握:三分快,三大小倍.投方案是什么
三分快,三大小倍.投方案是什么【 +藤汛óó:《9462194》《罔:29hf点cc》fwsngj秋天是一个丰收的季节,秋天果子熟了。农民...
如何实现对语音的打分?
又分为两种情况: 1、评分完全有AI系统自主判断,没有任何参照。 2、上传对应文本的标准真人发,以此为参照,AI给出用户发的评分。 请问百度的语音处理服务有没有这样的服务,我翻了一遍没找到,如何实现这样的功能?  ...
语音合成和语音识别同时进行,导致识别不准确
截图能帮助您更快解决问题): 复现步骤、现象及其他描述:     在进行语音合成(例如:读一段文字),这个时候启用语音识别,把合成的声和人说的声混一起了,这种情况如何处理呢...
Parakeet TTS 旋律问题
话说前面有可以克隆声的模型(个人用tacotron2),那我在想,能不能有个在tts更上一层楼的操作,让输出的声有旋律,但是在...
请问最新版本的语音识别sdk有做降噪相关的处理吗
在录音完成后的识别过程中,稍远距离或者有轻微杂就提示音频质量有问题
BDS_ASR_PLAY_TONE
BDS_ASR_PLAY_TONE 设置参数为@(EVRPlayToneAll),但是没有提示,这是怎么回事呢?
显存占满,GPU利用率为0?是什么情况,如何解决?
,还是分配的资源的问题。训练的很慢,这可能是因为Decoder变成了多个。但是我也怀疑,这个分配的卡有点问题,上图显存小了很多,然后电源是ERR。这会是什么情况呢?...
stylegan中AdaIN的作用是什么?这一步对于原图像有什么效果?
stylegan中AdaIN的作用是什么?为什么要有这一步?这一步对于原图像有什么效果? 我今年刚读研一,希望各位大佬回答的基础一下,详细一下!谢谢...
【回看】百度大脑公开课信息服务专场
11月9日“百度大脑AI技术实战与场景解析公开课—信息服务专场“,无法到现场的同学欢迎围观直播 https://www.itdks.com/eventlist/detail/2804 ...
【立即回看】百度大脑行业创新技术公开课!
百度大脑行业创新论坛技术实战公开课已经开始,欢迎不能到场的同学观看直播,既学到手! 链接:http://www.itdks.com/eventlist/detail/2725   ...
Android SDK 有没有设置单声道的接口
我发现Android SDK的语音识别录出来的都是立体声,有没有设置单声道的接口啊? 谢谢!!
如何编码为pcm 或 wav
 请教个问题,获取到的采样声 是 float[] 数组,这样的如何编码为pcm 或 wav啊?(不懂编码)
关于Mummy语音识别的疑问
测试接口(英语模式下)的时候,多人分别输入mummy语音(包括百度翻译的发),接口始终返回“mami”。 不知为何?  ...
拼音读音识别判定
有没有关于拼音读音识别判定以及拼手写输入识别判定的第三方的接口
VAD断句时间可以设置吗
再对接智能 呼叫 中心,实时 语音 识别 LinuxSDK 时,发觉断句太快,这个 静 检测 断句时间可以设置吗?
切换版块
智能客服