首页 版块 访问AI主站 注册 发帖
操作指南:
技术专区:
AI赛事:
集思广益:
tts文本转语音的模型,针对多音字问题是如何处理的?
如果遇到多音字的情况,例如唐山乐亭、南堡等多音字使用tts文本转语音是错误的声调,是否能实现模型微调呢?有没有可供参考的微调的指南?...
在使用pp-ocrv4时开启use_mkldnn=True加速失效
mkldnn加速,发现使用ppocrv4时,加速没效果,但是换成ppocrv3的模型时,加速效果 ...
请问datatype等于5和6是指的什么?求帮忙
在改动官方课程CH7的GAN程序后,加入了自己的数据集 数据集格式:mat 大小:单个128*128 没标签 前面运行都没错误,到训练...
Notebook项目的GPU驱动版本问题
to run.] at (/paddle/paddle/fluid/platform/gpu_info.cc:65) 几天之前跑还没这个问题。请问是GPU的配置变化吗?办法解决吗?...
关于全局平均池化的问题?
全局平均池化是将整张特征图n*n*c平均成 1*1*c的操作,什么作用吗(除了在网络最后减少计算量以外)? 尤其是在图像分割中,说全局...
长语音文件识别如何获得每一句的时间起止
开发文档里写明返回,实际上并没返回,这对制作字幕、根据语义关键词增加视频贴纸之类的功能来说非常重要 这是返回的数据,各个回调里都看...
考虑Notebook支持更多单元格折叠?
批量折叠某一级标题下的所单元格,包括文本和代码单元格,就像Word的标题(分级样式)前的折叠按钮那样(WPS没),一键隐藏/显示某一级标题下的所单元格,使得Notebook结构清晰。  ...
请教数据增广的问题
我在原数据上训练的一段时间,然后对图片进行了新的增广操作(比如任意角度旋转)。请教各位大佬,这样做会导致数据分布的变化以使模型的分类进度...
百度人脸注册工具中的数据回传问题
/Face-Facekit-Register/top,说得不清楚,自己的监听接口正常,就是没百度的数据过来。也无法查询到回传状态,请问有没有什么好的办法可以解决?...
项目全流程实践学习心得
aistudio的使用技巧,例如“??model.....”可以了解模型具体参数,利于调整参数 百度easy系列产品可以很方便地进行...
后台无打断训练模型
后这个环境就会被关闭,再次进入,这个任务就没了。 我看到页面上个“任务”栏,只是直接创建任务,没运行如上 shell 命令的地方(我还...
paddle批量预测和多线程预测?
在调用paddle的CAPI的时候,如果300个样本,现在两种方式预测: (A) 将300个样本平均拆分成3份,然后用3个线程(每个...
炼丹师读源码之DSSM Loss、Optimiz
entropy以及mult lable ce、mse)还optimizer 用adam的部分代码来学习PaddlePaddle是怎么实现的,大家...
百度语音试用服务已经到期,请及时更新授权
1,刚开始使用语音服务的时候,语音提示:百度语音试用服务已经到期,请及时更新授权。请问这是怎么回事?如果上线,是否影响?该申请的东西已经...
sqlserver中搜索全部表的关键字
sqlserver中搜索所表中的关键字的表和字段. 时候全文修改的时候好用.   declare @str varchar(100...
语音识别 玩家主动结束 sdk都操作了什么 我主动结束后 游戏音效都被停了
下 开始识别 和结束识别  也这样  我觉得sdk很多家都用 不能这种大问题啊 还是别人都自己加什么东西解决了 还是 sdk什么设置相关的没弄好  大神没...
android的语音识别的对话框可不可以像ios一样设置tiplist
BaiduASRDigitalDialog  类里面下面的设置项,但是我设置了之后对话框没什么变化。 String PARAM_TIPS...
调用api,响应速度慢,无法连续识别。
(上传截图能帮助您更快解决问题): 复现步骤、现象及其他描述: 1.在调用api时只能上传一段语音再返回识别结果?有没有类似于边说边识别的实现...
离线语音词条说明等问题
= * 说法 it.content = 在网页测试中没问题,而在app中测试却不行了呢? 或者我想知道有没有方法能将 在线解析的语句 通过 自定义语义 的方式返回json数据,那就更方便了,请问什么方法能实现吗?...
直接使用百度自带的库无法识别文件
(os.curdir) # 列出目录下的所文件和目录 for i in list: if i == filePath: print('找到文件...
切换版块
智能客服