首页 版块 访问AI主站 注册 发帖
操作指南:
技术专区:
AI赛事:
集思广益:
[BUG]语音合成遇到“howold”开头的会挂掉
我使用的服务是:语音合成 调用的接口是:base_url = 'http://tsn.baidu.com/text2audio' 参...
上传opus格式文件进行识别返回3301标识,sn:383234114881487581729
我使用的服务是:REST_API 调用的接口是: 参设置情况: 开发平台和机型:mac  SDK版本号: 代码或日志截图(上传截图能帮助...
语音识别模拟器处理方法
若开发者希望能在模拟器中开发,建议开发者使用宏屏蔽语音相关代码,并关闭XCode中强制引入库的参。宏可以参考-- 官方文档里面的这个描述...
PaddleClas中的模型效果为什么这么好,他们怎么训练得到的?
使用了一下PaddleClas中的模型,效果十分好,但是使用相同的网络,不加载预训练参,自己训练的效果超级差,目前遇到的是过拟合现象超级...
转nb文件以及label的疑问
谢谢,谁能回答这两问题啊,刚学习paddle 1.通过opt转nb,有的可以转成功,有的转失败。看opt的参没有能够检查是否能够支持...
paddleSeg中SETR模型的backbone_indices,里面的参设置具体是什么意思?
backbone_indices=(9, 14, 19, 23)为什么这么设置?理由是啥? 而且SETR只能用ViT_large_*()的backbone,也就是当ViT模型中depth=24的时候才能运行,不...
CV七日打卡营心得(疫情特辑)
。 这一次的人以及规模都比上一次要大不少,百度AI studio的GPU算力资源为打卡营助力了许多,当然这一次的人众多导致算力资源比较紧张,所以...
paddle上的代码识别出这张已经检测好的图片。怎么识别出红框里面的
如上图,我已经将文本检测出来了,需要识别出文本框里面的文字,代码怎么实现?
使用Resnet50预训练模型调整了输出类别后,权重形状不一致如何解决
model = paddle.vision.models.resnet50(pretrained=True, num_classes=12) 出现错误 fc.weight receives a shape [2048, 1000], but the expected shape is [2048, 12], 模型输...
动态图转静态图报错
predict class FM(paddle.nn.Layer): # 在__init__()函中创建了需要训练的参...
【AI达人养成营】学习笔记
在python中修改变量值的操作,并不是修改了变量的值,而是修改了变量指向的内存地址。首先读取x的值,然后加6,并将结果存放于内存中...
语音合成的声音很小是怎么回事呢
语音合成的声音很小是怎么回事呢?手机音量已经调成最大了, speechSynthesizer.setParam(SpeechSynthesizer.PARAM_VOLUME, "9"); 音量参设成9...
AI我的手写版文字照片识别,问题太多了,如何解决
我想截个图,证明easydl的复杂程度,对小白的困难指不低啊,为什么要4个分类呢,
没有V3版本的Demo下载么?
没有V3版本的Demo下载么?怎么下载下来都是V2版本的,主要是参不一样了
语音识别开着wifi能不能走离线
语音识别开着wifi能不能走离线,或者是像TTS那像超时1.2s走离线。 有参可以设置吗?
语音唤醒demo中的问题
demo中语音唤醒识别ActivityWakeUpRecog中,设置参SpeechConstant.AUDIO_MILLS 是不是应该是...
如何判断是否证件照
根据哪些参和规则能够判断出一张照片是否证件照? 请提供一下思路或者方法
切换版块
智能客服