上传的语音返回3303
没有上传词库文件,上传的wav 单声道 16k , 参数传的pcm的情况
请求:data:audio/wav;base64...
关于预训练模型数据预处理的问题
请问Paddle是否和Keras一样:
在调用预训练模型时,有process_input之类的数据预处理函数。
如果没有的话 VGG16\Resnet50 进行训练时的均值和方差是多少?这个有文档介绍吗...
上传/下载速度如何提升
想要下载预训练模型 vqgan_imagenet_f16_16384 不到一个G结果发现要下二十多个小时......有些离谱后来又想从本地上传到上面,结果有150mb大小的限制,不知如何是好...
周计算时间消耗异常
更改计费价格后,用算力卡使用v100,无论是32还是16G版本,每周剩余计算时间的消耗比实际使用时间多好几倍,请问如何设置可以避免时间消耗异常?...
百度AR技术取得突破进展
百度AR技术取得突破进展 两大交互系统刷新探索世界方式
2019年百度AI开发者大会上,百度视觉技术部、增强现实技术部总监吴中勤宣布...
卷积网络最新的进展怎么样?
想用卷积网络做一个中文识别的模型,目前用的是VGG-16,但是效果还不太好。
不知道分类的卷积网络最新进展如何?又或者在哪里能看到最新进展呢?...
安卓集成语音识别导包问题
步骤、现象及其他描述:
我在项目中集成上图中第一个下载的包没有问题,但是用第二个集成就有问题,报的错误如下:05-17 16:57...
语音问题
:324]Thread start (SP ~ 0x16f0e6f08, threadID: 0x16f0e7000
Invalid...