语音识别时长问题
百度有没有付费服务,我们网站每天会产生上百个长度为几分到半小时的音频文件,我们想每天把他们转成文本。你们的公有云服务好像无法完成这个任务。...
上传的语音返回3303
没有上传词库文件,上传的wav 单声道 16k , 参数传的pcm的情况
请求:data:audio/wav;base64...
请问返回的72个关键点每个点都代表什么位置呢?
只返回了xy坐标,可我不知道这些点每个点都代表哪个部位啊,face++返回的关键点里提供的有每个点的对应部位,不知道百度的有没有。
想做一个识别到脸部以后再脸上盖一个脸谱的玩玩。...
设备唤醒
不知道有没有人听过迪姆机器人,一款需要手动按键唤醒的智能对话设备,不知道能不能通过什么方式变成语音唤醒,求各路大神指教
...
百度语音合成能移植到嵌入式arm板子上吗
我使用的服务是:语音合成
请问百度语音合成能移植到嵌入式arm板子上吗,用linux C/C++进行开发,我下载了android版的语音合成SDK,有动态库,却没有C/C++开发用的头文件...
同一图片的多人人脸识别如何实现?
调用人脸识别的 $client->identifyUser($groupId, $image); 发现同一图片有多人时返回结果也只有一个,有没有办法识别同一图片中的多个人(多人均已注册)...
6月来了好的项目还远嘛?
6月来了,5月已经逝去,回想一下你已经多久没有出新项目了?
6月还不好好把握?
这里水深我们把握不住!
这不是理由
6月让我们一起逐梦起航!...
关于预训练模型数据预处理的问题
请问Paddle是否和Keras一样:
在调用预训练模型时,有process_input之类的数据预处理函数。
如果没有的话 VGG16\Resnet50 进行训练时的均值和方差是多少?这个有文档介绍吗...
江湖救急!!
1.这是原图文件夹:
2。这是已经生成对应的json文件夹:
我找不到能把他们转成标准的COCO格式或者VOC格式,各位大佬有没有代码求分享一下,万分感谢...