如何支持小程序语音上传识别
需求:手机端在微信小程序里语音输入,上传到服务器,发送百度识别,将识别内容保存下来。
问题:手机上传的文件是需要转换成PCM文件吗?有没有成型的jar包参考?
...
对人脸的胖瘦识别不是很好
这两天尝试着百度的sdk,运行他们的Demo,注册人脸,注册一张胖的时候的脸庞,然后用瘦了的脸庞去识别
正确率直接下降到50%多,大家有没有遇到这种问题?要怎么解决呢?...
百度语音有无Linux上的sdk啊?急用!
我们现在用的是Linux基础的机器人操作系统ros,想集成百度的语音识别sdk,可是发现百度语音没有基于Linux的sdk,各位高人,有无合适到方案啊?
要求占用flash、cpu和内存都不能太大,急啊!
...
REST API 标准的上传格式
我对http了解的比较少,但是百度没有提供windows的sdk。试了很多遍都不能成功,已经严格按照文档来了,还是无效,返回结果总是...
如何在docker安装h5py工具包
您好!win10安装的,在用书的配套代码训练猫脸识别模型时提示h5py工具包没有安装ImportError: No module named h5py。请问是要在镜像中自己安装该工具包么?如何安装?...
百度离线人脸QQ群有哪些?
请问大家加入的百度离线人脸QQ群或微信群有哪些? 官方的QQ人脸识别群282744268,我连续申请了10天都还没有能被批准入群啊。 这个群主好忙。...
语音合成如何实现停顿,比如停顿1秒或者2秒
不要告诉我用标点符号什么的,一点用也没有。
不要告诉我用这pause或sleep,这只在临时试听有效果,如果生成音频文件就不行了。
如果拆分成多个文件,这样如何实现精准停顿?...
这两天训练的速度感觉有点慢???
现在是46张,1个标签。每张图1~3个标记。凌晨3点到刚才9点都没有训练完。
有考虑过类似VIP的版本吗?百度的模型收敛等部分的参数都比自己调参的要好。不能随便翻车呀。。。...
识别后无法唤醒
先开启语音识别,正常识别几次以后,再开启唤醒 ,唤醒启动正常,说出唤醒词,唤醒监听中没有任何回调. 如果我先开启唤醒,再开识别就没事...
6.0以上系统手机 锁屏一段时间后停止语音合成
手机连接wifi,应用设置在线语音合成,将应用置于后台,手机锁屏,一段时间后,语音合成停止,查出来原因是app内检测到网络断开了
除了Android Doze设置不优化电量 还有没有其他方案?...
导出唤醒词出错
导出唤醒词时没有出现下载对话框,而是在浏览器中显示一串不可读字符。把显示内容拷贝保存为WakeUp.bin文件,运行出错。错误提示如下...
身份证识别, 图片方向不对识别不出来
调用身份证识别, 身份证图片的方向不正确时,识别不出来; 我尝试添加detect_direction等参数后, 在接口返回的数据中,也没有对应的返回值; 参数: 返回值: 烦请帮助!...
常见loss paddle实现
最近在做语义分割,看了很多不同种类的loss,有些是paddle有的,有些没有。英语水平有限照着论文实现了一些loss也不是很清楚是不是很准确。分享出来大家一起进步。...
为什么语音识别返回curl_error:28错误
我用自己解码出来的16bit,16k采样率、单声道的pcm文件进行语音识别,返回curl_error_code:28的请求超时错误,但百度的监控上却显示调用成功。我用百度提供的示例pcm文件就没有这些问题。...