对人脸的胖瘦识别不是很好
这两天尝试着百度的sdk,运行他们的Demo,注册人脸,注册一张胖的时候的脸庞,然后用瘦了的脸庞去识别
正确率直接下降到50%多,大家有没有遇到这种问题?要怎么解决呢?...
语音合成如何实现停顿,比如停顿1秒或者2秒
不要告诉我用标点符号什么的,一点用也没有。
不要告诉我用这pause或sleep,这只在临时试听有效果,如果生成音频文件就不行了。
如果拆分成多个文件,这样如何实现精准停顿?...
语音识别SDK的大小问题
除了官方接入文档中使用的sdk,请问是否有比较精简的sdk,现在按照文档集成.a包后,一个简单的demo的大小都达到了63.7M,感觉这个大小有点难以接受。
百度是否提供了其他功能比较精简的sdk?...
摄像头上下颠倒
ocr_ui这个包下的摄像头处理的有问题,在nexus 5x和部分小米手机上视频是上下颠倒的,严重影响了使用,请尽快修复,这个bug涉及到了所有需要用摄像头的功能
...
语音识别apk打包出现错误???
程序里有语音唤醒 识别和合成 用手机运行调试的时候没问题 打包apk的时候报错
Error:Execution failed...
6.0以上系统手机 锁屏一段时间后停止语音合成
手机连接wifi,应用设置在线语音合成,将应用置于后台,手机锁屏,一段时间后,语音合成停止,查出来原因是app内检测到网络断开了
除了Android Doze设置不优化电量 还有没有其他方案?...
现在音频转写功能是否能够在android 端实现
我之前测试 时,发现官网没有提供在android 实现 音频文件 识别转写功能。自己尝试写了android demo,但是没有成功。我想知道的是android端是否能够实现,是需要和贵公司进一步沟通吗?...
无法加载BaiduFaceApi.dll
vs2019编译也不, vs2015编译也不行, x64也不行 ,x86也不行 ,release也不行 ,一直无法找到BaiduFaceApi.dll ,明明放在当前目录下,也注册序列号了,就是不行,有没有大神解答一下...
发布到服务器出现api调用问题,请求指点感激!!
我本地Windows测试没问题,放到Linux服务器出现问题。只要上传的图片大约超过1M,代码就会卡住,我测试发现卡在AipHttpClient中。具体位置见图片。有没有大神解答一下。感激不尽。...
crash
我们是一个swift 与 OC混编的项目,人脸识别部分的代码是swift编写的,在调用IDLFaceLivenessManager之后,发现线上有不低的crash率,截图如下:
有工程师能帮忙解决嘛?...
GPU使用高峰期, 您需要稍候 ...
GPU使用高峰期, 您需要稍候. 建议22:00之后的非高峰时段使用, 或先试用CPU环境编码.
以前刷两下就有了,这次刷了半小时都没有GPU,这是在维护还是GPU挂了?...
请教报表识别的实现方案
工作实际中主要是扫描表格,如何对pdf选择特定几页进行识别,输出表格页excel?
另外尝试时基于百度api的高精度识别也会将“19,285”识别为“19.285”,有没有进一步优化的方法...
求推荐一个数据集标注工具
问一下各位大佬,现在有没有可以帮助我们标注数据集的工具呀,我想找一个目标检测YOLO算法的数据集标注工具,求大佬们推荐推荐。...
【求助】使用opencv环境自动重启的问题
在notebook里无法正常使用opencv,具体是在使用函数cv2.imshow时环境会自动重启
环境版本:
python3.7
PaddlePaddle1.6.2
各位大佬有没有解决方案呀,感激不尽...
增值税发票识别
请问一下票据识别接口,对发票字体是否有要求。我的发票使用Java Graphic2D生成的,调用识别接口的结果一直有错。编号多个0,明细的数量识别错误等。
发票:
识别错误字段:
...
语音识别同时进行录音,占用麦克风
系统有个功能,在进行录音的同时进行语音识别,但是由于录音和识别都需要AudioSource.MIC,导致占用,必定有一个功能无法正常使用麦克风
这样的情况要怎么处理?...
camvid数据集中的void类该怎么处理
看到很多论文使用11类的camvid数据集,但是其中没有void类,请问void类是映射到哪一类了么?还是应该忽略这一类?如下图所示,gt中黑色的是void类,但是seg结果中没有任何void,怎么做到的?
...