首页 版块 访问AI主站 注册 发帖
操作指南:
技术专区:
AI赛事:
集思广益:
对人脸的胖瘦识别不是很好
这两天尝试着百度的sdk,运行他们的Demo,注册人脸,注册一张胖的时候的脸庞,然后用瘦了的脸庞去识别 正确率直接下降到50%多,大家有没有遇到这种问题?要怎么解决呢?...
语音合成如何实现停顿,比如停顿1秒或者2秒
不要告诉我用标点符号什么的,一点用也没。 不要告诉我用这pause或sleep,这只在临时试听效果,如果生成音频文件就不行了。 如果拆分成多个文件,这样如何实现精准停顿?...
请问:“未找到相应的技能 ”是怎么回事
":"未找到相应的技能"} ,应用添加/删除了几次都没用;请问是哪几个方向可以排查原因呢?...
语音识别SDK的大小问题
除了官方接入文档中使用的sdk,请问是否比较精简的sdk,现在按照文档集成.a包后,一个简单的demo的大小都达到了63.7M,感觉这个大小点难以接受。 百度是否提供了其他功能比较精简的sdk?...
摄像头上下颠倒
ocr_ui这个包下的摄像头处理的问题,在nexus 5x和部分小米手机上视频是上下颠倒的,严重影响了使用,请尽快修复,这个bug涉及到了所需要用摄像头的功能 ...
语音识别apk打包出现错误???
程序里语音唤醒 识别和合成 用手机运行调试的时候没问题 打包apk的时候报错 Error:Execution failed...
6.0以上系统手机 锁屏一段时间后停止语音合成
手机连接wifi,应用设置在线语音合成,将应用置于后台,手机锁屏,一段时间后,语音合成停止,查出来原因是app内检测到网络断开了 除了Android Doze设置不优化电量 还有没有其他方案?...
现在音频转写功能是否能够在android 端实现
我之前测试 时,发现官网没提供在android 实现 音频文件 识别转写功能。自己尝试写了android demo,但是没成功。我想知道的是android端是否能够实现,是需要和贵公司进一步沟通吗?...
无法加载BaiduFaceApi.dll
vs2019编译也不, vs2015编译也不行, x64也不行 ,x86也不行 ,release也不行 ,一直无法找到BaiduFaceApi.dll ,明明放在当前目录下,也注册序列号了,就是不行,有没有大神解答一下...
如何从用户的一大段语句中获取感兴趣的信息?
有没有办法让用户说一大段话,比如说自我介绍,然后再从这段话中解析出感兴趣的信息,比如说家庭成员、职业等?这也能通过定义词槽来实现么?...
发布到服务器出现api调用问题,请求指点感激!!
我本地Windows测试没问题,放到Linux服务器出现问题。只要上传的图片大约超过1M,代码就会卡住,我测试发现卡在AipHttpClient中。具体位置见图片。有没有大神解答一下。感激不尽。...
crash
我们是一个swift 与 OC混编的项目,人脸识别部分的代码是swift编写的,在调用IDLFaceLivenessManager之后,发现线上不低的crash率,截图如下: 工程师能帮忙解决嘛?...
fluid1.5训好模型预测时,关于cvm特征的问题
首先确认下下图应该就是 infer时候 做前向计算时cvm的api 但是没看明白,按照这个写法 输出y的维度不是少了2维么 因为x是加...
GPU使用高峰期, 您需要稍候 ...
GPU使用高峰期, 您需要稍候. 建议22:00之后的非高峰时段使用, 或先试用CPU环境编码.   以前刷两下就了,这次刷了半小时都没GPU,这是在维护还是GPU挂了?...
请教报表识别的实现方案
工作实际中主要是扫描表格,如何对pdf选择特定几页进行识别,输出表格页excel? 另外尝试时基于百度api的高精度识别也会将“19,285”识别为“19.285”,有没有进一步优化的方法...
求推荐一个数据集标注工具
问一下各位大佬,现在有没有可以帮助我们标注数据集的工具呀,我想找一个目标检测YOLO算法的数据集标注工具,求大佬们推荐推荐。...
【求助】使用opencv环境自动重启的问题
在notebook里无法正常使用opencv,具体是在使用函数cv2.imshow时环境会自动重启 环境版本: python3.7 PaddlePaddle1.6.2 各位大佬有没有解决方案呀,感激不尽...
增值税发票识别
请问一下票据识别接口,对发票字体是否要求。我的发票使用Java Graphic2D生成的,调用识别接口的结果一直错。编号多个0,明细的数量识别错误等。 发票: 识别错误字段: ...
语音识别同时进行录音,占用麦克风
系统个功能,在进行录音的同时进行语音识别,但是由于录音和识别都需要AudioSource.MIC,导致占用,必定一个功能无法正常使用麦克风 这样的情况要怎么处理?...
camvid数据集中的void类该怎么处理
看到很多论文使用11类的camvid数据集,但是其中没void类,请问void类是映射到哪一类了么?还是应该忽略这一类?如下图所示,gt中黑色的是void类,但是seg结果中没任何void,怎么做到的? ...
切换版块
智能客服