百度视觉技术囊括两大世界大赛冠军!
等业务上均发挥了重要作用。
去年,百度OCR(文字识别)技术在ICDAR竞赛数据集最具挑战的竞赛任务“Incidental Scene Text...
音频文件转写,文件格式问题
文件格式可以是.mp3的吗,调用上传都没问题,但是一直没有最后结果。
反馈一直是{'status': 50006, 'msg': '正在...
营业执照识别错误
如果图片是营业执照的扫描件时,公司名称和地址识别严重错误,如果是直接用手机拍照或者截图的图片,识别起来相对准确,这是什么原因呢,有朋友遇到过吗...
FZ3板卡安装无线网卡的问题
实验室有一块FZ3A的板卡,我想给他装上usb无线网卡,请问对无线网卡的芯片型号有什么要求吗?
手头上现有的网卡都用不了,能识别出是usb网卡,但貌似没有驱动,也安装不了驱动。...
concat未运行时强制检查报错
使用resize_bilinear对不同的feature map进行resize之后(actual shape指定实际形状),进行...
Paddle端部署
最近想把之前用PaddleDetection开发的一个CV项目部署到端上,各位大佬有什么好的建议吗,之前捣鼓PaddleDetection提高性能去了,没有试过部署,求大佬指点,如果有项目可以学习就更好啦~...
反卷积网络的数据增强问题
在做反卷积网络时,如果数据集不大,想做数据增强处理来提高训练效果,目前想到的方法有,用GAN网络来生成部分数据掺入原始数据其中,请问大家还有什么其他的好方法吗?...
语音合成输出的音频格式问题
你好,使用语音合成功能,输出的音频格式是
$ file wav_baidu.duxiaoyao/auto_00001.wav...
人脸识别技术求大佬开导
求问,有一个场景,50个人的课堂,若采用人脸识别技术,能否解决所有学生的签到?百度人脸识别技术的人脸数量限制可以突破吗?...
paddlepaddle安装问题
import paddle.fluid出错:DLL load failed: 找不到指定的模块。百度了几种方法都没有作用,有碰到类似问题的吗?
...
人脸闸机/门禁
人脸闸机/门禁的demo没加活体检测,不会判断是不是活体,android端应该调用哪个接口去判断是否是活体而不是照片或者视频等。
有人...
语音唤醒功能持续时间问题
想问下语音唤醒功能可以持续等待唤醒词多久
因为我使用唤醒功能测试时过一晚上回来就无法唤醒了
若会中途停止 有回调函式能收到通知吗
...
后台运行不能保存模型的问题
/yolo_best{}.pdparams'.format(epoch)) 我在项目中是用这个保存代码,后台运行的输出结果是对的,但是,运行文件里面却没有应该保存的文件,这是bug吗?在项目里面运行是可以的...
【应用方案】智能问答方言答复
我们的宝贵财富。我希望,在未来,智能问答系统能够根据提问人的语言特征,采取与之相对应的语言来回复,简单一点,就是可以用方言来提问、用方言来回答提问...
[人脸识别] API接口
///+qualities 否 string 质量相关的信息,无特殊需求可以不使用
///+faceliveness 否 string...
docker cpu版 文字识别预测特别慢
chinese_ocr_db_crnn_server模型识别图片,一张1920×1080的图要40多秒,这正常吗? 还有一个问题,用python写加载模型预测的时候,_init_咋写,enable_mkldnn怎么开? 新手刚体验,请各位指点...