首页 版块 访问AI主站 注册 发帖
操作指南:
技术专区:
AI赛事:
集思广益:
OCR 字符识别
你好,在字符识别的OCR 中,传入到API的是base64编码的字节流,我用二进制方打开图像,转换后可以。但是对于numpy.array...
活体检测相关问题
是否可以?有什么标准吗?如果我想用一般小区里的海康 大华等厂家的监控摄像头, 对图片和视频的格有要求吗,对MJPEG ,H.264...
关于label的一些问题
label图片打开发现有两种 一种是不同类别用不同的颜色表示,请问这种表示方有没有颜色(像素值)和类别的对照表,方便one-hot编码...
视频活体检测
浏览器获取了视频的base64编码后,无法传递到后端系统,但用同样的方苹果浏览器是可以传递视频base64编码到后端系统的。大家有谁在安卓移动端的H5活体检测示例运行成功的嘛?希望分享下经验  ...
一元线性回归
在数学上变量之间可以用确定的函数关系来表示是比较常见的一种方。然而在实现应用中,还存在许多变量之间不能用确定的函数关系来表示的例子。前面...
【AI核心技术】课程二十一:神经图灵机—控制器
其中的具体原理 【视频获取方】 1.移动端:关注PaddlePaddle微信公众号(扫文末二维码即可),点击“深度学习公开课”→“AI技术...
REST_API接口返回空白
pcm有什么好的方法?或者一定要转为16k的pcm格吗?(讯飞听见可以直接转:https://www.iflyrec.com/html...
安卓离线识别问题
,打开一下 说法: medical.test  = ,,帮我,给我,请,请帮我,请给我 上面是词条和说法,离线模下识别很不准,比如...
录音达到11s左右自动断开(使用的是百度语音官方代码bd_speech_sdk_asr_v2.1.20.20160623_e3e63ce_beta 中的demo)
您更快解决问题): 复现步骤、现象及其他描述:打开应用-->普通模-->开始-->录音(直录了11S多一点点) ...
请问语音识别支持多长时间的说话?说话一停顿,识别就结束了
描述:使用sdk中的demo的普通模,点击开始,说话过程中,稍微一停顿,识别就结束了,不能连续识别一段长语音。。...
后台唤醒跟其它应用出现冲突,比如微信的对话功能就无法使用了
后台唤醒跟其它应用出现冲突,比如微信的对话功能就无法使用了,这样体验太不好了,能不能用其它方实现,录音功能完全被霸占了,其它应用无法使用...
语音问答系统源码,收费语音问答就这系统到底用到哪些核心技术
功能大概如下: 1、易答:付费你(我)问,我(你)答,有人付费听,你我分钱。2、录音时自动转MP3格,支持所有移动端设备3、每晚程序自动...
关于设置语音识别词库的使用问题
我设置了语音识别词库,并且选中“仅识别上传数据中的用户输入”,如何在应用中体现呢,应该用哪个识别模?是说只有我上传的txt里面有的词才能...
定制版词法分析没有生效
自定义了一个定制词典,内容是交通规则,内容格如下: 超速驾驶超速\t超速驾驶违章超速\t超速驾驶超速行驶\t超速驾驶超载超载行车\t...
百度语音唤醒使用繁体中文
我用百度唤醒的Android的范例程原本的WakeUp.bin的百度一下 小度你好是可以使用的 然后我下载了自己的唤醒字不过当初没有发现...
文章标签接口 调用失败
我已经把 body里的参数转换成gbk 编码格了但是还是返回{"log_id": 5491831751295139032...
定制化图像识别无效的access_token问题
之前通过data方提交access_token图像识别都没有问题,但发现定制化图像识别出错:100 Invalid parameter...
关于语义分割里的mIOU求取问题
无意义(无效),不参与后续IOU计算 个人感觉第②种方比较正确,毕竟此时第13类是预测正确的结果,IOU不应该等于0,想看看大家是怎么处理的。...
cv2resize相同大小图像不会丢失精度
,发现INTER_AREA效果最好。所以在进行模型训练时,可以考虑更换resize的方,结果如下: ...
AI Studio用多卡训练莫名其妙的就挂掉了
用的是launch方 python -m paddle.distributed.launch run.py 然后日志显示...
切换版块
智能客服