首页 版块 访问AI主站 注册 发帖
操作指南:
技术专区:
AI赛事:
集思广益:
提供音频流进行语音识别,但是此时录音设备是被占用的,无法进行识别,有没有解决办法
应用场景是:卓手机,双方视频过程中,想使用类似输入法中的语音识别(语音转文字),我们可以提供音频流,但是使用百度sdk发现,录音设备被占用的过程中,无法识别,有没有解决方案...
语音识别 闪退
);//开始识别 发出识别开始的消息后 直接闪退。 在卓环境下项目没有问题 集成到 Unity3d 中就出这个问题了 请问有解决方法吗...
java.lang.UnsupportedOperationException: easr not found 语音识别 什么原因?
我使用的服务是:语音识别 调用的接口是: 参数设置情况:标准配置 开发平台和机型:卓7.0 SDK版本号:官方下载 代码或日志截图(上传...
语音唤醒启动报错
使用卓SDK3.0.5 I/MyWakeup.Debug: wakeup params(反馈请带上此行日志):{"kws-file...
4G下无法切换发音人,WIFI下没问题
应用在卓上,代码是这样的。 public void SetTTSSpeaker(int speaker...
在win10的as上部署自己训练的模型报错闪退
image_classification_demo上,安装在我的卓手机上后会闪退。只修改了这几个地方 报错如下: 想请教一下大家这个可能是什么原因导致的...
目标检测demo部署替换自己模型后怎么修改图像输入宽高
如题啊,用的yolov5n_detection的卓部署demo,模型标签都已经替换了,就是它原始的输入图像宽高是320,我想修改为640...
百度获CCKS 2020医疗事件抽取技术评测冠军
随着医疗信息化的发展,数据、算力及算法等条件日益成熟,应用 AI 实现医疗智慧化已具备充分条件。 近日,2020全国知识图谱与语义计算大会...
网络softmax函数输出一个5向量后和为1,加上高斯噪声后,和依然为1?
】保证和依然为1, 或者如何生成一个和为0的5向量【0.1,-0.1,0.21,0.1,-0.31】的高斯扰动向量, 代码如何实现? ...
AI战疫【百度大脑新品体验】口罩检测攻略
口罩。 2.PaddleHub 模型介绍pyramidbox_lite_mobile_mask类别图像-目标检测网络PyramidBox数据集WIDER...
求助,为何paddleseg cpu和gpu训练结果不同
用paddleseg对数据进行训练,cpu训练的结果虽然差但还能预测到一些。之后我只是将其改成了使用GPU训练,其他都没有改变,但是训练过...
离线语音合成
。之前提交过工单(20190118034613961),得到反馈说可能是因为网络抖动产生数据丢失,但是是用离线版本依旧有这种情况。...
能否使用opencv、keras等库函数
和训练的部分,代码中能否使用其他python库?例如能否用opencv的图像变换函数,能否用keras的数据增强函数?...
iOSTerminated due to mem
Message from debugger: Terminated due to memory issue而且链接的数据线直接断掉,并且语音播报也不...
问答集导入、导出报错
问答集导入数据报错之后卡住不动了,无法中断和退出,关闭网页后,再次导入,提示“您当前问答对导入任务正在执行,暂时不能进行当前的操作,待当前任务完成后再试。" 已经等了三天了,还是一直提示这个...
智能写诗 总是返回后端连接超时错误
(res) {res.pipe(process.stdout); })// 携带数据发送https请求req.write...
请教图片旋转后,聚类anchor框的问题
最近用了好多数据增广的方式试图提高目标检测准确率时遇到这样一个问题:将图片旋转任意角度后,由于标注的ground truth框大多是矩形...
金融机构想要获取一些接口、比如房产、公积金信息
我们是一家金融机构想要获取一些接口、比如房产、公积金、车辆数据信息接口。可以让客户提供授权书、人脸识别认证等,我们机构也可提供相应资质证书。请大家帮忙给点建议。...
文字识别返回位置信息的单位
数据结果位置信息并不像我所想的直接使用 RelativeLayout.LayoutParams params...
身份证识别的api把照片
https://aip.baidubce.com/rest/2.0/ocr/v1/idcard这个api 图像数据,base64编码...
切换版块
智能客服