首页 版块 访问AI主站 注册 发帖
操作指南:
技术专区:
AI赛事:
集思广益:
人脸识别离线版SDK-JAVA 能用外部数据库
SDK中的db文件夹下面有个face.db,是自带的一个数据库,人脸注册默认都在这个数据库中。 请问能否换外部的数据库,比如mysql等?
请问最新版本的语音识别sdk有做降噪相关的处理
在录音完成后的识别过程中,稍远距离或者有轻微杂音就提示音频质量有问题
每个账号只有3个技能可以免费申请生产环境
如题:https://ai.baidu.com/forum/topic/show/892085 如果有多个技能,都需要生产环境,每添加一个大约需要多少费用呢?
请问大家有实现了持续识别的(允许中间出现短暂的间隔)?
最近做的项目需要持续识别,不过在stop之后直接start好像会报“引擎忙”的错误吧,求问有没有解决策略 或者有没有能重写onstoplistener()...
请问离线语音识别.bsg文件大小有限制
是几百KB,或者几M还是其他呢?
某个账户语音识别接口对于应用的机器数有限制
在两台机上跑过我开发的识别接口程序,第三台上跑同一个数据没有返回结果。
请问语音识别有商用版的,我们公司想用在线语音识别
我使用的服务是: 调用的接口是: 参数设置情况: 开发平台和机型: SDK版本号: 代码或日志截图(上传截图能帮助您更快解决问题)...
离线语音识别只能识别特定的语法?不能随便说话?
我使用的服务是:在离线语音识别 调用的接口是: 参数设置情况: 开发平台和机型: SDK版本号: 代码或日志截图(上传截图能帮助您...
PP-ShiTu 部署,检测失败,能有人帮忙解答下
按照文档进行 pp-shitu的Serving部署,运行python3 recognition_web_service.py &>log.txt & 命令,看启动日志是正常的,但是运行 python3 pipeline_http_client....
hub上的模型,能再加一列说明,模型运行需要的gpu显存占用
win10环境,下载了 disco_diffusion_ernievil_base 顺便发现模型再windows平台下,会发现读取配置文件错误的问题。 解决后,按照示例运行模型...
【audio】模式下的url是MPEG1编码的?
大家好,我想请问下,dueros返回的audio和speech两种url,其对应的mp3文件编码方式有所不同? 软件SDK...
语音唤醒问题
问题: 1、语音唤醒支持保存声音文件? 2、比如说,“百度一下打开浏览器”,能否唤醒?若能唤醒,onEvent()中word能否包含...
关于卷积神经网络注意力的问题?
。 不能直接一对一用element-mul乘? 3. 还想问一下,就是input 经过 1x1conv,然后 用softmax,是把1x1conv得到的特征图变成概率模式?变成每个像素占得比重是多少?...
训练语义分割Unet,请大佬看一下是否有误
每个卷积层提取的特征可视化? 请问如果损失函数一直为0,或者miou一直为1,是因为参数没调好吗?这是过拟合是吗? 采用的是Adam优化器,学习率为0.005,它用像别的优化器那样多少轮之后进行学习率衰减?...
关于模型 stable_diffusion 显存的怪异问题
. CUDA 11.6 / cuDNN 8.4.0 请问有其他人遇到过这种问题? 其次还有一个问题: 相同的模型配置下,通常情况下...
切换版块
智能客服