首页 版块 访问AI主站 注册 发帖
操作指南:
技术专区:
AI赛事:
集思广益:
语音识别的垂直领域参数,如何同时设置多个垂直领域
语音识别的垂直领域每次只能设置一个领域?  如何设置多个     自定义词库如何使用
下载demo之后,一直提示“把脸移于框内”?
人脸明明已经在框内了,居然还一直提示把脸移于框内”,然后最好检测超时。怎么回事? 另外,这张图是什么意思?我每一个月得去更新licence?这样我的APP还能用?...
nodejs开发mp3转pcm
最近正在使用nodejs开发语音识别功能,使用的是fluent-ffmpeg依赖来转换音频,目前尝试将mp3转成pcm的时候失败,还有其他方案?谢谢大家了...
视觉模组ROS package
百度的视觉模组有对应的ROS Package? 如果需要将双目和IMU数据通过ROS输出,使用Kalibr来标定可以怎么实现?...
语音合成字数太少,无法播放!有没有客服解答?
, -2147483648)  ),没法播放,但是超过4个字后是可以正常播放的!   这个有遇到过...
语音唤醒
语音唤醒的唤醒词通过定制之后,使用次数和收费,是如何的,有限制?谁给下具体说明
paddle视频培训教程在哪里
https://chuanke.baidu.com/v9040713-232493-1668016.html这里视频教程播放不完整,请问哪里有完整的视频教程
无词槽训练
如果不定义词槽进行训练的话,即我没有词槽的需求而只是想通过数据和定义好的意图进行训练,训练效果上有所区别?...
增值税发票识别的12位发票代码只有10位
调用增值税发票识别接口识别出来的12位发票代码,输出只有10位。导致提取的4要素准确率非常低。请问可以优化?...
大神来~nlu部分实现技术疑问
unit对话中词槽的识别和提取以及填充使用的是什么方法实现的?是基于神经网络的?具体怎么实现呢
人体分析关键点识别报连接错误WSAECONNRE
aborted.', OSError("(10054, 'WSAECONNRESET')",)) 只要是连续获取连接就会报这个错误 有人遇到这个问题 怎么解决的 谢谢各位大佬了...
离线识别sdk 中人脸检测track接口无法识别
离线识别sdk 中人脸检测track接口无法识别人脸,同组五张人脸只能识别三张,是对照片有什么质量要求?...
为什么将一段30分钟的录音转成文字需要30多分钟
为什么将一段30分钟的录音转成文字需要30多分钟才能转完啊,转几分钟的录音几十秒就转完了,录音文件越长,转的越慢,有什么解决办法?急急急!!!...
语音合成离线模式的问题
假如第一次联网拿到离线授权,后面都没有网络的情况,机器永久离线是否还能正常使用。离线授权是否一段时间需要更新才能使用?...
多音字问题
我这里上海市闵行区政府官网用的百度语音,遇到上海市闵行区里的“闵行”有大概50概率会读成“闵行xing”,应该读成“闵行hang”这个能解决?...
PaddlePaddle如何导入IDE?
PaddlePaddle如何导入IDE来阅读代码,因为本身cmakelist,就打算导入clion中,一直未成功,有小伙伴可以指导下? 读源码太麻烦...
无法上传数据集
预训练模型通过上传数据集的方式上传,但不能上传,提示:服务异常,请稍后重试。有人知道这是怎么回事?chrome和firefox都试过了,不行的...
关于Android离在线融合SDK授权的问题
我在一个问答中看到如下的回复: 根据回复,如果使用的正式授权还需要定期联网更新授权
离线语音合成的声音很小如何解决?
离线语音合成的声音很小,手机音量已经调成最大了,speechSynthesizer.setParam(SpeechSynthesizer.PARAM_VOLUME, "15");还有别的方法增大音量?即使破音也是可以被接受 ...
关于 .a 文件大小问题
你好:       集成百度语音的语音识别与语音合成的功能,两个.a文件的大小分布为170M,200M;;是否过大了呢?没有简化的包?...
切换版块
智能客服