首页 版块 访问AI主站 注册 发帖
操作指南:
技术专区:
AI赛事:
集思广益:
stylepro_artistic模组是否可应用于即时webcam?
是否可以应用在cv2.VideoCapture(0)的基础上,将webcam即时风格转化? 谢谢各路大神...
语音识别引入外部音频文件必须一起上传服务器吗
);上传到服务器吗? 外部音频包括音频文件或者自定义的音频流(二进制语音流byte[]等)可以分段上传吗?还是必须一次性上传所有的?...
识别、锁定。无论怎么移动最后都能准确定位,能不能
比如一副十张的牌,正面图片识别一次,然后全部翻过来随便洗一洗。通过什么技术可以准确的分析和识别准确信息和位置。求大神指导,重金答谢。...
人脸对比时不能提取证件照的特征(身份证照片)
用离线人脸识别SDK中的示例代码,调用身份证照片时返回“get feature error”,非证件照可以的。证件照来自与身份证芯片中,其图片分辨率时102*126,参数都是默认的。...
语言合成的最长文本到底是多少?
“Invalid text length”,有时又可以支持到2000个字符。我测试用的基本上都是中文。 ...
语音唤醒功能持续时间问题
想问下语音唤醒功能可以持续等待唤醒词多久 因为我使用唤醒功能测试时过一晚上回来就无法唤醒了 若会中途停止 有回调函式能收到通知吗 ...
相似图搜索 返回了全部的自建图库中的所有图片
为什么相似图搜索会返回自建库中的所有图片呢? 不会进行相似度匹配的吗? 还有相似图片入库的时候bref参数 是必须要传的,文档那里写的不是要必传 希望可以改一下 ...
语音合成输出的音频格式问题
kHz, Monaural 请问可以输出wav格式吗?或者怎么转成wav格式啊?...
人脸识别技术求大佬开导
求问,有一个场景,50个人的课堂,若采用人脸识别技术,能否解决所有学生的签到?百度人脸识别技术的人脸数量限制可以突破吗?...
添加OCR文字识别之后打包出现的问题
AipBase.framework添加进我创建的项目中, 测试的时候可以正常使用, 但是我需要打包的时候, 编译不过去。...
语音合成的音质能提高吗
III, v2,  16 kbps, 16 kHz, Monaural合成的音质只有16 kbps,所以听起来像电话的效果。请问有没有什么选项,可以提高语音合成的音质?...
百度语音今天是不是有异常。
已经发布的版本,前面每天都有30左右的用户,超过3k次的合成。今天只有12个用户,合成次数只有1k多次。我晚上回来下载软件商店的版本试了下,android 的可以合成。是不是异常恢复了?...
语音识别 REST API OPUS格式 返回3301
上录下来的wav转成opus格式后,调用语音识别 REST API来识别会返回3301.但是转码前的wav是可以识别成功的。...
通过CLIENT_STATUS_AUDIO_DATA获取的原始录音文件声音很小
的API得到的原始录音文件声音是正常的。请问有没有什么方式可以提高录音文件的声音大小?...
请教大神怎么直接在浏览器的浏览框里调用UNIT
/openapi/api?key=48195ca8b68048daa04657f4fe6a93c2&info=讲个笑话&userid=1   那么UNIT可不可以这样实现呢   ...
iOS语音识别VAD如何设置
如果开启语音识别后,不说话,需要很久才能触发识别报错,如何缩短这个时间?比如3s没有检测到说话就结束识别,并没有看到可以设置VAD的地方 ...
关于阈值的设定
关于阈值范围,是否可以这样理解:值越接近0的越正常合格,越接近于1的越色情 如图,一般色情的阈值区间设置为0.3-0.5,那么值在0.5-1区间的图片不会被过滤,但其实这部分图片非常色情 ...
请问tts和asr支持mrcp协议吗
对接华为平台的呼叫中心,tts和asr需要用mrcp协议对接,我看到技术文档说是支持,但是又看到今年一月份的帖子说tts不支持mrcp,想确认清楚tts和asr时候都可以用mrcp协议对接呼叫中心...
语音合成返回带情感语音问题
百度开发者:        你们好,在你们的介绍中看到了你们可以合成带情感的语音合成输出,但是我在REST API文档中,并未发现任何与此有关的相关介绍,不知道带情感语音合成这块接口是否提供了?...
人脸识别跟踪的这种人脸识别、人脸查询,我想了解
客户进入进门我们就记录客户来访记录,这种摄像头必须买指定专业的摄像头就可以还是普通摄像头就行?有知道的回答一下,十分感谢!!!...
切换版块
智能客服