百度AI开发者社区

stylepro_artistic模组是否可应用于即时webcam？

/paddle/forum/topic/show/990297 2021-08-16

是否可以应用在cv2.VideoCapture(0)的基础上，将webcam即时风格转化？谢谢各路大神...

语音识别引入外部音频文件必须一起上传服务器吗

/forum/topic/show/971873 2020-11-18

);上传到服务器吗？外部音频包括音频文件或者自定义的音频流(二进制语音流byte[]等)可以分段上传吗？还是必须一次性上传所有的？...

识别、锁定。无论怎么移动最后都能准确定位，能不能

/forum/topic/show/941635 2018-12-15

比如一副十张的牌，正面图片识别一次，然后全部翻过来随便洗一洗。通过什么技术可以准确的分析和识别准确信息和位置。求大神指导，重金答谢。...

人脸对比时不能提取证件照的特征（身份证照片）

/forum/topic/show/941108 2018-11-27

用离线人脸识别SDK中的示例代码，调用身份证照片时返回“get feature error”，非证件照可以的。证件照来自与身份证芯片中，其图片分辨率时102*126，参数都是默认的。...

语言合成的最长文本到底是多少？

/forum/topic/show/943426 2019-04-30

“Invalid text length”，有时又可以支持到2000个字符。我测试用的基本上都是中文。 ...

语音唤醒功能持续时间问题

/forum/topic/show/498374 2018-03-16

想问下语音唤醒功能可以持续等待唤醒词多久因为我使用唤醒功能测试时过一晚上回来就无法唤醒了若会中途停止有回调函式能收到通知吗 ...

相似图搜索返回了全部的自建图库中的所有图片

/forum/topic/show/864715 2018-05-09

为什么相似图搜索会返回自建库中的所有图片呢？不会进行相似度匹配的吗？还有相似图片入库的时候bref参数是必须要传的，文档那里写的不是要必传希望可以改一下 ...

语音合成输出的音频格式问题

/forum/topic/show/889082 2018-08-27

kHz, Monaural 请问可以输出wav格式吗？或者怎么转成wav格式啊？...

人脸识别技术求大佬开导

/forum/topic/show/940917 2018-11-13

求问，有一个场景，50个人的课堂，若采用人脸识别技术，能否解决所有学生的签到？百度人脸识别技术的人脸数量限制可以突破吗？...

添加OCR文字识别之后打包出现的问题

/forum/topic/show/492472 2017-07-05

AipBase.framework添加进我创建的项目中，测试的时候可以正常使用，但是我需要打包的时候，编译不过去。...

语音合成的音质能提高吗

/forum/topic/show/492947 2015-07-11

III, v2, 16 kbps, 16 kHz, Monaural合成的音质只有16 kbps，所以听起来像电话的效果。请问有没有什么选项，可以提高语音合成的音质?...

百度语音今天是不是有异常。

/forum/topic/show/493244 2015-09-15

已经发布的版本，前面每天都有30左右的用户，超过3k次的合成。今天只有12个用户，合成次数只有1k多次。我晚上回来下载软件商店的版本试了下，android 的可以合成。是不是异常恢复了？...

语音识别 REST API OPUS格式返回3301

/forum/topic/show/493607 2015-12-21

上录下来的wav转成opus格式后，调用语音识别 REST API来识别会返回3301.但是转码前的wav是可以识别成功的。...

通过CLIENT_STATUS_AUDIO_DATA获取的原始录音文件声音很小

/forum/topic/show/493818 2016-03-08

的API得到的原始录音文件声音是正常的。请问有没有什么方式可以提高录音文件的声音大小？...

请教大神怎么直接在浏览器的浏览框里调用UNIT

/forum/topic/show/498137 2018-03-01

/openapi/api?key=48195ca8b68048daa04657f4fe6a93c2&info=讲个笑话&userid=1 那么UNIT可不可以这样实现呢 ...

iOS语音识别VAD如何设置

/forum/topic/show/864115 2018-04-12

如果开启语音识别后，不说话，需要很久才能触发识别报错，如何缩短这个时间？比如3s没有检测到说话就结束识别，并没有看到可以设置VAD的地方 ...

关于阈值的设定

/forum/topic/show/953220 2019-07-16

关于阈值范围，是否可以这样理解：值越接近0的越正常合格，越接近于1的越色情如图，一般色情的阈值区间设置为0.3-0.5，那么值在0.5-1区间的图片不会被过滤，但其实这部分图片非常色情 ...

请问tts和asr支持mrcp协议吗

/forum/topic/show/954174 2019-08-07

对接华为平台的呼叫中心，tts和asr需要用mrcp协议对接，我看到技术文档说是支持，但是又看到今年一月份的帖子说tts不支持mrcp，想确认清楚tts和asr时候都可以用mrcp协议对接呼叫中心...

语音合成返回带情感语音问题

/forum/topic/show/495372 2016-12-26

百度开发者：你们好，在你们的介绍中看到了你们可以合成带情感的语音合成输出，但是我在REST API文档中，并未发现任何与此有关的相关介绍，不知道带情感语音合成这块接口是否提供了？...

人脸识别跟踪的这种人脸识别、人脸查询，我想了解

/forum/topic/show/496694 2017-12-01

客户进入进门我们就记录客户来访记录，这种摄像头必须买指定专业的摄像头就可以还是普通摄像头就行？有知道的回答一下，十分感谢！！！...