首页 版块 访问AI主站 注册 发帖
操作指南:
技术专区:
AI赛事:
集思广益:
语音识别 REST API OPUS格式 返回3301
上录下来的wav转成opus格式后,调用语音识别 REST API来识别会返回3301.但是转码前的wav是可以识别成功的。...
通过CLIENT_STATUS_AUDIO_DATA获取的原始录音文件声音很小
的API得到的原始录音文件声音是正常的。请问有没有什么方式可以提高录音文件的声音大小?...
请教大神怎么直接在浏览器的浏览框里调用UNIT
/openapi/api?key=48195ca8b68048daa04657f4fe6a93c2&info=讲个笑话&userid=1   那么UNIT可不可以这样实现呢   ...
iOS语音识别VAD如何设置
如果开启语音识别后,不说话,需要很久才能触发识别报错,如何缩短这个时间?比如3s没有检测到说话就结束识别,并没有看到可以设置VAD的地方 ...
关于阈值的设定
关于阈值范围,是否可以这样理解:值越接近0的越正常合格,越接近于1的越色情 如图,一般色情的阈值区间设置为0.3-0.5,那么值在0.5-1区间的图片不会被过滤,但其实这部分图片非常色情 ...
请问tts和asr支持mrcp协议吗
对接华为平台的呼叫中心,tts和asr需要用mrcp协议对接,我看到技术文档说是支持,但是又看到今年一月份的帖子说tts不支持mrcp,想确认清楚tts和asr时候都可以用mrcp协议对接呼叫中心...
语音合成返回带情感语音问题
百度开发者:        你们好,在你们的介绍中看到了你们可以合成带情感的语音合成输出,但是我在REST API文档中,并未发现任何与此有关的相关介绍,不知道带情感语音合成这块接口是否提供了?...
人脸识别跟踪的这种人脸识别、人脸查询,我想了解
客户进入进门我们就记录客户来访记录,这种摄像头必须买指定专业的摄像头就可以还是普通摄像头就行?有知道的回答一下,十分感谢!!!...
为什么我从上一个activity回退到这个activity时 tts不发声了
我在onresume已经再次调用了两个init方法 但是当我从这个activity 跳到下一个activity时可以正常发音 但是我回退回来是 再次点击不会再发声了 请问这是为什么尼...
语音识别音频质量问题
语音识别测试报语音质量错误,能否通过减噪,减去背景音,提高音频质量,从而达到识别该音频,转换为文字。(有些可以返回json数据,但只显示result[]里面内容数据为空),...
visualIDL无法显示
输入http://127.0.0.1:8080之后无法加载任何内容,请问这是什么原因? 1../log中包含日志文件 2.http://127.0.0.1可以访问...
不是说PaddlePaddle2.2支持字符串张量吗?
记得12月12号的时候,去参加WAVE SUMMIT峰会时,听到说PaddlePaddle2.2支持字符串张量,可以免掉一切字符串预处理...
from utils import load_vocab, convert_example报错
我已经安装了需要的组建,难道还有漏的吗 输入 别的不报错 输入load_vocab, convert_example马上报错 实在不懂为什么在这个点会出问题,研究了一晚有好兄弟可以回答一下吗...
paddle试图索引失败
!= 1:1.] (at /paddle/paddle/fluid/pybind/imperative.cc:599) 请问该如何解决,同样的代码在torch上是可以跑通的...
求 curl 访问 Serving(ppyolo)的参数示例
已经按照教程完成 Serving 的部署,并且使用 test_client.py 可以获取正确的识别结果。 但是一直没整明白如果通过...
请问使用脚本任务的时候,如果安装外部包?
比如我想使用Senta,作为百度自家的产品应该还是能安装的吧?当然还有polars之类处理数据的。 补充:如果可以安装,如果永久安装,具体的路径是啥呢? 调用永久安装的包的话,需要添加什么路径到系统路径中?...
后台运行不能保存模型的问题
/yolo_best{}.pdparams'.format(epoch)) 我在项目中是用这个保存代码,后台运行的输出结果是对的,但是,运行文件里面却没有应该保存的文件,这是bug吗?在项目里面运行是可以的...
如何对密集字符图像进行分割?
如下图所示,字符粘连在一起,但是想把每个字符都能精确找到与其他字符的边界?仅限水平字符,请问大神们有什么办法可以做到?...
新人求教pycharm导入paddle引包问题
各位大佬,我在使用pycharm导入paddle,import可以正常显示paddle包名,但是导入后无法正常使用paddle包下的引用...
Streaming ASR 输出是流式,怎么能接收流式输入?
(paddlespeech.readthedocs.io/en/latest/streaming_asr_demo_video.html)里演示的是可以接收麦克风输入的,去哪儿能找到实时音频输入的例子?...
切换版块
智能客服