首页 版块 访问AI主站 注册 发帖
操作指南:
技术专区:
AI赛事:
集思广益:
TTS在线合成个别代理方法不调用
)synthesizerSpeechEndSentence:(NSInteger)SpeakSentence;方法不被调用了,其他的代理方法都能正常调用,离线模式下也可以正常调用...
语音合成报错误码“400”TTS未初始化
语音合成报错误码“400”TTS未初始化;但是这个程序已经上线。大部分可以正常播报,只有部分机具会报上面的错误。api 22 ,百度语音版本是Baidu-TTS-Android-2.3.5.2.20180713_6101c2a...
音频文件转写,文件格式问题
文件格式可以是.mp3的吗,调用上传都没问题,但是一直没有最后结果。 反馈一直是{'status': 50006, 'msg': '正在...
c++版本是不是比py版慢
各位,之前py快速安装,机器,ubuntu18.4,pp2.0,RTX 4000,cuda10.2,性能还可以。 相同配置硬件,用了...
如何将使用save_dygraph接口保存的模型使用save_inference_model接口保存
"]) 这样保存的模型,可以使用 save_inference_model 接口保存成.pdmodel和.pdiparam格式的模型吗?...
在运行paddleOCR 使用GPU的时候提示出错
本平台暂时无法支持TF/PyTorch/MxNet等框架的运行, 现在自动关闭。如您需要将代码和训练模型迁移, 您可以在本项目”空闲中”的状态下, 将相关文件打包下载。...
后台任务运行的空间限制20G
这个限制20G是最终的输出结果,还是运行的过程中就不能超过20G 跑了个paddledetection项目 存的模型大概20g的时候,还没跑完任务就失败了 跑的过程中将模型存到data目录下是否可以解决呢...
PaddleNLP机器翻译直接run不报错,调试
PaddleNLP做transformer的机器翻译模型时,直接run train.py可以运行,但是在debug调试到...
stylepro_artistic模组是否可应用于即时webcam?
是否可以应用在cv2.VideoCapture(0)的基础上,将webcam即时风格转化? 谢谢各路大神...
语音识别引入外部音频文件必须一起上传服务器吗
);上传到服务器吗? 外部音频包括音频文件或者自定义的音频流(二进制语音流byte[]等)可以分段上传吗?还是必须一次性上传所有的?...
识别、锁定。无论怎么移动最后都能准确定位,能不能
比如一副十张的牌,正面图片识别一次,然后全部翻过来随便洗一洗。通过什么技术可以准确的分析和识别准确信息和位置。求大神指导,重金答谢。...
人脸对比时不能提取证件照的特征(身份证照片)
用离线人脸识别SDK中的示例代码,调用身份证照片时返回“get feature error”,非证件照可以的。证件照来自与身份证芯片中,其图片分辨率时102*126,参数都是默认的。...
语言合成的最长文本到底是多少?
“Invalid text length”,有时又可以支持到2000个字符。我测试用的基本上都是中文。 ...
语音唤醒功能持续时间问题
想问下语音唤醒功能可以持续等待唤醒词多久 因为我使用唤醒功能测试时过一晚上回来就无法唤醒了 若会中途停止 有回调函式能收到通知吗 ...
相似图搜索 返回了全部的自建图库中的所有图片
为什么相似图搜索会返回自建库中的所有图片呢? 不会进行相似度匹配的吗? 还有相似图片入库的时候bref参数 是必须要传的,文档那里写的不是要必传 希望可以改一下 ...
语音合成输出的音频格式问题
kHz, Monaural 请问可以输出wav格式吗?或者怎么转成wav格式啊?...
人脸识别技术求大佬开导
求问,有一个场景,50个人的课堂,若采用人脸识别技术,能否解决所有学生的签到?百度人脸识别技术的人脸数量限制可以突破吗?...
添加OCR文字识别之后打包出现的问题
AipBase.framework添加进我创建的项目中, 测试的时候可以正常使用, 但是我需要打包的时候, 编译不过去。...
语音合成的音质能提高吗
III, v2,  16 kbps, 16 kHz, Monaural合成的音质只有16 kbps,所以听起来像电话的效果。请问有没有什么选项,可以提高语音合成的音质?...
百度语音今天是不是有异常。
已经发布的版本,前面每天都有30左右的用户,超过3k次的合成。今天只有12个用户,合成次数只有1k多次。我晚上回来下载软件商店的版本试了下,android 的可以合成。是不是异常恢复了?...
切换版块
智能客服