首页 版块 访问AI主站 注册 发帖
操作指南:
技术专区:
AI赛事:
集思广益:
语音合成,能支持同时2个声音同时播放,例如一个高音,一个低音
语音合成,能支持同时2个声音同时播放,例如一个高音,一个低音 或者不分高低音,能同时播放2句话,不排队 好像没看到有介绍 ...
语法识别是哪个版本以上sdk才支持的呢?语法识别有识别音频流的接口
RT 就是1.6版本有feedAudioBuffer 自定义输入语音数据,现在想用这种方法传入音频流进行语法识别,还可以
烟雾检测那个案例如果使用它的沙盒部署,生成API的话代码是咋样的,谢谢
烟雾检测那个案例如果使用它的沙盒部署,生成API的话代码是咋样的,谢谢,输入输出代码不会写,paddle2.1.2版本,谢谢...
每次部署应用都要重新下载模型,模型又非常的大,有啥好的建议
每次部署应用都要重新下载模型,模型又非常的大,有啥好的建议 [03:32 1:47:06, 1.36MB/s] 29%|██▉ | 3.33G/11.5G...
AI社区、AI Studio 九月积分兑换
5-8条内容。 5)礼品接收人姓名 6)收件地址 7)联系方式(手机号或者座机号) 8)AI Studio 个人主页链接(无AI Studio...
bd_etts_text.dat是什么格式
bd_etts_text.dat是什么格式,有相关的数据结构,能自己解析
脚本任务日志输出
脚本任务的日志输出只能通过logging输出,使用print会在日志中刷新
yolo系列学习与改进
yolo系列已经这么多了,还有改进的空间?把yolo系列论文看完再自己改进发表论文,有可行度
物体检测EdgeBoard(VMX)专用SDK集
物体检测EdgeBoard(VMX)专用SDK集成文档,这个芯片只支持win10,win7可以用
语音识别、语音合成、语音唤醒都是永久免费的?特别是语音合成里面要情感合成的也是免费的?SDK里面说每日限额50000条,是超过收费
我使用的服务是: 调用的接口是: 参数设置情况: 开发平台和机型: SDK版本号: 代码或日志截图(上传截图能帮助您更快解决问题)...
语音识别在linux 平台上支持流式上传?有这种支持 前后端点检测到一次识别的方案
我使用的服务是: 调用的接口是: 参数设置情况: 开发平台和机型: SDK版本号: 代码或日志截图(上传截图能帮助您更快解决问题)...
人脸检测主题创意赛-官方样例预测输出貌似有问题
/aistudio/projectdetail/402840 这是我的项目地址,fork了官方的人脸检测示例,结果运行的时候提示没有保存预测图片...
从图片处理到视频处理的捷径
,AI Studio 项目地址是: https://aistudio.baidu.com/aistudio/projectdetail/448839 欢迎吐槽。...
百度语音转文字
/receive',)); 通过这个接口我传人远程的的文件地址,例如:七牛云的返回给我的的代码是:{"err_msg":"success....
在线语音识别 REST API 不能识别wav格式
的pcm格式,可以正常返回语音转换文字 但使用,使用录制的wav:地址:http://www.wimichina.com:8011...
paddle,恢复训练时报错
, default='./output/train-20211210-09-50-43/Swin-Epoch-45') 写入地址,并运行...
【第三季度奖励公示】精选项目贡献榜单
请获奖的作者,填写邮寄地址:https://paddle.wjx.cn/vm/exhva8o.aspx 填写截止时间:10月8日 ...
每次上传的语音数据是独立的?会跟下一段语音连接起来一起识别
语音数据可能从任意位置截断,导致前一段语音结尾是半个字,后一段语音开头是半个字
NLP短文本语义判断,一对多的如何进行对比呢?
举个例子,A:“明天天气怎么样?” B:“不知道明天天气怎么样呢” C:“明天需要带伞” D:“明天能去爬山” 我想要使用A分别和BCD进行语义对比,有方法可以只调用一次接口,直接返回三个分数?...
能只是用离线合成语音,不使用在线的? 认证是必须的?我的应用不联网就无法使用了?
我使用的服务是: 调用的接口是: 参数设置情况: 开发平台和机型: SDK版本号: 代码或日志截图(上传截图能帮助您更快解决问题)...
切换版块
智能客服