首页 版块 访问AI主站 注册 发帖
操作指南:
技术专区:
AI赛事:
集思广益:
寻求人声分离(多人说话分离每个人说话)解决方案
想开发一个某展厅用的讲解机器人,当有多个参观展厅的时候,有可能在相同的方向同时向机器人提问,这时需要分离不同人的声音,有针对性的回答。寻求解决方案 ...
授权成功,在线使用speek()函数,返回值为0,但没有合成声音;监听器只检测到合成开始,没有检测到合成错和结束,这是为什么?
我使用的服务是:语音合成 调用的接口是:speek 参数设置情况: 开发平台和机型: SDK版本号: 代码或日志截图(上传截图能帮助您更...
安全帽检测实验请问有人现过这个问题吗?怎么解决呀
[ERROR] No voc record found in %s' % (file_list) 这个数据集是下载的给的现成的,这个错误怎么解决呀
C++ SDK 人脸检测编译时头文件现问题
运行环境是虚拟机unbuntu 16.0.4,用的是C++ SDK,在编译时遇到如下问题,本人新手,望大牛帮忙具体一点解答:
谁有另一些语音合成的语言包吗?来百度自带的五个
自带的五种声音不好听!谁知道如何把声音调好听一点吗
身份证号码识别不来,位置找不到?????
用的sdk里的demo和图片,找不到身份证号码。(PHP版本的SDK)
使用语音识别,之前好好的,更新到IOS9之后就问题了
如题:在IOS8上完全可用,可是装到IOS9的手机上,录音说话就crash,不说话就没问题。不知道是不是图中的对象为空的问题,但是搜了一...
我使用合成语音合成来的声音无法被语音识别识别
var option = new Dictionary() { {"spd", 4}, // 语速 //{"pit", 7}, // 音调 {"vol", 7}, // 音量 {"per", 4} // 发音人发音人选择, 0为女声,1为男声,3为情感合...
c#文字识别,图片已转码base64现图片格式
Encoding encoding = Encoding.UTF8; string base64 = getFileBase64(img); string str = HttpUtility.UrlEncode(base64); byte[] buffer = encoding.GetBytes(str); // 如果有可选参数 ...
如何可视化Paddle分类网络中某些卷积层输
想要看一下Paddle分类网络中某些卷积层提取特征的效果,需要将特征图可视化,请问该如何做呢
在用yoloV3训练模型时现这个问题怎么解决
Error Message Summary:----------------------InvalidArgumentError: The Tensor in the crop Op's Input Variable X(create_parameter_15.w_0) is not initialized. [Hint: Expected t->IsIni...
深度学习工程师认证的中级考试来了
感谢七年期限同学的提醒,认证考试入口:https://aistudio.baidu.com/aistudio/certification 看了下条件,没有太多限制,配套课程好像就是毕老师...
相似图片入库都正常,就是相似图搜索现了问题
返回空数组Array ( [has_more] => [log_id] => 1529100770204516144 [result_num] => 0 [result] => Array ( ) ) 我还专门去百度图片那个网站找了很多相似的图片入...
掐指一算,6.28号周一六月份积分兑换?
这次的兑换时间有点晚哦,可能是飞桨快速扩张期,工作人员事务繁忙
Paddle Serving 跨语言RPC+GPU运行环境 错,请问如何解决?
要实现的目标: 1、将inference_model转换为Serving模型 2、在nvidia-docker环境下将模型服务化,要求模型运行在GPU上,模型服务提供跨语言RPC接...
在本地环境训练正常,在ai studio上面经过卷积后输全是nan
在本地的paddle环境下执行模型,正常,但放到ai studio上面运行,经过第一个卷积数据就全是nan
切换版块
智能客服