首页 版块 访问AI主站 注册 发帖
操作指南:
技术专区:
AI赛事:
集思广益:
百度识别如何使用自己的音频流
我现在需要用语音识别 去识别自己说的话 然后用百度合成去合成了然后播放出来。现在我把两个项目整和到一起发现百度合成的声会被百度识别识别...
多音字合成问题
文本提供一个标准的控制语音输出的方法,例如发、音量、音调、语速等参数。 控制一句话中某些字按照指定拼合成...
iOS语音合成和音乐播放功能之前会有冲突 该怎么解决
音乐播放器播放音乐了  语音合成就没有声了,我查看了是正常走的代码而且也正常调用了setCategory方法,但是不会出现声,程序回到前台...
百度语音合成方法无法调用问题
那个Demo中的speak方法,当时speak方法没有声发出。 有尝试过直接编译Demo,speak方法是可以的,但是同一个包中的其他类...
如何实现对语音的打分?
又分为两种情况: 1、评分完全有AI系统自主判断,没有任何参照。 2、上传对应文本的标准真人发,以此为参照,AI给出用户发的评分。 请问百度的语音处理服务有没有这样的服务,我翻了一遍没找到,如何实现这样的功能?  ...
语音合成和语音识别同时进行,导致识别不准确
截图能帮助您更快解决问题): 复现步骤、现象及其他描述:     在进行语音合成(例如:读一段文字),这个时候启用语音识别,把合成的声和人说的声混一起了,这种情况如何处理呢...
Parakeet TTS 旋律问题
话说前面有可以克隆声的模型(个人用tacotron2),那我在想,能不能有个在tts更上一层楼的操作,让输出的声有旋律,但是在...
请问最新版本的语音识别sdk有做降噪相关的处理吗
在录音完成后的识别过程中,稍远距离或者有轻微杂就提示音频质量有问题
BDS_ASR_PLAY_TONE
BDS_ASR_PLAY_TONE 设置参数为@(EVRPlayToneAll),但是没有提示,这是怎么回事呢?
百度语音合成,获取服务器可用的引擎模型信息(比如男女声中英文发)一直返回为空
我使用的服务是:百度语音合成,获取服务器可用的引擎模型信息(比如男女声中英文发) 调用的接口是: AvailableConditions...
〔 盘 点 一 下 〕 龙 虎 大 小 稳 赢 技 巧 ( 头 条 / 搜 狗 )
管理、歌手帮唱到商用授权等助力万入驻音乐人打造个人品牌的同时也可以涨涨收入。在酷狗音乐开酷狗音乐开放平台一站式解决音乐分发难题助力音乐人...
Android SDK 有没有设置单声道的接口
我发现Android SDK的语音识别录出来的都是立体声,有没有设置单声道的接口啊? 谢谢!!
NBA和cba的篮球比赛在哪里可以滚球和大小球?
足球比赛可以在app上、m365990 㸃 cōm电视上看。在app上能看世界杯转播的为:手机端是、今日头条、咪咕视频app...
如何编码为pcm 或 wav
 请教个问题,获取到的采样声 是 float[] 数组,这样的如何编码为pcm 或 wav啊?(不懂编码)
关于Mummy语音识别的疑问
测试接口(英语模式下)的时候,多人分别输入mummy语音(包括百度翻译的发),接口始终返回“mami”。 不知为何?  ...
拼音读音识别判定
有没有关于拼音读音识别判定以及拼手写输入识别判定的第三方的接口
智能家居中硬件控制是怎么控制的呢?
比如说用声控制灯的开关,这种智能灯和控制器都是什么,从哪里能买到呢?
VAD断句时间可以设置吗
再对接智能 呼叫 中心,实时 语音 识别 LinuxSDK 时,发觉断句太快,这个 静 检测 断句时间可以设置吗?
项目评论好像出bug了
我评论有些内容的时候  虽然输入的是汉字  但是在发出去之后就成了拼  有遇到同样问题的吗?  
切换版块
智能客服