首页 版块 访问AI主站 注册 发帖
操作指南:
技术专区:
AI赛事:
集思广益:
百度语音识别WAV是否只支持不压缩格式?
百度开发者们好: 请问百度语音识别WAV是否只支持不压缩格式?
手机浏览器访问语音合成web,不能自动播放?
使用的是语音合成web或RESTful接口开发的,在电脑正常但手机不行,怎么在手机浏览器上也能自动播放?
ios离线语音合成中bd_etts_text.dat文件在哪儿获取?
ios离线语音合成Demo中缺少bd_etts_text.dat文件,这个文件是生成的还是,下载的?在哪儿下载?
PaddleSpeech语音合成返回的数据是错的,怎么办?
我能正常发送和接收到WebSocket的消息,事实上我已经成功的用PaddleSpeech完成了语音识别的功能,但是在语音合成上,我发现我...
【应用案例】智能语音客服成为你的恋爱助手
a.背景介绍、适用场景 当代直男不在少数,苦于不知恋爱技巧,不知如何讨女/男孩子开心,苦于不知如何回答死亡之问,该语音助手即是帮助解决...
MRCP端到端解决方案上线,轻松搭建智能语音客服
随着企业的发展,客服服务不可获缺。客服面对的80%的问题可能都是重复性的问题。人工智能的发展可以大大减轻员工的工作强度和难度。语音...
Android语音合成出现ANR
我使用的服务是:语音合成 调用的接口是:speechSynthesizer.initTts(TtsMode.MIX); SDK版本号...
我们现在项目的入口就是百度直达号,html+js+css技术开发的web项目如何调用到麦克风,调用百度语音识别接口
们现在做的这个项目的入口就是-直达号,用的技术全部都是html+js_css的,就是不知道语音这块,如何调用到百度语音识别接口。...
如何在生成语音时得知各字的时间标签
:00.72]三[0:00.72-0:01.05] 想问接口是否支持直接在返回音频时返回各字的起止时间戳;若不支持,有没有可能运用语音识别等能力间接识别出这些时间点、或者运用其他非AI技术实现这个需求。...
语音识别的录音文件格式有错
语音识别的时候,保存识别过程产生的录音文件,最后产生的voice.amr文件,通过格式工厂看到以下内容 GeneralComplete...
语音合成代理设置问题,C#
请问我用的语音合成的dll文件,用C#开发的一个合成软件,如果网络正常的话完全没问题,现在是要在公司用,公司不能直接直接上外网,但可...
预期使用离线语音识别时,提示网络错误
我使用的服务是:语音识别服务-离在线融合SDK安卓 调用的接口是:SpeechRecognizer.startListening...
关于设置语音识别词库的使用问题
我设置了语音识别词库,并且选中“仅识别上传数据中的用户输入”,如何在应用中体现呢,应该用哪个识别模式?是说只有我上传的txt里面有的词才能...
语音识别的录音格式是.WAV 可以吗?
步骤、现象及其他描述: 语音识别的录音格式是.WAV 可以吗,这个扩展名有大小写区别吗? PS:我使用的Linux下的C++程序测试的,返回3301,不知道是不是因为这个格式的原因...
语音识别wav格式返回3301
我使用的服务是:语音识别 调用的接口是:http://vop.baidu.com/server_api 参数设置情况: "format...
Android语音合成没有声音
我使用的服务是:语音合成没有声音,但是在Demo里面有声音集成在项目就没有声音 sh...
语音识别总是返回"err_no":3301
我使用的服务是:语音识别 调用的接口是: client.asr("output.wav", "wav", 16000, null...
语音识别SDK只支持pcm和wav格式了吗?
语音识别SDK只支持pcm和wav格式了吗?为啥我传入amr格式就提示参数格式错误? $response = $client->asr...
语音合成使用了一段时间,会提示:百度语音还有xxx天,这个提示语怎么去掉???
我使用的服务是:语音合成 调用的接口是: 参数设置情况: 开发平台和机型:android5.1 SDK版本号: 代码或日志截图(上传截图能帮助您更快解决问题): 复现步骤、现象及其他描述:...
iOS开发 百度语音主题包里面的资源图片无法加载出来,无法使用资源包里的图片资源!
iOS开发 百度语音主题包里面的资源图片无法加载出来,无法使用资源包里的图片资源!但是能进行语音识别,就是不能使用资源包里的图片资源,导致UI上很不美观!...
切换版块
智能客服