AudioTrack播放合成语音的问题
audioPlayer.prepare(); audioPlayer.play();}我用AudioTrack播放合成后pcm数据,但是我觉得声音始终...
怎么修改语音源提供给API?
智能硬件上面有多个麦,多个麦收音后要进行优化得到单个音频给API,如何修改这部分?主要是对百度API是怎么得到语音的这块不理解...
语音识别与AVPlayer冲突
语音识别后的一个问题是,AVPlayer播放的视频没有声音了,但是如果调整一下AVPlayer的播放进度声音又回来了。请问大概是哪里冲突了
...
多音字处理
):
复现步骤、现象及其他描述:
TTS之后,‘爪’字的发音是zhǎo,请问下如何使发音改为zhǔa?...
给大家介绍一位非常 开放 的新朋友
开发者大会上,百度副总裁、百度 App & 信息流业务体系总负责人沈抖博士说,“相信在百度合作伙伴们的共同努力下,我们一定可以重新定义互联网...
关于Mummy语音识别的疑问
测试接口(英语模式下)的时候,多人分别输入mummy语音(包括百度翻译的发音),接口始终返回“mami”。
不知为何?
...
如何实现对语音的打分?
又分为两种情况:
1、评分完全有AI系统自主判断,没有任何参照。
2、上传对应文本的标准真人发音,以此为参照,AI给出用户发音的评分。
请问百度的语音处理服务有没有这样的服务,我翻了一遍没找到,如何实现这样的功能?
...
语音合成和语音识别同时进行,导致识别不准确
截图能帮助您更快解决问题):
复现步骤、现象及其他描述:
在进行语音合成(例如:读一段文字),这个时候启用语音识别,把合成的声音和人说的声音混一起了,这种情况如何处理呢...
Parakeet TTS 旋律问题
话说前面有可以克隆声音的模型(个人用tacotron2),那我在想,能不能有个在tts更上一层楼的操作,让输出的声音有旋律,但是在...
关于返回的人脸坐标信息
大佬们好, 关于人脸检测中返回人脸信息的对象FaceInfo,其中有centerX, centerY,width 这三个信息,用于接下来...