百度AI开发者社区

AudioTrack播放合成语音的问题

/forum/topic/show/494442 2016-06-28

audioPlayer.prepare(); audioPlayer.play();}我用AudioTrack播放合成后pcm数据，但是我觉得声音始终...

怎么修改语音源提供给API？

/forum/topic/show/865244 2018-06-01

智能硬件上面有多个麦，多个麦收音后要进行优化得到单个音频给API，如何修改这部分？主要是对百度API是怎么得到语音的这块不理解...

语音识别与AVPlayer冲突

/forum/topic/show/494211 2016-05-17

语音识别后的一个问题是，AVPlayer播放的视频没有声音了，但是如果调整一下AVPlayer的播放进度声音又回来了。请问大概是哪里冲突了 ...

多音字处理

/forum/topic/show/495135 2016-10-28

）：复现步骤、现象及其他描述： TTS之后，‘爪’字的发音是zhǎo，请问下如何使发音改为zhǔa?...

【案例】度小满支付：卡证识别提升绑卡便捷性

/forum/topic/show/943072 2019-04-16

价值成果度小满支付通过集成百度OCR文字识别-卡片证照识别（银行卡识别）技术，在用户将银行卡添加至度小满金融账户，完成账号注册绑定银行卡...

给大家介绍一位非常开放的新朋友

/forum/topic/show/870059 2018-07-23

开发者大会上，百度副总裁、百度 App & 信息流业务体系总负责人沈抖博士说，“相信在百度合作伙伴们的共同努力下，我们一定可以重新定义互联网...

查询天气，怎么样才能告诉准确的查询结果？

/forum/topic/show/943423 2019-04-30

想完成一个简单的查询天气功能，比如问北京天气，回答，今天多云，温度20-30等，但是现实是只能回答“正在查询。。。” ，怎么解决！...

创建用户后，能查询用户相关的图片吗

/forum/topic/show/497261 2017-12-28

是否可以提供接口可以查询指定uid的图片信息，最好是能提供批量导入和批量导出的接口

公测 | 定额发票、VIN码、护照识别抢先使用

/forum/topic/show/943053 2019-04-15

，包括国家码、护照号、姓名、姓名拼音、性别、出生日期、出生地点、签发日期、签发地点、有效期。应用场景： ● 财税报销核对：通过...

合成-REST_API 参数lan有其他值吗

/forum/topic/show/494682 2016-08-01

lan参数出了zh还能有其他什么值？中英文混合用zh合成的语音英文字母部分有问题，读法不是英文单字母发音而且语速特别快,还是说字母只能...

Android 导航没有语音

/forum/topic/show/496946 2017-12-12

key是对的，没声音

Error: AudioQueueStart failed (-66681)

/forum/topic/show/495537 2017-02-16

我使用的服务是：语音识别调用的接口是：语音识别接口（无ＵＩ的）参数设置情况：设置开始提示音和结束提示音开发平台和机型...

有百度文字识别OCR加持极限词查询更方便快捷智能

/forum/topic/show/889867 2018-09-02

来自百度AI开放平台，的文字识别OCR接口），同时加入了宝贝链接查询。在此同时为了拟补极限词更新不及时，我们加入了个人词库管理功能，用户可以...

关于Mummy语音识别的疑问

/forum/topic/show/957034 2019-12-10

测试接口（英语模式下）的时候，多人分别输入mummy语音（包括百度翻译的发音），接口始终返回“mami”。不知为何？ ...

怎样打开

/forum/topic/show/492967 2015-07-16

开通服务之后，怎样打开声音合成

如何实现对语音的打分？

/forum/topic/show/987734 2021-04-04

又分为两种情况： 1、评分完全有AI系统自主判断，没有任何参照。 2、上传对应文本的标准真人发音，以此为参照，AI给出用户发音的评分。请问百度的语音处理服务有没有这样的服务，我翻了一遍没找到，如何实现这样的功能？ ...

语音合成和语音识别同时进行，导致识别不准确

/forum/topic/show/496184 2017-08-09

截图能帮助您更快解决问题）：复现步骤、现象及其他描述：在进行语音合成（例如：读一段文字），这个时候启用语音识别，把合成的声音和人说的声音混一起了，这种情况如何处理呢...

Parakeet TTS 旋律问题

/paddle/forum/topic/show/991456 2021-11-07

话说前面有可以克隆声音的模型(个人用tacotron2),那我在想,能不能有个在tts更上一层楼的操作,让输出的声音有旋律,但是在...

关于返回的人脸坐标信息

/forum/topic/show/956837 2019-11-19

大佬们好，关于人脸检测中返回人脸信息的对象FaceInfo，其中有centerX, centerY，width 这三个信息，用于接下来...

快,三查询结果

/paddle/forum/topic/show/4180444 2023-10-28

快,三查询结果