百度AI开发者社区

语音识别远场模式拾音距离短，超过1米效果就很差了

/forum/topic/show/497369 2018-01-04

请问有没有相关设置可将拾音效果增强些；

请问为什么总是认证失败

/forum/topic/show/493769 2016-02-15

, "../speechData/" + TEXT_MODEL_NAME); // 设置语音合成声音模型文件...

【停服公告】EasyDL将于7月19日晚间停服

/forum/topic/show/869997 2018-07-19

无法使用，已上线接口不受影响本次服务即将升级内容：声音分类模型定制上线：定制声音分类模型，可以定制识别出当前音频是哪种声音，或者是什么状态...

百度与华东六校共建人工智能微专业

/forum/topic/show/982035 2021-01-18

副主任吴甜代表百度与高研院签约，并将共建新一代人工智能科教育人联合体暨人工智能微专业。（图一：浙江大学上海高等研究院与百度等企业签署合作协议...

主页的产品体验，点击了根本没声音啊，也不播放啊

/forum/topic/show/943063 2019-04-16

360.谷歌浏览器都试了，你们自己没试试？吹的挺牛的公司，犯这种低级错误不应该吧

iOS语音合成获取合成结果后播放没有声音

/forum/topic/show/955881 2019-08-24

- (void)synthesizerNewDataArrived:(NSData *)newData DataFormat:(BDSAudioFormat)fmt characterCount:(int)newLength ...

汉语发音数字一和幺怎么做绑定关系？

/forum/topic/show/954170 2019-08-07

我这边创建一个词槽选择了系统词典的sys_num和sys_phone_num。因为发音问题一和幺都是表示一。如果发送数字一为汉字幺，如：幺三幺幺二...

PARL强化学习公开课的笔记

/forum/topic/show/960523 2020-06-27

强化学习的学习营中主要课程主要有 1、Sarsa模型 2、Q-learning模型 3、DQN模型 4、PG模型 5、DDPG模型第一个...

强化学习7日小白入门笔记

/paddle/forum/topic/show/960517 2020-06-27

SARSA, Q-Learning, DQN, DDPG的介绍和实例分析，深入浅出，讲解的非常细致。听完课后，对强化学习的基础知识和整体框架都有...

发现马约拉纳费米子存在证据，微软在构建量子计算机

/forum/topic/show/682292 2018-03-30

更稳定的量子信息编码方式。微软早在 2005 年就已经开始钻研量子计算技术。在当时微软还悄悄成立了「Station Q」实验室，负责人是数字...

做语言命令时如何判断有人开始说话和结束说话了

/forum/topic/show/498178 2018-03-06

是一直不停的录音。当声音到达某个值时就认为有人在发送命令。然后又小于这个值就认为发送结束不过怎么写代码不太清楚用python实现 ...

android实时语音识别是否支持语音块上传？

/forum/topic/show/870170 2018-07-31

对讲，麦克风已经被底层占用，希望用底层程序复制一份声音数据给上层，然后进行语音识别。...

乐器音高识别

/forum/topic/show/498182 2018-03-06

现在有没有可以实现识别乐器音高的技术，单音识别已经有了，多音识别（和弦）能不能做到？因为乐谱中6到8个音同时弹的概率也非常高。我想做一款练琴的app，我是学音乐的，不是做IT技术的，请各位大神指点！ ...

WIFI下能合成语音，移动网络下不可以

/forum/topic/show/494865 2016-08-27

disabled, restarting 平板内存里也放了文本和声音模型文件，路径没错...

将语音合成生成的文件做语音识别报错3301

/forum/topic/show/494170 2016-05-10

合成和识别都是用REST API接口, 通过接口语音合成的文件采样率16k,位深16bit,格式wav,播放都没问题, 与我自己录制的声音...

百度easyDL的图像分类原理是？

/forum/topic/show/942805 2019-03-28

百度的easyDL名为让深度学习更简单，使不懂深度学习的用户能够在此平台训练数据集，数据集的训练涵盖声音，图像，文本分析领域，针对图像中的图像分类和物体检测，两者背后所支撑的技术原理是什么?...

语音识别API目前可以支持AMR音频格式吗？

/forum/topic/show/869984 2018-07-18

quality error",23.85khz是AMR-WB格式最高的码率了，我也听了下转码的AMR文件声音很清楚，可API为何报告识别不了？是不是语音识别API目前还无法支持AMR格式？...

如何关闭vad

/forum/topic/show/497422 2018-01-09

一句话说完后，如何控制不自动停止识别？/ 为何我静音一段时间后，自动停止了识别？关闭VAD即可设置的哪个参数啊...

盛源在线是真的吗【hj8828.vip】初学电脑

/forum/topic/show/2296597 2023-05-27

初学电脑先学什么?鼠标演练是第一步，拖动，复制、粘贴、移动等等，主要是训练对于鼠标功能的了解开始学习用键盘上打字母、打拼音、打汉字，练习对于键盘的熟练度等等。学会了解文件属性，比如：大小、分辨率、尺等等。...

百度大脑开放日厦门站-企业服务专场

/forum/topic/show/988227 2021-05-09

/live.html?room_id=4442618918&source=h5pre B站：http://live.bilibili.com/21863531 ...