百度AI开发者社区

主页的产品体验，点击了根本没声音啊，也不播放啊

/forum/topic/show/943063 2019-04-16

360.谷歌浏览器都试了，你们自己没试试？吹的挺牛的公司，犯这种低级错误不应该吧

iOS语音合成获取合成结果后播放没有声音

/forum/topic/show/955881 2019-08-24

- (void)synthesizerNewDataArrived:(NSData *)newData DataFormat:(BDSAudioFormat)fmt characterCount:(int)newLength ...

汉语发音数字一和幺怎么做绑定关系？

/forum/topic/show/954170 2019-08-07

我这边创建一个词槽选择了系统词典的sys_num和sys_phone_num。因为发音问题一和幺都是表示一。如果发送数字一为汉字幺，如：幺三幺幺二...

【AI达人养成营】笔记分享

/paddle/forum/topic/show/991615 2021-11-16

Python函数基础一、自定义函数： 1. 函数代码块以def开头，后接函数标识符名称和圆括号（），任何传入参数和自变量必须放在圆括号...

如何获取人脸库管理后台中的图片base64

/forum/topic/show/867015 2018-06-25

在百度人脸库管理后台上传图片后，如果通过接口获取到图片的base64内容或图片url? 目前看到的接口，是能获取到 face_token，但没看到如何进一步获取base64...

语音识别自定义词库仅支持上传一个文件？

/forum/topic/show/942926 2019-04-07

rt, 我的自定义词库转换为 txt 文件有 30M +, 但是上传文件设置仅支持 5M 以内的 txt，于是切割为多个文件，然后上传的时候发现仅能上传一个文件？...

百度地图和百度语音冲突，已删除galaxy_lite.jar库

/forum/topic/show/493668 2016-01-12

项目里面集成了百度地图，后来添加百度语音后就报错了，已删除galaxy_lite.jar库。错误见下图。 ...

百度地图和百度语音冲突，已删除galaxy_lite.jar库

/forum/topic/show/493670 2016-01-12

项目里面集成了百度地图，后来添加百度语音后就报错了，已删除galaxy_lite.jar库。错误见下图。 ...

果敢老街正规靠谱真人实体同步线上三合一平台识别

/forum/topic/show/2297341 2023-07-18

首要，此庙坐落于老街市中心的街后坐南向北，占地约10亩。大庙是果敢人的俗称，这是一座由关帝庙和观音庙组合而成的庙宇。老街大庙原先修建的是关帝庙...

android实时语音识别是否支持语音块上传？

/forum/topic/show/870170 2018-07-31

对讲，麦克风已经被底层占用，希望用底层程序复制一份声音数据给上层，然后进行语音识别。...

Doris 使用Flink 做离线 ETL

/forum/topic/show/990618 2021-09-06

没有什么问题，flink 处理的好的数据doris 对外提供查询算是比较成熟的方案。 2.关于关于离线部分可以用两种方案 1）直接使用...

乐器音高识别

/forum/topic/show/498182 2018-03-06

现在有没有可以实现识别乐器音高的技术，单音识别已经有了，多音识别（和弦）能不能做到？因为乐谱中6到8个音同时弹的概率也非常高。我想做一款练琴的app，我是学音乐的，不是做IT技术的，请各位大神指点！ ...

WIFI下能合成语音，移动网络下不可以

/forum/topic/show/494865 2016-08-27

disabled, restarting 平板内存里也放了文本和声音模型文件，路径没错...

将语音合成生成的文件做语音识别报错3301

/forum/topic/show/494170 2016-05-10

合成和识别都是用REST API接口, 通过接口语音合成的文件采样率16k,位深16bit,格式wav,播放都没问题, 与我自己录制的声音...

百度easyDL的图像分类原理是？

/forum/topic/show/942805 2019-03-28

百度的easyDL名为让深度学习更简单，使不懂深度学习的用户能够在此平台训练数据集，数据集的训练涵盖声音，图像，文本分析领域，针对图像中的图像分类和物体检测，两者背后所支撑的技术原理是什么?...

语音识别API目前可以支持AMR音频格式吗？

/forum/topic/show/869984 2018-07-18

quality error",23.85khz是AMR-WB格式最高的码率了，我也听了下转码的AMR文件声音很清楚，可API为何报告识别不了？是不是语音识别API目前还无法支持AMR格式？...

如何关闭vad

/forum/topic/show/497422 2018-01-09

一句话说完后，如何控制不自动停止识别？/ 为何我静音一段时间后，自动停止了识别？关闭VAD即可设置的哪个参数啊...

iOCR快速识别证件信息，让客户管理从此简单高效

/forum/topic/show/956023 2019-09-10

车辆合格证和车辆销售发票信息时，实现快速提取客户姓名、身份证号、车架号、发动机号、车型等信息，并将客户信息便捷录入至管理系统。以往员工录入...

用post上传图片，怎么老返回282000错误啊

/forum/topic/show/870470 2018-08-15

测试地址：ai.baidu.com 设备号：6B725AF84E053E67BB7D341E806B5E3C activeKey：I3GZ-KKQE-ZJNR-R0M1 使用的是官方提供的测试设备号。请问谁有这个例程啊，多谢了...

使用hub加速git时需要注意

/paddle/forum/topic/show/978095 2020-12-15

加速git clone的速度，但需要注意，该仓库可能不是最新版本，我的理解是跟托管在码云上的差不多，会有几天的延迟（可能更久...）。所以...