百度AI开发者社区

语音识别到底需要啥样的音频文件？

/forum/topic/show/953127 2019-07-09

本地的音频文件全部不能识别，无论是pcm、wav、mp3哪种格式的文件，无论是网上下的，还是自己合成的，都不能用百度语音合成的音频文件...

请问datatype等于5和6是指的什么？求帮忙

/paddle/forum/topic/show/963798 2020-07-23

在改动官方课程CH7的GAN程序后，加入了自己的数据集数据集格式：mat 大小：单个128*128 没有标签前面运行都没有错误，到训练...

华为手机speak的时候没声音

/forum/topic/show/966887 2020-09-23

音量已经开到最大了，而且也没有静音模式，麻烦帮看下是不是还有哪里要设置 speechSynthesizer.setParam...

变量命名的规范性

/paddle/forum/topic/show/972117 2020-11-20

大小 batch_size ...... 但最近读代码的时候发现了一种新（少见）的命名方式——从第二个单词起开头大写：标签长度...

安装paddle出现runtimeerror

/paddle/forum/topic/show/989849 2021-08-03

://mirror.baidu.com/pypi/simple 这种方式安装的；出现了错误 RuntimeError: (PreconditionNotMet...

购物小票信息识别方案推荐？

/forum/topic/show/960168 2020-06-05

针对线下的购物小票，通用文字识别与 iOCR自定义通用模板识别哪种更合适？由于线下购物小票格式、信息位置、信息量、打印清晰度等都不...

我想用PaddleGan训练一个条件GAN应该用哪种dataset呢？

/paddle/forum/topic/show/990816 2021-09-21

用我自己的数据集（格式和MNIST一样，一张图片标注了一个类别），应该使用哪种dataset呢？...

使用hub加速git时需要注意

/paddle/forum/topic/show/978095 2020-12-15

git clone https://hub.fastgit.org/PaddlePaddle/PaddleOCR 这种方式可以通过hub...

初始化语音合成SDK，出现错误-204

/forum/topic/show/941805 2018-12-25

集成语音合成Android SDK，使用TtsMode.MIX模式。使用Android studio 直接在手机上运行...

真心在用，真心建议

/forum/topic/show/942031 2019-01-12

1，我们在用API调用接口的方式调用UNIT，然后呢我们每次请求完训练后，就会有10-20秒的时间是无法对话的。建议优化一下，就是在...

如何正确的开启词义解析啊？

/forum/topic/show/493011 2015-07-27

= VoiceRecognitionConfig.PROP_MAPmConfig.setProp(prop);mConfig.enableNLU();代码中已经指定了为地图模式也开启了词义解析。但是实际语音中输入...

语音合成无法合成出百度语音试听页面的男声

/forum/topic/show/494200 2016-05-14

合成的怎么没有这个试听页面的男声呢？关于REST API的文档说明里没有显示如何使用新的男声合成。API访问方式的男声参数怎么调也调不出来这个新的男声。请了解的大神及论坛维护人员不吝赐教，多谢多谢！ ...

【定制化-果蔬识别】Python-API示例代码

/forum/topic/show/864058 2017-12-27

两点：1.参数格式改为json 2.头部请求参数类型 ...

炼丹师读源码之DSSM Loss、Optimiz

/paddle/forum/topic/show/865418 2018-06-16

如果有心，可以从底层构建属于自定义的loss和optimizer，有在优化器、loss、以及分布式机器学习底层架构的的小伙伴也可以选择PaddlePaddle来做相关的研究工作，个人感觉和mxnet 差异不大，都比较灵活...

如何在一个训练中使用多个损失函数

/paddle/forum/topic/show/941198 2018-12-03

+ 0.5 * cost1 + 0.5 * cost2 我使用这样的方式，但是一直训练结果不收敛...

调用demo调起ar显示网络不给力请重试

/forum/topic/show/938934 2018-10-29

"];改成slam 然后对应key type填上去显示我出错了也没说为啥是我方式不对吗 slam是个demo里面的压缩包我是指导入进来了没解压不过result 返回是yes...

离线语音词条说明等问题

/forum/topic/show/496878 2017-12-08

= * 说法 it.content = 在网页测试中没问题,而在app中测试却不行了呢？或者我想知道有没有方法能将在线解析的语句通过自定义语义的方式返回json数据，那就更方便了，请问有什么方法能实现吗？...

离线识别只能识别设置的bsg文件里的吗？s_1以及s_2_InputMethod不能用于离线识别？

/forum/topic/show/495188 2016-11-09

我使用的服务是：语音识别调用的接口是：api方式参数设置情况：配置了s_2_InputMethod以及s_1 开发平台和机型...

调用api，响应速度慢，无法连续识别。

/forum/topic/show/495502 2017-02-08

方式? 2.8s的语音返回时间在5s左右。实时性太差，请问有何提高实时性的解决办法？...

关于填写 url callback 参数，callback参数的具体意义？

/forum/topic/show/495831 2017-05-05

（POST，还是 GET），具体格式(key)是什么。。2、如果使用这个参数，接口要异步通知callback，callback回调地址要如何判断...