首页 版块 访问AI主站 注册 发帖
操作指南:
技术专区:
AI赛事:
集思广益:
语音识别到底需要啥样的音频文件?
本地的音频文件全部不能识别,无论是pcm、wav、mp3哪种格的文件,无论是网上下的,还是自己合成的,都不能 用百度语音合成的音频文件...
请问datatype等于5和6是指的什么?求帮忙
在改动官方课程CH7的GAN程序后,加入了自己的数据集 数据集格:mat 大小:单个128*128 没有标签 前面运行都没有错误,到训练...
华为手机speak的时候没声音
音量已经开到最大了,而且也没有静音模,麻烦帮看下是不是还有哪里要设置 speechSynthesizer.setParam...
变量命名的规范性
大小 batch_size ......   但最近读代码的时候发现了一种新(少见)的命名方——从第二个单词起开头大写: 标签长度...
安装paddle出现runtimeerror
://mirror.baidu.com/pypi/simple 这种方安装的; 出现了错误 RuntimeError: (PreconditionNotMet...
购物小票信息识别方案推荐?
针对线下的购物小票,通用文字识别 与 iOCR自定义通用模板识别 哪种更合适?由于线下购物小票格、信息位置、信息量、打印清晰度等都不...
我想用PaddleGan训练一个条件GAN应该用哪种dataset呢?
用我自己的数据集(格和MNIST一样,一张图片标注了一个类别),应该使用哪种dataset呢?...
使用hub加速git时需要注意
git clone https://hub.fastgit.org/PaddlePaddle/PaddleOCR 这种方可以通过hub...
初始化语音合成SDK, 出现错误-204
      集成语音合成Android SDK, 使用TtsMode.MIX模。使用Android studio 直接在手机上运行...
真心在用,真心建议
1,我们在用API调用接口的方调用UNIT,然后呢我们每次请求完训练后,就会有10-20秒的时间是无法对话的。建议优化一下,就是在...
如何正确的开启词义解析啊?
= VoiceRecognitionConfig.PROP_MAPmConfig.setProp(prop);mConfig.enableNLU();代码中已经指定了为地图模也开启了词义解析。但是实际语音中输入...
语音合成无法合成出百度语音试听页面的男声
合成的怎么没有这个试听页面的男声呢?关于REST API的文档说明里没有显示如何使用新的男声合成。API访问方的男声参数怎么调也调不出来这个新的男声。请了解的大神及论坛维护人员不吝赐教,多谢多谢! ...
【定制化-果蔬识别】Python-API示例代码
两点:1.参数格改为json    2.头部请求参数类型             ...
炼丹师读源码之DSSM Loss、Optimiz
如果有心,可以从底层构建属于自定义的loss和optimizer,有在优化器、loss、以及分布机器学习底层架构的的小伙伴也可以选择PaddlePaddle来做相关的研究工作,个人感觉和mxnet 差异不大,都比较灵活...
如何在一个训练中使用多个损失函数
+ 0.5 * cost1 + 0.5 * cost2 我使用这样的方,但是一直训练结果不收敛...
调用demo调起ar显示网络不给力请重试
"];改成slam 然后对应key type填上去 显示我出错了 也没说为啥是我方不对吗 slam是个demo里面的压缩包我是指导入进来了没解压  不过result 返回是yes...
离线语音词条说明等问题
= * 说法 it.content = 在网页测试中没问题,而在app中测试却不行了呢? 或者我想知道有没有方法能将 在线解析的语句 通过 自定义语义 的方返回json数据,那就更方便了,请问有什么方法能实现吗?...
离线识别只能识别设置的bsg文件里的吗?s_1以及s_2_InputMethod不能用于离线识别?
我使用的服务是:语音识别 调用的接口是:api方 参数设置情况:配置了s_2_InputMethod以及s_1 开发平台和机型...
调用api,响应速度慢,无法连续识别。
? 2.8s的语音返回时间在5s左右。实时性太差,请问有何提高实时性的解决办法?...
关于填写 url callback 参数,callback参数的具体意义?
(POST,还是 GET),具体格(key)是什么。。2、如果使用这个参数,接口要异步通知callback,callback回调地址 要如何判断...
切换版块
智能客服