首页 版块 访问AI主站 注册 发帖
操作指南:
技术专区:
AI赛事:
集思广益:
语音输入时是否对环境噪音进行了处理来提高准确?
我使用的服务是:语音输入转化为文字 使用语音输入转化为文字时,如果过滤噪音或者周围环境音的影响?...
多音字问题
我这里上海市闵行区政府官网用的百度语音,遇到上海市闵行区里的“闵行”有大概50概率会读成“闵行xing”,应该读成“闵行hang”这个能解决吗?...
不小心更新了AIstudio上项目的版本,可以找回吗
如题,我在一次运行中,直接生成了一个无用的新版本,把我项目覆盖了,请问能帮忙找回吗,有训练了比较久的模型和数据...
初始化报错
集成后的初始化报错,返回码是4,问题是模型内容为空。 我的操作是在Application 进行初始化,初始化的代码使用的...
评价指标accuracy报错
报错cuda error(700), 找了教程全是pytorch的,意思是使用gpu时,不能在cpu上计算,那该如何解决呢? 使用的是系统...
离线识别使用在线批量授权后可否离线使用
设备只能在初次使用的时候联网,之后就是在内网环境 请问能否在第一次联网的时候使用批量授权,之后断网也能继续使用...
请问有用3050TI搭建环境的吗
用的笔记本电脑是3050Ti,目前只能用5.1的驱动,导致cuda 版本在11.6,请问我是需要降驱动版本再降cuda版本,还是直接可以降cuda版本?...
import paddle出错
import paddle出现imp模块无法使用的问题 D:\Anaconda3_install\lib\site-packages...
PaddleOCR识别标点符号问题
用的Paddle2.0版本,rec_r34_vd_none_bilstm_ctc_v2.0_train预训练模型,识别数字。数字能够正确识别,但是负号无法识别。字典中已经写入了负号。...
付费寻求大神做表格线框内文字的OCR识别
付费寻求大神能做通用的表格线框内文字的OCR识别,比如人员简历(线框可能粗细不一,清晰度也略微有差异),识别出每个框内的文字。...
智慧医疗赛题baseline2
在整个模型训练过程,哪些文件夹是没有用的?可以删除的?不影响训练验证推理等过程。(最后内存总是不够)...
语音识别改变infile参数后出问题
用的android语音识别. 测试demo.其他功能都是正常的.改了一个IN_FILE的参数为MicrophoneInputStream....
官网给的语音合成 sdk zip包无法解压
/Baidu-TTS-Android-2.3.2-2017-12-28.zip 这个地址下载下拉的zip包根本无法解压,麻烦给我一个新的. 我用的Mac...
C++ SDK 人脸检测编译时头文件出现问题
运行环境是虚拟机unbuntu 16.0.4,用的是C++ SDK,在编译时遇到如下问题,本人新手,望大牛帮忙具体一点解答: ...
怎么识别一个wav格式的音频文件
将一个wav格式的音频文件放到官网下的demo也不能识别,文件没问题,android上可以识别出来,安卓用的也是百度的语音识别sdk。 ...
人脸识别facetoken失效问题
人脸识别和比对时存储的facetoken,下一次使用的时候部分用户出现facetoken失效的问题,这个大家有遇到过吗?着急解决...
如何用python识别并读出输入的一句话
想用python调用百度语音合成api,让电脑读出输入的汉子。但是,不太知道该怎么写?请问有python的调用的例程么?在win7,64位下面写的代码。...
2.0.1版本下载的开发包里面怎么没有开发文档
我使用的服务是:语音识别 您好,   请问我下载的最新版本2.0.1版本的开发包里面怎么没有开发文档。
多音字朗读问题
我使用的服务是:语音合成 问题: 在朗读到公司名称:“拓朋”时,读做 ta4 peng2,实际上是 tuo4 peng2,希望能添加到语音库内,谢谢! 公司官网:http://www.talkpod.cn/...
语音识别开启后不说话8到9秒后自动回调用户没说话 这个时间哪里设置
求解啊。  用的语音识别,长按按钮之后不说话  8 9 秒之后就自动回调 用户没说话。  回调的时间可以设置吗? 我是IOS开发的。为什么没人回答啊!!!!!快来人!!!...
切换版块
智能客服