首页 版块 访问AI主站 注册 发帖
操作指南:
技术专区:
AI赛事:
集思广益:
语音识别LinuxSDK(C++)识别越来越慢
,修改 recog_one_file() 文中 string filename = "../pcm/test.pcm"; 2,打开终端...
armeabi-v7a下,加载云端语音失败
配置abiFilters 'armeabi-v7a' 不使用demo下assets里面的dat文 先通过...
Python笔记 06(完)
笔记 —— 06(完) ## 一、文操作 - open > [菜鸟教程 - Python open() 函数](https...
课程实录-如何利用EasyDL进行视觉定位及质检
所谓的数控机床,这个是精度很高的,价格应该是以百万元计算的,应该是精度可以到微级的,但是如果这个精度要达到微级,需要我们把它只能放在一落...
运行paddlex导出代码报错 argument 'BBoxes' (position 0) must be Tensor
在paddlex训练好目标检测模型后导出,然后执行paddlex_python_predict文夹下的predict.py文时报...
如何支持小程序语音上传识别
需求:手机端在微信小程序里语音输入,上传到服务器,发送百度识别,将识别内容保存下来。 问题:手机上传的文是需要转换成PCM文吗?有没有成型的jar包参考? ...
语音合成如何实现停顿,比如停顿1秒或者2秒
不要告诉我用标点符号什么的,一点用也没有。 不要告诉我用这pause或sleep,这只在临时试听有效果,如果生成音频文就不行了。 如果拆分成多个文,这样如何实现精准停顿?...
如何才能更加准确的识别bsg设定的值?
现在的情况是这样的,我在bsg文中的条目里设置的是:李三。我说“打电话给李三”,可是识别出来的却是“打电话给李3”,如何才能保证相似读音的情况下,识别出来的是bsg文中条目中的值? ...
为什么语音识别返回curl_error:28错误
我用自己解码出来的16bit,16k采样率、单声道的pcm文进行语音识别,返回curl_error_code:28的请求超时错误,但百度的监控上却显示调用成功。我用百度提供的示例pcm文就没有这些问题。...
记事本只有NASI编码和其他编码,没有GBK编码
语音自训练平台要求标注文格式应为txt格式,GBK编码,但win10系统自带的记事本没有这个编码,怎么处理?总提示未找到对应的标准文本。其他条我都仔细看过,应该没问题。...
Android语音合成偶尔-204
applicationId一致,需要的权限都有。请问这是什么原因,该如何解决? so文与离线文位置如图:  ...
实例分割标签混乱的原因是
solov2实例分割可以检测出物体,但是标签基本都不对,看官网的模型用coco数据集时不需要标签的txt文,按理说都是json文里面提供的标签,那么为什么会出现这样的问题呢?...
在ai studio上使用paddle-lite
想在将模型转化为arm硬平台、naive_buffer格式的Paddle_Lite支持模型,优化后的模型文.nb,但是...
eclipse无法读取合成的音频
eclipse集成的一套Avaya的开发插,读取不到音频内容,sndrec32.exe这个工具说转换出来的这个音频文有问题,但是我本地播放器又能正常播放,请问有大佬遇到过这类情况吗?求解呀!...
Streamlit版本困扰
项目Streamlit默认版本是1.13.0,不支持chat_input,我在自建文夹中安装Streamlit1.30.0版本,并将...
嵌入式开发之 IIC通信理论
时间同步 以加速位处理能力,同时高速模式主机器有一个SDA H信号的开漏输出缓冲器和一个在SCL H输出的开漏极下拉和电流源上拉电路。这个...
急求人脸库创建问题,谁能解答?
一直说人脸库,请问各位大神: 如何创建人脸库啊? 该如何做?什么是文、文夹或格式? 放在哪儿? 谁能给个样板? 急急急啊,求大神们了。...
江湖救急!!
1.这是原图文夹:    2。这是已经生成对应的json文夹:   我找不到能把他们转成标准的COCO格式或者VOC格式,各位大佬有没有代码求分享一下,万分感谢...
免费语音合成版权问题?
目前想使用百度语音合成的音频文用作商业用途,作为设备的语音播报文进行使用,涉不涉及版权问题?如果涉及版权问题,是否需要付费?以及付费方式?...
求解:对词槽词典值有成千上万个时,如何更好的澄清
我们的用户通过机器人查找汽车的配,已设置车型和配名为必选词槽,但车型和配的词数量都在上千/上万个,枚举澄清只能针对1-5个词的词典...
切换版块
智能客服