首页 版块 访问AI主站 注册 发帖
操作指南:
技术专区:
AI赛事:
集思广益:
开始语音识别时抛出异常:java.lang.UnsupportedOperationException: easr not found!
我使用的服务是:百度语音识别 调用的接口是: 参数设置情况:根据demo设置 开发平台机型:Android HUAWEI...
百度飞桨第2课|数据集的获取数据处理技巧0
GBRmatplotlib RGB图形增:锐化、亮度变换、提高对比度欠拟合过拟合定义训练验证所用的数据集API地址:https...
AI快车道:图像语义分割专场+预训练模型管理工具
级场景。 2. PaddleSeg实战——人像分割与工业质检通过实验课代码介绍如果通过PaddleSeg数据增模型配置来优化人像分割...
android识别功能一直显示没有匹配的识别结果
! 08-22 16:43:07.063 20793-20876/com.itgaozhen.gourdrebotdemo W...
目标检测---02---目标检测数据准备
准备好数据集并进行了数据集划分之后。需要对数据集进行预处理数据增策略(数据增可根据实际需求添加),然后定义dataset加载划分...
离线语音识别提示网络不稳定
我使用的服务是:语音识别 调用的接口是: 参数设置情况: 开发平台机型: SDK版本号:2.1.21 代码或日志截图(上传截图能帮助...
合成的音频文件采样率是16k吗?如果是怎样转换这段音频的采样率为48k?
合成的音频文件采样率是16k吗?如果是怎样转换这段音频的采样率为48k?
公司注册个人注册在语音识别服务上有哪些区别(如提供的功能)?
我使用的服务是:语音识别 调用的接口是:REST_API 参数设置情况:16K 采样率 16bit位深单声道 pcm格式 开发平台机型...
iOS 13 beta 音频文件格式问题
在非 iOS 13 的设备上录音送语音识别接口都是正常识别的(单声道、码率:256、位深:16位、采样率:16kHz) 但是在iOS 13...
Pyramidbox模型实现
的网络结构采用了与S3FD一样的扩展自 VGG16 骨架代码 anchor 尺度设计,可以生成不同层级的特征图等比例间隔的anchor。在该骨架...
stream load写入失败版本失败
的配置或者使用方式不对,但是我在咱们官网没有找到版本这个概念的解释最佳实践,所以想问一下,针对这种错误有啥可以调整的内容吗? 应用...
将语音合成生成的文件做语音识别报错3301
合成识别都是用REST API接口, 通过接口语音合成的文件采样率16k,位深16bit,格式wav,播放都没问题, 与我自己录制的声音...
有关内积、外积、点乘、叉乘的数学问题
有些数学问题有点乱? 请问 点积的结果对应的是一个标量,也就是一个数。点乘对应是吗? 外积结果是得到一个张量,与叉乘对应...
AI Studio助力选手逐鹿KDD Cup
KDD Cup开赛在即 | AI Studio免费Tesla V100算力助力选手逐鹿   KDD Cup素有全球数据挖掘领域“世界杯...
飞桨图像分割训练营-图像增实现
import cv2 as cv import numpy as np from PIL import Image import random import math import matplotlib.pyplot as plt import os class Compose(object): def __init__(self, transfo...
自带的cv数据增强的问题
测试了下paddle自带的数据增,发现ColorJitter的饱度参数设为 0.1 时,有时转换后的图片几乎是灰度的,这正常么?...
四:蝴蝶分类相关笔记
这周的蝴蝶分类任务好难啊!! 视频课件反反复复观看了许多次,才勉完成了作业的要求 难度肉眼可见的提高,让我对个人的知识储备能力水平...
有transformergan结合的模型么?
有人用gan的对抗损失增文字生成图片的逼真度么?
飞桨第2课:数据获取处理
       · 调整亮度、对比度、饱度、色差等等        · 注入噪声        · 基于生成对抗网络GAN做数搪增AutoAugment...
切换版块
智能客服