首页 版块 访问AI主站 注册 发帖
操作指南:
技术专区:
AI赛事:
集思广益:
使用百度语音识别Rest API 报错
环境:(windows操作系统,用nginx搭建的静态服务器,通过ajax发送一部请求接口) 通过json发送WAV式的base64编码...
有没有能成功是识别的语音啊
有没有成功的语音示例啊,我一开始在百度用文字转mp3,然后式工厂转wav , 活生生将 “张良” 识别成了 “美女”。 然后我将MP3转成pcm,又说我音频质量差。就施舍一段能识别的语音。 ...
遇到汉字“一 二” 还有数字“1”识别不出的情况
扫描版的表,里面数字直接识别不了,自己创建模板以后又发现汉字“一 二”还有数字“1”经常识别不出来,不知道有没有训练的办法,比如“一月”只识别出“月”,“17.4”只识别出“7.4”...
222203错误怎么解决
  但是不知道怎么改   codee是不包含头的图片文本编码式  输出过codee是对的 但放到参数中就不能用...
pp-OCRv3-det 使用原图尺寸预测效果比使用训练时的尺寸效果好
pp-OCRv3_det 检测模型 使用640X640的尺寸训练,在预测的时候发现原图尺寸预测效果最好。 由于是表图片比较大,内容比较多...
C#的SDK已经没办法下载了,注册用户按特征值
的时候希望同步一次人脸库,如果每次都是按图片的话,就多了一次产生特征值的计算。如果是按特征值,就是数据级的计算,加载数据在几十万人的时候应该会快很多。...
文本检测使用icdar2015训练结果不理想
我使用PaddleOCR训练文本检测模型 数据集:icdar2015 预训练模型...
多卡训练的sampler的问题
了解到,用了 DistributedBatchSampler 才能将数据集“1分为n”送给多个脚本进程训练。我现在没用...
多卡训练的sampler的问题
了解到,用了 DistributedBatchSampler 才能将数据集“1分为n”送给多个脚本进程训练。我现在没用...
PaddleHub的文档该完善了
发现社区里不少人说不知道怎么用PaddleHub自定义数据集,比如文本分类这种基础任务。然后今天看了下PaddleHub仓库,愣是找不到...
飞桨轻量级目标检测挑战赛,评分模型时异常
用coco数据集、shufflenetv2-ssd,也就是轻量级竞赛里的内容,epoch_num =8 或10,训练出的模型,使用...
OCR和图像识别标注工具一般用哪个?
目前使用标注的时候,都是用的在线标注,但是在线标注的图片不能导出来(OCR的是这样),同时有时要优化精度,调整标注数据的时候,不太方便...
paddleViT类模型是不是没法使用recall或者Auc等度量?
无论是ViT还是SwinT,输入都要求是(n,3,224,224)(以224为例)的mini-batch=n的多张图片复合的数据,如果...
训练启动错误
检测模型训练错误,使用配置文件为:ch_det_res18_db_v2.0.yml 配置如下图: 训练文件有332个样本数据,测试...
【AI达人养成营】学习心得
数据格式如下: stu5.txt 特长同学,2020-10-5,20,'男',180,87,98,77,76,92,58,-76,84,69...
三个月教你从零入门深度学习
学生看的数学分析,计算机算法类一上来就推荐大块头的《算法导论》和理论性偏强的《数据挖掘:概念与技术》,认为这样入门的人来说并不合适。看书...
再见2018,你好2019!
资本市场,甚至搅动着既有的电商局; 而跨境电商的政策如春风般吹动着寂静许久的行业,众多跨境电商迎来新一轮博弈 “头疼大战”、短视频整顿...
2.3.2 demo优化,SDK 有问题
2.3.2 demo优化,SDK  这个包下载下来提示数据未知或者已经损坏的了
百度识别语音如何拿到音频文件,再次播放
EVoiceRecognitionClientWorkStatusNewRecordData 这个回调里面得到NSData数据,如何转转化才能进行播放
最近想发个nlp教程,有想一起做的吗?
准备把外网的与中国的评论数据拿出来  做个情感倾向性判断
切换版块
智能客服