这样增广会不会污染数据
做“AI识虫”的目标检测练习赛时寻思这样一个问题:查看测试数据,发现几个偏黑色的虫子识别不好,所以图像数据增广调明暗的参数范围设为了0.2...
第2课笔记 数据获取与处理
1、数据的获取途径
各个比赛平台:百度AI Studio ,Kaggle、天池、讯飞等平台。通过关键词搜索获取需要的数据集或者是...
如何加入千言技术专家?
“千言数据共建计划”是百度联合中国计算机学会、中国中文信息学会共同发起的,携手高校和企业的数据资源研发者共同建设中文开源数据集...
说说度目的镜头模组和人脸套件
大批量采用的原因,主板厂商不愿意大量支持我们小的团队,百度也不怎么愿意,所以导致未知因素太多了;
2、识别速度还是比较慢,对比...
如何生成自己的 voc数据集
这个故事要从你自己标注完图片以后才能做:
数据集文件夹结构在PaddleX中,目标检测支持VOC数据集格式。建议将数据集按照如下方式进行...
千言数据集-文本相似度计算
BQ Corpus数据集提供的训练数据是100,000,但是我在读取的过程中,只读到了86200 rows ,请问有大神知道怎么回事吗...
gym库导入时错误
import gym库时提示如下错误: AttributeError: module 'importlib_metadata' has no attribute 'entry_points' 哪位高手指点一下这个怎么解决?...
数据增广的道路是正义的吗?
昨天看了大佬的直播,介绍比赛经验(https://live.bilibili.com/21689802)。期间老师说,数据增广是调整、优化...
运行时项目和数据集的问题!
平台正在运行的项目不能和数据集同步更新。每次都要停止运行的项目,重新运行一下才有最新的数据集文件。能不能优化一下。经不起这样来来回回的折腾啊!...
谈一谈这个后台运行的鸡肋之处
最近Notebook新出了后台运行的功能,在你生成新版本的时候可以选择这个版本进行后台运行。但是目前这个功能我感觉还是个鸡肋,原因如下...
数据处理与获取技巧
一。数据集处理流程
1. 数据集获取
数据集获取平台:Kaggle,天池,DataFountain,coco,科大讯飞,具体获取方式就是...