首页 飞桨领航团 帖子详情
百度AI达人创造营7.28笔记
收藏
快速回复
飞桨领航团 文章AI达人创造营 412 0
百度AI达人创造营7.28笔记
收藏
快速回复
飞桨领航团 文章AI达人创造营 412 0

百度AI达人创造营7.28笔记
1、数据集的获取
1.1 Kaggle有趣比较火热的数据集
House Prices-Advanced Regression Techniques      预测销售价格

Cat and Dog                        猫狗分类

Machine Learning from Disaster     预测泰坦尼克号的生存情况并熟悉机器学习基础知识

1.2 天池
Barley Remote Sensing Dataset大麦遥感检测数据集    遥感影像分割

耶鲁人脸数据库                  目标检测任务(人脸检测)

1.3 DataFountain
花卉分类数据集                      图像分类

1.4 其他常用的数据集官网
科大讯飞官网

COCO数据集

2、数据处理
2.1 官方数据处理成VOC或者COCO
2.1.1COCO2017数据集介绍
   COCO数据集是Microsoft制作收集用于Detection + Segmentation + Localization + Captioning的数据集,作者收集了其2017年的版本,一共有25G左右的图片和600M左右的标签文件。 COCO数据集共有小类80个

 

VOC与COCO简介

  Pascal 的全称是模式分析,静态建模和计算学习(Pattern Analysis, Statical Modeling and Computational Learning)。PASCAL VOC 挑战赛是视觉对象的分类识别和检测的一个基准测试,提供了检测算法和学习性能的标准图像注释数据集和标准的评估系统。从2005年至今,该组织每年都会提供一系列类别的、带标签的图片,挑战者通过设计各种精妙的算法,仅根据分析图片内容来将其分类,最终通过准确率、召回率、效率

   MS COCO的全称是Microsoft Common Objects in Context,起源于微软于2014年出资标注的Microsoft COCO数据集,与ImageNet竞赛一样,被视为是计算机视觉领域最受关注和最权威的比赛之一。

2.2 自定义数据集进行训练
2.2.1 常见标注工具
  对于图像分类任务,我们只要将对应的图片是哪个类别划分好即可。对于检测任务和分割任务,目前比较流行的数据标注工具是labelimg、labelme,分别用于检测任务与分割任务的标注。

标注工具Github地址:

               labelimg

                labelme

                PPOCRLabel

2.2.2 Labelme安装教程(基于anaconda)
安装参考博客1

1、创建环境
conda create -name=labelme python=3.7 //应该是自己的anaconda Python版本
conda activate labelme //激活以labelme为名称的labelme环境
2、安装pyqt
conda install pyqt //系统会自动安装最新的pyqt5,所以安装Python2时到此步也许会报错
3、安装labelme
pip install labelme // 此处一般不会报错
4、启动labelme
labelme环境,输入labelme,即可使用软件。
使用参考博客

 

0
收藏
回复
在@后输入用户全名并按空格结束,可艾特全站任一用户