首页 飞桨领航团 帖子详情
【AI达人创造营】第1、2课笔记
收藏
快速回复
飞桨领航团 文章AI达人创造营 470 0
【AI达人创造营】第1、2课笔记
收藏
快速回复
飞桨领航团 文章AI达人创造营 470 0

日期:20210726(第一节课)
主题:项目创意从何而来 (原文:让人拍案叫绝的创意都是如何诞生的)
主持人:韩磊(聊天机器人)
嘉宾:顾茜(坑姐,安全帽检测),颜鑫(上海,垃圾分类),郑博培(AI写诗)
## 尚有疑问:
1. 了解一下树莓派!!!
2. 颜鑫大佬的第一个项目貌似暂未公开,需尝试寻找类似项目。
3. (第二节课)标注视频的工具?(视频分帧然后单张标注)

韩磊:聊天机器人(项目关键技术是 人脸分割 和 人脸关键点检测 。)
创意是将现有想法进行某种组合。

技术:Wechaty + Paddlehub

万茜,安全帽检测(部署在了树莓派上);以始为终!
开始时想部署到paddle X 上,但是遇到了问题。
之后选择逆推,从落地开始选择可实现部件。

项目的创意从哪来? 从需求来进行逆推,寻找需求,进行研究。
当需求复杂时,可以先实现类似简单的项目,目的是将需求进行分解,分步进行。

项目的进度应该追求清晰,不能只是满足于当下能够看懂

 

颜鑫:垃圾分类项目(创意来源于生活)
PS:B站链接 https://www.bilibili.com/video/BV1354y1b7H7

郑博培,AI写诗
idea: 尝试将图片与文字进行结合

实现思路,从最简单入手,逐步复杂。

第一步:从图片中提取信息
第二步:组合关键词;思路来源:诗中语句由关键字、词组成。
第三步:利用已有技术,输入诗的上阕,利用已有技术生成诗的下阕。


日期:20210728(第二节课)
第一部分:获取数据
Kaggle:
1. 预测销售价格
https://www.kaggle.com/c/house-prices-advanced-regression-techniques/data?select=test.csv
2. 猫狗分类 https://www.kaggle.com/tongpython/cat-and-dog
3. 预测泰坦尼克号的生存情况并熟悉机器学习基础知识
https://www.kaggle.com/shuofxz/titanic-machine-learning-from-disaster

天池
1. 遥感影像分割(Barley Remote Sensing Dataset大麦遥感检测数据集) https://tianchi.aliyun.com/dataset/dataDetail?dataId=74952
2. 目标检测任务(人脸检测)(耶鲁人脸数据库 )https://tianchi.aliyun.com/dataset/dataDetail?dataId=88824

DataFountain
1. 花卉分类数据集 https://www.datafountain.cn/datasets/6070

其他常用的数据集官网
1. 科大讯飞官网 https://www.xfyun.cn/service/object-recg
2. COCO数据集 https://cocodataset.org/#download

数据处理
数据预处理:reshape(为了规定输入网络的统一尺寸);去中心化(有利于模型收敛)
数据增强:平移、旋转、缩放

三种常见标注工具:
Labelimg :https://github.com/tzutalin/labelImg
Labelme(点、线等标注形式多样;可以将标注留到下一张图片) :
https://github.com/wkentaro/labelme
PPOCRLabel(百度出的,需要从GIT上下载代码然后在pycharm中运行) :
https://github.com/PaddlePaddle/PaddleOCR
OCR 光学字符识别
easydl:可以实现标注几张之后,后续自动标注。

疑问:标注视频的工具?(思路,将视频分为单帧图像标注,视频分帧然后单张标注)

关于图像
图像本质:分为位图(由像素点组成矩阵:放大会失真、体积较大、色彩逼真)和矢量图(体积小、色彩不丰富、线勾勒出区域;因不是矩阵故无法做卷积运算)

炼丹两个关键因素:数据干净、全面 和 超参数调优。

 

 

 

 

 

0
收藏
回复
在@后输入用户全名并按空格结束,可艾特全站任一用户