百度飞桨深度学习7日打卡小白营学习心得
duanduanwa 发布于2020-04 浏览:2118 回复:3
0
收藏
最后编辑于2022-04

又一期深度学习7日打卡营结束了,本次是打卡营第六期:Python小白逆袭大神,主要讲解从Python进入人工智能领域,让Python小白快速逆袭AI大神!

从这一轮学习体验来说,感觉比上次打卡营的收获还大。因为教学内容确实配合了本期打卡营的目标,快速帮助新手了解深度学习的基本过程。

第一天是Python语法基础,人工智能概述,作业实现九九乘法表和查找文件。题目比较基础,主要是循环运算和文件遍历,这里的坑主要是遍历文件选择调用os.walk()。

第二天是Python进阶内容,以及Linux命令使用,作业实现《青春有你2》选手信息爬取。主要通过Requests.get()对一个url进行访问,为模拟浏览器,需要设置hearders,获取后,通过beautifulsoup对获取的文本进行解析。数据爬取还是挺有意思,爬来的数据可以用来生成深度学习项目的数据集,aistudio网站也有不少项目实现不同网站爬取数据,个人也去运行体验了一下,建议新手多读多看别人的例子。

第三天比较细致的介绍了常用Python库的使用,作业是利用这些库完成对《青春有你2》选手数据分析,难度不大,主要是自己需要去查看下这些库的官方文档。

第四天讲PaddleHub体验与应用,作业是使用PaddleHub自制数据集(训练集、验证集)完成对指定的五名选手照片分类。这个任务还是有一定难度的,首先要利用爬虫知识去爬取数据,

我是在百度图片搜索里爬取了选手图片,简单筛除然后就跑分类了,后来发现在两个选手的训练集里有和验证集相同的图片,这是个坑,需要自己在划分数据集的时候就把这些图片清除,另外,有些同学不能正确的写数据集划分的文本文件,这个坑其实可以避免,在PaddleHub的自制数据集部分有明确的说明。我个人也上传了自制数据集

https://aistudio.baidu.com/aistudio/datasetdetail/31856。

第五天是EasyDL体验与综合大作业的发布,这个大作业对于小白来说确实是非常大的挑战,挑战是需要将前几天的爬虫,库应用,PaddleHub使用都综合起来。

主要的坑是这个爬虫和之前不同,调用的接口找起来有点麻烦,对于url参数来说,要特别注意last_id,last_id主要是达到一个翻页的作用,程序里面通过循环把本次查询到的最后一个评论的用户的id赋值给last_id从而实现反复查询下一页的评论。另一个坑是词云的背景图需要时白色背景的图片,不符合的话无法正确显示。还有就是,正则表达式去除爬取文本里的一些不合规字符,需要去查询文档。

最后有个PaddleHub创意挑战赛,有做好的不少公开的项目,也能加深自己对PaddleHub应用的理解。

收藏
点赞
0
个赞
共3条回复 最后由用户已被禁言回复于2022-04
#4189******30回复于2020-05

来AI Studio互粉吧~等你哦~ https://aistudio.baidu.com/aistudio/personalcenter/thirdview/76563

【一些项目,有空可以fork玩玩】

训练数据太少?过拟合?一文带你领略“数据增长魔法”(上) (https://aistudio.baidu.com/aistudio/projectdetail/408059)

训练数据太少?过拟合?一文带你领略“数据增长魔法”(下) (https://aistudio.baidu.com/aistudio/projectdetail/422256)

一文帮你理解用Paddle训练模型的原理1-手写回归模型 (https://aistudio.baidu.com/aistudio/projectdetail/367090)

一文帮你理解用Paddle训练模型的原理2-权值可视化(VisualDL) (https://aistudio.baidu.com/aistudio/projectdetail/386954)

0
#3189******30回复于2020-05

加油~~共同进步~~

0
#2furoce回复于2020-05

感谢分享

0
TOP
切换版块