百度深度学习集训营已经正式开营,每个阶段的作业都将有各自的奖励,欢迎大家学习~
PS:如遇帖子过期、审核不通过的情况,请先复制内容保存在word文档,然后根据提示,完成个人实名验证,刷新后重新粘贴复制的内容,即可提交~
欢迎大家报名参加~
1月9日作业:
作业9-1:在第二章中学习过如何设置学习率衰减,这里建议使用分段衰减的方式,衰减系数为0.1, 根据ResNet目前的训练情况,应该在训练到多少步的时候设置衰减合适?请设置好学习率衰减方式,在眼疾识别数据集iChallenge-PM上重新训练ResNet模型。
作业9-1奖励:在作业中随机各抽取5名同学送出飞桨本+数据线+飞桨贴纸
回复帖子形式: 作业9-1:XXX
抽奖作业截止时间:2020年1月13日中午12点之前
作业9-2奖励:在作业中随机各抽取5名同学送出飞桨本+数据线+飞桨贴纸
回复帖子形式: 作业9-2:XXX
抽奖作业截止时间:2020年1月13日中午12点之前
1月7日作业:
作业8:如果将LeNet模型中的中间层的激活函数Sigmoid换成ReLU,在眼底筛查数据集上将会得到什么样的结果?Loss是否能收敛,ReLU和Sigmoid之间的区别是引起结果不同的原因吗?请发表你的观点
作业8奖励:在作业中随机各抽取5名同学送出飞桨本+数据线+飞桨贴纸
回复帖子形式: 作业8:XXX
获奖同学:#820 thunder95、#819 你还说不想我吗、 #818 百度用户#0762194095、#817 呵赫 he、#816 星光1dl
1月2日作业
作业7-1 计算卷积中一共有多少次乘法和加法操作
输入数据形状是[10, 3, 224, 224],卷积核kh = kw = 3,输出通道数为64,步幅stride=1,填充ph = pw =1
完成这样一个卷积,一共需要做多少次乘法和加法操作?
提示:先看输出一个像素点需要做多少次乘法和加法操作,然后再计算总共需要的操作次数
提交方式:请回复乘法和加法操作的次数,例如:乘法1000,加法1000
作业7-1奖励:抽取5人赢得飞桨定制本+数据线,截止时间2020年1月6日中午12点之前
回复帖子形式: 作业7-1:XXX
作业7-2奖励:从正确答案中抽取5人获得飞桨定制本+50元京东卡,截止时间2020年1月6日中午12点之前
12月31日作业
作业6-1:
1.将普通神经网络模型的每层输出打印,观察内容
2.将分类准确率的指标 用PLT库画图表示
3.通过分类准确率,判断以采用不同损失函数训练模型的效果优劣
4.作图比较:随着训练进行,模型在训练集和测试集上的Loss曲线
5.调节正则化权重,观察4的作图曲线的变化,并分析原因
作业6-1奖励:抽取5人赢得飞桨定制本+数据线 ,回复帖子形式: 作业6-1:XXX
作业6-2:
正确运行AI Studio《百度架构师手把手教深度学习》课程里面的作业3 的极简版代码,分析训练过程中可能出现的问题或值得优化的地方,通过以下几点优化:
(1)样本:数据增强的方法
(2)假设:改进网络模型
(2)损失:尝试各种Loss
(2)优化:尝试各种优化器和学习率
目标:尽可能使模型在mnist测试集上的分类准确率最高
提交实现最高分类准确率的代码和模型,我们筛选最优结果前10名进行评奖
作业6-2奖励:飞桨定制本+50元京东卡
12月25日作业
12月23日作业
作业4-1:在AI studio上运行作业2,用深度学习完成房价预测模型
作业4-1奖励:飞桨定制本+ 《深度学习导论与应用实践》教材,选取第2、3、23、123、223、323…名同学送出奖品
作业4-2:回复下面问题,将答案回复帖子下方:
通过Python、深度学习框架,不同方法写房价预测,Python编写的模型 和 基于飞桨编写的模型在哪些方面存在异同?例如程序结构,编写难易度,模型的预测效果,训练的耗时等等?
回复帖子形式: 作业4-2:XXX
作业4-2奖励:在12月27日(本周五)中午12点前提交的作业中,我们选出最优前五名,送出百度定制数据线+《深度学习导论与应用实践》教材
12月17日作业
完成下面两个问题,并将答案回复在帖子下面,回帖形式:作业3-1(1)XX(2)XX
作业奖励:在2019年12月20日中午12点之前提交,随机抽取5名同学进行点评,礼品是本+数据线
12月12日作业
获奖者:第12名:飞天雄者
12月10日作业
作业1-1:在AI Studio平台上https://aistudio.baidu.com/aistudio/education/group/info/888 跑通房价预测案例
作业1-1奖励:最先完成作业的前3名,以及第6名、66名、166名、266名、366名、466名、566名、666名的同学均可获得飞桨定制大礼包:飞桨帽子、飞桨数据线 、飞桨定制logo笔
作业1-1的获奖者如图:
作业1-2:完成下面两个问题,并将答案发布在帖子下面
①类比牛顿第二定律的案例,在你的工作和生活中还有哪些问题可以用监督学习的框架来解决?假设和参数是什么?优化目标是什么?
②为什么说AI工程师有发展前景?怎样从经济学(市场供需)的角度做出解读?
作业1-2奖励:回复帖子且点赞top5,获得《深度学习导论与应用实践》教材+飞桨定制本
点赞Top5获奖者:1.飞天雄者 2.God_s_apple 3.177*******62 4.学痞龙 5.故乡237、qq526557820
作业截止时间2020年1月10日,再此之前完成,才有资格参加最终Mac大奖评选
报名流程:
1.加入QQ群:726887660,班主任会在QQ群里进行学习资料、答疑、奖品等活动
2.点此链接,加入课程报名并实践:https://aistudio.baidu.com/aistudio/course/introduce/888
温馨提示:课程的录播会在3个工作日内上传到AI studio《百度架构师手把手教深度学习》课程上
作业5-1:
以2-6【手写数字识别】之优化算法代码为基础
输出结果:
作业5-1:
以2-6【手写数字识别】之优化算法代码为基础
输出结果:
start evaluation .......
loading mnist dataset from ./work/mnist.json.gz ......
There are 100 eval images in total.
100张测试图片测试的准确率是: 99.0%。
作业4-2:
通过Python、深度学习框架,不同方法写房价预测,Python编写的模型 和 基于飞桨编写的模型在哪些方面存在异同?例如程序结构,编写难易度,模型的预测效果,训练的耗时等等?
答:
相同点——都是按照深度学习的原理,形成了各自解决问题的程式套路, 能比较清晰的解决问题;相同的数据处理方式, 最后结果输出也是大致相同
不同点——飞浆框架,帮我们解决了深度学习中,不变的程式化流程, 给研发人员留出了重点解决模型设计,优化算法,调优方面的空间和便利性;极大的提升了工作效率。这些点原生python就繁琐些。其中飞浆最大的问题是解决了研发人员不必要去过度关注算法实现细节,能极大推广深度学习到工业应用中。
模型训练和部署:
飞浆同样有好的解决方案,无需研发人员过度关注硬件。进一步提升了深度学习在工业应用中的可能性。
作业5-1:
作业5-2:常用的几种卷积神经网络有:LeNet、AlexNet、VggNet、ResNet。
作业5-3:一般采用采用梯度下降算法进行参数学习更新。 a. 随机梯度下降算法SGD。
b. Momentum优化器: 加入“动量”,使得参数更新的方向更加稳定。
c. AdaGrad优化器:根据不同参数距离最优解的远近,动态调整学习率。
d. Adam算法。
很明显。Adam优化算法更好。
把之前的作业都补充一下
作业1-2:
①类比牛顿第二定律的案例,在你的工作和生活中还有哪些问题可以用监督学习的框架来解决?假设和参数是什么?优化目标是什么?
曾经参加过一个腕力比赛,这个可以算是监督学习的问题,同等重量区间的对手比赛 假设就是和对手比赛的输赢,参数就是你在比赛过程中所采取的策略,比如身体各部位腿部, 臂力,腕力等的如何配合,优化目标就是发挥身体最大的力量以赢得对手。比如臂力和腰部配合发力要比单独用臂力更有输出。其他比赛也可以类似于监督学习。
②为什么说AI工程师有发展前景?怎样从经济学(市场供需)的角度做出解读?
我的理解有一下几点:
1 智能代表着更少的人力成本,国内一方面老龄化人口增加,2019年新出生人口比以往持续降低,代表着未来中国的劳动人口将会大幅下跌。所以提高效率 降低人工是未来必然的趋势。
2 年轻人更不愿意去干重复,体力支出的劳动。00后的家庭条件相对比90后和80后要优越很多,成长环境经历了中国快速发展的几十年,内心深处对工厂或者体力劳动较为排斥,这也是越来越多的工厂遭遇用工荒的原因,而且未来用工荒必将加剧。提前布局AI的应用的企业将会缓解这样的问题。
3 AI 发展这几年,业内大咖提出了很多经典的模型,这些学术模型的提出需要大量的人才将其应用到实际领域,解决实际问题,所以未来的AI工程师需求会持续增加。
所以无论从大环境还是产业需求,AI工程师都非常有需求。
作业2-1:
作业1-2:(1)学习期末的考试成绩可以用监督学习来解决,假设每章节的内容和老师着重划的重点,通过每章节的练习题,确定该知识点是否掌握;
(2)第一:国家的一个政策,促进AI产业的发展;第二:就目前而言,智能家居、无人驾驶、刷脸技术已经发展,并且已经深入到生活的方方面面;
市场需求方面讲:目前AI产业正在发展中,国家也促进该事业的发展,这就导致很多企业向AI产业转变或发展,就会需要很多的AI工程师,当AI产业达到一定的发展后,会导致AI工程师的数量饱和或者过饱和,就会需要AI工程师中的顶尖人才,而平庸的人可能不会找到工作,会导致AI工程师的学习者数量减少。
作业3-1
作业3-2
作业4-2:
通过Python、深度学习框架,不同方法写房价预测,Python编写的模型 和 基于飞桨编写的模型在哪些方面存在异同?例如程序结构,编写难易度,模型的预测效果,训练的耗时等等?
程序结构方面 飞桨内部封装了前向传播,loss,优化,反向传播,推理,方便直接调用,是网络结果简单明了,模型预测 效果更好,训练更快,相同之处是数据的预处理还是和Python一样,另外模型的整体流程大致相同。
作业4-2:
相同之处:由于采用的理论一样,所以在程序思路设计,特征工程,以及模型框架构造上均有很大的相同点。
不同之处:由于深度学习框架对深度学习相关的框架进行了封装处理,在使用上更加简洁,另外由于paddle集成了大量的优化函数和损失函数,大大降低了在深度学习中的难度,和编程所需要的时间。在耗费时间上,由于paddle深度学习框架的主要算法采用了C语言,因此编译后计算更快,更节省内存,在对硬件的支持上也更加凸显优势,并行运算以及GPU的支持也更加的方便,大大的节省了使用中的时间。
作业2-1(基础题)
作业3-1(1)
(2)
57
作业4-2:
问题:通过Python、深度学习框架,不同方法写房价预测,Python编写的模型 和 基于飞桨编写的模型在哪些方面存在异同?例如程序结构,编写难易度,模型的预测效果,训练的耗时等等
网络结构的改变:比如多加几个全连接层,对于非框架的实现就需要额外引入更多的权重和偏置变量并且做前向矩阵运算,而且反向传播的计算梯度也会由于没有autograd需要手动修改训练的代码,然而对应在Paddle框架的实现中只需要多加几行FC layer,并且反向传播部分无需改变,而这仅仅是加全连接层。更进一步,如果换成Convolution Layer, Recurrent Net这样的结构对于非框架的代码可想而知会有多大的修改,而在框架中这些层都是封装好的
下面放一下测试结果:
作业4-2: 通过Python、深度学习框架,不同方法写房价预测,Python编写的模型 和 基于飞桨编写的模型在哪些方面存在异同?例如程序结构,编写难易度,模型的预测效果,训练的耗时等等?
程序结构:
程序结构大体都是一样的,可能深度学习框架上的模型是经过优化过的,更有利于程序的执行;自己通过python手写的很容 易出现代码不规范的情况,降低了代码执行的效率。
编写难易度:
使用框架编写很简单,直接三两行代码调用导入的已经写好的包就可以,效率很高;自己编写模型的话,虽然每次训练用到的模型可能很相像,但是还是极大的增加了代码量,而且还很容易出错,毕竟出错了调试代码有时候很费时间,工作效率太低。
模型的预测效果:
框架上更好一些,
训练的耗时:
深度学习框架的运算速度远远快于python编写的模型的,
使用性上:
框架使用起来很方便,支持许多的模型,直接导入数据训练就可以了。
作业5-1:
请参考543楼
作业5-2:
在计算机视觉中,常见的CNN网络有AlexNet, VGG, GoogleLeNet以及ResNet。
作业5-3:
1. 优化方法比较;
执行5个epoch,总共2500次迭代后的得出的迭代次数和loss的趋势图:
总结: 仅仅从5个epoch的结果来看Momentum和Adam已经收敛,相比于Adagrad优化器有更好的效果。
2. 学习率比较;
执行5个epoch,总共2500次迭代后的得出的迭代次数和loss的趋势图:
总结: 仅仅从5个epoch的结果来看当学习率设置为0.001与0.01时具有较好的学习效果。
作业5-1
参考#543(可以直接测试)
作业5-2
参考#556
作业5-3
比较学习率:学习率赋值都相同,都是0.01
上面是SGD的结果,Acc有较大的跳变
上面是Momentum的结果,Acc比较稳定(源代码中有误,缺少momentum=0.9这一个参数)
上面是Adagrad,Acc还可以的
这次是Ada,Acc比较稳定
作业4-2:
通过Python、深度学习框架,不同方法写房价预测,Python编写的模型 和 基于飞桨编写的模型在哪些方面存在异同?例如程序结构,编写难易度,模型的预测效果,训练的耗时等等?
通过Python、深度学习框架,不同方法写房价预测,Python编写的模型 和 基于飞桨编写的模型主要有以下几个异同点:
作业4-1:在AI studio上运行作业2,用深度学习完成房价预测模型
作业4-2:回复下面问题,将答案回复帖子下方:
通过Python、深度学习框架,不同方法写房价预测,Python编写的模型 和 基于飞桨编写的模型在哪些方面存在异同?例如程序结构,编写难易度,模型的预测效果,训练的耗时等等?
在数据处理目前学习的还是python原生处理,希望可以在paddle中集成方便点,使用paddle编写程序更加规范,易于理解,对于模型的效果比python更好,耗时更短
作业5-2:
1.LeNet网络。 1998年由LeCun推出,它是第一个广为流传的卷积神经网络。
2.AlexNet网络:有五个广义卷积层和3个广义全连接层。
3.VGG-Net网络:是牛津大学计算机视觉组和DeepMind公司共同研发一种深度卷积网络。
4.Inception Net网络:核心思想是稀疏连接。
5.ResNet网络:提出了一种残差学习框架来解决网络退化问题,从而训练更深的网络。
6.SENet网络:提出了一种新的架构单元来解决通道之间相互依赖的问题。
7.DenseNet网络:通过特征重用来提升网络的学习能力。
作业3-1
(1)
(2)