首页 AI Studio教育版 帖子详情
作业帖 | 百度深度学习集训营
收藏
快速回复
AI Studio教育版 其他师资培训 1068406 953
作业帖 | 百度深度学习集训营
收藏
快速回复
AI Studio教育版 其他师资培训 1068406 953

百度深度学习集训营已经正式开营,每个阶段的作业都将有各自的奖励,欢迎大家学习~

PS:如遇帖子过期、审核不通过的情况,请先复制内容保存在word文档,然后根据提示,完成个人实名验证,刷新后重新粘贴复制的内容,即可提交~

欢迎大家报名参加~

1月9日作业:

作业9-1:在第二章中学习过如何设置学习率衰减,这里建议使用分段衰减的方式,衰减系数为0.1, 根据ResNet目前的训练情况,应该在训练到多少步的时候设置衰减合适?请设置好学习率衰减方式,在眼疾识别数据集iChallenge-PM上重新训练ResNet模型。

作业9-1奖励:在作业中随机各抽取5名同学送出飞桨本+数据线+飞桨贴纸

回复帖子形式:  作业9-1:XXX

抽奖作业截止时间:2020年1月13日中午12点之前

作业9-2奖励:在作业中随机各抽取5名同学送出飞桨本+数据线+飞桨贴纸

回复帖子形式:  作业9-2:XXX

抽奖作业截止时间:2020年1月13日中午12点之前

 

1月7日作业:

作业8:如果将LeNet模型中的中间层的激活函数Sigmoid换成ReLU,在眼底筛查数据集上将会得到什么样的结果?Loss是否能收敛,ReLU和Sigmoid之间的区别是引起结果不同的原因吗?请发表你的观点

作业8奖励:在作业中随机各抽取5名同学送出飞桨本+数据线+飞桨贴纸

回复帖子形式:  作业8:XXX

获奖同学:#820 thunder95、#819 你还说不想我吗、 #818 百度用户#0762194095、#817 呵赫 he、#816 星光1dl

1月2日作业

作业7-1  计算卷积中一共有多少次乘法和加法操作

输入数据形状是[10, 3, 224, 224],卷积核kh = kw = 3,输出通道数为64,步幅stride=1,填充ph = pw =1

完成这样一个卷积,一共需要做多少次乘法和加法操作?

提示:先看输出一个像素点需要做多少次乘法和加法操作,然后再计算总共需要的操作次数

提交方式:请回复乘法和加法操作的次数,例如:乘法1000,加法1000

作业7-1奖励:抽取5人赢得飞桨定制本+数据线,截止时间2020年1月6日中午12点之前

回复帖子形式:  作业7-1:XXX

作业7-2奖励:从正确答案中抽取5人获得飞桨定制本+50元京东卡,截止时间2020年1月6日中午12点之前 

 

12月31日作业

作业6-1:

1.将普通神经网络模型的每层输出打印,观察内容
2.将分类准确率的指标 用PLT库画图表示
3.通过分类准确率,判断以采用不同损失函数训练模型的效果优劣
4.作图比较:随着训练进行,模型在训练集和测试集上的Loss曲线
5.调节正则化权重,观察4的作图曲线的变化,并分析原因
作业6-1奖励:抽取5人赢得飞桨定制本+数据线 ,回复帖子形式:  作业6-1:XXX

作业6-2:

正确运行AI Studio《百度架构师手把手教深度学习》课程里面的作业3 的极简版代码,分析训练过程中可能出现的问题或值得优化的地方,通过以下几点优化:

(1)样本:数据增强的方法

(2)假设:改进网络模型

(2)损失:尝试各种Loss

(2)优化:尝试各种优化器和学习率

目标:尽可能使模型在mnist测试集上的分类准确率最高

提交实现最高分类准确率的代码和模型,我们筛选最优结果前10名进行评奖

作业6-2奖励:飞桨定制本+50元京东卡

 

12月25日作业

12月23日作业

作业4-1:在AI studio上运行作业2,用深度学习完成房价预测模型

作业4-1奖励:飞桨定制本+ 《深度学习导论与应用实践》教材,选取第2、3、23、123、223、323…名同学送出奖品

作业4-2:回复下面问题,将答案回复帖子下方:

通过Python、深度学习框架,不同方法写房价预测,Python编写的模型 和 基于飞桨编写的模型在哪些方面存在异同?例如程序结构,编写难易度,模型的预测效果,训练的耗时等等?

回复帖子形式:  作业4-2:XXX

作业4-2奖励:在12月27日(本周五)中午12点前提交的作业中,我们选出最优前五名,送出百度定制数据线+《深度学习导论与应用实践》教材


12月17日作业

完成下面两个问题,并将答案回复在帖子下面,回帖形式:作业3-1(1)XX(2)XX

作业奖励:在2019年12月20日中午12点之前提交,随机抽取5名同学进行点评,礼品是本+数据线

12月12日作业

获奖者:第12名:飞天雄者                                     

12月10日作业
作业1-1:在AI Studio平台上https://aistudio.baidu.com/aistudio/education/group/info/888 跑通房价预测案例

作业1-1奖励:最先完成作业的前3名,以及第6名、66名、166名、266名、366名、466名、566名、666名的同学均可获得飞桨定制大礼包:飞桨帽子、飞桨数据线 、飞桨定制logo笔

作业1-1的获奖者如图:

作业1-2:完成下面两个问题,并将答案发布在帖子下面
①类比牛顿第二定律的案例,在你的工作和生活中还有哪些问题可以用监督学习的框架来解决?假设和参数是什么?优化目标是什么?
②为什么说AI工程师有发展前景?怎样从经济学(市场供需)的角度做出解读?
作业1-2奖励:回复帖子且点赞top5,获得《深度学习导论与应用实践》教材+飞桨定制本

点赞Top5获奖者:1.飞天雄者  2.God_s_apple  3.177*******62   4.学痞龙   5.故乡237、qq526557820

作业截止时间2020年1月10日,再此之前完成,才有资格参加最终Mac大奖评选

 

报名流程:

1.加入QQ群:726887660,班主任会在QQ群里进行学习资料、答疑、奖品等活动

2.点此链接,加入课程报名并实践:https://aistudio.baidu.com/aistudio/course/introduce/888

温馨提示:课程的录播会在3个工作日内上传到AI studio《百度架构师手把手教深度学习》课程上

 

49
收藏
回复
全部评论(953)
时间顺序
m
mjaoo49
#502 回复于2019-12

作业4-2: 基于飞浆框架编写的程序更简洁,运算速度更快。 很多程序段的功能仅需几行甚至一行代码就可以实现,这归因于框架对诸多常用功能的模块化,使得编程不再是一行行的独自编写,而变成了根据需求调用不同的函数,这使得用方可以更快速的完成编程,且易于新手使用。一个问题可以使用不同的方法来处理,这取决于每个人对问题的理解角度,飞浆框架是通过诸多资深程序员研发出的各函数模块构成的,在程序简洁、运算速度等方面远远优于单一程序员或单一团队进行的程序编写。目前全球AI领域发展迅速,诸多框架的竞争异常激烈,希望飞浆能成为其中翘楚。(之前用错号了 重新发下 = =#)

0
回复
yuzaihuan
#503 回复于2019-12

作业4-2

直接借鉴#498的,写的很好,谢谢。

0
回复
scy
#504 回复于2019-12

作业4-2:

相同点:无论是使用飞浆框架还是python编写房价预测程序,对过程进行抽象和概括,都需要加载数据和预处理,定义模型,配置模型训练策略和资源配置,模型训练,模型评价,模型预测,模型部署几个步骤等。

不同点:手工编写训练神经网络的代码进行网络训练,需要不但要考虑模型本身,还有有较高的代码编写能力,需要对编程语言有深刻的理解、抽象、测试,最终的结果还不一定有较好健壮类库。飞浆框架是经过大规模产业实验和专家级工程时开发测试过的,无论是程序执行效率和代码的健壮性上都时可靠的,最重要的事开发人员可关注与模型和数据本身,而不必对计算机有深入了解即可以较低的难度入门尝试机器学习。

 

0
回复
傲骨heart
#505 回复于2019-12

作业2-1:

(1)基础题 苹果和橘子的梯度传播

0
回复
c
cheeryoung79
#506 回复于2019-12

作业2(2)挑战题:

#!/usr/bin/env python
# coding: utf-8

# In[3]:


import numpy as np
import matplotlib.pyplot as plt
from mpl_toolkits.mplot3d import Axes3D


# In[4]:


def load_data():
# 从文件导入数据
datafile = 'data/data17808/housing.data'
data = np.fromfile(datafile, sep=' ')

# 每条数据包括14项,其中前面13项是影响因素,第14项是相应的房屋价格中位数
feature_names = [ 'CRIM', 'ZN', 'INDUS', 'CHAS', 'NOX', 'RM', 'AGE', 'DIS', 'RAD', 'TAX', 'PTRATIO', 'B', 'LSTAT', 'MEDV' ]
feature_num = len(feature_names)

# 将原始数据进行Reshape,变成[N, 14]这样的形状
data = data.reshape([data.shape[0] // feature_num, feature_num])

# 将原数据集拆分成训练集和测试集
# 这里使用80%的数据做训练,20%的数据做测试
# 测试集和训练集必须是没有交集的
ratio = 0.8
offset = int(data.shape[0] * ratio)
training_data = data[:offset]

# 计算train数据集的最大值,最小值,平均值
maximums, minimums, avgs = training_data.max(axis=0), training_data.min(axis=0), training_data.sum(axis=0) / training_data.shape[0]

# 对数据进行归一化处理
for i in range(feature_num):
#print(maximums[i], minimums[i], avgs[i])
data[:, i] = (data[:, i] - avgs[i]) / (maximums[i] - minimums[i])

# 训练集和测试集的划分比例
training_data = data[:offset]
test_data = data[offset:]
return training_data, test_data


# In[5]:


class Network(object):
def __init__(self, num_of_weights):
# 随机产生w的初始值
# 为了保持程序每次运行结果的一致性,此处设置固定的随机数种子
#np.random.seed(0)
self.w = np.random.randn(num_of_weights, 1)
self.v = x*w
self.b = 0.

def forward(self, x):
z = np.dot(x, self.w) + self.b
return z

def loss(self, z, y):
error = z - y
num_samples = error.shape[0]
cost = error * error
cost = np.sum(cost) / num_samples
return cost

def gradient1(self, gv, y):
v = self.forward(x)
N = x.shape[0]
gradient_w = gv * x
return gradient_w

def gradient2(self, v, y):
z = v+b
N = v.shape[0]
gradient_v = 1. / N * np.sum(z-y)
gradient_b = 1. / N * np.sum(z-y)
return gradient_v, gradient_b

def update(self, gradient_w, gradient_b, eta = 0.01):
self.w = self.w - eta * gradient_w
self.b = self.b - eta * gradient_b


def train(self, training_data, num_epoches, batch_size=10, eta=0.01):
n = len(training_data)
losses = []
for epoch_id in range(num_epoches):
# 在每轮迭代开始之前,将训练数据的顺序随机的打乱,
# 然后再按每次取batch_size条数据的方式取出
np.random.shuffle(training_data)
# 将训练数据进行拆分,每个mini_batch包含batch_size条的数据
mini_batches = [training_data[k:k+batch_size] for k in range(0, n, batch_size)]
for iter_id, mini_batch in enumerate(mini_batches):
#print(self.w.shape)
#print(self.b)
x = mini_batch[:, :-1]
y = mini_batch[:, -1:]
a = self.forward(x)
loss = self.loss(a, y)
gradient_v, gradient_b = self.gradient2(v, y)
gradient_w=self.gradient1(gradient_v,x)
self.update(gradient_w, gradient_b, eta)
losses.append(loss)
print('Epoch {:3d} / iter {:3d}, loss = {:.4f}'.
format(epoch_id, iter_id, loss))

return losses


# In[6]:


# 获取数据
train_data, test_data = load_data()

# 创建网络
net = Network(13)
# 启动训练
losses = net.train(train_data, num_epoches=50, batch_size=100, eta=0.1)

# 画出损失函数的变化趋势
plot_x = np.arange(len(losses))
plot_y = np.array(losses)
plt.plot(plot_x, plot_y)
plt.show()


# 请点击[此处](https://ai.baidu.com/docs#/AIStudio_Project_Notebook/a38e5576)查看本环境基本用法.

# Please click [here ](https://ai.baidu.com/docs#/AIStudio_Project_Notebook/a38e5576) for more detailed instructions.

0
回复
o
oceancjc
#507 回复于2019-12

作业4-2: 通过Python、深度学习框架,不同方法写房价预测,Python编写的模型 和 基于飞桨编写的模型在哪些方面存在异同?例如程序结构,编写难易度,模型的预测效果,训练的耗时等等?

0
回复
o
oceancjc
#508 回复于2019-12
oceancjc #507
作业4-2: 通过Python、深度学习框架,不同方法写房价预测,Python编写的模型 和 基于飞桨编写的模型在哪些方面存在异同?例如程序结构,编写难易度,模型的预测效果,训练的耗时等等?

作业4-2: 通过Python、深度学习框架,不同方法写房价预测,Python编写的模型 和 基于飞桨编写的模型在哪些方面存在异同?例如程序结构,编写难易度,模型的预测效果,训练的耗时等等?

文字答案一直审核不过,传图片

0
回复
莲子心
#509 回复于2019-12

作业4-2:

(2)Python编写的模型 和 基于飞桨编写的模型均是未实现共同的模型训练而设计的代码,其功能或是业务目标是相同的,但是

Python编写的模型执行效率慢,代码量高(由于实际上从0开始写神经网络模型),且需要掌握较深的数学知识,等诸多缺陷;

基于飞桨编写的模型可以充分利用计算机资源(如GPU资源),且常用的功能已经做好了封装,我们编写代码时只需注重具体的业务功能,无需留意功能的实现,要求的数学能力无需深奥,等诸多有点

0
回复
小公主mini516
#510 回复于2019-12

作业4-2: 通过Python、深度学习框架,不同方法写房价预测,Python编写的模型 和 基于飞桨编写的模型在哪些方面存在异同?例如程序结构,编写难易度,模型的预测效果,训练的耗时等等?

程序结构:基本相同。

编写难易程度:基于飞桨编写的模型容易很多。

模型的预测效果:差距不大

训练的耗时:飞桨耗时短很多

0
回复
y
yun101bd
#511 回复于2019-12

理论作业4-2:

本人60后,从事供热行业,为省内供热专家。供热行业目前处于原始混沌状态,面临着产业升级阶段,急需技术上的突破。“智慧供热”在行业内已经提出2年多了,参加了几次国内相关会议,均未得到明确的解决方案。因此,产生了学习人工智能的愿望,希望了解人工智能技术,具备与人工智能专家沟通的能力,发挥各自专业的能力,有机结合,促进人工智能在供热行业尽快落地。

我的体会是:

1.  Python本来就是接近人类语言的编程语言,又是开源的,对于零基础的门外汉来说,是能够接受的,经过努力是可以迈过的门槛。

2. 飞桨相比于Python编程更容易掌握,其提供了一个框架平台,让像我这样的门外汉可以实现涉足人工智能梦想的可能。百度飞桨好比windows对电脑的普及,使各行各业可以实现人工智能落地,促进各行各业的产业升级,发展前景无限广阔。

0
回复
huly1220
#512 回复于2019-12

作业4-2:

1.使用python编写的模型写房价预测,难免会导致程序结构非常复杂,而且效率比较低,时间复杂度比较高,代码编写过程难度比较大,并且模型的预测效果也不一定很好,同时因为没有压缩的框架,会使得训练的耗时相当多。有很多算法公式都需要自己编写完成,比如loss损失函数,优化函数等,而且特别容易出错。

2.用基于飞桨编写的模型使得编程特别有规律,特别简单,对于模型,损失函数,优化函数等直接调用飞桨的包即可完成,程序简练,大致包括(1)数据处理,此部分和之前一样,包括读文件,对数据进行预处理,归一化操作,导成飞桨内置的数据格式等;(2)模型设计,包括网络结构的设计,损失函数的选取,网络结构有多层网络、单层网络、激活函数等等,损失函数有均方误差等;(3)训练配置,选取优化器和资源配置,最常用的有梯度下降法(瞎子下坡法)SGD,资源配置即选取cpu或者gpu;(4)训练,对模型进行训练,作图等;(5)把训练的模型进行保存,调用保存的参数进行预测。

1
回复
学习使我快乐
#513 回复于2019-12

作业4-2:
使用飞桨编写模型,更利于快速的开发以及验证,编写的难度低,代码量小;若完全手写感觉比较适合初学者去理解更多的东西,但无论是编写效率或者运行效率应该慢不少

 

0
回复
j
jack1998l
#514 回复于2019-12

通过Python、深度学习框架,不同方法写房价预测,Python编写的模型 和 基于飞桨编写的模型在哪些方面存在异同?例如程序结构,编写难易度,模型的预测效果,训练的耗时等等?

共同点:   代码结构完全一致,分为5个部分:

1. 数据处理:读取数据 和 预处理操作

2. 模型设计:网络结构(假设)

3. 训练配置:优化器(寻解算法)和 计算资源配置

4. 训练过程:循环调用训练过程,包括前向计算 + 计算损失(优化目标) +后向传播

5. 保存模型:将训练好的模型保存

不同点:飞桨编写了基本的优化算法和封装函数,可读性更好,效率更高,开发人员可以将重心放在数据预处理、网络结构和调优上。

0
回复
虚风浸谷
#515 回复于2019-12

作业1-2:

1.零售业某商品的销售量问题;假设和参数:销售量(y)与该商品价格(x1),时间段(x2),天气情况(x3),商场周边居住人口数量(x4),居住人口的年龄段分布(x5)成正比,满足 (预测值) z= w1*x1+w2*x2+w3*x3+w4*x4+w5*x5+b ;优化目标:(y-z)*(y-z) 趋于0

2.随着大数据的发展,使得深度学习有了足够的数据进行学习,以及GPU等硬件的发展,提升的深度学习的性能得到大幅提升,使得深度学习可以满足工业应用的要求,也促使深度学习原理得到优化与进步。  随着中国工业自动化的需求,更多的机器将代替人工,但有些复杂的事情传统的算法无法做到,深度学习提供了一条切实可行的道路。

 

0
回复
得儿飘飘飘飘
#516 回复于2019-12

0
回复
s
sljackson
#517 回复于2019-12

作业4-2:
共同点:加载数据的方式都一样。构建网络模型,前向计算,计算损失,后向传播,保存模型。

不同点:代码量不一样。Python编写的模型代码量要比Paddle框架的大很多,由于Padddle框架内置实现了很多算法,所以可以一两行代码即可完成复杂的逻辑。

0
回复
w
wangyf童鞋
#518 回复于2019-12

作业4-2:

相同处:代码均分为如下的5个部分:数据处理、 模型设计、训练配置、 训练过程、 保存模型,程序结构相同。模型的预测效果也差不多。

不同处:使用paddlepaddle框架编写更加简单,代码量大大减小,不需要自己从头编写代码;使用框架后训练耗时也会缩短。

0
回复
l
lu66a
#519 回复于2019-12

作业4-2:

同:原理都是一样的,都需要经过导入数据,处理数据,向前计算,计算损失函数,向后计算,更新模型等.

异:python的编写代码多一些,没有框架使用,预测效果可能都是差不多的,因为原理是一样的,效率方面是飞浆好点,应为这是百度大佬不断加强修改的框架,用起来也方便许多,更重要的是,你只需要明白逻辑,步骤,就可以使用飞浆完成编写代码,不需要自己十分了解计算过程.

0
回复
甲基硫酸二乙酯
#520 回复于2019-12

作业3.1

(1)

import numpy as np
import matplotlib.pyplot as plt
x = np.arange(-10, 10, 0.1)
a = np.exp(x)
b = np.exp(-x)
y = (a - b) / (a + b)
plt.plot(x, y)
plt.show()

(2)

p = np.random.randn(10,10)
q = (p > 0)
q = q.astype(int)
q.sum()

0
回复
1
1124803903l
#521 回复于2019-12

作业4-2:

共同点:大体的流程是一致的,都需要经过数据处理,然后设置参数、搭建模型、设定梯度传递公式、设定损失函数、设定损失函数优化方法、数据批输入方式然后设定训练轮数,才能开始送数据进模型进行优化。

不同点:paddle优化了设置参数、搭建模型、梯度传递、损失优化方法、数据输入方法;使得使用者可以更加专注于网络的设计,而不需要进行底层优化,让术业有专攻。同时paddle优化过的函数,在运行效率上比自己写要好的,训练效果也好。

0
回复
在@后输入用户全名并按空格结束,可艾特全站任一用户