新的一年,新的开始啦。
最近paddlepaddle真是火热火热的,估计有一大堆小伙伴准备入手了,但是你发现缺少了数学知识,和机器学习的概念还是很吃力的。
没关系,没关系,我也是一样的,学习是一点一滴的过程,加油吧,要对自己有信心。
本期就给大家更新PaddlePaddle深度学习的框架吧,非常非常基础的,我自己也看了两遍视频。
如题,是新手入门,大神给点指点指点就好啦。哈哈哈,最后放视频地址,
目录:
A:机器学习基础知识
有监督学习&无监督学习
模型是什么
假设函数(hyothesis function)
目标函数(cost function)
梯度下降(gradient descent)
B:paddlepaddle实战:线性回归预测房价
数据预处理
设计假设函数
设计损失函数
开始训练,观察训练结果
用模型做预测
【第一课:机器学习基础知识】
深度学习是机器学习的一个分支。
机器学习总体分类(监督学习 supervised learning 和 无监督学习 unsupervised learning)
而监督学习分类(决策树:decision tree,svm等,回归(线性回归和非线形回归))
无监督学习(聚类,词嵌入等)
【1.1 模型是什么】
监督学习是要根据已知数据集X和Y寻找出映射关系f。
手写字识别 。 X手写数字图片,Y数字,模型
样本(example):一个feature和对应的label数据构成一条样本(X,Y)
数据集(dataset):所有样本一起构成一个数据集
填空题:2,4,(),8
(1,2),(2,4),(4,8),(3,?)
y=f(X)=某X 。 这个某=2.
模型的能力:
1.拟合:描述已有数据之间的映射关系(拟合fit)
2.预测:对未知数据有预测能力(泛化generalization)
【2.机器学习是什么?】
A:机器学习
从数据中产生模型
B:关键概念
假设函数(hypothesis function)
损失函数(cost function)
优化算法(gradient descent)
【2.机器学习是什么?】
【2.1 假设函数】
用数据的方法描述自变量X和因变量Y之间的关系
比如说:线形假设函数,包括了二次函数,三次函数..多次函数..
【2.2 损失函数】
用数学的方法衡量假设函数预测结果与真实值之间的“误差”。
MSE(mean square error)均方差损失函数。
【2.3 梯度下降(gradient descent)】
问题:给定训练数据集和损失函数,希望找到对应的Q使得损失函数J(Q)最小
分析:函数的极值点就是它的导数为0的那个点
方法:人可以通过解方程算出极值点对应的Q。计算机不会解方程,但是可以凭借强大的计算能力,一步一步迭代算出极值点。
学习率太小:逼近极值点很慢
学习率太大:函数无法收敛,甚至发散,cost越来越大。
三种梯度下降优化框架
【3. 机器学习基础知识总结】
【术语总结】
监督学习(supervised learning)
非监督学习(unsupervised learning)
假设函数(hypothesis function)
均方差MSE(mean square error )
损失函数(cost function)
梯度下降(gradient descent)
在下一章节中,我们一起研究下如何用paddlepaddle来预测房价哈,从数据预处理到函数到模型一步一步。
本期学习的视频:在强大的百度技术学院:http://bit.baidu.com/course/detail/id/137/column/7.html
来支持下
支持