吴恩达机器学习笔记P1-2

首页版块访问AI主站注册发帖

吴恩达机器学习笔记P1-2

杨凯kd 发布于2020-02 浏览:2058 回复:0

吴恩达机器学习笔记P1-2

快速回复

本次课程讲了机器学习的两个子类——监督学习和无监督学习

首先说监督学习。监督学习（Supervised Learning）指的是在进行机器学习之前，我们会给一个数据集，其中包含“正确答案”。比如房价预测。在进行机器学习之前，我们会给定一个样本数据，其中有不同面积下的房价数据，也就是说，机器学习的输出——房价这样的标签已经在数据集中给定。我们在这些数据的训练下，才能得到正确的输出。监督学习可以分为回归（Regression）和分类（Classification）。所谓回归问题，就是预测连续输出的问题（Predict continuous valued output），如房价预测，训练数据会被正确地标注不同面积下的房价。所谓分类问题，就是离散输出问题（Discrete valued output）。比如，预测肿瘤是否是恶性肿瘤，训练数据中会明确标注哪些是恶性肿瘤，哪些不是。以上这些都是样本数据会被标注的问题。生动地来说，就是机器会在“正确答案的监督下”进行。

再说无监督学习（Unsupervised Learning）。我们给定的训练数据中不会有正确的标注，即“正确答案”，机器需要通过自己来学习数据之间的区别，将他们分成不同的簇（cluster）。我们常用的搜索引擎就是很好的无监督学习的例子。算法会自动将相关的主题聚集在一起，这就是“聚类算法”。聚类算法在组织计算机集群、社交网络分析、市场细分以及天文数据分析中有这广泛的应用。

总结一下，监督学习问题就是训练数据中包含正确标注的机器学习问题，而非监督学习的训练数据中没有任何标注。这是监督学习和非监督学习之间的本质区别。在监督学习中，算法需要根据带有正确标注的数据训练出一个函数，来得到正确的输出；而非监督学习的训练数据中没有标注，机器需要通过自己来学习不同样本之间的联系和区别，实现聚类。

其他

个赞

快速回复

小编推荐

【征稿计划第二期】评测报告、使用攻略、行业案例

用户已被禁言 14回复

Baidu Create 2019 | 百度大脑

用户已被禁言 6回复

【颁奖】第三期百度大脑新品体验师

用户已被禁言 19回复

【四月评测】远场语音识别套件

goJhou 17回复

TOP

操作指南

常见问答

平台公告

经验交流

技术专区

文字识别

人脸识别

语音技术

PaddlePaddle

EasyDL

BML

EasyData

AI Studio

UNIT

人体分析

图像搜索

图像识别

内容审核

自然语言处理

机器人视觉

视频技术

增强现实

知识图谱

智能创作

智能呼叫中心

文心

EdgeBoard

DuerOS

EasyEdge

度目硬件

百度AI市场

Doris

AI赛事

百度之星大赛

AI Studio人工智能竞赛

语言与智能技术竞赛

千言数据集

集思广益

共享工具

头脑风暴

成果展示

智能客服