深度学习和机器学习有什么差别？

首页版块访问AI主站注册发帖

深度学习和机器学习有什么差别？

精

荒墨丶迷失发布于2017-11 浏览:608299 回复:3101

快速回复

Artificial Intelligence，也就是人工智能，就像长生不老和星际漫游一样，是人类最美好的梦想之一。虽然计算机技术已经取得了长足的进步，但是到目前为止，还没有一台电脑能产生“自我”的意识。是的，在人类和大量现成数据的帮助下，电脑可以表现的十分强大，但是离开了这两者，它甚至都不能分辨一个喵星人和一个汪星人。

那么人工智能中的两大热点“学习”，即Deep Learning（深度学习）和Machine Learning（机器学习）。两者的区别是什么呢？

于是，今天翻阅许多介绍这两个学习的一些学术文章以及讲解，希望分享给大家！

机器学习（Machine Learning）是一门专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能的学科。简单的说，就是“从样本中学习的智能程序”，那么机器能否像人类一样能具有学习能力呢？

其实我深刻理解这个机器学习之后会发现，例如图像识别、语音识别、自然语言理解、天气预测、基因表达、内容推荐等等，是存在很多问题的。

举个例子，人脸识别技术，从开始的通过传感器（例如CMOS）来获得数据。然后经过预处理、特征提取、特征选择，再到推理、预测或者识别。最后一个部分，也就是机器学习的部分，绝大部分的工作是在这方面做的，也存在很多的paper和研究。

而中间的三部分，概括起来就是特征表达。良好的特征表达，对最终算法的准确性起了非常关键的作用，而且系统主要的计算和测试工作都耗在这一大部分。但，这块实际中一般都是人工完成的。靠人工提取特征。

特征是机器学习系统的原材料，对最终模型的影响是毋庸置疑的。如果数据被很好的表达成了特征，通常线性模型就能达到满意的精度。

或者这么说，机器学习目的是让机器如何像人的大脑一样去学习，目前的这个学习过程的办法，就是不断教机器识别这个“特征”，并且依靠不断地算法能力训练，达到语音识别，人脸识别，图像识别等技术。而我们一直用的UNIT，其实就是不对的增加对话样本的同时，配置对话模板，会发现这个对话式机器人越来越强大，这就是所谓的机器学习过程，不知大家理解了嘛。

当然，机器学习远远没有我讲的这么简单，只是粗略的了解一下，毕竟我没有机器学习、计算机视觉、神经网络等等基础。hhh~有兴趣的可以多了解相关的文章！

深度学习（Deep Learning）是机器学习研究中的一个新的领域，其动机在于建立、模拟人脑进行分析学习的神经网络，它模仿人脑的机制来解释数据，例如图像，声音和文本。深度学习是无监督学习的一种。

深度学习的概念源于人工神经网络的研究。含多隐层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征，以发现数据的分布式特征表示。

Deep learning本身算是machine learning的一个分支，简单可以理解为neural network的发展。

那么深度学习究竟是在做什么呢，举个我看到的例子：

2012年6月，《纽约时报》披露了Google Brain项目，吸引了公众的广泛关注。这个项目是由著名的斯坦福大学的机器学习教授Andrew Ng和在大规模计算机系统方面的世界顶尖专家JeffDean共同主导，用16000个CPU Core的并行计算平台训练一种称为“深度神经网络”（DNN，Deep Neural Networks）的机器学习模型（内部共有10亿个节点。这一网络自然是不能跟人类的神经网络相提并论的。要知道，人脑中可是有150多亿个神经元，互相连接的节点也就是突触数更是如银河沙数。曾经有人估算过，如果将一个人的大脑中所有神经细胞的轴突和树突依次连接起来，并拉成一根直线，可从地球连到月亮，再从月亮返回地球），在语音识别和图像识别等领域获得了巨大的成功。

项目负责人之一Andrew称：“我们没有像通常做的那样自己框定边界，而是直接把海量数据投放到算法中，让数据自己说话，系统会自动从数据中学习。”另外一名负责人Jeff则说：“我们在训练的时候从来不会告诉机器说：‘这是一只猫。’系统其实是自己发明或者领悟了“猫”的概念。”

重点注意加粗的这几句话，没错，深度学习就是如何让机器能够自己掌握学习能力！！

那么就可以解释为什么拥有大数据的互联网公司争相投入大量资源研发深度学习技术。听起来感觉deeplearning很牛那样。

但是深度学习真的真的没有那么简单，就通过我对深度学习的理解来说，你最少需要了解

人脑视觉机理，初级（浅层）特征表示，结构性特征表示，深度神经网络，常用模型或者方法。

so，深度学习目前仍有大量工作需要研究。目前的关注点还是从机器学习的领域借鉴一些可以在深度学习使用的方法，特别是降维领域。

好了，就先了解到这么多，其实这些东西的深层次学问，不是我们能够做到的，但是我们相信，不管是百度还是其他领域的公司肯定是不断研究的

而我们作为技术的享用者（语音识别，人脸识别....），我们不仅需要更多考虑如何结合这些技术，去创造可见的人工智能未来

那么我们又该如何创造可见的人工智能未来呢，请看文章：《从用户场景，来思考人工智能可见的未来》，或许会有你需要的灵感。

地址：https://ai.baidu.com/forum/topic/show/492135

感谢大家，分享到这里啦~

其他

文档

个赞

共3101条回复最后由今天你笑死我了回复于2023-10

#1286goJhou回复于2018-11

对#1285 荒墨丶迷失回复

你会吗我当时还以为黑客攻击我电脑了...

现在也有sql注入漏洞。像如果你的后端不是用参数代入跑的sql脚本的话就容易被注入

#1285荒墨丶迷失回复于2018-11

对#1276 worddict回复

SQL注入好像是一种网络攻击方式

你会吗我当时还以为黑客攻击我电脑了...

#1284荒墨丶迷失回复于2018-11

对#1281 婉嫕男回复

一般来说很多公司是不愿意贡献数据的，专业领域的专业数据是未来时代一个行业的护城河

展开

是的比如说上海的所有个人服务查询的接口都掌握在一个公司上，对接动不动就是一年多少费用

#1283荒墨丶迷失回复于2018-11

对#1282 婉嫕男回复

光自动驾驶领域离职的就有四五十人都是主任架构师，首席科学家一类的，国内自动驾驶创业公司大半都有百度技术背景

展开

百度真是培养了一大批这方面的人才哇哈哈

#1282婉嫕男回复于2018-11

对#1279 蓝兰兰111回复

百度是互联网的黄埔军校

光自动驾驶领域离职的就有四五十人都是主任架构师，首席科学家一类的，国内自动驾驶创业公司大半都有百度技术背景

#1281婉嫕男回复于2018-11

对#1275 才能我浪费99回复

这种打法，好像所有的大互联网公司都是这个调调

一般来说很多公司是不愿意贡献数据的，专业领域的专业数据是未来时代一个行业的护城河

#1280婉嫕男回复于2018-11

对#1274 才能我浪费99回复

他是老好人? 印象里应该是一个到处怼人的战士啊

前两年确实是红衣大炮，3Q,3B大战，促成了腾讯的转型，百度的沉沦，现在收敛了不少

#1279蓝兰兰111回复于2018-11

对#1277 worddict回复

百度的技术还是很强的，百度出来的应该很厉害

百度是互联网的黄埔军校

#1278秘密花园jay回复于2018-11

对#1272 荒墨丶迷失回复

说起sql注入又让我想起我以前的电脑玩着游戏提示我sql什么东西注入然后一分钟关闭电脑

展开

大佬玩什么游戏呀，烧脑吗

#1277worddict回复于2018-11

对#1270 荒墨丶迷失回复

哈哈哈是的是的我上周去了一个叫达观数据的他们CEO都是百度的工程师用数据文本处理都是自审研发的但是我感觉百度开源的也跟他们差不多这就没办法了

展开

百度的技术还是很强的，百度出来的应该很厉害

#1276worddict回复于2018-11

对#1272 荒墨丶迷失回复

说起sql注入又让我想起我以前的电脑玩着游戏提示我sql什么东西注入然后一分钟关闭电脑

展开

SQL注入好像是一种网络攻击方式

#1275才能我浪费99回复于2018-11

对#1269 婉嫕男回复

百度自身不是也在做这块，也和行业里面一些公司合作做这个知识图谱嘛，百度很鸡贼，合作可以给你免费导流，数据也必须给我一份

展开

这种打法，好像所有的大互联网公司都是这个调调

#1274才能我浪费99回复于2018-11

对#1271 荒墨丶迷失回复

周鸿祎公认的老好人之前有在天天向上看过很逗的

他是老好人? 印象里应该是一个到处怼人的战士啊

#1273才能我浪费99回复于2018-11

对#1267 婉嫕男回复

要说百度被谁爬的最惨？应该是360搜索，360的百科基本上全部爬的百度百科

展开

百科这种东西一开始爬取别人的的确是最方便的做法

#1272荒墨丶迷失回复于2018-11

对#1265 才能我浪费99回复

我忘了在哪里看的一个故事，一个网站被爬得烦了，设了一个套、用类似SQL注入的方式把爬的人的库给清了

展开

说起sql注入又让我想起我以前的电脑玩着游戏提示我sql什么东西注入然后一分钟关闭电脑

#1271荒墨丶迷失回复于2018-11

对#1267 婉嫕男回复

要说百度被谁爬的最惨？应该是360搜索，360的百科基本上全部爬的百度百科

展开

周鸿祎公认的老好人之前有在天天向上看过很逗的

#1270荒墨丶迷失回复于2018-11

对#1269 婉嫕男回复

百度自身不是也在做这块，也和行业里面一些公司合作做这个知识图谱嘛，百度很鸡贼，合作可以给你免费导流，数据也必须给我一份

展开

#1269婉嫕男回复于2018-11

对#1253 荒墨丶迷失回复

搜索的细分市场还是狠多的我倒是觉得有些文本处理的公司，做的知识图谱哪些，完全也可以专一的做搜索引擎。比如金融行业，你搜百度的范围太大，内容多又不精，所以很难搜到自己想要的。

展开

百度自身不是也在做这块，也和行业里面一些公司合作做这个知识图谱嘛，百度很鸡贼，合作可以给你免费导流，数据也必须给我一份

#1268婉嫕男回复于2018-11

对#1248 daipeng_hi回复

百度搜索起家可不是吃素的，只是当年向移动转型太慢才导致下行开始

当年中国第一市值互联网企业，中国广告业老大的地位不是吃素的

#1267婉嫕男回复于2018-11

对#1259 goJhou回复

《爬虫与反爬虫》论就此展开

要说百度被谁爬的最惨？应该是360搜索，360的百科基本上全部爬的百度百科

快速回复

小编推荐

【征稿计划第二期】评测报告、使用攻略、行业案例

用户已被禁言 14回复

Baidu Create 2019 | 百度大脑

用户已被禁言 6回复

【颁奖】第三期百度大脑新品体验师

用户已被禁言 19回复

【四月评测】远场语音识别套件

goJhou 17回复

TOP

操作指南

常见问答

平台公告

经验交流

技术专区

文字识别

人脸识别

语音技术

PaddlePaddle

EasyDL

BML

EasyData

AI Studio

UNIT

人体分析

图像搜索

图像识别

内容审核

自然语言处理

机器人视觉

视频技术

增强现实

知识图谱

智能创作

智能呼叫中心

文心

EdgeBoard

DuerOS

EasyEdge

度目硬件

百度AI市场

Doris

AI赛事

百度之星大赛

AI Studio人工智能竞赛

语言与智能技术竞赛

千言数据集

集思广益

共享工具

头脑风暴

成果展示

智能客服