Artificial Intelligence,也就是人工智能,就像长生不老和星际漫游一样,是人类最美好的梦想之一。虽然计算机技术已经取得了长足的进步,但是到目前为止,还没有一台电脑能产生“自我”的意识。是的,在人类和大量现成数据的帮助下,电脑可以表现的十分强大,但是离开了这两者,它甚至都不能分辨一个喵星人和一个汪星人。
那么人工智能中的两大热点“学习”,即Deep Learning(深度学习)和Machine Learning(机器学习)。两者的区别是什么呢?
于是,今天翻阅许多介绍这两个学习的一些学术文章以及讲解,希望分享给大家!
机器学习(Machine Learning)是一门专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能的学科。简单的说,就是“从样本中学习的智能程序”,那么机器能否像人类一样能具有学习能力呢?
其实我深刻理解这个机器学习之后会发现,例如图像识别、语音识别、自然语言理解、天气预测、基因表达、内容推荐等等,是存在很多问题的。
举个例子,人脸识别技术,从开始的通过传感器(例如CMOS)来获得数据。然后经过预处理、特征提取、特征选择,再到推理、预测或者识别。最后一个部分,也就是机器学习的部分,绝大部分的工作是在这方面做的,也存在很多的paper和研究。
而中间的三部分,概括起来就是特征表达。良好的特征表达,对最终算法的准确性起了非常关键的作用,而且系统主要的计算和测试工作都耗在这一大部分。但,这块实际中一般都是人工完成的。靠人工提取特征。
特征是机器学习系统的原材料,对最终模型的影响是毋庸置疑的。如果数据被很好的表达成了特征,通常线性模型就能达到满意的精度。
或者这么说,机器学习目的是让机器如何像人的大脑一样去学习,目前的这个学习过程的办法,就是不断教机器识别这个“特征”,并且依靠不断地算法能力训练,达到语音识别,人脸识别,图像识别等技术。而我们一直用的UNIT,其实就是不对的增加对话样本的同时,配置对话模板,会发现这个对话式机器人越来越强大,这就是所谓的机器学习过程,不知大家理解了嘛。
当然,机器学习远远没有我讲的这么简单,只是粗略的了解一下,毕竟我没有机器学习、计算机视觉、神经网络等等基础。hhh~有兴趣的可以多了解相关的文章!
深度学习(Deep Learning)是机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像,声音和文本。深度学习是无监督学习的一种。
深度学习的概念源于人工神经网络的研究。含多隐层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。
Deep learning本身算是machine learning的一个分支,简单可以理解为neural network的发展。
那么深度学习究竟是在做什么呢,举个我看到的例子:
2012年6月,《纽约时报》披露了Google Brain项目,吸引了公众的广泛关注。这个项目是由著名的斯坦福大学的机器学习教授Andrew Ng和在大规模计算机系统方面的世界顶尖专家JeffDean共同主导,用16000个CPU Core的并行计算平台训练一种称为“深度神经网络”(DNN,Deep Neural Networks)的机器学习模型(内部共有10亿个节点。这一网络自然是不能跟人类的神经网络相提并论的。要知道,人脑中可是有150多亿个神经元,互相连接的节点也就是突触数更是如银河沙数。曾经有人估算过,如果将一个人的大脑中所有神经细胞的轴突和树突依次连接起来,并拉成一根直线,可从地球连到月亮,再从月亮返回地球),在语音识别和图像识别等领域获得了巨大的成功。
项目负责人之一Andrew称:“我们没有像通常做的那样自己框定边界,而是直接把海量数据投放到算法中,让数据自己说话,系统会自动从数据中学习。”另外一名负责人Jeff则说:“我们在训练的时候从来不会告诉机器说:‘这是一只猫。’系统其实是自己发明或者领悟了“猫”的概念。”
重点注意加粗的这几句话,没错,深度学习就是如何让机器能够自己掌握学习能力!!
那么就可以解释为什么拥有大数据的互联网公司争相投入大量资源研发深度学习技术。听起来感觉deeplearning很牛那样。
但是深度学习真的真的没有那么简单,就通过我对深度学习的理解来说,你最少需要了解
人脑视觉机理,初级(浅层)特征表示,结构性特征表示,深度神经网络,常用模型或者方法。
so,深度学习目前仍有大量工作需要研究。目前的关注点还是从机器学习的领域借鉴一些可以在深度学习使用的方法,特别是降维领域。
好了,就先了解到这么多,其实这些东西的深层次学问,不是我们能够做到的,但是我们相信,不管是百度还是其他领域的公司肯定是不断研究的
而我们作为技术的享用者(语音识别,人脸识别....),我们不仅需要更多考虑如何结合这些技术,去创造可见的人工智能未来
那么我们又该如何创造可见的人工智能未来呢,请看文章:《从用户场景,来思考人工智能可见的未来》,或许会有你需要的灵感。
地址:https://ai.baidu.com/forum/topic/show/492135
感谢大家,分享到这里啦~
现在也有sql注入漏洞。像如果你的后端不是用参数代入跑的sql脚本的话就容易被注入
你会吗 我当时还以为黑客攻击我电脑了...
是的 比如说上海的所有个人服务查询的接口都掌握在一个公司上,对接动不动就是一年多少费用
百度真是培养了一大批这方面的人才哇 哈哈
光自动驾驶领域离职的就有四五十人都是主任架构师,首席科学家一类的,国内自动驾驶创业公司大半都有百度技术背景
一般来说很多公司是不愿意贡献数据的,专业领域的专业数据是未来时代一个行业的护城河
前两年确实是红衣大炮,3Q,3B大战,促成了腾讯的转型,百度的沉沦,现在收敛了不少
百度是互联网的黄埔军校
大佬玩什么游戏呀,烧脑吗
百度的技术还是很强的,百度出来的应该很厉害
SQL注入好像是一种网络攻击方式
这种打法,好像所有的大互联网公司都是这个调调
他是老好人? 印象里应该是一个到处怼人的战士啊
百科这种东西一开始爬取别人的的确是最方便的做法
说起sql注入又让我想起 我以前的电脑 玩着游戏提示我sql什么东西注入 然后一分钟关闭电脑
周鸿祎公认的老好人 之前有在天天向上看过 很逗的
哈哈哈 是的是的 我上周去了一个叫达观数据的 他们CEO都是百度的工程师 用数据文本处理都是自审研发的 但是我感觉百度开源的也跟他们差不多 这就没办法了
百度自身不是也在做这块,也和行业里面一些公司合作做这个知识图谱嘛,百度很鸡贼,合作可以给你免费导流,数据也必须给我一份
当年中国第一市值互联网企业,中国广告业老大的地位不是吃素的
要说百度被谁爬的最惨?应该是360搜索,360的百科基本上全部爬的百度百科