Artificial Intelligence,也就是人工智能,就像长生不老和星际漫游一样,是人类最美好的梦想之一。虽然计算机技术已经取得了长足的进步,但是到目前为止,还没有一台电脑能产生“自我”的意识。是的,在人类和大量现成数据的帮助下,电脑可以表现的十分强大,但是离开了这两者,它甚至都不能分辨一个喵星人和一个汪星人。
那么人工智能中的两大热点“学习”,即Deep Learning(深度学习)和Machine Learning(机器学习)。两者的区别是什么呢?
于是,今天翻阅许多介绍这两个学习的一些学术文章以及讲解,希望分享给大家!
机器学习(Machine Learning)是一门专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能的学科。简单的说,就是“从样本中学习的智能程序”,那么机器能否像人类一样能具有学习能力呢?
其实我深刻理解这个机器学习之后会发现,例如图像识别、语音识别、自然语言理解、天气预测、基因表达、内容推荐等等,是存在很多问题的。
举个例子,人脸识别技术,从开始的通过传感器(例如CMOS)来获得数据。然后经过预处理、特征提取、特征选择,再到推理、预测或者识别。最后一个部分,也就是机器学习的部分,绝大部分的工作是在这方面做的,也存在很多的paper和研究。
而中间的三部分,概括起来就是特征表达。良好的特征表达,对最终算法的准确性起了非常关键的作用,而且系统主要的计算和测试工作都耗在这一大部分。但,这块实际中一般都是人工完成的。靠人工提取特征。
特征是机器学习系统的原材料,对最终模型的影响是毋庸置疑的。如果数据被很好的表达成了特征,通常线性模型就能达到满意的精度。
或者这么说,机器学习目的是让机器如何像人的大脑一样去学习,目前的这个学习过程的办法,就是不断教机器识别这个“特征”,并且依靠不断地算法能力训练,达到语音识别,人脸识别,图像识别等技术。而我们一直用的UNIT,其实就是不对的增加对话样本的同时,配置对话模板,会发现这个对话式机器人越来越强大,这就是所谓的机器学习过程,不知大家理解了嘛。
当然,机器学习远远没有我讲的这么简单,只是粗略的了解一下,毕竟我没有机器学习、计算机视觉、神经网络等等基础。hhh~有兴趣的可以多了解相关的文章!
深度学习(Deep Learning)是机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像,声音和文本。深度学习是无监督学习的一种。
深度学习的概念源于人工神经网络的研究。含多隐层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。
Deep learning本身算是machine learning的一个分支,简单可以理解为neural network的发展。
那么深度学习究竟是在做什么呢,举个我看到的例子:
2012年6月,《纽约时报》披露了Google Brain项目,吸引了公众的广泛关注。这个项目是由著名的斯坦福大学的机器学习教授Andrew Ng和在大规模计算机系统方面的世界顶尖专家JeffDean共同主导,用16000个CPU Core的并行计算平台训练一种称为“深度神经网络”(DNN,Deep Neural Networks)的机器学习模型(内部共有10亿个节点。这一网络自然是不能跟人类的神经网络相提并论的。要知道,人脑中可是有150多亿个神经元,互相连接的节点也就是突触数更是如银河沙数。曾经有人估算过,如果将一个人的大脑中所有神经细胞的轴突和树突依次连接起来,并拉成一根直线,可从地球连到月亮,再从月亮返回地球),在语音识别和图像识别等领域获得了巨大的成功。
项目负责人之一Andrew称:“我们没有像通常做的那样自己框定边界,而是直接把海量数据投放到算法中,让数据自己说话,系统会自动从数据中学习。”另外一名负责人Jeff则说:“我们在训练的时候从来不会告诉机器说:‘这是一只猫。’系统其实是自己发明或者领悟了“猫”的概念。”
重点注意加粗的这几句话,没错,深度学习就是如何让机器能够自己掌握学习能力!!
那么就可以解释为什么拥有大数据的互联网公司争相投入大量资源研发深度学习技术。听起来感觉deeplearning很牛那样。
但是深度学习真的真的没有那么简单,就通过我对深度学习的理解来说,你最少需要了解
人脑视觉机理,初级(浅层)特征表示,结构性特征表示,深度神经网络,常用模型或者方法。
so,深度学习目前仍有大量工作需要研究。目前的关注点还是从机器学习的领域借鉴一些可以在深度学习使用的方法,特别是降维领域。
好了,就先了解到这么多,其实这些东西的深层次学问,不是我们能够做到的,但是我们相信,不管是百度还是其他领域的公司肯定是不断研究的
而我们作为技术的享用者(语音识别,人脸识别....),我们不仅需要更多考虑如何结合这些技术,去创造可见的人工智能未来
那么我们又该如何创造可见的人工智能未来呢,请看文章:《从用户场景,来思考人工智能可见的未来》,或许会有你需要的灵感。
地址:https://ai.baidu.com/forum/topic/show/492135
感谢大家,分享到这里啦~
原来如此,明白了,谢谢。
如果不太清楚实际方案的写法的话,可以去GITHUB看一下别人的方案,比如参加Kaggle比赛的各种方案
哈哈,Demo除了demo还能是什么,需要用户自己把这些串起来。
感觉所有的DEMO真的只是一个DEMO 哈哈
超过三次有水贴嫌疑,但有时候发言人数太多,真的三次都不好选回谁的。。选择困难症
我记得好像没有这条吧。。我再去翻翻
阿里B端优势大,腾讯C端优势大,反倒是百度B端C端做的都不够深入
每天不能回复同一贴子超过三次
所以这点阿里舒服一点的地方就是它现在商业那边铺的很广,比较好落地。现在搞各种ET大脑。
就是这个意思,一次不能联系回超过3次。
前面讲一大堆专业名词,能看懂一些,但是话是不敢插了,现在敢了,百度不缺技术,只缺落地,因为移动互联网时代的缺失,所以导致现在落地场景也少,最难的就是解决落地场景问题
一直都是不能连回三次啊,我还记得刚开始不清楚规则被笔墨妹连番警告
是连续回复不能超过三次吗?我一直以为只能一次呢
落地就要结合实际的应用了
。。。。。玩demo不难,如何落地难
哇,那这还算是奇遇了,多年不见还能再次相见,有些像言情片
AWS,AZURE,GOOGLE CLOUD其实都开始悄然布局中国有的已经落地了,但因为政策原因所以都铺不开
机器学习可以看看python的Sklearn例代码,很简单的。深度学习玩一玩Keras等比较高层的框架也很容易的。
现在一般的机器学习和深度学习上手都不难了啊。
是啊,其实现在中国的云计算平台,阿里领先其他所有家一个身位。只要AWS之类的进不来,一般轻易是撼不动它的地位的