首页 炼丹房 帖子详情
为什么GPU比CPU快?
收藏
快速回复
炼丹房 文章新手上路 16929 106
为什么GPU比CPU快?
收藏
快速回复
炼丹房 文章新手上路 16929 106

作者:毛大闲

来源:https://mbb.eet-china.com/blog/3887969-407803.html

一、前言

  近几年深度学习在各领域大显神威,而”GPU加速"也得到了越来越多的篇幅,似乎任何程序只要放到GPU上运行那速度就是杠杠的。GPU代替CPU计算已成了大势所趋?我先告诉你结论”那是不可能滴“,然后咱们再来说说”GPU为什么比CPU快“。


二、图形处理,GPU的源起

  GPU是显卡的计算单元,就好比CPU是电脑的计算核心,有时我们直接就把GPU称为显卡。显而易见,GPU从诞生之初就是用来处理图像的。下面我们讲一个简单的例子来说明下为什么图像处理需要用到GPU,而CPU的缺点是什么。

  我们讲一个画面”立体“,其实讲的是画面中对于光影的运用,下图就是一个简单的”圆“。

  当我们给这个圆加上”光影“之后,它就变成了一个球。我们说球要比圆立体的多,这就是光影的作用。

  光影的原理很简单,你需要想象一个远处的”光“,然后在画面上模拟出光照在物体上的明暗变化,计算机中这些明暗变化都是通过”计算“得到的。编程人员只需要输入光源的距离、亮度、被照体的位置,然后通过逐步计算、光影叠加就能得到图像中每一个像素应该显示什么颜色、什么亮度,一个立体画面也就跃然纸上了。

  那么现在问题来了,假设屏幕分辨率为1920*1080,即2073600(207.36万)个像素,游戏中每个像素都需要根据光影参数来计算显示的颜色和明暗。假设一个常见的Intel I5 CPU主频为3.2GHz,即最多每秒可做32亿次运算。但这里的一次运算只是做了一次简单的二进制加减法或数据读取,一个像素的光影计算我们可以假设需要100次运算,即CPU一秒约处理3200万次像素运算,大概15张图片,用专业点的说法,这个游戏流畅度大概是每秒15帧的样子。

  可见使用CPU全力进行图形运算是有点吃力的,更何况CPU还要处理很多键盘指令、游戏后台计算等等。是CPU还不够快吗?假设现在速度翻倍,即每秒64亿次运算似乎也是不够的。其实CPU面临的主要问题是,虽然每一次光影计算都非常简单,但经不住像素太多啦,还都得排队一个一个做。然后工程师们想到“其实任何一个像素的计算与其他像素的计算结果关系不大”,那为啥不多整几个计算核心“并行”计算呢,于是GPU就出现了。

  一个典型的显卡GTX1060,主频是1.5GHz大概是Intel I5一半左右,但是它具备1280个计算核心。每个计算核心每秒可做15亿次运算,1280个核心每秒就是19200亿次运算,那一秒可以处理192亿次像素计算,大概925张图片,是CPU计算能力的61倍!但GPU的特性只能应用于图形计算这种可以并行的任务,若是做普通的串行任务其速度远远不如CPU。

 

三、核心越多越好?

  通过前面的叙述我们都知道了GPU速度“快于”CPU的奥秘在于它有很多的“核”,那能不能这样,我们给CPU也装上1000多个核,那速度岂不是快到飞起?答案是“不得行”。由于制造工艺的原因,CPU内核越多其频率也就越低。其实很容易想到,同步10个人的动作和同步1000个人的动作其难度肯定是不一样的。其次,电脑中大部分的运算都是串行的,即下一个运算要等到上一个运算完毕才能继续,这时候单次运算的速度才是最重要的。

  所以相当长时间以内,CPU+GPU的搭配才是最佳方案。

 

 四、GPU与并行计算

  深度学习与图形处理有一些相通的地方,它需要大量的数据来“训练”模型。比如一个猫图识别AI,你需要提供数以万计的猫图供其“学习”。而每一张猫图的学习又与其他猫图没有先后关系,即你可以同时并行100、1000张猫图的学习,所以GPU在深度学习领域大放异彩。

  实际上GPU编程一直是近年来的热点,作为高效程序员又怎么能不了解一二呢?CUDA是NVIDIA推出的并行计算框架,它囊括了GPU并行计算中所有你需要的组件,只需要简单安装(当然你电脑得是N卡)就可以在C代码中使用它提供的接口进行GPU编程了,当然对于非从业人员来说了解下相关知识也是极好的。

5
收藏
回复
全部评论(106)
时间顺序
AIStudio810258
#63 回复于2020-07
这个应该属于边缘计算范畴,部署要看边缘端设备性能的提升,云端太远了,延迟受不了;我理解5G是给数据源传给边缘端计算中心用的,不是传到云上。

家庭计算中心?咖啡店计算中心?是这个意思么

0
回复
AIStudio810258
#64 回复于2020-07
这个应该属于边缘计算范畴,部署要看边缘端设备性能的提升,云端太远了,延迟受不了;我理解5G是给数据源传给边缘端计算中心用的,不是传到云上。

连手机的算力不知道够不够

0
回复
AIStudio810258
#65 回复于2020-07
他说的应该不是把深度学习用在炒股,是由券商开始研究VR这个板块。。。

被懂得了,哈哈

0
回复
AIStudio810258
#66 回复于2020-07
thinc #57
时间序列来建模也很难搞

在线看行情应该是个不错的主意。

我知道有人做期货,出去打了个电话,回来再盯盘,发现杯具了~~

0
回复
AIStudio810258
#67 回复于2020-07
在线看行情应该是个不错的主意。 我知道有人做期货,出去打了个电话,回来再盯盘,发现杯具了~~

我觉得以后操盘手和操盘手们的老板一定是忠实客户的~~

0
回复
thinc
#68 回复于2020-07
今年创业板注册制改革、科创版推出,可能是个元年。十年牛市起点。可能到10000点的。 不可认真啊~~

上半年股市这么好  把钱丢在余额宝真是*了!

0
回复
thinc
#69 回复于2020-07
家庭计算中心?咖啡店计算中心?是这个意思么

资源合理分配~

0
回复
thinc
#70 回复于2020-07
连手机的算力不知道够不够

算力不够  流量来凑

0
回复
thinc
#71 回复于2020-07
在线看行情应该是个不错的主意。 我知道有人做期货,出去打了个电话,回来再盯盘,发现杯具了~~

少投点 赚点零花钱就够了  真拿这个吃饭太难了

0
回复
thinc
#72 回复于2020-07
我觉得以后操盘手和操盘手们的老板一定是忠实客户的~~

基金经理也开始学编程和算法了哈哈

0
回复
AIStudio810260
#73 回复于2020-07
家庭计算中心?咖啡店计算中心?是这个意思么

额。。。不太是这个意思,5G其实给工业用场景更多点,车间边缘中心之类的,好像有个类似路由器的问题,这个5G路由器能覆盖的地方。

0
回复
AIStudio810258
#74 回复于2020-07
thinc #71
少投点 赚点零花钱就够了  真拿这个吃饭太难了

我看这种想法还真是别有的好。

金融是研究分蛋糕的,离蛋糕最近,所以自己分得最多。

0
回复
AIStudio810258
#75 回复于2020-07
thinc #71
少投点 赚点零花钱就够了  真拿这个吃饭太难了

有种说法,交易员都是忐忑不安的“自大狂”,哈哈。

。。。一年买车、五年买房、十年买墓地。。。

赚这个钱真心不易。

只是说说,别认真~~

0
回复
AIStudio810258
#76 回复于2020-07
thinc #72
基金经理也开始学编程和算法了哈哈

网传有张图,十年前华尔街想赶集的,现在只剩几台电脑,估计都连着alpha狗之类的吧

0
回复
AIStudio810258
#77 回复于2020-07
thinc #72
基金经理也开始学编程和算法了哈哈

我觉得一流的后浪们还是当科学家、实业家的比较好。个人踏实,对国家也更有益。现在经济危机的本质就是金融业太过侵蚀实体经济了。预期收益太高了。钱还没赚到就已经被各种金融手段给分完了,剩下给事业的不多。而且实体一出问题,更是成了空中楼阁。这现在已经演变成社会危机了,导致了世界地区紧张与冲突。

0
回复
AIStudio810258
#78 回复于2020-07
额。。。不太是这个意思,5G其实给工业用场景更多点,车间边缘中心之类的,好像有个类似路由器的问题,这个5G路由器能覆盖的地方。

哦,现在边缘系统总在耳边响,已经成了深度学习应用的一个热门领域。

0
回复
AIStudio810258
#79 回复于2020-07
额。。。不太是这个意思,5G其实给工业用场景更多点,车间边缘中心之类的,好像有个类似路由器的问题,这个5G路由器能覆盖的地方。

看来,边缘系统的概念还得深入了解下啊。

我原来以为,就是主机加wifi给眼镜、手环之类用的。

看来边缘系统的概念很丰富呢,尤其是在工业物联网领域。

0
回复
没入门的研究生
#80 回复于2020-07
哦,现在边缘系统总在耳边响,已经成了深度学习应用的一个热门领域。

什么是边缘系统呀??

0
回复
AIStudio810258
#81 回复于2020-07
什么是边缘系统呀??

我粗浅理解就是推理不部署在服务器上,而是直接部署在手机、加了计算棒的树莓派这样的边缘端硬件上。

Paddle就是用Paddle Lite

0
回复
AIStudio810258
#82 回复于2020-07
什么是边缘系统呀??

觉得还是“doubi渣渣”同学更了解深入些

0
回复
在@后输入用户全名并按空格结束,可艾特全站任一用户