用什么加快计算速度？异构处理器来助力-电子发烧友网

计算机发展到今天，已经大大改变了我们的生活，我们已经进入了智能化的时代。但要是想实现影视作品中那样充分互动的人工智能与人机互动系统，就不得不提到深度学习。

深度学习

深度学习的概念源于人工神经网络的研究。含多隐层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征，以发现数据的分布式特征表示。

深度学习的概念由Hinton等人于2006年提出。基于深信度网(DBN)提出非监督贪心逐层训练算法，为解决深层结构相关的优化难题带来希望，随后提出多层自动编码器深层结构。此外Lecun等人提出的卷积神经网络是第一个真正多层结构学习算法，它利用空间相对关系减少参数数目以提高训练性能。

深度学习是机器学习研究中的一个新的领域，其动机在于建立、模拟人脑进行分析学习的神经网络，它模仿人脑的机制来解释数据，例如图像，声音和文本。

同机器学习方法一样，深度机器学习方法也有监督学习与无监督学习之分。不同的学习框架下建立的学习模型很是不同．

例如，卷积神经网络（Convolutional neural networks，简称CNNs）就是一种深度的监督学习下的机器学习模型，而深度置信网（Deep Belief Nets，简称DBNs）就是一种无监督学习下的机器学习模型。

Artificial Intelligence，也就是人工智能，就像长生不老和星际漫游一样，是人类最美好的梦想之一。虽然计算机技术已经取得了长足的进步，但是到目前为止，还没有一台电脑能产生“自我”的意识。是的，在人类和大量现成数据的帮助下，电脑可以表现的十分强大，但是离开了这两者，它甚至都不能分辨一个喵星人和一个汪星人。

图灵（图灵，大家都知道吧。计算机和人工智能的鼻祖，分别对应于其著名的“图灵机”和“图灵测试”）在 1950 年的论文里，提出图灵试验的设想，即，隔墙对话，你将不知道与你谈话的，是人还是电脑。这无疑给计算机，尤其是人工智能，预设了一个很高的期望值。但是半个世纪过去了，人工智能的进展，远远没有达到图灵试验的标准。这不仅让多年翘首以待的人们，心灰意冷，认为人工智能是忽悠，相关领域是“伪科学”。

但是自 2006 年以来，机器学习领域，取得了突破性的进展。图灵试验，至少不是那么可望而不可及了。至于技术手段，不仅仅依赖于云计算对大数据的并行处理能力，而且依赖于算法。这个算法就是，Deep Learning。借助于 Deep Learning 算法，人类终于找到了如何处理“抽象概念”这个亘古难题的方法。

2012年6月，《纽约时报》披露了Google Brain项目，吸引了公众的广泛关注。这个项目是由著名的斯坦福大学的机器学习教授Andrew Ng和在大规模计算机系统方面的世界顶尖专家JeffDean共同主导，用16000个CPU Core的并行计算平台训练一种称为“深度神经网络”（DNN，Deep Neural Networks）的机器学习模型（内部共有10亿个节点。这一网络自然是不能跟人类的神经网络相提并论的。要知道，人脑中可是有150多亿个神经元，互相连接的节点也就是突触数更是如银河沙数。曾经有人估算过，如果将一个人的大脑中所有神经细胞的轴突和树突依次连接起来，并拉成一根直线，可从地球连到月亮，再从月亮返回地球），在语音识别和图像识别等领域获得了巨大的成功。

项目负责人之一Andrew称：“我们没有像通常做的那样自己框定边界，而是直接把海量数据投放到算法中，让数据自己说话，系统会自动从数据中学习。”另外一名负责人Jeff则说：“我们在训练的时候从来不会告诉机器说：‘这是一只猫。’系统其实是自己发明或者领悟了“猫”的概念。”

2012年11月，微软在中国天津的一次活动上公开演示了一个全自动的同声传译系统，讲演者用英文演讲，后台的计算机一气呵成自动完成语音识别、英中机器翻译和中文语音合成，效果非常流畅。据报道，后面支撑的关键技术也是DNN，或者深度学习（DL，DeepLearning）。

用什么加快计算速度？异构处理器

在摩尔定律的作用下，单核标量处理器的性能持续提升，软件开发人员只需要写好软件，而性能就等待下次硬件的更新，在2003年之前的几十年里，这种“免费午餐”的模式一直在持续。2003年后，主要由于功耗的原因，这种“免费的午餐”已经不复存在。为了生存，各硬件生产商不得不采用各种方式以提高硬件的计算能力，以下是目前最流行的几种方式是。

（1）让处理器一个周期处理多条指令，这多条指令可相同可不同。如Intel Haswell处理器一个周期可执行4条整数加法指令、2条浮点乘加指令，同时访存和运算指令也可同时执行。

（2）使用向量指令，主要是SIMD和VLIW技术。SIMD技术将处理器一次能够处理的数据位数从字长扩大到128或256位，也就提升了计算能力。

（3）在同一个芯片中集成多个处理单元，根据集成方式的不同，分为多核处理器或多路处理器。多核处理器是如此的重要，以至于现在即使是手机上的嵌入式 ARM处理器都已经是四核或八核。

（4）使用异构处理器，不同的架构设计的处理器具有不同的特点，如X86 处理器为延迟优化，以减少指令的执行延迟为主要设计考量（当然今天的X86 处理器设计中也有许多为吞吐量设计的影子）；如NVIDIA GPU和AMD GPU则为吞吐量设计，以提高整个硬件的吞吐量为主要设计目标。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

人工智能

人工智能

+关注

关注
1791

文章
47339

浏览量
238726
异构处理器

异构处理器

+关注

关注
0

文章
9

浏览量
6450
深度学习

深度学习

+关注

关注
73

文章
5504

浏览量
121217

原文标题：如何加速深度学习？GPU、FPGA还是专用芯片

文章出处：【微信号：mcuworld，微信公众号：嵌入式资讯精选】欢迎添加关注！文章转载请注明出处。

量子计算速度超快，对信息安全构成威胁

量子计算的计算速度远超传统计算机，传统的加密手段在量子计算面前毫无招架之力。

发表于 05-13 09:16 •1552次阅读

中国首个异构计算处理器IP核实现可用于机器学习

日前，中国华夏芯公司宣布，其异构计算处理器IP核已经在硅片上成功实现，并已通过HSA（异构系统架构）一致性测试。公司还宣布了新的机器学习和深层神经网络的开源项目，旨在进一步推动HSA异构计算

发表于 09-01 11:42 •1298次阅读

AMD第七代APU处理器计算速度提升20%

amd的第七代处理器在APU性能上也进行了优化，计算速度与Carrizo相比提升了20%，同时GPU和节能性上分别提升了37%和12%。

发表于 09-07 19:12 •909次阅读

异构众核系统高性能计算架构

随着计算机技术的发展，单核处理器已经难以满足高性能计算的需求，众核处理器成为了一种有效的解决方案。众核处理器是指在一个芯片上集成多个

发表于 11-30 08:27 •759次阅读

浅谈国产异构双核RISC-V+FPGA处理器AG32VF407的优势和应用场景

关于国产异构双核RISC-V+FPGA处理器AG32VF407的具体优势和应用场景浅谈如下: 优势 异构计算能力：异构双核设计结合了RISC-V的高效指令集和FPGA的灵活可编程性

发表于 08-31 08:32

求助：ucos下和linux下 计算速度的问题

linux下低，其计算速度应该比较快，为什么会出现linux下比ucos下计算mac快这么多的情况？是linux下对硬件进行的二次优化吗？

发表于 12-16 09:58

在AM3359 ICE上跑裸机程序，VFP打开后为什么会影响整数的计算速度呢？

您好，我写了一个裸机程序在AM3359 ICE上跑，现在遇到一个很奇怪的问题。①代码中只执行整数运算，VFP无效，计算速度非常快。但若打开VFP，计算速度会下降数十倍。②但另外一种情况，如果代码只

发表于 05-15 01:10

DSP 6748计算速度慢

做了一个DSP C6748+FPGA的电机控制+调制程序，发现6748计算速度慢，会出现程序执行不完的情况（之前用28335做的都没问题）。请教了周围的人，有人说是没有添加“快速运行库” ，具体也不知道，恳请各位前辈来指点迷津，

发表于 05-14 17:01

异构计算在人工智能什么作用？

计算或外设管理等，从而达到性能和成本的最优化。异构计算大厨房里的CPU我们熟知的CPU （中央处理器，Central Processing Unit）作为通用处理器，是更偏重支持控制流

发表于 08-07 08:39

异构计算的前世今生

算系统加速器/协处理器的应用趋势 / TOP5002020年以后，各国的超级计算机计划都定位在了Exascale的百亿亿级别，要想实现目标，要么靠堆核心规模来堆性能，要么就是选择

发表于 12-26 08:00

基于异构并行计算的两个子概念异构和并行的简单分析

异构并行计算包含两个子概念：异构和并行。 1异构是指异构并行计算需要同时

发表于 01-25 16:37 •6610次阅读

异构计算的两大派别为什么需要异构计算？

20世纪80年代，异构计算技术就已经诞生了。所谓的异构，就是CPU、DSP、GPU、ASIC、协处理器、FPGA等各种计算单元、使用不同的类型指令集、不同的体系架构的

发表于 04-28 11:41 •2.3w次阅读

电机选型基础知识第3部分：如何计算速度、加速扭矩和RMS扭矩

电机选型基础知识第 3 部分：如何计算速度、加速扭矩和 RMS 扭矩

发表于 03-09 15:16 •2.4w次阅读

新型全光开关可提高计算机处理器速度

由于电子开关的局限性，传统的计算机处理器几乎已经达到了它们的“时钟速度”（衡量它们可以打开和关闭的速度的指标）。希望改进计算机

发表于 12-25 14:55 •686次阅读

AM625SIP处理器如何透过整合LPDDR4，加快开发速度

电子发烧友网站提供《AM625SIP处理器如何透过整合LPDDR4，加快开发速度.pdf》资料免费下载

发表于 08-28 10:47 •0次下载