人工智能(AI)的发展已达60余年,涉及范围非常广泛,拥有比一般科技领域更复杂、更丰富的内涵。现阶段人工智能技术研究将围绕算法、框架软件、芯片三个方面。未来十年是人工智能产业发展的重要时期,也是人工智能芯片技术突破的关键时期,远期人工智能技术的发展路径将会沿着算法、算力两条主线向前发展,并逐步带领人类进入到人机协同时代。发展人工智能的最终目标并不是要替代人类智能,而是要与人类智能形成互补,使得人类从繁重的重复性工作中解放出来,从而专注于推动人类自身文明的进步。
一、我国发展人工智能面临三方面挑战
我国发展人工智能当前面临的挑战主要在AI算法、AI框架软件及AI芯片三个方面,详细论述如下。
(一)AI算法
人工智能技术常见的算法技术有决策树、随机森林、逻辑回归、支持向量机、朴素贝叶斯算法等,国内各大高校团队一直有深入研究,但是在科研成果转化领域一直发展缓慢,难点在于如何将算法和实际工程应用结合,实现技术向生产力的转化。目前以华为、阿里、腾讯等公司主导的技术研发团队,将自身应用和算法技术结合,从产业领域实现算法的技术成果转化。
底层数学库的研究一直属于冷门行业,一方面因为技术成果转化不易,另一方面因为研究领域狭窄,国内仅有少数科研团队专注于此。企业领域,主要是尝试从底层硬件开发角度,通过优化数学库实现硬件效率最优化的方式进行研究,如美国NVIDIA公司开发了cuDNN的深度学习库,是专门针对其CUDA GPU的优化,但是并没有对大规模机器学习场景中分布式并行的支持。美国IBM (PML)和Intel (DistML)在前些年均开发了机器学习/深度学习相关框架、库和工具集,但均限内部使用或者是简单版本的开源。Databricks公司以Spark为核心开发支持机群学习相关的库。基于开源软件Caffe扩展了基于MPI的分布式并行实现。从面向市场的产品角度看,这些目前还处于研制阶段,性能和稳定性改善空间潜力巨大。
算法领域的技术突破,我国科研机构和企业的关注点是不一样的。科研领域针对目前的已有算法进行深度优化,实现更好的处理效果,或者另辟蹊径,对原有算法进行脱胎换骨。而企业则更多立足于产业发展需要,将成熟的算法应用到实际的工程项目中,实现人工智能产业化。
(二)AI框架软件
国内的AI框架软件逐渐起步,也开始拥抱开源,并正在培育自己的生态环境。框架软件是人工智能生态中最重要的因素之一,我国需要促进国产自研框架软件的发展和推广,摆脱国外的软件生态标准制约。国产AI框架软件需要和国产AI芯片及硬件进行相互适配、性能优化和应用推广,能够形成面向行业应用的软硬件一体化平台,促进这种融合技术在各行业的产业推广。
1.AI框架软件
AI框架软件是相关算法、库、工具的集合。AI框架软件的出现降低了使用门槛,开发人员借助计算框架,不需要从复杂的神经网络开始编写代码,可以依据需要,使用已有的模型,快速实现应用。框架软件提供了一系列的机器学习、深度学习组件,其中,通用的AI算法已集成实现,若需要使用新的算法可根据自己的需求去定义,然后调用深度学习框架的函数接口使用户自定义的新算法。随着这些开源框架在全球范围内的广泛使用,互联网巨头开始逐渐掌控了人工智能的应用生态,形成了几乎所有的AI芯片、系统、平台都需要与这些主流框架适配的局面。AI算法的生产与程序生产不同,是一个系统工程,需要能够协同优化数据、算法、算力的平台级产品。深度学习对算力有较高需求,因此相继出现了一些专门的计算框架软件和平台,如谷歌的TensorFlow、伯克利大学的Caffe、Facebook的PyTorch(基于Torch推出)、微软的CNTK、亚马逊的MXNet、百度的PaddlePaddle等。
2.国内AI框架软件主要研发厂商
国内人工智能产业也是大面积采用国外研发的这些框架软件,自研的AI框架软件相对比较小众,主要集中在从事AI算法研究比较早的几个公司内部使用,但是随着技术进步,逐渐开始进入实用环节,并开源发布。国内比较知名的几个框架软件的情况如下。
百度飞桨PaddlePaddle:是国内开发较为完善的AI计算框架,是集深度学习核心框架、基础模型库、端到端开发套件、工具组件和服务平台于一体的开源深度学习平台。目前百度有超过30个主要产品都在使用 PaddlePaddle,从市场接受程度判断,目前还处于起步阶段,使用群体相对较少,还需要加大研发投入和市场培养。
旷视Brain++:拥有自主研发深度学习框架,自主研发的AI算法平台Brain++作为统一的底层架构,为算法训练及模型改进过程提供重要支持。在算法开发方面,旷视自研开源深度学习框架MegEngine(Brain++核心组件之一),Brain++帮助旷视构建了一条不断自我改进、不断更加自动化的算法生产线,并能够针对不同垂直领域的碎片化需求定制丰富且不断增长的算法组合。
商汤Parrots:是一个训练框架,核心是一个动态的编译与调度引擎,商汤Parrots采用动态实时编译技术,所有代码都是在运行过程当中即时编译,并且放到计算芯片或引擎上大规模地并行执行。具备了传统静态深度网络的伸缩性,以及当代动态编程模型的灵活性,达到了这两者的最佳结合。
华为MindSpore:计算框架已经正式开源。MindSpore原生适应每个场景包括端、边缘和云。通过MindSpore自身的技术创新及MindSpore与华为昇腾AI芯片的协同优化,实现运行态的高效,大大提高了计算性能。
(三)AI芯片
早在上世纪80年代,学术界就提出了相当完善的AI算法模型,但直到近些年,模型的内在价值也没有被真正实现过,这主要是受限于硬件水平难以提供可以支撑深度神经网络训练/推理过程所需要的算力。AI芯片的出现显著提高了数据处理速度,尤其在处理海量数据时明显优于传统CPU。一般将AI芯片定义为“专门针对AI算法做了特殊加速设计的芯片”,根据技术体系结构,主要分为GPU、FPGA、ASIC和类脑芯片四大类。AI芯片在边缘计算中是提供算力的灵魂和大脑,承载了为各种终端提供强大算力的重要任务,直到近年,GPU、FPGA、ASIC等AI芯片被投入到相关领域应用,才解决了算力不足的问题。
1.基于技术架构分类的AI芯片
(1)GPU
GPU(Graphics Processing Unit,图形处理器),是利用处理图形任务的图形处理器来计算原本由中央处理器处理的通用计算任务。GPU经过多年的生态发展,已经对机器学习、深度学习类应用具有良好的兼容性,通用性强、精度支持灵活、性能出众。GPU面对的则是类型高度统一的、相互无依赖的大规模数据和不需要被打断的纯净的计算环境。GPU的关键性能是并行计算,主流的GPU具有强大的计算能力和内存带宽,无论性能还是内存带宽,均远大于同代的CPU。CPU 由专为顺序串行处理而优化的几个核心组成,而 GPU 则拥有一个由数以千计的更小、更高效的核心(专为同时处理多重任务而设计)组成的大规模并行计算架构。同时CPU相当一部分时间在执行外设的中断、进程的切换等任务,而GPU有更多的时间并行计算。
(2)FPGA
FPGA(Field Programma-ble Gate Array,现场可编程门阵列),作为一种半定制电路,含有数字管理模块、内嵌式单元、输出单元以及输入单元等,对于特定运算,可以通过编程重组电路,直接生成专用电路,用户可以通过 FPGA 配置文件来实现应用场景的高度定制,可同时进行数据并行和任务并行计算,进而实现高性能、低功耗。FPGA一次性成本远低于ASIC,在芯片需求还未成规模、深度学习算法暂未稳定,仍需不断迭代改进的情况下,利用FPGA具有可重构的特性来实现半定制的AI芯片是最佳选择之一。FPGA可以面向前端推理场景灵活设定功能,目前在人工智能推理市场应用广泛。
(3)ASIC
ASIC(Application Specific Integrated Circuits,专用集成电路),是指应特定用户要求和特定电子系统的需要而设计、制造的集成电路。ASIC芯片可以面向一些成熟或特定的深度学习算法,定制电路和专用指令集,使效率和能效比达到最优。当前ASIC芯片主要面向人工智能推理应用场景。针对特定用户场景使用FPGA 进行研发,当算法成熟、芯片设计固定后再以ASIC 的方式进行大规模生产,针对适用应用场景,ASIC的性能和能耗都要优于市场上的现有芯片,包括 FPGA 和 GPU。
TPU(张量处理单元,Tensor Processing Units),是一种定制化的ASIC芯片,TPU的单片存储器容量是NVIDIA K80 GPU的3.5倍,但是它的体积相对更小。谷歌TPU已为谷歌的主要产品提供了计算支持,第一代 TPU 仅能用于推理,而目前发布的 TPU2.0 既可以用于推理,又可以用于训练神经网络。
(4)类脑芯片
类脑芯片(Brain-Inspired Chip),可模拟人类大脑信息处理方式,能以极低的功耗对信息进行异步、并行、低速和分布式处理,并具备自主感知、识别和学习等多种能力,使之能够在推理、决策、记忆等方面达到类人智能水平。类脑芯片把数字处理器当作神经元,把内存作为突触,跟传统冯诺依曼结构不一样,它的内存、CPU和通信部件是完全集成在一起。因此信息的处理完全在本地进行,而且由于本地处理的数据量并不大,传统计算机内存与CPU之间的瓶颈不复存在。
类脑智能借鉴大脑中“内存与计算单元合一”等信息处理的基本规律,在硬件实现与软件算法等多个层面,对于现有的计算体系与系统做出本质的变革,并实现在计算能耗、计算能力与计算效率等方面的大幅改进。IBM已经开始进行颠覆冯·诺依曼体系结构的类脑智能算法与技术的探索,并已成功研制出TrueNorth芯片。
2.AI芯片特征对照及国内外主要研制厂商
不同类型的芯片在通用性、应用兼容性、编程难度、性能、能效比等方面具有各自的优缺点,适用于训练、推理等不同的应用场景。不同类型AI芯片的特征和优缺点如表1所示。
表1 不同类型AI芯片的特征和优缺点
当前,AI芯片的核心技术和市场被美国厂商垄断,虽然国内一些厂商也在进行AI芯片研制,但无论是技术成熟度还是市场占有率等方面,与国际巨头的差距仍然非常明显。AI芯片国内外主要研制厂商如表2所示。
表2 AI芯片国内外主要研制厂商
GPU:凭借GPU在当前人工智能市场的主导地位,NVIDIA在AI芯片市场一家独大。AMD新发布的GPU产品已经实现了对主流AI框架软件的良好支持,上升势头明显。Intel也正在进行GPU研发。在国内,目前海光公司正在按进度推进类GPU(DPU)芯片研制,目前已经取得阶段性进展。
FPGA:市场份额排名第二的AI芯片FPGA,当前完全被美国的两家公司Xilinx和Intel(收购的Altera)所垄断,全球市场占有率达90%。目前国内从事FPGA芯片研发的厂商有紫光同创(Titan)、复旦微电子等企业,其FPGA产品相比美国厂商落后一代,且产品性能只能达到国外品牌上一代同系列产品的中高端水平,尚不具备可抗衡实力。
ASIC:国内多采用ASIC芯片架构进行创新,ASIC芯片相比国外厂商差距相对较小,特别是在芯片本身的性能和能效比方面,而在高性能 GPU 和 FPGA 芯片领域研发相对滞后。如寒武纪等的ASIC芯片已形成了量产产品。但相比国外巨头仍然存在一些先天差距,如Google研制的TPU,可以和自己研发并开源的主流深度学习框架Tensor Flow进行深入整合和优化,有软件生态的加持,将具有更好的生存优势。
二、我国发展人工智能的三个建议
(一)打造我国人工智能软硬件产业生态
PC时代的Wintel体系(微软+Intel),以及移动终端时代的AA体系(ARM + Android),都是通过打造完整的产业生态来把控产业的主导权,并且处于绝对的行业垄断地位。人工智能产业属于新型领域,目前尚未形成绝对主导的技术路径依赖,产业生态也没有形成绝对的壁垒,软硬件协同优化已成为提升技术的主要手段,单纯的数据与算法优化已不能满足产业发展需求。
面对这一发展契机,我国应强化人工智能产业发展顶层设计,加强人工智能软硬件协同布局,如,鼓励百度飞桨Paddle Paddle、旷视、商汤Parrots、华为Mind Spore等软件框架企业,与寒武纪(MLU)、华为(昇腾)、阿里(含光)、中星微(NPU)、比特大陆(算丰)、地平线、百度(昆仑)、海光(DPU)、紫光同创(Titan)、复旦微电子等AI芯片企业强强联合,重点布局我国自主知识产权的“框架软件+AI芯片”的人工智能生态体系,力争五年内在人工智能领域占据主导优势。
(二)采取全面布局、分步突破的芯片发展路径
AI芯片的核心技术和市场均处于被美国厂商垄断的状态,虽然国内一些厂商也在进行AI芯片研制,但无论是技术成熟度还是市场占有率方面,与国际巨头的差距仍然非常明显。目前来看我国GPU及FPGA基本完全依赖进口。GPU方面全球70%的市场都被NVIDIA占据。FPGA呈现寡头垄断的竞争格局,美国两家公司Xilinx和Intel(收购的Altera)所垄断,全球市场占有率达到90%。三款AI芯片总体来看,ASIC国产化程度相对较好。
因此,现阶段针对我国AI芯片的现实情况,可采取全面布局、分步突破的发展路径,近期重点突破专用芯片ASIC,远期依次突破GPU、FPGA等通用芯片。由于ASIC专用性较强,不同厂商往往会根据特定的应用场景需求进行有针对性的研发,而GPU、FPGA等通用芯片由于目前国外有较为成熟的标准化产品,国内厂商自主研发或国产化替代的意愿并不强烈。因此从产业布局角度来看,政府应加大力度助力有条件有意愿的企业,在GPU、FPGA等通用芯片研制方面投入精力实现分步突破。
(三)加强类脑芯片等前沿领域的布局
类脑芯片研发领域属于前瞻性领域,目前企业在此方面并不会过多涉及,因此应充分发挥国内高校以及科研院所力量进行充分布局。目前,IBM研制的TrueNorth芯片作为类脑计算领域的突破性进展,极大地推进了人工智能的发展,但类脑计算仍存在很大的发展空间。随着存储、逻辑、传感技术的改进,将来类脑计算芯片有望达到更低能耗、更紧凑结构和更快速度。
我国针对类脑芯片的研究尚处于理论阶段,国际龙头企业还没有形成明确的技术及知识产权壁垒,因此全球科技产业巨头都在积极推动人工智能技术生态的研发布局,全力抢占人工智能产业的制高点和话语权。
三、结语
人们对人工智能的期望,绝不仅用来解决狭窄的、特定领域的某个简单具体的小任务,而是期望能够真正像人类一样,解决不同领域、不同类型的复杂问题,并进行判断和决策。
发展人工智能的终极目标也不是要替代人类智能,而是要与人类智能形成优势互补,帮助人类处理许多虽然能够处理但效率不够高的工作,使得人类从繁重的重复性工作中解放出来,从而专注于推动人类自身文明的进步。
评论
查看更多