0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

算力、功耗还是架构?四位大咖纵论终端AI的四大挑战

章鹰观察 来源:电子发烧友原创 作者:章鹰 2019-05-14 10:37 次阅读

本站原创,作者:章鹰,电子发烧友执行副主编。

2019年,AI市场风起云涌,一方面不少独角兽公司融资不断扩大,比如2月27日地平线 (Horizon Robotics) 宣布完成由SK中国、SKHynix以及数家中国一线汽车集团 (与旗下基金) 联合领投的B轮融资,获得6亿美金左右的投资,又比如5月8日,旷视科技完成D轮融资,融资额达到7.5亿美元,在热门的边缘计算、视觉领域的前沿研究获得充足的资金支持。

另外一方面,市场对人工智能的期望恢复理性,国内厂商开始进入落地应用阶段。核心AI能力不断扩展,寒武纪在苏州举办的全球智博会上,展示了14个应用案例,寒武纪AI芯片,比如MLU100芯片已经在阿里云城市大脑提供算力支持,寒武纪的AI芯片在智能手机领域的应用呈现扩大之势,此外,在教育行业、智能制造和工业、服务器领域,这家公司都带来了实质性的落地项目。

IDC高级新兴技术研究部高级研究经理卢言霞向记者表示,近五年来,中国AI市场成就斐然,2018年中国软件市场占据全球软件市场规模的3.1%,中国人工智能软件市场占据全球的15.4%,未来还有更大的增长空间。终端AI俨然是落地应用中的重要支持点。

对于终端AI市场,市场有哪些痛点呢?笔者整理了四位大咖的观点,与工程师和电子领域的高管分享。

终端AI应用量最大,算力和功耗是两大难题

图:清华大学微纳电子学系主任魏少军

4月9日,清华大学微纳电子学系主任魏少军在人工智能创新峰会上表示,从应用需求端来看,我们发现应用量最大的并不在云端,而是在终端,ARM公司的专家把人工智能分成“大机器学习”、“中机器学习”和“小机器学习”,三者之间在数量上依次有二次方的增加,从108、1010再到1012。但当AI服务从云端走向终端时,要克服的困难远远比在云端大得多。

在边缘上,资源和功耗都是受限的,而要解决AI问题,算力仍然需要那么大。换句话说,算力需求没变,但资源不足,难度自然变大。这里面涉及两个关键问题,一个是算力本身,一个是功耗。

在智能系统中,最重要的功能是实现智能化,软件承载了智能化的理念和方法,而硬件只是承载智能化所需要的计算。如果能把两者有机融合在一起,让硬件在任何时候都能提供软件运行所需的最佳计算效率,就能够得到我们所需的理想计算模式。

持续创新!推出性能功耗比好的终端AI产品,抢占市场先机

图:寒武纪创始人陈天石

寒武纪是国际上最早从事AI芯片研发的团队之一,研发的终端智能处理器已经运行在数千万的终端设备中,研发的云端智能芯片为云端大规模智能处理提供了高性能和高性价比的芯片方案,推动人工智能计算力突破和提升。

陈天石描述寒武纪公司的战略目标:“3年内占领10亿智能AI终端,占领中国云端高性能芯片1/3市场份额”。在市场策略层面,如何与英伟达竞争,陈天石告诉媒体:“提供性能功耗比更好的芯片。这个市场很大,其实未见得是零和博弈。”

早在2016年,寒武纪就研发了全球第一款商用终端AI处理器,早于国外同行两年,寒武纪的1A处理器是世界上首款智能终端处理器IP产品。第一代1A已经在四款华为手机中使用。

第二款寒武纪的IP 1H是第二代高性能、低功耗的智能终端IP产品,在2017年11月公开发布,这款处理器带来了深度学习处理速度的提升和功耗的降低,在寒武纪1H带来了AI算力的大幅提升,使能和增强人脸识别、物体识别、物体检测、图像分割、智能翻译等AI场景,实现了从图像识别到物体检测的跨越。在苏黎世联邦理工学院的AI Benchmark测试中,搭载麒麟980(集成寒武纪1H)的华为Mate 20 Pro、Mate 20 X和Mate 20,超过了搭载麒麟970的华为P20 Pro,排在了榜首。

2018年5月,寒武纪正式发布了多个最新一代终端 IP 产品——采用 7nm工艺的终端芯片Cambricon 1M、首款云端智能芯片MLU100及搭载了MLU100的云端智能处理计算卡。

寒武纪创始人陈天石博士对公司的定位是,独立芯片公司,服务广大云计算、大数据、服务器厂商、互联网公司和行业巨头,为下游厂商提供不同尺寸、面向不同应用场景的终端AI处理器Ip以及覆盖interference和training的不同处理能力的云端智能芯片。随着华为智能手机在全球市场份额的不断提升,寒武纪在终端AI芯片市场的认可度也不断提升。

物联网应用中,如何实现无处不在的AI应用?

图:清华大学微纳电子系副主任尹首一教授

智能终端的AI计算成为趋势。考虑通讯延时、基于硬件设备、个人隐私考虑,我们需要在终端设备、传感器,各种设备端上实现AI计算。这已经成为电子行业的巨头共识,百分之九十以上的物联网设备上使用CPU是arm公司提供的内核,Google首席科学家在全球半导体大会上报告上说,Google认为,IoT景下,未来AI计算一定是分布式、分层次、分等级的综合系统。

要满足各种场景下AI计算的需求,需要考虑算力和功耗问题的平衡。例如智能手机对语音技术的应用,智能家电中有严苛的功耗约束,因而要在功耗受限场景下实现AI算法和运算就成为关键。

算力与场景结合,联发科在终端AI运用领域不断突破

联发科技副总经理暨家庭娱乐事业群总经理游人杰表示,人工智能的崛起与以往不同,人工智能进入第三次革命,需要三种关键因素的配合:第一、物联网产生的大数据,第二、各种应用层应用多元化,尤其在2012年,Deep Learning新的演算法开发出来后,运算能力、精确率和收敛速度有了很大突破。不仅在云端,或者在终端,能力够强。第三、算力(computation)的不断提升。

目前,联发科的芯片方案已经占据了智能音箱垂直市场份额的60%-70%,大幅度领先竞争对手。联发科的优势是将智能音箱方案拥有更高的硬件整合度。把第一代IC周边电子元器件、电路等全部集成在第二代IC中,同时在软件层面开发更智能的工具Power AQ,可通过Power AQ有效调整智能音箱的音质,加速硬件厂商把产品推向市场。

2019年4月18日,联发科技发布AIoT平台, 包含拥有高集成度和高端APU性能的i300和i500系列处理器芯片,为业界提供面向智能家居、智慧城市和智能工厂三大领域的解决方案,助力人工智能技术和物联网技术的落地融合。

最早,联发科看到了人工智能在移动手机的应用商机,自2018年初起,就推出了NeuroPilot的技术,并将之首次运用在其手机处理平台曦力P60上。NeuroPilot是基于他们的核心监控与调节技术CorePilot的进阶版。CorePilot在2014年就已经被开发出来,其主要作用就是动态监控手机多核处理器的每个核心的工作负载量,并加调节和分配,以提高手机运行的性能并降低电耗。

i500高性能解决方案则是基于强大的计算能力, 结合联发科技的人工智能平台NeuroPilot,搭配低时延的边缘AI处理技术,提供精准的人脸、行为和环境识别分析,大幅度提升准确度、生产效率和智能化水平。

游人杰指出,对于不同的芯片公司,最大的区别就是运算能力的差别。运算的处理能力在晶片里面是三个单元结合起来,我们称之为联合运算能力。CPU+GPU +Deep Learning加速器 ,联发科内部做到CPU八核,CPU的运算好处是可以透过软件的规划,让演算方法在开发的过程中拥有最大的弹性。GPU的运算能力,在人工智能的开发过程中,同时具备高的处理速度,还能提供中等的弹性度。第三、当你的演算方法做到比较成熟后,晶片运算功率做到更低,还需要做AI的Processing,做Deep Learning加速器或者是做视觉影像的处理器,能够让演算法找到最低的功耗处理。

小结

终端AI的进程在不断加速,随着寒武纪、MTK、耐能等国内国际厂商不断推出新品,未来在未联网应用的细分市场,会逐步诞生应用的前三甲企业,在无人机、智能家居、智能硬件、智能手机都是AI未来应用增长点,企业必须研究好消费者需求的转变,在技术能力和市场需求结合的契合度上下大功夫,在算力提升、功耗降低和运算架构支持多元应用不断拓展,才能领先海外厂商,抢占市场的先机。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • MTK
    MTK
    +关注

    关注

    2

    文章

    178

    浏览量

    48168
  • 寒武纪
    +关注

    关注

    11

    文章

    185

    浏览量

    73848
  • AI芯片
    +关注

    关注

    17

    文章

    1852

    浏览量

    34874
收藏 人收藏

    评论

    相关推荐

    企业AI租赁是什么

    企业AI租赁是指企业通过互联网向专业的提供商租用所需的计算资源,以满足其AI应用的需求。
    的头像 发表于 11-14 09:30 79次阅读

    亿铸科技熊大鹏探讨AI芯片的挑战与解决策略

    在SEMiBAY2024《HBM与存储器技术与应用论坛》上,亿铸科技的创始人、董事长兼CEO熊大鹏博士发表了题为《超越极限:大芯片的技术挑战与解决之道》的演讲,深入剖析了AI大模型
    的头像 发表于 10-25 11:52 307次阅读

    一体架构创新助力国产大AI芯片腾飞

    在湾芯展SEMiBAY2024《AI芯片与高性能计算(HPC)应用论坛》上,亿铸科技高级副总裁徐芳发表了题为《存一体架构创新助力国产大
    的头像 发表于 10-23 14:48 214次阅读

    芯片 高性能 CPU/GPU/NPU 微架构分析》第1-4章阅读心得——之巅:从基准测试到CPU微架构的深度探索

    ,还优化了能效比,使天河二号在Green500榜单上也表现出色。另一方面,MLPerf的出现标志着AI时代对需求的变化。它涵盖了图像分类、目标检测、自然语言理解、智能推荐算法、强化学习等多个
    发表于 10-19 01:21

    一文读懂中心四大类型,深度解读应用与趋势

    强大计算能力的核心设施,在推动科技创新、产业升级和社会发展中扮演着不可或缺的角色。本文将详细解析中心的四大类型,并探讨它们的最新发展与应用。一、通用
    的头像 发表于 10-17 08:05 415次阅读
    一文读懂<b class='flag-5'>算</b><b class='flag-5'>力</b>中心<b class='flag-5'>四大</b>类型,深度解读应用与趋势

    【「芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】--全书概览

    、GPU、NPU,给我们剖析了芯片的微架构。书中有对芯片方案商处理器的讲解,理论联系实际,使读者能更好理解芯片。 全书共11章,
    发表于 10-15 22:08

    青云科技强化AI架构,升级产品与服务体系

    10月9日,青云科技正式揭晓了其升级版的产品与服务阵容、行业及场景定制化解决方案,以及全新的生态战略。该公司旨在通过AI平台、AI
    的头像 发表于 10-10 16:42 413次阅读

    名单公布!【书籍评测活动NO.43】 芯片 | 高性能 CPU/GPU/NPU 微架构分析

    社会资源和资本力量关注芯片的发展,希望我们的国家能够更独立自主地设计制造高性能芯片。 内容简介: 本书介绍了超级计算机
    发表于 09-02 10:09

    大模型时代的需求

    现在AI已进入大模型时代,各企业都争相部署大模型,但如何保证大模型的,以及相关的稳定性和性能,是一个极为重要的问题,带着这个极为重要的问题,我需要在此书中找到答案。
    发表于 08-20 09:04

    AI网络发展的四大核心技术支柱

    AI大模型时代,随着模型参数量与训练集规模的爆炸性增长,单纯依赖GPU单体的提升已难以满足需求,业界焦点逐渐转向系统架构层面的革新,其中,作为底层核心技术的网络成为了突破的关键。
    的头像 发表于 08-14 17:11 899次阅读

    探秘四大主流芯片架构:谁将主宰未来科技?

    在科技日新月异的今天,芯片作为现代电子设备的心脏,其架构的选择与设计显得尤为重要。目前市场上主流的芯片架构种:X86、ARM、RISC-V和MIPS。它们各具特色,广泛应用于各种电子设备中。本文将详细剖析这
    的头像 发表于 07-31 11:15 2121次阅读
    探秘<b class='flag-5'>四大</b>主流芯片<b class='flag-5'>架构</b>:谁将主宰未来科技?

    半和四位半万用表的区别

    半和四位半万用表是电子测量领域中常用的两种数字万用表,它们在测量精度、显示方式、应用范围等方面存在一定的差异。本文将从多个方面详细分析这两种万用表的区别。 一、基本概念 三半万用表 三
    的头像 发表于 07-14 14:23 4564次阅读

    MES实施的四大疑惑

    电子发烧友网站提供《MES实施的四大疑惑.docx》资料免费下载
    发表于 03-01 15:35 0次下载

    中科曙光服务年度盘点 四大关键词

    总结为以下个关键词。 聚焦 —  曙光服务紧跟市场趋势,积极参与信通院新一代网技术创新联盟、首批可信
    的头像 发表于 01-04 10:34 567次阅读

    浅谈为AI而生的存-体芯片

    大模型爆火之后,存一体获得了更多的关注与机会,其原因之一是因为存一体芯片的裸相比传统架构AI
    发表于 12-06 15:00 360次阅读
    浅谈为<b class='flag-5'>AI</b>大<b class='flag-5'>算</b><b class='flag-5'>力</b>而生的存<b class='flag-5'>算</b>-体芯片