0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI时代进一部发展需要的新架构概述

电子工程师 2018-04-14 09:13 次阅读

视觉应用与人工智能AI)正朝着精细化的方向发展,其背后的多种推动力中,最重要的两种是高端智能手机的先进功能以及ADAS(高级驾驶辅助系统)/自动驾驶技术。

智能手机的面部识别功能需要同时调用视觉与AI处理两种技术,而且技术难度不断增加。最难的部分在于非理想状态下的面部识别,如侧脸、戴帽子、部分脸被围巾遮盖等。为此,智能手机的摄像头变得越来越精细,采用多种传感器实现高动态范围图像(HDR)、双摄变焦、图像稳定等功能。

第二个推动力,即ADAS,它的设计需要满足两大需求。第一个是面向特定功能的性能要求,比如行人侦测、驾驶员注意力监控、道路偏离预警;第二个是降低功耗。大多数芯片都安装在空气流通较差的环境(没有风扇),甚至极端温度环境,如前挡风玻璃上后视镜的背面。

还有一些其他驱动因素,如虚拟现实、增强现实、机器人无人机、监控摄像头等技术的发展,它们的需求与上述场景大同小异。

上述功能、视觉和AI技术通常被集成到单独的摄像头管道,从降噪、视觉后处理等任务开始,再到图像分类和分割。有时候,AI需要先完成场景分类,然后再执行HDR或Bokeh焦外成像(模糊处理在日语里被称作 boke)等精细图像处理任务。

总体看来,目前有以下三种技术需求:

将视觉和AI处理集成在单一DSP

提升性能

极低功耗的限制

为了满足这三种技术需求,新一代Tensilica Vision处理器应运而生。

全新Tensilica Vision Q6简介

提高性能,我们考虑了下面几套可选方案:

增加SIMD宽度或VLIW槽的数量。但是这样会增加编程难度,因为很多闲散资源无法有效利用。简单地增加算力比有效地利用算力要简单。

多核。可以立马将可用处理能力提高一倍(或更多),但是需要两倍的本地内存,而且很难做到每个核计算负载的平衡

升频。显而易见的提高性能的方法,但代价是面积(成本)和功耗的增加

打造更高性能的新架构

AI时代进一部发展需要的新架构概述

Cadence决定采取第四种方案。全新Vision Q6 DSP是第五代产品,面向视觉和AI 应用量身打造,采用13级流水线,16nm工艺下可实现1.5GHz处理器频率。较上一代P5,相同版图面积条件下的频率提升达50%。峰值性能的效率提高1.25倍。采用标准图像处理内核时,性能提升可达2倍。

流水线构成如下:

指令前端(3级)

指令解码与分派(2级)

AR/标量整数管道(5标量寄存器/标量流水线)

矢量DSP(3级)

读取和写入会在指令解码一级完成后分别进行。同时,矢量执行和标量执行也分开进行,这样可以提高标量性能,并提供了增加标量cache的机会。该cache可以提高标量处理能力50%,而且存储器速度越慢,cache优势就越明显(与没有cache的情况相比)。

Q6的另一个新特色是添加了一个分支预测。流水线越深,这个功能就越重要,因为一旦错过就必须清空并重新填充流水线。

Q6与P6向上兼容,为P6写的任何代码都可以无需修改在Q6上运行。但是Q6有一些新指令无法在P6上运行。

AI时代进一部发展需要的新架构概述

凭借AXI4互联技术,Q6可以在多处理器环境中运行。用户不仅可以使用多个Q6 核,在VQ6的系统中增加VisionC5来分担AI的处理。

Q6编程

AI时代进一部发展需要的新架构概述

在芯片上设计一大堆高性能处理资源是很容易的,但程序员可能最终无法从高层软件开发中获得这些处理资源。AI采用多种框架,Q6可以实现以下功能:

安卓神经网络:在安卓平台(即非苹果智能机)上实现本地AI应用

TensorFlow、TensorFlow Lite、Caffe

定制层支持:用户可以在标准网络基础上自行添加特殊功能

支持多种标准神经网络(MobileNet、Inception、Resnet、VGG、Segnet、FCN、YOLO、RCNN、SSD等)

安卓神经网络(ANN)相对比较新,去年10月刚刚发布,到现在也就半年的时间。ANN提供的神经网络API可以让开发者无需关注具体AI处理是在应用处理器(通常是高端ARM处理器)还是在专有的AI DSP上执行。。Q6支持运行在安卓8.1系统(Oreo)的ANN,可实现实时的优化执行。右图显示的是ANN各组件的协作方式。作为专用处理器(也可称DSP,术语不同而已)的Q6位于流程的中心

AI时代进一部发展需要的新架构概述

上图中显示的是现有Tensilica AI工具链,也称为XNNC(Xtensa神经网络编译器)。该工具链需要一个神经网络描述符(在Caffe或Tensorflow框架下)将其编译成可以在Q6(或P6、C5)上运行的代码。它可以自动处理许多管理工作,如DMA和tile管理。Tensilica AI处理技术采用8位定点权重,但经过几年的发展,32位浮点和8位定点也能实现同样的精度了(约0.5%量子化误差),其好处就是可以节省大量的功耗和面积。

对于HDR、语音身份认证、图像稳定等特殊算法,Cadence正与相关领域的合作伙伴展开广泛合作。我们还是Khronos公司OpenVX工作组的负责人,推动视觉处理分流标准的开发。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    30350

    浏览量

    268610
  • adas
    +关注

    关注

    309

    文章

    2173

    浏览量

    208549

原文标题:新的AI时代需要新架构:Tensilica Vision Q6

文章出处:【微信号:gh_fca7f1c2678a,微信公众号:Cadence楷登】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    未来AI大模型的发展趋势

    上得到了显著提升。未来,算法和架构进一步优化将推动AI大模型在性能上实现新的突破。 多头自注意力机制、前馈神经网络等关键技术的改进,将增强模型的表达能力和泛化能力。 多模态融合 : AI
    的头像 发表于 10-23 15:06 478次阅读

    【「大模型时代的基础架构」阅读体验】+ 第、二章学习感受

    今天阅读了《大模型时代的基础架构》前两章,还是比较轻松舒适的;再就是本书知识和我的工作领域没有任何关联,切都是新鲜的,似乎每读页都会有所收获,这种快乐的学习过程感觉也挺不错的。 第
    发表于 10-10 10:36

    【「大模型时代的基础架构」阅读体验】+ 未知领域的感受

    国庆前就收到《大模型时代的基础架构书,感谢电子发烧友论坛。欢度国庆之余,今天才静下心来体验此书,书不厚,200余页,彩色图例,印刷精美! 当初申请此书,主要是看到副标题“大模型算力中心建设指南
    发表于 10-08 10:40

    开启全新AI时代 智能嵌入式系统快速发展——“第六届国产嵌入式操作系统技术与产业发展论坛”圆满结束

    计算机学院牛建伟教授主持。 中科院软件所副所长、总工程师,武延军研究员做了“AI大模型时代下的操作系统发展思考”主题演讲。 武延军介绍了操作系统的发展历程,指出应用的高速
    发表于 08-30 17:24

    大模型时代的算力需求

    现在AI已进入大模型时代,各企业都争相部署大模型,但如何保证大模型的算力,以及相关的稳定性和性能,是个极为重要的问题,带着这个极为重要的问题,我需要在此书中找到答案。
    发表于 08-20 09:04

    平衡创新与伦理:AI时代的隐私保护和算法公平

    在人工智能技术飞速发展的今天,它不仅带来了前所未有的便利和效率,也暴露出了系列伦理和隐私问题。从数据隐私侵犯到“信息茧房”的形成,再到“大数据杀熟”、AI歧视和深度伪造技术的威胁,AI
    发表于 07-16 15:07

    精益生产的创新发展需要哪些数字化技能?

    随着科技的飞速发展,数字化转型已成为企业不可逆转的趋势。在这个背景下,精益生产作为提高生产效率、降低成本的重要手段,也迎来了创新发展的新时期。那么,精益生产的创新发展需要哪些数字化技能呢?本文将带您
    的头像 发表于 07-03 10:11 285次阅读

    移动通信产业,需要通往AI时代的“波托兰海图”

    加速5G-A发展,开启移动AI时代
    的头像 发表于 06-27 10:42 3457次阅读
    移动通信产业,<b class='flag-5'>需要</b>通往<b class='flag-5'>AI</b><b class='flag-5'>时代</b>的“波托兰海图”

    EPSON(爱普生)获得高频输出的方法(第一部:锁相环电路)

    EPSON(爱普生)获得高频输出的方法(第一部:锁相环电路)
    的头像 发表于 06-20 10:42 447次阅读
    EPSON(爱普生)获得高频输出的方法(第<b class='flag-5'>一部</b>:锁相环电路)

    进一步解读英伟达 Blackwell 架构、NVlink及GB200 超级芯片

    新的标准。Blackwell架构和GB200 超级芯片有望推动英伟达在人工智能领域更进一步,巩固其在高性能计算和人工智能技术领域的领先地位。随着亚马逊网络服务、谷歌云和微软 Azure 等公司开始整合这些新系统,英伟达创新的影响将进一
    发表于 05-13 17:16

    芯盾时代深度参编的行业标准《总体架构》即将施行

    近日,工信部发布公告,芯盾时代深度参与编写的行业标准:YD/T 4598.1-2024《面向云计算的零信任体系 第1分:总体架构》(以下简称《总体
    的头像 发表于 04-29 14:30 346次阅读
    芯盾<b class='flag-5'>时代</b>深度参编的行业标准《总体<b class='flag-5'>架构</b>》即将施行

    risc-v多核芯片在AI方面的应用

    在极低的能耗下实现高效的AI元器件的运行。这对于需要长时间运行和依赖电池供电的AI设备来说尤为重要。 其次,RISC-V的模块化架构允许其不同部分以模块化的方式串在
    发表于 04-28 09:20

    解锁AI时代的利器——讯飞AI鼠标AM30助你在AI时代脱颖

    AI鼠标AM30就是你在AI时代的利器,它凭借其出色的功能和特点,助你在激烈的竞争中脱颖而出。 讯飞AI鼠标AM30搭载了星火认知大模型AI
    的头像 发表于 03-25 13:37 532次阅读
    解锁<b class='flag-5'>AI</b><b class='flag-5'>时代</b>的利器——讯飞<b class='flag-5'>AI</b>鼠标AM30助你在<b class='flag-5'>AI</b><b class='flag-5'>时代</b>脱颖

    AI时代怎么样不被淘汰?讯飞AI鼠标助力你在AI时代成长

    AI时代怎么样不被淘汰?讯飞AI鼠标助力你在AI时代成长 随着人工智能的发展
    的头像 发表于 03-23 11:41 670次阅读
    <b class='flag-5'>AI</b><b class='flag-5'>时代</b>怎么样不被淘汰?讯飞<b class='flag-5'>AI</b>鼠标助力你在<b class='flag-5'>AI</b><b class='flag-5'>时代</b>成长

    AI ready是什么?文明的发展需要做好准备

    从古至今,时代的进步都依靠工业的发展,四次工业革命,让全世界进入了新时代。现如今,互联网科技发展速度飞快,AI大模型
    的头像 发表于 01-17 10:19 576次阅读
    <b class='flag-5'>AI</b> ready是什么?文明的<b class='flag-5'>发展需要</b>做好准备