0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

如何在手持设备上安装庞大的transformer网络

CEVA 来源:CEVA 2023-10-11 14:37 次阅读

Siri和OK Google是最早实现语音控制的应用程序,这着实为我们带来了很多乐趣;但很快我们便意识到,必须仔细说出请求才能获得实用回答。

就现在所见,ChatGPT理解程度高,使用起来更容易,但直到最近,其功能还仅限于通过基于云的应用程序进行文本互动。现如今,ChatGPT是大势所趋,手机几乎人人必备,促使着针对ChatGPT(手机版)的transformer网络尽快推出,让每个拥有手机的人都能感受到大语言模型的威力。

在此方面面临的一个明显挑战是,我们所知的 ChatGPT依赖于数万亿个参数。而这种规模的transformer网络只能在云端运行。有人建议采用混合模式,即先由手机或其他应用程序负责完成部分简单工作,再连接到云端进行更为繁重的推理。然而,普通手机用户可能无法接受混合解决方案与生俱来的长时间延迟和隐私风险问题。因此,更好的方法是,直接在手机上处理大部分或全部transformer网络工作,只在需要时将偶尔出现的匿名搜索请求转至云端处理。

缩减网络大小

如何在手持设备上安装庞大的transformer网络?Google DeepMind在检索transformer方面取得了重大突破。其RETRO transformer网络运行时的大小只有 LLM transformer的百分之几,因为前者的模型参数中不包含具体数据。只保留了基本的语言对话技能,但在理解水平上仍可与GPT3相媲美。如此将网络大小缩减到了约80亿个参数。

CEVA在预处理时进一步缩减此网络大小,将对感兴趣领域提示的准确度几乎没有影响的参数归零,进行再训练。仔细利用这一功能可以大大加快transformer网络分析的速度。

准备边缘模型的第二步是压缩,CEVA对此非常熟悉,并在支持检索transformer方面做得更好。我们充分利用NeuPro-M架构进行再训练,大力推进此步骤,促使广泛的混合定点精度和低精度选项降到4位,未来甚至还能降到2位。

通过使用这些技术,我们可以将现有检索transformer压缩至最低1/20(较现在而言),尽管其相较LLM而言已经压缩了很多。将这种压缩剪枝应用于RETRO模型缩减后,可以产生巨大缩减,将万亿参数模型转换为十亿参数模型,进而有望实现ChatGPT(移动版)。

NeuPro-M AI核心

当然,仅仅适合的transformer网络是不够的。它还需要运行得足够快,才能满足用户对响应时间的期望。而这一点可以通过专为LLM应用程序优化的NeuPro-M NPU IP多引擎架构实现。在此流程中,首先要做到的是由真正的稀疏引擎来进行管理,且这一步举足轻重。稀疏引擎管理可跳过权重或数据为零的冗余操作,提高吞吐量,这是需要注意的一点。而在预处理时缩减之后,会出现大量归零参数,尽管这些参数分布不均匀。对于这种非结构化稀疏引擎,每个NeuPro-M处理器内核中的专用稀疏引擎可发挥4倍性能优势(与传统稀疏引擎相比),并相应地降低功耗。

鉴于transformer架构可以分解为可并行实现的离散正交运算,下一优化应运而生。此时,可以利用 NeuPro-M多核架构支持多达8个内核。transformer中 query、key和value三个向量的计算会在引擎中分批进行,在共享公共二级缓存的多个内核并行处理。并行处理不仅有利于attention步骤,还有利于softmax步骤,以及计算attention函数之后的归一化函数。在传统的人工智能系统中,softmax可能是遏制性能提升的重大瓶颈。在NeuPro-M中,attention和softmax可以并行实现,因此softmax对于吞吐时间的增加几乎可以忽略不计。NeuPro-M在transformer计算中实现大规模并行处理如下图所示。

fca80bde-67ff-11ee-939d-92fbcf53809c.png

fcbd0f2a-67ff-11ee-939d-92fbcf53809c.png

▲transformer计算中的可扩展并行化

NeuPro-M架构包括特殊支持,最大限度地提高芯片吞吐量,线程之间几乎没有停滞,进一步简化这些流中的高度并行性以及线程之间的数据共享。

为ChatGPT(移动版)构建语音界面

完成最难的部分后,在前端添加语音识别和在后端添加文本转语音,便可以通过额外相对简单的transformer网络实现。将我们的ClearVox语音处理前端软件连接到语音识别transformer,以输入提示,并接受引导,确定主transformer应执行哪一组精炼提示。必要时,可从互联网上检索查询相关文档。最后,使用文本转语音transformer对下载的回复或文件进行语音处理。现在来说,完全在手机上运行,且具有完全基于语音的 ChatGPT功能界面便是ChatGPT(移动版)的不同之处。

更广泛的应用

NeuPro-M平台并不局限于ChatGPT(移动版)这样的GPT类应用。它可以同样应用于任何生成式方法。例如,您可以使用稳定的扩散transformer生成图像、视频或任何其他人工生成或修改的体验。NeuPro-M解决方案在transformer网络建模方面非常通用。

审核编辑:彭菁

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 网络
    +关注

    关注

    14

    文章

    7492

    浏览量

    88564
  • 手持设备
    +关注

    关注

    0

    文章

    45

    浏览量

    24008
  • 应用程序
    +关注

    关注

    37

    文章

    3238

    浏览量

    57558
  • Transformer
    +关注

    关注

    0

    文章

    139

    浏览量

    5971

原文标题:针对ChatGPT(手机版)的优化版Transformer网络

文章出处:【微信号:CEVA-IP,微信公众号:CEVA】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    LV1365-EX条码识别模组在手持终端类中的应用

    在当今数字化转型的浪潮中,高效、精准的数据采集成为各行业提升运营效率的关键。LV1365-EX条码识别模组,凭借其卓越的性能和强大的条码识别能力,在手持终端设备中展现出了非凡的应用潜力,成为物流
    的头像 发表于 09-09 14:24 126次阅读
    LV1365-EX条码识别模组<b class='flag-5'>在手持</b>终端类中的应用

    Transformer能代替图神经网络

    Transformer作为一种在处理序列数据方面表现出色的深度学习模型,自其提出以来,已经在自然语言处理(NLP)、时间序列分析等领域取得了显著的成果。然而,关于Transformer是否能完全代替图神经网络(GNN)的问题,需
    的头像 发表于 07-12 14:07 366次阅读

    网络模块的安装方法

    网络模块的安装方法主要包括以下几个步骤,这些步骤将确保安装的准确性和网络模块的稳定运行: 准备阶段: 确定网络设备的型号、规格和技术参数,确
    的头像 发表于 07-12 09:58 528次阅读

    求助,请问如何在Windows系统安装ESP-IDF⼯具链?

    求助,请问如何在Windows系统安装ESP-IDF⼯具链?
    发表于 07-09 06:28

    北斗应急通信手持终端如何在户外使用

    使用的情况。熟悉设备:在使用前,对北斗应急通信手持终端进行充分的了解和熟悉,掌握其各项功能和使用方法。检查设备状态:检查设备组件是否完好无损,如屏幕、键盘或其他控
    的头像 发表于 06-14 11:16 355次阅读
    北斗应急通信<b class='flag-5'>手持</b>终端如<b class='flag-5'>何在</b>户外使用

    手持设备使用的扫码模组

    手持设备使用的扫码模组,哪款更适合推荐呢?在选择适用于手持设备的扫码模组时,我们需要考虑多个关键因素,包括尺寸、功耗以及其实用性。尺寸要求
    的头像 发表于 05-30 10:26 203次阅读
    <b class='flag-5'>手持</b><b class='flag-5'>设备</b><b class='flag-5'>上</b>使用的扫码模组

    何在STM32MP157C DK2实现管脚输出PTP的PPS信号?

    的步骤如何? 例如设置一个STM32MP157C 为master,另一个STM32MP157C 为slave , 进行网络时钟同步。 可以安装运行PTP4L这样的程序吗? 另外如何在 STM32MP157C DK2
    发表于 04-11 07:18

    何在鸿蒙系统安装Google Play

    。但是,通过以下简易步骤仍然可以在鸿蒙系统安装Google Play。 了解鸿蒙系统和Google Play之间的不兼容性 鸿蒙系统的背景介绍 鸿蒙系统是华为自主研发的操作系统,致力于实现全场景全连接的智能体验。它旨在为各种设备
    的头像 发表于 01-31 17:13 1.5w次阅读

    何在KW45-EVK使用RTC

    电子发烧友网站提供《如何在KW45-EVK使用RTC.pdf》资料免费下载
    发表于 01-03 09:41 0次下载
    如<b class='flag-5'>何在</b>KW45-EVK<b class='flag-5'>上</b>使用RTC

    手持终端定制|PDA|手持机|rfid手持终端设备开发解决方案

    手持终端定制|PDA|手持机|rfid手持终端设备开发解决方案厂家。以联发科64位八核MT6771芯片为核心,搭载Android 10系统,运行速度更快、功耗更低。其2GB LPDDR
    的头像 发表于 12-27 19:12 670次阅读
    <b class='flag-5'>手持</b>终端定制|PDA|<b class='flag-5'>手持</b>机|rfid<b class='flag-5'>手持</b>终端<b class='flag-5'>设备</b>开发解决方案

    网络滤波器用在什么设备

    网络滤波器是一种用于限制或阻止不良网络内容的技术。它被广泛应用于各种设备和环境中,包括个人电脑、移动设备、企业网络和公共场所的
    的头像 发表于 12-08 16:29 626次阅读

    更深层的理解视觉Transformer, 对视觉Transformer的剖析

    最后是在ADE20K val的LeaderBoard,通过榜单也可以看出,在榜单的前几名中,Transformer结构依旧占据是当前的主力军。
    的头像 发表于 12-07 09:39 724次阅读
    更深层的理解视觉<b class='flag-5'>Transformer</b>, 对视觉<b class='flag-5'>Transformer</b>的剖析

    何在LCD显示汉字和英文

    摘要:LCD是嵌入式常见设备,如何在LCD显示汉字和英文?矢量字体和点阵字体有何不同?同一个字符为何有多种编码?GB2312、GB18030指什么?他们之间有关系吗?嵌入式设备如何支
    的头像 发表于 11-28 10:20 2785次阅读
    如<b class='flag-5'>何在</b>LCD<b class='flag-5'>上</b>显示汉字和英文

    浅谈网络变压器(Network Transformer

    网络变压器(Network Transformer)是一种用于信号转换和传输的电子设备,广泛应用于网络设备中,如路由器、交换机、网卡等。网络
    的头像 发表于 11-24 09:31 3444次阅读

    关于深度学习模型Transformer模型的具体实现方案

    Transformer 本质是一个 Encoder-Decoder 架构。因此中间部分的 Transformer 可以分为两个部分:编码组件和解码组件。
    发表于 11-17 10:34 492次阅读
    关于深度学习模型<b class='flag-5'>Transformer</b>模型的具体实现方案