0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

ChatGPT的核心算法为何如此强大?

新思科技 来源:未知 2023-03-17 18:10 次阅读

ChatGPT近期成为了全球话题中心。短短两个月,ChatGPT注册用户数已经破亿,成为史上用户破亿速度最快的软件之一。它不但可以回答问题,还能写诗,写代码,提供旅游攻略…而ChatGPT的核心结构正是Transformer模型。

Transformer是一种能够同时处理所有输入数据的深度学习模型,最初是为翻译和自动问答等自然语言处理应用开发的。计算机视觉应用领域过去主要采用卷积神经网络(CNN),现在Transformer模型则更为流行,但它不会取代CNN,而是与之配合来提高视觉处理应用的准确度。

比如,当自动驾驶汽车在行驶过程中遇到障碍物,它是如何判断马路中间的是人,而不是电线杆呢?自动驾驶汽车的物体检测和防撞系统必须正确识别前方路况并给车辆发出相应的指令。在现代汽车的计算机视觉处理应用中,深度学习模型就发挥着重要作用。

除了汽车会采用AI驱动的计算机视觉技术外,摄像头如今已经在很多系统中都普及开了,手机和安防系统等大量基于摄像头的设备都已经在使用神经网络来提高图像质量和准确性了。

为何Transformer是嵌入式计算机视觉的理想选择呢?Transformer又将如何改变深度学习架构的发展方向?哪些技术可以优化这些模型来获得更出色的结果?本文将带着这些问题与大家共同探讨。

更专注的注意力机制

更好的情景感知

10多年来,CNN一直是视觉处理的首选深度学习模型。随着技术的不断发展,CNN现已能够准确地完成图像分类、物体检测、语义分割(对图像中的每个像素进行分组或标记)和全景分割(识别物体位置以及对每个物体中的每个像素进行分组和标记)。

但Transformer除了需要将语言块替换为图像块外,不需要任何其他修改就可以在准确性方面超越CNN。

2017年,Google Research将Transformer定义为一种基于自注意力机制的新型神经网络架构,特别适合用于语言理解。到2020年,Google Research的科学家们发表了一篇关于Vision Transformer(ViT)的文章,ViT是一个基于原始Transformer架构的模型。据该文章表示,当有足够的数据进行训练时,ViT表现出了优异的性能,超过了先进的CNN,而所需的计算资源却只有CNN的四分之一。这些Transformer虽然需要庞大的数据集进行训练,但确实非常擅于处理图像分类和物体检测等视觉任务。

Transformer之所以能够在视觉应用中游刃有余,其专有的注意力机制是关键,该机制让模型能够对特定情境有更深入的理解。Transformer和CNN一样都可以检测到前方道路上的物体是行人,而不是电线杆或者一棵树,但不同的是,Transformer并不会同等处理所有像素,它更多关注的是数据中微小但重要的部分,比如那个行人,而不太会去过多关注代表道路其余部分的那些不重要像素。

在处理每帧数据时,CNN通常并不会考虑该帧之前和之后的数据。而相比CNN,Transformer更擅于学习较为复杂的模式,因此所需的计算也就更多,所以在速度方面Transformer没有CNN快,但它也在努力的奋起直追了。

GPU目前可以支持这二种模型,但如果在实际应用中需要以更小的尺寸和更低的功耗来实现更高的性能,那么NPU或神经处理单元等专用AI加速器将会是更好的选择。

为了提高推理效率,视觉处理应用可同时使用CNN和Transformer。要想实现全方位视觉感知,仅靠纯视觉模型可能无法轻松获得所需的信息,而多模态学习可以提供更详尽的视觉信息。此外,Transformer等基于注意力机制的神经网络非常适合像汽车应用这种集成了多个传感器的应用。

利用NPUIP优化

Transformer和CNN的性能

Transformer包括以下几种运算:

  • 矩阵乘法

  • 逐元素加法

  • Softmax数学函数

  • L2归一化

  • 激活函数

目前大多数AI加速器都针对CNN进行了优化,但它们并非全都适合Transformer。Transformer需要庞大的计算能力来执行大量计算并支持其注意力机制。

新思科技的ARC NPX6 NPU IP就是一款能够同时处理CNN和Transformer的AI加速器。ARC NPX6 NPU IP的计算单元包括一个用于矩阵乘法(对这两种深度学习模型都非常重要)的卷积加速器,以及一个用于处理Transformer运算和激活函数的张量加速器。该IP提供高达3,500 TOPS的性能和高达30 TOPS/瓦的出色能效。

设计团队还可以使用新思科技的MetaWare MX开发工具包来加速其应用软件开发。该工具包提供了一个综合的软件编程环境,其中包括神经网络软件开发工具包和对各种虚拟模型的支持。

ChatGPT安全吗?

在ChatGPT爆火的背后,我们也要知道,ChatGPT或者其他AI软件所产出的内容或做出的决策并不是无懈可击的。这些工具提供的结果往往会和现实有所偏差,而只有人类才能基于现实去对结果进行检查和验证。

而且是否会有人利用ChatGPT编写恶意代码来进行网络攻击呢?自从人类开始编写代码以来,开发人员一直都在无意或者有意地编写出可被利用的代码。幸运的是,有很多安全测试工具可以帮助开发者们进行安全防护。无论编码者是谁,都应该使用安全工具扫描源代码发现漏洞。

总结

Transformer拥有强大的计算能力,且一直在自然语言处理应用中被广泛采用。现在,因Transformer模型基于其注意力机制的神经网络拥有更出色的情感感知能力,智能手机、安防系统、自动驾驶汽车等实时视觉处理应用也开始采用此模型。以后,各种基于摄像头的产品会越来越先进,提供的图像质量也越来越高。在深度学习中加入Transformer后,嵌入式视觉摄像头系统势必能够提供更清晰的图像和更准确的物体检测。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 新思科技
    +关注

    关注

    5

    文章

    737

    浏览量

    50121

原文标题:ChatGPT的核心算法为何如此强大?

文章出处:【微信号:Synopsys_CN,微信公众号:新思科技】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    网络延迟为何如此重要

    网络延迟是指数据在网络上从一点传输到另一点所需的时间。它是影响任何基于网络的系统(包括网站、应用程序和云服务)的关键因素。 以下是网络延迟很重要的一些原因: 体验 延迟会影响基于网络的系统的用户体验。例如,在浏览网站时,延迟可能会导致页面加载时间延迟,从而导致用户感到沮丧,甚至可能导致用户离开。 生产力 网络延迟会严重影响生产力。例如,网络速度慢会导致访问文件或应用延迟,从而浪费时间并降低效率。 收入 对于依赖
    的头像 发表于 05-28 10:39 164次阅读

    OpenAI 深夜抛出王炸 “ChatGPT- 4o”, “她” 来了

    当地时间5月13日OpenAI推出ChatGPT-4o,代表了人工智能向前迈出的一大步。在GPT-4turbo的强大基础上,这种迭代拥有显著的改进。在发布会的演示中,OpenAI展示该模型的高级
    发表于 05-27 15:43

    FPGA能实现什么样的算法

    FPGA功能如此强大,请问用FPGA能实现或者比较适合实现什么样的算法
    发表于 05-26 20:18

    环保又高效:365nm固化灯为何如此受欢迎?

    在追求绿色发展和高效生产的当下,一款产品若能在满足性能需求的同时,还兼具环保与高效两大优势,无疑会受到市场的热烈追捧。而在工业固化领域,365nm固化灯便是这样一款备受瞩目的产品。那么,为何
    的头像 发表于 05-15 11:19 158次阅读
    环保又高效:365nm固化灯<b class='flag-5'>为何如此</b>受欢迎?

    RISC-V为何如此重要?

    什么让RISC-V如此受欢迎,为什么从NVIDIA到微软的每个人都在投资它?什么是RISC-V?RISC-V是一种指令集架构(ISA)。ISA是CPU必须能够解释和处
    的头像 发表于 04-29 08:28 159次阅读
    RISC-V<b class='flag-5'>为何如此</b>重要?

    什么是边缘计算?它为何如此重要?

    ,什么是边缘计算?它为何如此重要?本文将对其进行详细的解析。 边缘计算,简而言之,是指在靠近物或数据源头的一侧,采用网络、计算、存储、应用核心能力为一体的开放平台,就近提供最近端服务。它的核心思想是将计算任
    的头像 发表于 04-22 15:25 171次阅读

    在FPGA设计中是否可以应用ChatGPT生成想要的程序呢

    当下AI人工智能崛起,很多开发领域都可看到ChatGPT的身影,FPGA设计中,是否也可以用ChatGPT辅助设计呢?
    发表于 03-28 23:41

    【国产FPGA+OMAPL138开发板体验】(原创)6.FPGA连接ChatGPT 4

    : ChatGPT 4说:\'优化硬件设计需要考虑很多因素,如功耗、性能、成本等。你可以从改进算法、优化数据路径、减少冗余操作等方面入手。\'\"); // 7. 关闭与ChatGPT 4服务器的连接
    发表于 02-14 21:58

    电机启动电流为何如此之小?

    后话:直接启动时电机用钳安表测的瞬间电流是53A左右,而实际满负荷工作的电流只有23A,很可能是大马拉小车,电机选型选大了。当然钳安表测得的瞬间电流可能也不准。经过这次教训,深切感受到学电气的基础一定要扎实,接触面一定要广,不要像我这次遇到问题才去查资料上网请教专家。再次感谢论坛各位大佬,谢谢! 困扰我们的有两个问题(为简单化,将电机在空载状态讨论) 1.如何精确测出电机启动电流峰值和启动时间。 2.发电机的短时电流系数150%两分钟,那么在10-15秒内是不是允许达到200%,甚至更大呢? 我想,如果电机厂提供启动电流峰值,发电机厂提供15秒内电流最大过载系数。有了这两个关键参数,电机能不能直接启动,要不要软启动,不就迎刃而解了吗! 不幸的是,发电机厂家为经济效益考虑,他不会告诉你过载系数,而且推荐的发电机功率至少为电机容量的2.5倍以上,造成了巨大的资源浪费。就像变频器和软启动厂家,推荐的都比电机功率大一档,而不是从电流来考虑。
    发表于 11-22 06:30

    ChatGPT Plus怎么支付 开通ChatGPT plus有什么功能?

    ,为全球的专业人士提供了强大的工具。如果你也想体验这一创新的AI技术,下面是关于如何开通ChatGPT 4.0付费服务的教程: 1️⃣ 访问OpenAI官方网站 首先,你需要访问OpenAI的官方网站
    的头像 发表于 10-10 16:01 3924次阅读
    <b class='flag-5'>ChatGPT</b> Plus怎么支付 开通<b class='flag-5'>ChatGPT</b> plus有什么功能?

    沐曦携手富春云打造国产GPU华北核心算力节点

    近日,沐曦集成电路(上海)有限公司(以下简称“沐曦”)与浙江日报报业集团旗下北京富春云网络科技有限公司(以下简称“富春云”)在浙报数字文化科技园举行“沐曦富春云国产GPU华北核心算力节点项目”签约仪式,沐曦销售副总裁裘敏松、富春云总裁朱成永代表合作双方完成签约。
    的头像 发表于 09-20 14:16 919次阅读

    chatGPT有什么强大的功能?

    chatGPT有什么作用?chatGPT有什么强大的功能?为什么chatGPT可以火爆全球? 作为一款全球领先的在线聊天机器人平台,chatGPT
    的头像 发表于 08-09 15:48 980次阅读

    chatgpt是什么意思 ChatGPT背后的技术原理

      今天我们为大家带来的文章,深入浅出地阐释了ChatGPT背后的技术原理,没有NLP或算法经验的小伙伴,也可以轻松理解ChatGPT是如何工作的。  ChatGPT是一种机器学习自然
    发表于 07-18 17:12 0次下载

    chatgpt怎么用 ChatGPT的多种使用方法

      ChatGPT可以用于多种不同的应用场景和使用方法,包括但不限于以下几种:  1. 聊天机器人:ChatGPT可以用于开发聊天机器人,通过自然语言处理技术和机器学习算法,让机器人可以像人类一样
    发表于 07-18 14:47 7次下载

    对于三维视觉,C++为何如此重要?

    C++一直都被称作是最难学的计算机语言,笔者从业多年,也认为确实如此。相比于其他几种语言,单纯从语法结构来说,C++都是比较困难的。何况很多同学并不是计算机专业出身,基础不是很扎实。
    的头像 发表于 07-17 14:27 332次阅读
    对于三维视觉,C++<b class='flag-5'>为何如此</b>重要?