电子发烧友App

硬声App

扫码添加小助手

加入工程师交流群

0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

电子发烧友网>人工智能>Transformer迎来强劲竞争者 新架构Mamba引爆AI圈!

Transformer迎来强劲竞争者 新架构Mamba引爆AI圈!

收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

评论

查看更多

相关推荐
热点推荐

基于DINO知识蒸馏架构的分层级联Transformer网络

在本文的网络设计中,训练阶段首先会训练第一阶段的 Transformer 网络来得到一个有较好表征能力的特征生成器,随后再引入池化操作,加上二三阶段 Transformer 共同训练。最终在三阶段中通过验证集挑选出最优结果作为最终输出。
2022-07-25 16:58:131712

关于深度学习模型Transformer模型的具体实现方案

Transformer 本质上是一个 Encoder-Decoder 架构。因此中间部分的 Transformer 可以分为两个部分:编码组件和解码组件。
2023-11-17 10:34:521022

深入解析NVIDIA Nemotron 3系列开放模型

这一全新开放模型系列引入了开放的混合 Mamba-Transformer MoE 架构,使多智能体系统能够进行快速长上下文推理。
2025-12-24 10:34:073211

1小时玩转AI语音识别

`报名链接:http://t.elecfans.com/live/563.html直播主题及亮点本次直播讲解AI语音识别核心技术知识以及语音识别系统架构,现场实操写代码实现语音采集、语音传输与解析
2018-09-19 13:40:42

AI开发大赛9强出炉,即将迎来1024巅峰对决

。10月24日,他们将在1024开发迎来终极比拼!音书科技、吉斯卡教育、奇幻科技晋级风从海上来,传递的是一个时代的强音符;光从南方来,点亮的是夜空最亮的星。从上海到香港,从香港到北京,AI 开发大赛
2018-08-21 09:30:13

AI芯片热潮和架构创新是什么

魏少军谈AI芯片热潮和架构创新 透露清华Thinker芯片将独立融资
2020-04-24 11:29:35

AI芯片热潮和架构创新有什么作用

魏少军谈AI芯片热潮和架构创新 透露清华Thinker芯片将独立融资
2020-04-23 14:59:04

ABBYY FineReader 和 ABBYY PDF Transformer+功能比对

Office 创建加密 PDF 文档√文件数字签署[td=189]√FineReader 12和PDF Transformer+ 各有千秋,着重点不一样,以上对比只是为了让大家更好的查看两的功能,希望对大家在选择上有帮助!
2017-09-01 10:45:12

FPGA+AI王炸组合如何重塑未来世界:看看DeepSeek东方神秘力量如何预测......

近期,DeepSeek这个名字在AI彻底炸开了锅并且关于DeepSeek的消息网络铺天盖地,短视频,朋友随处可见不少网友留言称其是“来自东方的神秘力量”又一次震撼海外人士心脏“这太疯狂了
2025-03-03 11:21:28

ST MCU边缘AI开发云 - STM32Cube.AI

。STM32Cube.AI 开发云[https://stm32ai-cs.st.com]现在免费提供给注册的MyST用户。该工具已由多个嵌入式开发客户进行测试和评估。“我们过去
2023-02-02 09:52:43

VL-CKR-MAMBA

MAMBA SBC CABLING KIT
2023-03-29 19:54:55

AI专家讲座】不懂编程没关系,邀请您来学AI

、之旅”,深圳是首发站。他将给大家带来一次相当接地气、完整的AI讲解、AI应用及实践课程的精彩分享!高先生同时也是一位创新思维的倡导和实践,他希望和致力于实现中国的AI产业化、平台化、生态化!最终
2019-04-18 15:51:32

【CC3200AI实验教程11】疯壳·AI语音人脸识别-AI语音系统架构

CC3200AI实验教程——疯壳·开发板系列AI语音系统架构AI语音识别系统的系统架构如图1.0.1所示。图1.0.1 AI语音系统结构 用户通过语音采集板卡采集到在驻极体端的语音,通过I2S接口
2022-08-30 14:54:38

【CC3200AI实验教程14】疯壳·AI语音人脸识别-AI人脸系统架构

CC3200AI实验教程——疯壳·开发板系列AI人脸系统架构AI人脸识别系统由7大块组成,分别是摄像头、CC3200、串口调试助手、路由器、公网、服务器、数据库以及百度AI组成。AI人脸识别系统
2022-08-31 16:35:59

【HarmonyOS HiSpark AI Camera】AI守望

项目名称:AI守望试用计划:申请理由本人在计算机视觉领域有两年的从业经验,目前主要专注于边缘设备的算法移植,优化,部署等等.对树莓派,intel神经计算棒,华为Atlas都有使用经验。对鸿蒙OS
2020-11-19 20:39:23

【「AI芯片:科技探索与AGI愿景」阅读体验】+AI芯片的需求和挑战

Transformer引擎③NVLink Switch系统④机密计算⑤HBM FPGA: 架构的主要特点:可重构逻辑和路由,可以快速实现各种不同形式的神经网络加速。 ASIC: 介绍了几种ASIC AI芯片
2025-09-12 16:07:57

【「AI芯片:科技探索与AGI愿景」阅读体验】+第二章 实现深度学习AI芯片的创新方法与架构

Transformer 模型的后继 二、用创新方法实现深度学习AI芯片 1、基于开源RISC-V的AI加速器 RISC-V是一种开源、模块化的指令集架构(ISA)。优势如下: ①模块化特性②标准接口③开源
2025-09-12 17:30:42

【「DeepSeek 核心技术揭秘」阅读体验】第三章:探索 DeepSeek - V3 技术架构的奥秘

一、模型架构 在阅读第三章关于 DeepSeek 的模型架构部分时,我仿佛打开了一扇通往人工智能核心构造的大门。从架构图中,能清晰看到 Transformer 块、前馈神经网络、注意力机制等模块
2025-07-20 15:07:25

【书籍评测活动NO.18】 AI加速器架构设计与实现

经验总结图解NPU算法、架构与实现,从零设计产品级加速器当前,ChatGPT和自动驾驶等技术正在为人类社会带来巨大的生产力变革,其中基于深度学习和增强学习的AI计算扮演着至关重要的角色。新的计算范式需要
2023-07-28 10:50:51

【书籍评测活动NO.64】AI芯片,从过去走向未来:《AI芯片:科技探索与AGI愿景》

创新、应用创新、系统创新五个部分,接下来一一解读。 算法创新 在深度学习AI芯片的创新上,书中围绕大模型与Transformer算法的算力需求,提出了一系列架构与方法创新,包括存内计算技术、基于开源
2025-07-28 13:54:18

【开发教程11】AI语音人脸识别(会议记录仪-人脸打卡机)-AI语音系统架构

CC3200AI实验教程——疯壳·开发板系列AI语音系统架构AI语音识别系统的系统架构如图1.0.1所示。图1.0.1 AI语音系统结构 用户通过语音采集板卡采集到在驻极体端的语音,通过I2S接口
2022-05-20 15:35:19

【开发教程14】AI语音人脸识别(会议记录仪-人脸打卡机)-AI人脸系统架构

CC3200AI实验教程——疯壳·开发板系列AI人脸系统架构AI人脸识别系统由7大块组成,分别是摄像头、CC3200、串口调试助手、路由器、公网、服务器、数据库以及百度AI组成。AI人脸识别系统
2022-06-10 14:32:38

三星LED灯珠有什么特点?

三星LED灯珠高亮度、色彩丰富、可智 能化控制等优点,使其成为下一代照明光源的有力竞争者,绿色节能是其对社会最重要的贡献。
2019-09-30 09:00:46

分享一种基于RK3399+RK1808架构AI边缘计算商显主板

分享一种基于RK3399+RK1808架构AI边缘计算商显主板
2022-02-16 06:14:37

如何更改ABBYY PDF Transformer+界面语言

在安装ABBYY PDF Transformer+时会让您选择界面语言。此语言将用于所有消息、对话框、按钮和菜单项。在特殊情况下,您可能需要在安装完成后更改界面语言以适应需求,方法其实很简单,本文
2017-10-11 16:13:38

嵌入式FRAM的主要技术属性是什么?

如今,有多种存储技术均具备改变嵌入式处理领域格局的潜力。然而,迄今为止还没有哪一种技术脱颖而出成为取代微控制器(MCU)中闪存技术的强劲竞争者,直到FRAM的出现这种情况才得以改变。铁电
2019-08-22 06:16:14

开发手机 AI - 目标识别 demo

功能简介 该应用是在Openharmony 4.0系统上开发的一个目标识别的AI应用,旨在从上到下打通Openharmony AI子系统,展示Openharmony系统的AI能力,并为开发提供AI
2024-04-11 16:14:55

探讨一下Vector架构AI领域的应用前景

的高点,但不久之后,在面对那些在广阔的AI蓝海市场中胜出的竞争者们,无论是成本、软件,生态,甚至性能上可能都无法与之抗衡,从而重蹈Cray对抗Intel的覆辙。这个可能性或许值得深思。作为曾经的超算霸主
2022-09-19 15:18:24

直播福利:1小时玩转AI语音识别

`报名链接:http://t.elecfans.com/live/563.html直播主题及亮点本次直播讲解AI语音识别核心技术知识以及语音识别系统架构,现场实操写代码实现语音采集、语音传输与解析
2018-09-19 13:46:18

移动终端架构之争:热血“三国”

嵌入式电子产品,区别于传统的PC高复杂性,它的系统相对简单而且功耗很低。因此,这也为嵌入式领域的诸多架构提供了平等竞争的舞台。   众所周知,现在主流嵌入式处理器架构有X86、ARM
2008-10-14 20:49:27

移动终端架构竞争

现在,让我们拨开罩在接入终端名称争论表面上的面纱,深入讨论隐藏其中的嵌入式处理器的架构之争。   从技术角度讲,无论是什么移动互联网终端,都将是一款嵌入式电子产品,区别于传统的PC高复杂性,它的系统相对简单而且功耗很低。因此,这也为嵌入式领域的诸多架构提供了平等竞争的舞台。   
2019-07-12 07:18:42

线程撕裂 背面中心的两元件是什么?

线程撕裂 背面中心的两元件是什么?掉了的话,焊接温度多少合适?有大神帮忙解答一下吗,谢谢。
2020-02-02 15:38:00

请问物联网引爆点是什么?

请问物联网引爆点是什么?
2021-06-15 08:30:13

首创开源架构,天玑AI开发套件让端侧AI模型接入得心应手

,联发科带来了全面升级的天玑AI开发套件2.0,在模型库规模、架构开放程度、前沿端侧AI技术支持和端侧LoRA训练落地等方面均迎来全面跃迁,为开发提供了更全面、更开放、更强大的端侧AI开发解决方案
2025-04-13 19:52:44

评测MAXQ指令系统和其它RISC竞争者

摘要:本文比较了MAXQ与其它微控制器竞争产品的指令系统,包括PIC16CXXX(中档器件)、AVR和MSP430。并以表格方式列出了各种指令系统的优势和弱点。我们将利用选定的算法和操作程序
2009-04-23 17:40:3018

谷歌新的竞争对手名单曝光 苹果、亚马逊、微软上榜

Alphabet日前公布了最新竞争对手名单,并向投资发出警告。在向美国证券交易委员会提交的最新年度报告中,Alphabet列出许多新竞争者名单,包括苹果、Netflix以及Hulu等,以此突出其新业务(比如消费硬件制造)面临的竞争风险。以下就是被Alphabet视为劲敌的公司.
2017-02-05 12:22:241068

张忠谋表示:台积电制程技术超越任何竞争者

台积电董事长张忠谋昨日表示,看好今年台积电半导体产业成长率。他并信心满满地指出,台积电制程技术超越任何竞争者。对于各界关注台积电是否参与东芝释股案,张忠谋只简短表示:「我们在观察」。
2017-03-04 01:03:18891

基于RDF电子商务竞争者数据挖掘设计

在日常生活中,越来越多的人使用互联网从事商务活动。由于电子商务数据的飞速扩张,网络销售商迫切希望可以找到网络上竞争者,获取竞争对手的经营数据,分析商品的交叉信息,以便对经营策略做出调整,从而获取较大
2017-11-01 16:24:300

比特币迎来竞争对手以太币和莱特币 价格双双创历史新高

随着比特币价格的水涨船高,终于迎来了最强劲的两个竞争对手以太币和莱特币,据悉,以太币和莱特币价格双双创历史新高,后者更是单日上涨91%,几乎是一周前的四倍。
2017-12-13 13:13:391210

2018手机竞争升级 AI将是绝对焦点

人工智能芯片已经成为手机发展的方向,从2018年开始,智能手机市场再次进入白热化阶段,竞争早就开始升级,AI将是新品领域的绝对焦点。苹果三星也将不可避免的走向人工智能化,只是华为抢先一步。
2018-01-04 13:35:53562

针对AI架构领导权的战争,企业将迎来最大规模竞争

)框架,企业间可能发生一场我们这个时代最大规模的竞争。迪克森在接受CNBC著名节目《疯狂金钱》(Mad Money)主持人吉姆·克莱默(Jim Cramer)采访时表示,操作系统的升级和新一轮手机迭代可能会决定今天的技术周期,但主要焦点将很快转向AI领域的竞争
2018-01-23 20:31:04731

中国互联网催生的三家并称TMD的独角兽,成为了BAT的最强竞争者

自中国拥抱互联网时代以来,催生了三大互联网公司BAT,它们主宰着中国的技术领域,也在挑战国际巨头。而现在,中国正在目睹下一代技术巨头的崛起——诞生于移动时代,由人工智能和共享经济推动,并致力于网络服务的更新迭代。今日头条、美团点评、滴滴出行,这三家并称TMD的独角兽,成为了BAT的最强竞争者
2018-01-30 14:18:2927216

亚马逊与Google真正欲大力发展的是,基于消费数据的AI领域

由于AI算法需要庞大的数据、网络规模,以及技术人才等,现今仅有如亚马逊与Google等少数业者能够真正满足这些需求。不过如三星电子(Samsung Electronics)、Facebook与阿里巴巴等业者,也是不可忽视的可能竞争者
2018-07-04 15:03:552851

71%的以色列人工智能公司专注于企业应用,以色列成全球AI竞争者

当今在AI领域,中国将要领先美国,欧洲的AI专家也挑战美国和中国,而同时AI领域的一个新竞争者正在迅速崛起。创业大国以色列正通过在尖端数据分析,软件和硬件工程人才以及企业成熟技能方面的专业知识,瞄准当今最热门的科技行业。
2018-10-01 11:14:002138

自动驾驶排名:“竞争者”之后是“挑战

日前,美国市场研究机构Navigant Research发布了自动驾驶竞争力的最新排名。据了解,该研究报告综合了企业愿景、市场发展策略、合作伙伴、生产策略、技术、营销&分销、产能、产品质量&可靠性、产品组合以及项目发展持久力等10个评价指标。
2019-03-26 17:18:01984

AWS在全球封王,但在中国不敌阿里云

尽管亚马逊与微软Azure在国内公有云市场很难对阿里云造成巨大影响,但国内腾讯、百度及华为等重量级玩家将会是阿里云强劲竞争者
2019-04-25 11:51:203880

谷歌将AutoML应用于Transformer架构,翻译结果飙升!

为了探索AutoML在序列域中的应用是否能够取得的成功,谷歌的研究团队在进行基于进化的神经架构搜索(NAS)之后,使用了翻译作为一般的序列任务的代理,并找到了Evolved Transformer这一新的Transformer架构
2019-06-16 11:29:223463

隐私币会是我们的未来吗

随着主流加密货币对于隐私功能的集成,纯粹的匿名币正在面临越来越多的强劲竞争者;但放眼隐私的未来,主流加密货币部署隐私功能或将成为隐私领域的最终趋势。
2019-10-26 09:53:231177

5G时代三星将有望成为强大的竞争者

近日,《亚洲时报》发表长文,对于三星在5G时代的竞争力以及市场机会和挑战进行了分析。报道称,通过在新兴5G市场占据主动地位,三星有望成为强大的竞争者
2019-11-26 10:29:00712

华为正在成为下一代通信技术领域的强大竞争者

根据弗吉尼亚州民主党参议员马克·沃克(Mark Warker)办公室发出的一份新闻稿,理由是“华为获得了大量的政府补贴”,而“应用战略联盟电信法案”则将帮助西方的公司与其竞赛,并且成为下一代通信技术领域的强大竞争者
2020-01-15 14:17:441812

AI的未来是由什么来决定的

AI被认为是最有可能的新工业革命引爆点,各国都在此方向积极投入参与竞争,中国当前的竞争位置还很不错,当在两强之一。
2020-02-24 15:45:55862

腾讯云坚持挺进 Gartner云AI推动AI技术加速落地

AI开发服务魔力象限的云厂商。这表明,在AI开发服务领域,腾讯云凭借多年在技术、产品以及生态等多领域的广泛布局,已经成为中国云厂商引领,并逐渐成为国际云厂商中强劲竞争者
2020-03-04 11:06:54587

人工远程操控的无人机将会成为F-35战斗机的竞争者

马斯克向引用其在军事研讨会上讲话的美国《航空周刊与空间技术》杂志记者李·哈德松解释了必须建造像F-35那样战斗机的必要性。 马斯克说:“人工远程操控的无人机应该成为F-35战斗机的竞争者,但是要为它的技术性增加自动性能。”
2020-03-13 14:06:301155

5G时代如何重构组织的核心竞争

还有另外一个视角,这是竞争战略大师迈克尔波特给出的,他提供了“五力竞争模型”,从供应商的议价能力、购买者的议价能力、潜在竞争者进入的能力、替代品的替代能力、行业内竞争者竞争能力来评估企业竞争优势。这个视角的价值在于让我们可以鸟瞰影响企业竞争优势的框架并且能够跟着迈克尔波特进入每个细节。
2020-06-19 16:54:222917

下一代显示技术的有力竞争者:Micro LED

如今显示技术行业百花齐放,其中MicroLED凭借高解析度、低功耗、高亮度、高色彩饱和度、反应速度快、厚度薄、寿命长等特性成为产业上游竞相争夺的技术高地。相比LCD和OLED,MicroLED均具有其难以匹敌的血统优势,这种近乎完美的显示技术,是业界公认下一代显示技术的有力竞争者
2020-07-20 10:42:58817

北科天绘成为全球激光雷达行业的强劲竞争者

体积越小的激光雷达,越容易“藏”在车里,“装”入机器人身体中,“挂”在无人机机腹,这是未来发展趋势。在国产激光雷达上市后的几年时间,国际产品价格已经降了80%。而北科天绘自产的激光雷达产品重量比同行轻50%到80%。
2020-09-01 15:12:513541

Nvidia扩大了在MLPerf Benchmark上进行AI推理的领先优势

弗洛伊德说:“英伟达在竞争激烈的竞争者中表现出色。” 与(Nvidia)V100(GPU)相比,他们的A100效果惊人,证明了其增强的Tensor核心架构的价值。我赞扬MLPerf添加了新的基准,这些基准越来越代表快速增长的推理机会,例如推荐引擎。
2020-10-24 09:17:152643

激光雷达的竞争者来了,分辨率提升15倍

(LiDAR)的竞争者来了,本不是什么颠覆性技术,但分辨率提升15倍,成本却与便宜的固态LiDAR相仿;埃隆·马斯克为其点赞,特斯拉也开始搭载,不过好像还没有玩转。要说真正量产搭载的还是传统意义上的豪车:奔驰S级和E级、宝马7系和5系
2021-01-19 10:36:064133

物联网产业发展迎来强劲新动能,多个行业实战5G+AIoT

刚刚过去的2020年,随着5G和AI人工智能正式入选新基建,物联网产业发展迎来强劲新动能。
2021-01-22 13:52:302723

解析Transformer中的位置编码 -- ICLR 2021

引言 Transformer是近年来非常流行的处理序列到序列问题的架构,其self-attention机制允许了长距离的词直接联系,可以使模型更容易学习序列的长距离依赖。由于其优良的可并行性以及可观
2021-04-01 16:07:2813603

如何使用Transformer来做物体检测?

导读 本文为一个Facebook的目标检测Transformer (DETR)的完整指南,详细介绍了DETR架构的内部工作方式以及代码。 介绍 DEtection TRansformer (DETR
2021-04-25 10:45:493198

Transformer深度学习架构的应用指南介绍

Understanding, NLU)信息检索和自然语言生成(Natural Language Generation, NLG)等语言和语义任务中取得了显著的成功。这一壮举主要归功于开创性的Transformer架构,导致
2021-05-06 11:32:215209

Transformer的复杂度和高效设计及Transformer的应用

来自:AI部落联盟 前言 这次我们总结一下ACL2021中的Transformers,看看2021年了,NLPer在如何使用、应用、改进、分析Transformers,希望可以对大家产生idea有
2021-09-01 09:27:437482

GTC2022大会黄仁勋:TransformerAI飞速发展

GTC2022大会黄仁勋:TransformerAI飞速发展,并解除了人工标记数据的需求。
2022-03-23 15:15:162027

NVIDIA助力微软将AI Transformer模型投入生产用途

Microsoft 的目标是,通过结合使用 Azure 与 NVIDIA GPU 和 Triton 推理软件,率先将一系列强大的 AI Transformer 模型投入生产用途。
2022-03-28 09:43:381848

英伟达H100 Transformer引擎加速AI训练 准确而且高达6倍性能

Hopper 架构从头开始构建,凭借强大的算力和快速的内存来加速这些新一代 AI 工作负载,从而处理日益增长的网络和数据集。 Transformer 引擎是全新 Hopper 架构的一部分,将显著提升 AI 性能和功能,并助力在几天或几小时内训练大型模型。 使用 Transformer 引擎
2022-04-01 09:24:555452

Microsoft使用NVIDIA Triton加速AI Transformer模型应用

Microsoft 的目标是,通过结合使用 Azure 与 NVIDIA GPU 和 Triton 推理软件,率先将一系列强大的 AI Transformer 模型投入生产用途。
2022-04-02 13:04:212347

AMD最有趣的更新就是Zen架构路线图

从FAD 2022开始,AMD最有趣的更新就是Zen架构路线图。Zen架构是AMD在x86处理器领域复苏并重新成为有竞争力和有能力的竞争者的基石,它是AMD从最小的嵌入式CPU到最大的企业芯片的基础。因此,在接下来的几年里,对于AMD乃至整个行业来说,都将是一件非常重要的事情。
2022-07-11 15:15:552711

基于卷积的框架有效实现及视觉Transformer背后的关键成分

来自清华大学和 Meta AI 的研究证明了视觉 Transformer 的关键,即输入自适应、长程和高阶空间交互,也可以通过基于卷积的框架有效实现。
2022-09-09 15:44:251781

基于专利情报的先进计算领域行业竞争者分析

本节依托 Incopat 专利数据库,对数模 / 模数转换器(AD/DA 转换器)、现场可编程门阵列(FPGA)以及数字信号处理(DSP)领域进行申请人的专利申请量排名统计,分析研究 3 个领域的主要行业竞争者的专利布局状况
2022-12-02 15:11:021801

ChatGPT/GPT的原理 ChatGPT的技术架构

ChatGPT 是基于GPT-3.5(Generative Pre-trained Transformer 3.5)架构开发的对话AI模型,是InstructGPT 的兄弟模型。 ChatGPT很可能是OpenAI 在GPT-4 正式推出之前的演练,或用于收集大量对话数据。
2023-02-24 10:05:132459

AI引爆算力存储芯片-2023人工智能高峰会

AI引爆算力存储芯片 ChatGPT的迅速崛起和应用推动人工智能产业进一步蓬勃发展,其中人工智能领域的重要组成部分AIGC产业成为科技热点。人工智能产业正在逐渐开启第四次工业革命的大门,推动着全球
2023-04-13 15:41:101634

Transformer在下一个token预测任务上的SGD训练动态

  【导读】 AI理论再进一步,破解ChatGPT指日可待? Transformer架构已经横扫了包括自然语言处理、计算机视觉、语音、多模态等多个领域,不过目前只是实验效果非常惊艳
2023-06-12 10:11:331446

基于 Transformer 的分割与检测方法

来源:机器之心 SAM (Segment Anything )作为一个视觉的分割基础模型,在短短的 3 个月时间吸引了很多研究的关注和跟进。如果你想系统地了解 SAM 背后的技术,并跟上内卷的步伐
2023-07-05 10:18:391996

AI芯片赛道上,英伟达迎来挑战

英伟达已成为AI革命早期的领跑,但大大小小的竞争对手已经在奋起直追。
2023-07-22 11:43:54704

RetNet架构Transformer架构对比分析

微软研究院最近提出了一个新的 LLM 自回归基础架构 Retentive Networks (RetNet)[1,4],该架构相对于 Transformer 架构的优势是同时具备:训练可并行、推理成本低和良好的性能,不可能三角。
2023-07-26 10:44:472194

基于Transformer模型的压缩方法

基于Transformer架构的大型模型在人工智能领域中发挥着日益重要的作用,特别是在自然语言处理(NLP)和计算机视觉(CV)领域。
2024-02-22 16:27:191415

AI引爆英伟达业绩 美国股市因英伟达季绩强劲上涨

AI引爆英伟达业绩 美国股市英伟达季绩强劲上涨 AI的持续火爆引发一场全球资本市场狂欢,而且随着Sora、Gemini1.5等大模型面世;大模型的加速迭代都对算力需求形成支撑,这给英伟达股价带来更多
2024-02-23 19:37:561856

福特推800V快充架构,应对电动车市场竞争

尽管Mach-E在第四季度取得了微弱的销售增长,同比增加了4.6%,售出了11,369辆车,但是它的市场份额正在被众多竞争者蚕食,尤其是现代IONIQ 5,其销量激增92%,达到8,612辆。
2024-02-29 11:34:101173

英特尔计划对Guadi 3进行深度精简,以积极进军中国AI芯片市场

众所周知,尽管现阶段AI芯片市场上英伟达的份额高达九成,市值已然飙升至3万亿之巨,甚至超越了同为科技巨头的苹果公司,然而这并不意味着英伟达在市场中便是无敌的存在。事实上,众多竞争者如Intel
2024-06-11 14:32:101547

Anthropic发布Claude 3.5 Sonnet,AI领域再掀波澜

近日,人工智能领域的竞争格局再次发生重要变化。OpenAI的强劲竞争对手Anthropic公司发布了其迄今为止最强大的AI模型——Claude 3.5 Sonnet。这一创新成果不仅展示了Anthropic在AI技术领域的深厚实力,也预示着生成式AI市场即将迎来新的高潮。
2024-06-24 15:14:171307

只能跑TransformerAI芯片,却号称全球最快?

transformer架构的模型。 Sohu,比H100快上20倍 之所以打算Sohu这一自研ASIC AI芯片,是因为Etched认为GPU在性能升级上的速度太慢了。如果以H100的单位面积算力和交期作为
2024-07-01 09:03:312904

Transformer架构在自然语言处理中的应用

随着人工智能技术的飞速发展,自然语言处理(NLP)领域取得了显著的进步。其中,Transformer架构的提出,为NLP领域带来了革命性的变革。本文将深入探讨Transformer架构的核心思想、组成部分以及在自然语言处理领域的应用,旨在帮助读者全面理解并应用这一革命性的技术。
2024-07-09 11:42:532241

AMD MI350挑战英伟达Blackwell,AI投资持续强劲

AMD首席执行官苏姿丰(Lisa Su)近日宣布,公司即将推出的MI350芯片将直接与英伟达的Blackwell架构芯片展开激烈竞争,标志着高性能计算领域即将迎来新一轮的技术革新。苏姿丰强调,当前AI投资周期依然强劲,市场需求旺盛,尽管供应量已有显著增加,但仍将保持紧俏状态。
2024-08-05 11:27:421130

IBM Granite系列模型被Forrester评为“强劲表现

近日,IBM 凭借其旗舰 Granite 系列模型,在 2024年第二季度的《Forrester Wave:语言 AI 基础模型》报告中,被评为“强劲表现”。
2024-08-16 11:34:071045

英伟达推出归一化Transformer,革命性提升LLM训练速度

英伟达团队近日在AI领域投下了一枚震撼弹,他们提出了一种全新的神经网络架构——归一化Transformer(nGPT)。这一创新架构基于超球面(hypersphere)进行表示学习,为AI领域带来
2024-10-23 11:30:421303

Transformer模型的具体应用

如果想在 AI 领域引领一轮新浪潮,就需要使用到 Transformer
2024-11-20 09:28:242504

Mamba入局图像复原,达成新SOTA

图像复原又来新突破了!还记得性能超越SwinIR(基于Transformer)的MambaIR吗?一种基于Mamba的图像复原基准模型,登上ECCV 2024。最近原作者又开发了新版本
2024-12-30 18:09:021772

港大提出SparX:强化Vision MambaTransformer的稀疏跳跃连接机制

本文分享香港大学计算和数据科学学院俞益洲教授及其研究团队发表于 AAAI 2025 的论文——SparX,一种强化 Vision MambaTransformer 的稀疏跳跃连接机制,性能强大
2025-01-03 09:28:361891

transformer专用ASIC芯片Sohu说明

架构烧到芯片中,我们无法运行大多数传统的AI模型:支持Instagram广告的DLRM,像AlphaFold 2这样的protein-folding模型,或者像Stable Diffusion 2这样
2025-01-06 09:13:101756

地平线ViG基于视觉Mamba的通用视觉主干网络

Vision Mamba的成功预示着将视觉表征学习转换为线性复杂度视觉序列表征学习具有巨大的潜力。尽管以Vision Mamba为代表的线性视觉序列表征学习结构在高清图像上展示了显著的效率优势,但在更为常见的分辨率,仍略逊于Transformer和CNN。
2025-01-08 09:33:081000

AI Agent崛起为AI应用的核心架构

最近,开源中国 OSCHINA、Gitee 与 Gitee AI 联合发布了《2024 中国开源开发报告》。 报告聚焦 AI 大模型领域,对过去一年的技术演进动态、技术趋势、以及开源开发生态数据
2025-02-14 17:54:481406

2025年Q1通信业技术跃迁与生态重构:AI+低空经济双轮驱动

腾讯2024年财报显示,AI相关资本开支同比增长221.27%,2025年计划继续加码AI原生应用研发及算力基础设施建设,其自研混元T1模型(Hybrid-Mamba-Transformer架构)已上线并开放云服务。
2025-04-03 15:11:541245

【解构·AI玩具】从“小智AI引爆开发热潮说起

2024年底开始,这个看似小众的市场却悄然升温,成为科技和消费的共同关注点,尤其以“小智AI”的现象级爆红为代表,引爆了全民DIY与AI陪伴的热潮,进一步推动AI玩具迈入主流市场。 二、小智AI:现象级爆款,点燃AI玩具想象力 “小智AI”是一款
2025-05-20 09:20:212120

Transformer架构概述

由于Transformer模型的出现和快速发展,深度学习领域正在经历一场翻天覆地的变化。这些突破性的架构不仅重新定义了自然语言处理(NLP)的标准,而且拓宽了视野,彻底改变了AI的许多方面。
2025-06-10 14:24:501134

Transformer架构中编码器的工作流程

编码器是Transformer体系结构的基本组件。编码器的主要功能是将输入标记转换为上下文表示。与早期独立处理token的模型不同,Transformer编码器根据整个序列捕获每个token的上下文。
2025-06-10 14:27:47922

NVIDIA Nemotron Nano 2推理模型发布

NVIDIA 正式推出准确、高效的混合 Mamba-Transformer 推理模型系列 NVIDIA Nemotron Nano 2。
2025-08-27 12:45:441573

已全部加载完成