0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

燧原科技发布第二代云端人工智能推理加速卡云燧 i20

RTThread物联网操作系统 来源:RTThread物联网操作系统 作者:RTThread物联网操作 2021-12-15 09:28 次阅读

AI芯片

数量级效率优势,原生适配AI计算:光芯片的下一个技术突破要来了

近年来,人工智能等技术的快速发展让计算机的算力需求暴增,但随着摩尔定律失效,传统芯片性能提升速度却开始大幅放缓。全世界都在寻找新的解决方法,光芯片的发展正让人看到希望。

我们经常会看到光芯片技术、光学神经网络的研究登上 Nature 和 Science 等顶尖科学杂志。在一些研究中科学家们指出,光学开关的速度要比现在商用的顶级硅芯片的晶体管快 100 到 1000 倍。

1万美元的L4自动驾驶解决方案面世,实测1小时表现如何?

高阶自动驾驶想要成功商业化,除了取决于感知、决策、执行各个层级的成熟度,降本也是至关重要的一点,否则不仅难以大规模投用,更难与乘用车结缘。

据艾瑞咨询的一项报告显示,仅L4级自动驾驶的硬件,在2018年底的成本就达到50万元左右,还有可能更高。而到今年,百度采用ANP-Robotaxi架构的Apollo Moon自动驾驶运营车,已将整车成本降至48万元,这还计算了其原型车北汽极狐阿尔法T的费用。

三年完成两代产品迭代,燧原科技的推理芯片性能又提升了三倍。

12 月,燧原科技在线上发布会上发布了第二代云端人工智能推理加速卡「云燧 i20」。

这是时隔五个月以来,燧原科技在今年连续第二次发布新产品。今年 7 月,燧原在 WAIC 世界人工智能大会上发布了第二代加速训练卡「云燧 T20」。

作为全新一代云端 AI 推理加速产品,云燧 i20 拥有迄今为止业内最大的 AI 加速卡存储带宽,高达 819 GB/s,远超行业同类产品水平。与此同时,该加速器全面支持从 FP32、TF32、FP16、BF16 到 INT8 的计算精度。单精度 FP32 峰值算力达到 32 TFLOPS,单精度张量 TF32 峰值算力达到 128 TFLOPS,整型 INT8 峰值算力达到 256 TOPS。对比第一代推理产品,云燧 i20 将浮点算力提升到 1.8 倍,整型算力提升到 3.6 倍。

达摩院成功研发存算一体AI芯片,性能提升10倍以上

12月3日,达摩院宣布成功研发新型架构芯片。该芯片是全球首款基于DRAM的3D键合堆叠存算一体AI芯片,可突破冯·诺依曼架构的性能瓶颈,满足人工智能等场景对高带宽、高容量内存和极致算力的需求。在特定AI场景中,该芯片性能提升10倍以上,能效比提升高达300倍。

过去70年,计算机一直遵循冯·诺依曼架构设计,运行时数据需要在处理器和内存之间来回传输。随着时代发展,这一工作模式面临较大挑战:在人工智能等高并发计算场景中,数据来回传输会产生巨大的功耗;目前内存系统的性能提升速度大幅落后于处理器的性能提升速度,有限的内存带宽无法保证数据高速传输。

AI热点

老电影和图片变清晰的秘密!分辨率提升400%的AI算法已开源

如上图, 从100x133pix→400x532pix,除了肉眼可见的清晰,拥有可以将分辨率提升400%的技术到底意味着什么?

它意味着:

老照片、老电影、动漫等画质可快速提升,分辨率自由调节

产业算法效果可以随着数据质量的提升大幅提高

网络信号较差时,也能快速查看高清视频或图片

影像传输带宽与存储空间大幅压缩,传输成本也将大大减少

增大模型依然有用,DeepMind用2800亿参数的Gopher,测试语言系统极限

近年来,国内外各大 AI 巨头的大规模语言模型(large language model,LLM)一波接着一波,如 OpenAI 的 GPT-3、智源研究院的悟道 2.0 等。大模型已然成为社区势不可挡的发展趋势。

然而,当前语言模型存在着一些问题,比如逻辑推理较弱。那么,我们是否可以仅通过添加更多数据和算力的情况下改进这些问题呢?或者,我们已经达到了语言模型相关技术范式的极限?

Gopher:2800 亿参数,接近人类阅读理解能力

今日,DeepMind「一口气」发表了三篇论文,目的之一就是解决当前语言模型存在的问题。DeepMind 得出的结论是进一步扩展大规模语言模型应该会带来大量的改进。此前在一次电话简报会上,DeepMind 研究科学家 Jack Rae 表示,「这些论文的一个关键发现是大规模语言模型依然在进展之中,能力也在继续增强。这个领域并没有停滞不前。」

2600亿参数,60多项任务突破,全球首个知识增强千亿大模型鹏城-百度·文心发布

百度与鹏城实验室联合发布全球首个知识增强千亿大模型——鹏城 - 百度 · 文心(ERNIE 3.0 Titan),是目前为止全球最大的中文单体模型。同时,百度产业级知识增强大模型 “文心” 全景图首次亮相。

从 15 亿参数的 GPT-2 到 1750 亿参数的 GPT-3,我们已经看到了模型规模增长和训练数据增加所带来的显著收益,其中最重要的一点就是对标注数据的依赖显著降低,这使得很多数据稀缺的场景也能用上性能强大的 AI 模型,为 AI 的大规模工业化应用扫清了障碍。

原文标题:【AI简报20211210期】L4自动驾驶解决方案面世、达摩院成功研发存算一体AI芯片

文章出处:【微信公众号:RTThread物联网操作系统】欢迎添加关注!文章转载请注明出处。

审核编辑:彭菁
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1797

    文章

    47867

    浏览量

    240885
  • AI芯片
    +关注

    关注

    17

    文章

    1914

    浏览量

    35272
  • 燧原科技
    +关注

    关注

    0

    文章

    128

    浏览量

    8427

原文标题:【AI简报20211210期】L4自动驾驶解决方案面世、达摩院成功研发存算一体AI芯片

文章出处:【微信号:RTThread,微信公众号:RTThread物联网操作系统】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    简单认识第二代高通3D Sonic传感器

    目前,已有多款搭载骁龙8至尊版移动平台的新机陆续发布,其中不少机型采用第二代高通3D Sonic超声波指纹解锁,为用户带来了更为便捷、高效的解锁体验。作为高通新一超声波指纹解锁解决方案,第二
    的头像 发表于 01-21 10:05 194次阅读

    第二代AMD Versal Premium系列器件的主要应用

    随着数据中心工作负载持续呈指数级增长,存储层也需要同等的性能提升才能跟上步伐。第二代 AMD Versal Premium 系列器件为各种存储应用提供了巨大优势,包括企业级 SSD、加密/压缩加速
    的头像 发表于 01-15 14:03 192次阅读

    原技术伙伴培育计划第二期开启

    新的里程碑,第二期ETP培训于昨日在上海正式开课,来自中电金信、恒生电子、清昴智能、超聚变、姆派乐、思迹信息、先进编译实验室、亿芯智算、弘华创等10家企业的近30位技术专家和工程师
    的头像 发表于 01-10 15:25 346次阅读

    第二代AMD Versal Premium系列产品亮点

    、测试和与测量数据密集型应用的需求。第二代 AMD Versal Premium 系列能够加快数据流程1,2并减少存储器瓶颈3,令数据密集型应用可以得到加速、洞察得以解锁。
    的头像 发表于 01-08 11:50 293次阅读

    原科技2024年度精彩回顾

    2024年,我们信念如磐,以新一代人工智能推理加速卡原S60”持续为通用人工智能算力底座筑基。
    的头像 发表于 12-31 14:54 665次阅读

    原科技联合腾讯入选“行业平台领航者典型案例”

    异构智算集群打造国产算力资源池”项目成功入选“行业平台领航者典型案例”。 原科技与腾讯合作已久,今年更是与专有TCE在智算领域开启
    的头像 发表于 12-24 09:29 722次阅读

    原科技亮相2024中国人工智能大会

    近日,原科技创新研究院首席研究员石恒博士受邀在2024中国人工智能大会的“AI芯片与智能计算创新生态”专题论坛上,发表了《面向AI芯片的高性能计算核领域特定语言探索》的主题演讲。
    的头像 发表于 12-19 13:58 285次阅读

    AMD推出第二代Versal Premium系列

    近日,AMD(超威,纳斯达克股票代码:AMD )今日宣布推出第二代 AMD Versal Premium 系列,这款自适应 SoC 平台旨在面向各种工作负载提供最高水平系统加速第二代 Versal
    的头像 发表于 11-13 09:27 476次阅读

    一加正式发布第二代东方屏,获全球首个DisplayMate A++认证

    近日,一加携手京东方正式发布第二代东方屏,并宣布将在年度旗舰产品一加 13 中首发搭载。去年,一加联合京东方打造出世界上最好的屏幕——东方屏,这是一次中国屏幕历史级的突破。本次发布第二代
    的头像 发表于 10-21 17:32 357次阅读

    Figure AI发布第二代人形机器人——Figure 02

    在科技日新月异的今天,人工智能领域再次迎来了一项重大突破。8月6日,备受瞩目的人工智能机器人初创公司Figure AI正式揭晓了其精心打造的第二代人形机器人——Figure 02,这一里程碑式的成果不仅标志着
    的头像 发表于 08-07 16:50 798次阅读

    FPGA在人工智能中的应用有哪些?

    FPGA(现场可编程门阵列)在人工智能领域的应用非常广泛,主要体现在以下几个方面: 一、深度学习加速 训练和推理过程加速:FPGA可以用来加速
    发表于 07-29 17:05

    从千集群卡到万集群,原科技打造更好的AI算力底座

    :WAIC 2024)上,不仅有国内各大模型厂商同场竞技,也有丰富的算力基础设施展示,其中包括专注人工智能领域云端算力产品的原科技。   原科技展台 从千
    的头像 发表于 07-07 09:45 2473次阅读
    从千<b class='flag-5'>卡</b>集群卡到万<b class='flag-5'>卡</b>集群,<b class='flag-5'>燧</b>原科技打造更好的AI算力底座

    第二代SiC碳化硅MOSFET关断损耗Eoff

    第二代SiC碳化硅MOSFET关断损耗Eoff
    的头像 发表于 06-20 09:53 643次阅读
    <b class='flag-5'>第二代</b>SiC碳化硅MOSFET关断损耗Eoff

    AMD推出第二代Versal器件,为AI驱动型嵌入式系统提供端到端加速

    Versal AI Edge 系列和第二代 Versal Prime 系列自适应 SoC,其将预处理、AI 推理与后处理集成于单器件中,能够为 AI 驱动型嵌入式系统提供端到端加速
    的头像 发表于 04-10 10:25 1179次阅读

    瑞芯微第二代8nm高性能AIOT平台 RK3576 详细介绍

    RK3576处理器 RK3576瑞芯微第二代8nm高性能AIOT平台,它集成了独立的6TOPS(Tera Operations Per Second,每秒万亿次操作)NPU(神经网络处理单元),用于
    发表于 03-12 13:45