0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

最被看好的 AI 芯片初创公司之一,Tenstorrent加速卡出货

E4Life 来源:电子发烧友网 作者:周凯扬 2024-01-04 00:04 次阅读

电子发烧友网报道(文/周凯扬)在 CRN 发布的 2023 年十大半导体初创公司的名单上,我们看到了不少AI 芯片厂商的名字,比如Cerebras Systems、SiMa.ai和Tenstorrent。其中Tenstorrent 最惹人关注,这家位于多伦多的初创企业如今由知名半导体业界大神 Jim Keller担任CEO。

Tenstorrent 在 2021 年收获了富达集团领投的 2 亿美元融资后,又在2023 年获得了来自现代汽车集团和三星催化剂基金会领投的 1 亿美元融资。但对于这家厂商的硬件产品,我们却很少得见真容,直到最近其开发套件开放订购和出货。

开发套件出货,新的 AI 硬件开发平台

从 Tenstorrent 的官网来看,目前已经开放订购的是其第一代 PCIe 4.0 AI 推理加速卡,e75 和 e150,两者的定价分别为 599 美元和 799 美元。e75 开发套件可用于基础的推理任务,采用了 1/2 PCIe长度的设计搭配了 Tenstorrent 的第一代 AI 芯片 Grayskull,集成了96 个 Tensix 核心、96MB 的 SRAM、8GB LPDDR4 内存,核心频率达到 1GHz,整个板卡的功耗约为75W。

e150 则是 3/4 长度的 PCIe 加速卡,同样搭载了一个 Grayskull 芯片,但核心数却达到了 120个,同时配备了120MB 的 SRAM,核心频率也提升至 1.2GHz,单卡功耗约为 200W.

e75 虽然只是入门级的推理硬件套件,却已经给到了完整的开发流程,开发者可以使用两种不同的软件实现方式,一套是从上至下的 TT-Buda,另一套是从下至上的TT-Metalium。TT-Buda适用于想要开箱即用,直接将任何模型投入量产的客户。而TT-Metalium则适用于想要充分了解 Tenstorrent软硬件,并借此定制开发模型的客户。

需要注意的是,e75 和 e150仅仅是 AI 加速卡而已,仍需要搭配一套通用计算系统才能精心开展 AI 开发。目前其仅支持 x86_64 架构和 Ubuntu 20.04 以上版本的系统,且需要 64GB 的内存和至少 100GB 的存储。

Tenstorrent 下一代 AI 芯片

除了第一代芯片 Grayskull 以外,Tenstorrent也公开了基于第二代芯片 Wormhole 的 PCIe AI 加速卡 n150 和 n300,n150 搭载了一个 Wormhole 芯片,而 n300 搭载了两个 Wormhole 芯片,因此两者的 Tensix 核心数存在较大差异,分别是 72 个和 128 个,单板功耗分别为 160W和 300W。

从内存配置上看,Wormhole也确实是面向更高性能的 AI 解决方案,将 Grayskull 的 LPDDR4 内存换成了带宽更高的 GDDR6 内存。根据Tenstorrent 提供的说明,GraySkull 和 Wormhole 已经支持了市面上主流的模型,比如 BERT、GPT-2、MobileNetV3、ResNet和YOLOv5等等,而性能更强的 Wormhole还提供了对 Falcon 和 Stable Diffusion 的支持。

不过,与可以单独购买单个开发套件的 e75 和 e150 相比,目前 n150 和 n300 只开放了批量购买,且并没有公布定价。要知道,无论是 Grayskull还是 Wormhole,都只是 Tenstorrent对 AI 芯片的早期设计与尝试,两者均基于 12nm 工艺开发,且实际算力差距并不大,都在 300TFLOPS@INT8左右,只是其他硬件资源配置上有些许不同。而后续即将推出的 Black Hole将基于 6nm 工艺打造,将算力提升至1000TFLOPS@INT8 左右。

在其产品路线图上,预计在今年公开发布的 Grendel才是其针对高端 AI 计算的杀手锏。Grendel采用了全新的 Chiplet 设计,且用到了自研的 RISC-V CPU 核心,结合 3nm 工艺的 AI&CPU Chiplet,以及 7nm 工艺的内存与 I/O Chiplet,将提供一个完整可扩展的 AI 硬件平台。

写在最后

对于任何一个新的 AI 开发平台而言,硬件开发套件和配套软件都是至关重要的,甚至决定了愿意尝试的开发者基数。Tenstorrent 在开放了 e75 和e150的购买后,无疑给不少还在观望其硬件架构的开发一个尝鲜的机会。而开箱即用的体验,想必也会吸引不少厂商对后续的高性能产品产生兴趣。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    32271

    浏览量

    271353
  • 加速卡
    +关注

    关注

    1

    文章

    61

    浏览量

    11034
  • AI芯片
    +关注

    关注

    17

    文章

    1925

    浏览量

    35370
  • Tenstorrent
    +关注

    关注

    0

    文章

    13

    浏览量

    167
收藏 人收藏

    相关推荐

    Tenstorrent获7亿美元融资,贝索斯参投挑战英伟达

    AI芯片初创公司Tenstorrent近日宣布获得高达7亿美元的融资,公司估值也随之攀升至26亿
    的头像 发表于 12-03 11:07 419次阅读

    S7t-VG6 VectorPath加速卡的特性和功能

    S7t-VG6 VectorPath加速卡是Achronix公司联合BittWare公司(Molex旗下的领先企业级FPGA加速器产品供应商)推出的
    的头像 发表于 11-14 11:19 442次阅读

    Tenstorrent与日本合作:五年内培训200名日本芯片工程师

    美国人工智能(AI芯片初创公司Tenstorrent近日宣布,已与日本政府达成了项重要协议。
    的头像 发表于 11-06 14:30 504次阅读

    AMD推出新款纤薄尺寸电子交易加速卡

    UL3422 为交易商、做市商和金融机构提供了款针对机架空间和成本进行优化的纤薄型加速卡,旨在快速部署到各种服务器中。
    的头像 发表于 10-16 09:14 553次阅读

    大模型向边端侧部署,AI加速卡朝高算力、小体积发展

    电子发烧友网报道(文/李弯弯)AI加速卡是专门用于处理人工智能应用中的大量计算任务的模块。它集成了高性能的计算核心和大量的内存,旨在加速机器学习、深度学习等算法的计算过程。当前,AI
    的头像 发表于 09-17 00:18 4170次阅读

    EPSON差分晶振SG3225VEN频点312.5mhz应用于AI加速卡

    AI加速卡,通常也被称为AI算力,是种专为加速人工智能(
    发表于 09-10 14:56 0次下载

    YXC高频差分晶振,频点312.5mhz,高精度.高稳定性,应用于AI加速卡

    AI加速卡中,扬兴推荐的YXC差分晶振YSO210PR系列,该系列频率范围为10MHz ~1500MHz,可满足高精度、高稳定度的需求,支持差分信号(LVDS/LVPECL)输出,以下为YSO210PR系列中OA2EIBW
    的头像 发表于 08-21 14:03 467次阅读
    YXC高频差分晶振,频点312.5mhz,高精度.高稳定性,应用于<b class='flag-5'>AI</b><b class='flag-5'>加速卡</b>

    AI初创公司Etched获1.2亿美元A轮融资,加速专用AI芯片研发

    旧金山的家人工智能(AI初创公司Etched宣布,在最近完成的A轮融资中成功筹集了1.2亿美元的资金。这笔资金将主要用于进步开发其专用
    的头像 发表于 06-26 14:13 842次阅读

    借助全新 AMD Alveo™ V80 计算加速卡释放计算能力

    灵活应变能力以实现工作负载优化。Alveo V80 加速卡现已量产出货,其能提供较之上加速卡至高 2 倍的带宽与计算密度1,并为使用 AMD Vivado™ 设计套件的 FPGA
    发表于 05-16 14:09 316次阅读
    借助全新 AMD Alveo™ V80 计算<b class='flag-5'>加速卡</b>释放计算能力

    AMD Alveo V80计算加速卡实现量产

    AMD公司近日迎来了个重要的里程碑,其专为大型数据集和内存受限型应用设计的Alveo V80计算加速卡,已正式进入量产出货阶段。这款创新产品针对高性能计算(HPC)、数据分析、金融、
    的头像 发表于 05-16 11:40 699次阅读

    OpenAI Sora模型需大量AI加速卡及电力支持

    若以每片H100加速卡3万美元市价估算,总花费将高达216亿美元(相当于1561.68亿元人民币),这仅是H100加速卡采购费用。该模型在运营时还会产生极高的能耗,每片H100能耗达到700瓦,72万片则意味着能耗高达50.4亿瓦。
    的头像 发表于 03-27 15:58 636次阅读

    英伟达发布最强AI加速卡Blackwell GB200

    英伟达在最近的GTC开发者大会上发布了其最新、最强大的AI加速卡——GB200。这款加速卡采用了新AI图形处理器架构Blackwell,
    的头像 发表于 03-20 11:38 1349次阅读

    英伟达发布超强AI加速卡,性能大幅提升,可支持1.8万亿参数模的训练

    得益于NVIDIA每两年进行次GPU架构升级以提高性能的策略,全新的基于Blackwell的加速卡比之前的H100更为强大,尤其适用于AI相关任务。
    的头像 发表于 03-19 12:04 1013次阅读

    英伟达发布最强AI加速卡GB200,开启新AI图形处理时代

    英伟达正式发布了其最新、也是迄今为止最强大的AI加速卡——GB200。这重大发布标志着英伟达在AI图形处理领域迈入了个新的里程碑。
    的头像 发表于 03-19 11:26 1420次阅读
    英伟达发布最强<b class='flag-5'>AI</b><b class='flag-5'>加速卡</b>GB200,开启新<b class='flag-5'>一</b>代<b class='flag-5'>AI</b>图形处理时代

    今日看点丨英伟达发布最强 AI 加速卡--Blackwell GB200;三星面临罢工 存储市场供需引关注

    的 GTC 开发者大会上,正式发布了最强 AI 加速卡 GB200,并计划今年晚些时候发货。   GB200 采用新AI 图形处理器架构 Blackwell,黄仁勋在 GTC 大
    发表于 03-19 11:08 1335次阅读