0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

瀚博完成DeepSeek全版本训推适配

瀚博半导体VastaiTech 来源:瀚博半导体VastaiTech 2025-02-08 11:28 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

国产高端GPU芯片提供商瀚博半导体(以下简称“瀚博”)已完成DeepSeek-V3与R1全系列模型训推适配,单机可支持V3与R1 671B全量满血版模型部署。

迅速完成DeepSeek-V3与R1全量满血版适配

普惠AI应用创新

瀚博产品全面支持DeepSeek-V3与R1全系列模型在数据中心、企业私有化和边缘智能部署。

瀚博VGX VA16 AIGC大模型一体机方案支持DeepSeek-V3与R1 671B全量模型及R1的各个蒸馏模型。凭借单服务器高达1TB或2TB的超大显存,单机可本地支持DeepSeek-V3与R1 671B模型的实时高精度推理,8机可有效地支持DeepSeek-V3与R1 671B模型的全参微调,在多种内容生成任务中展现优异性能,为广大企业提供高性价比和超低成本的私有化部署解决方案。

与此同时,瀚博全系列大模型加速卡产品支持DeepSeek-V3、R1 671B全量模型以及R1蒸馏模型在数据中心灵活可扩展部署,推动API成本进一步降低。

另外,瀚博边缘智算模组产品支持DeepSeek-R1 7B/13B蒸馏模型在车路云和机器人等边缘计算场景的低功耗低成本高性能部署,助力智慧交通、智慧工业、具身智能等行业应用落地。

跃进始于开源 扩容智算生态

无疑,因开源战略和技术创新,DeepSeek正在重塑全球AI产业版图。瀚博GPU与DeepSeek的适配,有助于加速国内AI产业链自主发展,完善智算生态。

在适配过程中,瀚博在软硬件协同优化方面做了大量工作,确保DeepSeek-V3和R1在瀚博平台上发挥最大效能,并为模型的持续优化以及大规模部署奠定了坚实基础。瀚博迅速集成DeepSeek的开源模型,为客户和合作伙伴提供高性能的算力资源,显著提升了模型的推理效率,同时节省了硬件成本,有助于加速尖端AIGC应用和体验的垂直类开发和规模部署。

未来,瀚博将持续深化与开源社区合作,秉持“为数字和像素世界提供浩瀚算力”的使命和愿景,充分发挥瀚博在异构计算领域的软硬件优势,全方位、深层次地推动更大规模部署,推进智算生态繁荣。

欢迎咨询基于瀚博半导体GPU的DeepSeek-V3/R1商业落地方案!

我们非常重视与每一位客户的交流与沟通。如果您有意了解基于瀚博半导体GPU的DeepSeek-V3/R1商业落地方案,或者对瀚博的产品和服务有任何建议,欢迎扫描下方二维码,填写表单告诉我们。您的反馈将是我们不断进步的动力,同时我们的销售团队也会为您提供详细的解答和专业的服务。期待您的声音。

关于瀚博

瀚博半导体是一家高端GPU芯片提供商,成立于2018年12月,注册地在中国上海。瀚博半导体为人工智能核心算力和图形渲染、内容生成提供全栈式芯片解决方案。瀚博秉持“为数字和像素世界提供浩瀚算力”的使命和愿景,潜心研发核心技术,目前拥有自主研发的核心IP以及两代GPU芯片,提供图形渲染GPU、数据中心AI GPU和边缘AI GPU三大产品线。

瀚博凭借前沿的自主原创架构、强大的软硬件融合开发能力以及丰富的设计经验研发出高质量的GPU产品,瀚博两代芯片现已量产并商业化落地,赋能人工智能与云端图形渲染产业,助力大模型与生成式人工智能、智算数据中心、智慧工业、机器人与具身智能、智慧交通、车路协同、数字孪生、工业软件、云手机、云电脑、云渲染等应用落地。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    463

    文章

    54484

    浏览量

    469869
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5292

    浏览量

    136113
  • 模型
    +关注

    关注

    1

    文章

    3835

    浏览量

    52293
  • DeepSeek
    +关注

    关注

    2

    文章

    859

    浏览量

    3419

原文标题:瀚博完成DeepSeek全版本训推适配,单机支持V3与R1 671B满血版部署

文章出处:【微信号:瀚博半导体VastaiTech,微信公众号:瀚博半导体VastaiTech】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    半导体载天VA16加速卡成功适配DeepSeek-V4大模型

    4月24日,深度求索正式开源全新系列模型DeepSeek-V4。半导体第一时间完成载天VA16加速卡的FP4+FP8 混合精度适配,加速
    的头像 发表于 05-06 15:54 313次阅读

    摩尔线程完成DeepSeek-V4链路工程化适配:S5000基于MUSA+SGLang实现复杂MoE模型快速落地

    近日,摩尔线程依托旗舰级AI一体智算卡MTT S5000与自研MUSA软件栈,基于SGLang 开源推理框架,成功完成DeepSeek-V4的完整运行验证。该成果表明,面向新一代M
    发表于 05-02 09:01 722次阅读

    摩尔线程携手智源人工智能研究院Day-0适配DeepSeek-V4 Pro和Flash双模型

    4月24日,摩尔线程联合北京智源人工智能研究院,基于旗舰级AI一体智算卡MTT S5000与FlagOS栈软件体系,完成DeepSeek
    的头像 发表于 04-30 16:30 1194次阅读

    摩尔线程携手上海AI实验室Day-0适配DeepSeek-V4核心算子

    今日,DeepSeek-V4预览版正式发布并开源。摩尔线程携手上海 AI 实验室 DeepLink 团队,通过大模型驱动的智能算子迁移系统 KernelSwift,率先在旗舰级AI一体智算卡
    的头像 发表于 04-30 16:24 1267次阅读

    登临科技GPU+架构深度适配DeepSeek-V4大模型

    DeepSeek-V4-Flash,系标配百万token长上下文能力,开启大模型长文本普惠新时代。同日,开源社区已提交适配DeepSeek-V4的代码。 作为国产高性能通用GPU的
    的头像 发表于 04-29 16:07 1435次阅读

    沐曦股份Day 0适配DeepSeek-V4-Flash模型

    4月24日,沐曦股份携手FlagOS,已完对DeepSeek最新开源的DeepSeek-V4-Flash模型的Day 0适配。同日,沐曦股份还联合上海人工智能实验室KernelSwift智能算子迁移系统,率先
    的头像 发表于 04-28 15:53 569次阅读

    燧原科技L600 FP8原生适配DeepSeek-V4-Pro/Flash模型

    两大版本系标配百万token长上下文能力,燧原L600已完成对上述两个模型在FP8精度上的极速适配
    的头像 发表于 04-28 15:19 526次阅读

    长江计算G940K V2超节点服务器完成DeepSeek V4模型极速适配

      4月24日,备受行业关注的大模型产品DeepSeek V4正式发布。烽火通信旗下长江计算凭借深厚的技术积累与前瞻布局,以G940K V2超节点服务器为核心载体,同步完成DeepSeek V4的
    的头像 发表于 04-24 17:40 1900次阅读

    海光信息DCU平台完成DeepSeek V4模型极速适配

      4月24日,深度求索正式发布并开源DeepSeek V4。海光DCU同步完成DeepSeek V4的Day0适配,以“模型发布—芯片适配
    的头像 发表于 04-24 17:32 1728次阅读

    摩尔线程S5000 + 智源FlagOS:基于原生FP8引擎,Day-0适配DeepSeek-V4

    4月24日,摩尔线程携手智源众智FlagOS社区,在旗舰级AI一体全功能GPU MTT S5000上,率先实现对新一代大模型DeepSeek-V4-Flash的Day-0极速适配
    发表于 04-24 16:30 1674次阅读
    摩尔线程S5000 + 智源FlagOS:基于原生FP8引擎,Day-0<b class='flag-5'>适配</b><b class='flag-5'>DeepSeek</b>-V4

    半导体与松应科技达成战略合作

    双方将基于VG1000 GPU与松应ORCA系统的深度适配,在具身智能、物理AI模拟仿真、机器人训练等领域展开技术合作,联合推出面向智能制造与具身智能场景的一体化解决方案,共同推动国产物理AI仿真生态体系建设。
    的头像 发表于 04-01 17:46 1246次阅读

    燧原科技一体芯片L600适配阶跃星辰基座模型Step 3.5 Flash

    ”的 Agent 底层模型选项,从而真正融入日常开发。燧原科技的新一代一体芯片L600已率先完成适配,成为国内首批适配该模型的国产算力。
    的头像 发表于 02-02 17:50 1612次阅读
    燧原科技<b class='flag-5'>训</b><b class='flag-5'>推</b>一体芯片L600<b class='flag-5'>适配</b>阶跃星辰基座模型Step 3.5 Flash

    润和软件AIRUNS一体化平台与昇腾910C芯片深度适配

    近日,在江苏鲲鹏・昇腾生态创新中心的全程支持下,江苏润和软件股份有限公司(以下简称“润和软件”)自主研发的AIRUNS一体化平台完成与搭载昇腾910C芯片的Atlas 800T A3训练服务器
    的头像 发表于 12-22 14:51 911次阅读
    润和软件AIRUNS<b class='flag-5'>训</b><b class='flag-5'>推</b>一体化平台与昇腾910C芯片深度<b class='flag-5'>适配</b>

    中科曙光AI超集群系统和scaleX640超节点等产品全面适配DeepSeek V3.2

    层实现“跨层协同”,曙光AI超集群系统、scaleX640超节点等产品0day完成DeepSeek版本的深度适配与调优,支持各行各业客户进行
    的头像 发表于 12-05 14:32 998次阅读

    曙光AI超集群系统全面支持DeepSeek-V3.2-Exp

    9月29日,DeepSeek-V3.2-Exp正式发布并开源,引入创新的稀疏Attention架构。基于中国首个AI计算开放架构,芯片层、软件层、模型层实现“跨层协同”,使得曙光AI超集群系统完成DeepSeek
    的头像 发表于 09-30 16:18 1901次阅读