0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AMD发布首款小语言AI模型Llama-135m

CHANBAEK 来源:网络整理 2024-09-30 16:38 次阅读

近日,AMD在Huggingface平台上正式推出了自家首款“小语言模型”——AMD-Llama-135m。这款模型以其独特的推测解码功能,吸引了业界的广泛关注。

AMD-Llama-135m模型拥有6700亿个token,并采用了Apache 2.0开源许可,为用户提供了更多的灵活性和自由度。据AMD介绍,该模型主打“推测解码”能力,这一功能的基本原理是通过使用一个小型草稿模型来生成一组候选token,然后由更大的目标模型对这些候选token进行验证。这种方法不仅能够确保生成的token的准确性和可靠性,而且允许每次前向传递生成多个token,从而显著提高了效率。

与传统的AI模型相比,AMD-Llama-135m在RAM占用方面也有了显著的优化。由于采用了推测解码技术,该模型能够在不影响性能的前提下,减少RAM的占用,实现了更加高效的计算和存储资源利用。

AMD-Llama-135m的发布,标志着AMD在AI领域迈出了重要的一步。未来,AMD将继续致力于AI技术的研发和创新,为全球用户提供更加智能、高效和可靠的解决方案。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • amd
    amd
    +关注

    关注

    25

    文章

    5480

    浏览量

    134320
  • AI
    AI
    +关注

    关注

    87

    文章

    31158

    浏览量

    269532
  • 模型
    +关注

    关注

    1

    文章

    3268

    浏览量

    48944
收藏 人收藏

    评论

    相关推荐

    NVIDIA推出开放式Llama Nemotron系列模型

    作为 NVIDIA NIM 微服务,开放式 Llama Nemotron 大语言模型和 Cosmos Nemotron 视觉语言模型可在任何
    的头像 发表于 01-09 11:11 192次阅读

    极空间私有云联合UnifyDrive亮相CES:发布全球语言模型 AI NAS

    的是,作为国内领先的网络存储品牌极空间私有云此次联合UnifyDrive宣布推出全球配备大语言模型(LLM)的AINAS,同时也是全球
    的头像 发表于 01-08 11:38 80次阅读
    极空间私有云联合UnifyDrive亮相CES:<b class='flag-5'>发布</b>全球<b class='flag-5'>首</b><b class='flag-5'>款</b>大<b class='flag-5'>语言</b><b class='flag-5'>模型</b> <b class='flag-5'>AI</b> NAS

    Meta重磅发布Llama 3.3 70B:开源AI模型的新里程碑

    新的高度。 一,技术突破:开源智能的新高度 Llama 3.3 70B 模型发布,标志着开源AI模型在智能水平上的一大飞跃。它不仅达到了之
    的头像 发表于 12-18 16:46 161次阅读
    Meta重磅<b class='flag-5'>发布</b><b class='flag-5'>Llama</b> 3.3 70B:开源<b class='flag-5'>AI</b><b class='flag-5'>模型</b>的新里程碑

    使用NVIDIA TensorRT提升Llama 3.2性能

    Llama 3.2 模型集扩展了 Meta Llama 开源模型集的模型阵容,包含视觉语言
    的头像 发表于 11-20 09:59 261次阅读

    Llama 3 与开源AI模型的关系

    在人工智能(AI)的快速发展中,开源AI模型扮演着越来越重要的角色。它们不仅推动了技术的创新,还促进了全球开发者社区的合作。Llama 3,作为一个新兴的
    的头像 发表于 10-27 14:42 398次阅读

    Llama 3 模型与其他AI工具对比

    Llama 3模型与其他AI工具的对比可以从多个维度进行,包括但不限于技术架构、性能表现、应用场景、定制化能力、开源与成本等方面。以下是对Llama 3
    的头像 发表于 10-27 14:37 435次阅读

    Llama 3 语言模型应用

    在人工智能领域,语言模型的发展一直是研究的热点。随着技术的不断进步,我们见证了从简单的关键词匹配到复杂的上下文理解的转变。 一、Llama 3 语言
    的头像 发表于 10-27 14:15 297次阅读

    亚马逊云科技上线Meta Llama 3.2模型

    亚马逊云科技近日宣布,Meta公司的新一代模型Llama 3.2已在其平台上正式上线。该模型包括Meta多模态
    的头像 发表于 10-11 18:08 469次阅读

    亚马逊云科技正式上线Meta Llama 3.2模型

    亚马逊云科技宣布,Meta的新一代模型Llama 3.2,包括其多模态模型,现已在Amazon Bedrock和Amazon SageM
    的头像 发表于 10-11 09:20 533次阅读

    英伟达发布AI模型 Llama-3.1-Nemotron-51B AI模型

    英伟达公司宣布推出 Llama-3.1-Nemotron-51B AI 模型,这个AI模型是源自 Meta 公司的
    的头像 发表于 09-26 17:30 628次阅读

    Meta发布全新开源大模型Llama 3.1

    科技巨头Meta近期震撼发布了其最新的开源人工智能(AI模型——Llama 3.1,这一举措标志着Meta在AI领域的又一重大突破。Met
    的头像 发表于 07-24 18:25 1464次阅读

    NVIDIA AI Foundry 为全球企业打造自定义 Llama 3.1 生成式 AI 模型

    借助 NVIDIA AI Foundry,企业和各国现在能够使用自有数据与 Llama 3.1 405B 和 NVIDIA Nemotron 模型配对,来构建“超级模型” NVIDIA
    发表于 07-24 09:39 726次阅读
    NVIDIA <b class='flag-5'>AI</b> Foundry 为全球企业打造自定义 <b class='flag-5'>Llama</b> 3.1 生成式 <b class='flag-5'>AI</b> <b class='flag-5'>模型</b>

    Meta Llama 3基础模型现已在亚马逊云科技正式可用

    亚马逊云科技近日宣布,Meta公司最新发布的两Llama 3基础模型——Llama 3 8B和Llam
    的头像 发表于 05-09 10:39 419次阅读

    英特尔AI产品助力其运行Meta新一代大语言模型Meta Llama 3

    英特尔丰富的AI产品——面向数据中心的至强处理器,边缘处理器及AI PC等产品为开发者提供最新的优化,助力其运行Meta新一代大语言模型Meta L
    的头像 发表于 04-28 11:16 657次阅读

    LLaMA 2是什么?LLaMA 2背后的研究工作

    Meta 发布LLaMA 2,是新的 sota 开源大型语言模型 (LLM)。LLaMA 2 代表着
    的头像 发表于 02-21 16:00 1137次阅读