0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Zyphra推出Zamba2-mini 1.2B模型

CHANBAEK 来源:网络整理 作者:网络整理 2024-08-29 18:13 次阅读

近日,AI创新先锋Zyphra公司科技界投下了一颗震撼弹,正式揭晓其最新力作——Zamba2-mini 1.2B模型。这款被誉为端侧SOTA(State-Of-The-Art)级别的小语言模型,以其卓越的性能参数和极致的压缩效率,成为了业界关注的焦点。

Zamba2-mini 1.2B携带着惊人的12亿参数量,却能在严苛的4bit量化条件下,将内存占用控制在惊人的700MB以下,这一成就无疑是对AI模型轻量化探索的一次重大突破。其背后,是Zyphra团队对模型架构的深度优化与大胆创新,成功融合了多种神经网络设计的精髓,既保留了大型密集变压器模型的高质量输出特性,又实现了小模型难以企及的计算与内存效率。

Zamba2-mini 1.2B的问世,不仅为端侧设备提供了更为强大的智能支持,更预示着AI技术在实际应用场景中的广泛落地与深度融合。随着这一技术的不断成熟与普及,我们有理由相信,未来的端侧AI将更加智能、高效,为人们的生活带来更多便利与惊喜。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 变压器
    +关注

    关注

    159

    文章

    7462

    浏览量

    135135
  • AI
    AI
    +关注

    关注

    87

    文章

    30728

    浏览量

    268886
  • 模型
    +关注

    关注

    1

    文章

    3226

    浏览量

    48807
收藏 人收藏

    评论

    相关推荐

    图森未来发布“Ruyi”视频大模型,Ruyi-Mini-7B版本现已开源

    重大献礼。 尤为值得一提的是,图森未来已经将Ruyi的Mini-7B版本正式开源,用户现在可以通过huggingface平台轻松下载并使用这一强大的工具。这一举措无疑将极大地推动视频大模型在更广泛领域的应用和发展。 “Ruyi”模型
    的头像 发表于 12-20 15:19 478次阅读

    Meta推出Llama 3.3 70B,AI大模型竞争白热化

    在今年的AI领域,Meta也不甘落后,推出了其压轴之作——Llama 3.3 70B模型。与此同时,马斯克的xAI也宣布其Grok模型从今天起全球免费开放(但存在一定的使用限制)。
    的头像 发表于 12-09 14:50 358次阅读

    智谱推出四个全新端侧模型 携英特尔按下AI普及加速键

    ,GLM-Edge-4B-chat、GLM-Edge-1.5B-chat为端侧大语言模型,GLM-Edge-V-5B、GLM-Edge-V-2B
    的头像 发表于 12-02 17:13 196次阅读
    智谱<b class='flag-5'>推出</b>四个全新端侧<b class='flag-5'>模型</b> 携英特尔按下AI普及加速键

    PerfXCloud重磅升级 阿里开源最强视觉语言模型Qwen2-VL-7B强势上线!

    体验吧! Qwen2-VL Qwen2-VL模型由阿里推出,在描述图像、理解视频以及解答视觉相关问题等方面表现极为卓越。该模型提供
    的头像 发表于 10-23 11:07 275次阅读
    PerfXCloud重磅升级  阿里开源最强视觉语言<b class='flag-5'>模型</b>Qwen<b class='flag-5'>2-VL-7B</b>强势上线!

    英伟达发布AI模型 Llama-3.1-Nemotron-51B AI模型

    英伟达公司宣布推出 Llama-3.1-Nemotron-51B AI 模型,这个AI大模型是源自 Meta 公司的 Llama-3.1-70B
    的头像 发表于 09-26 17:30 605次阅读

    马斯克旗下xAI对Grok-2-mini进行速度升级

    科技巨头马斯克旗下的xAI公司近日宣布了一项重大进展,其热门语言模型Grok-2-mini成功完成了速度升级。
    的头像 发表于 08-27 15:28 383次阅读

    如何通过JTAG这个接口给ESP32-LyraT-Mini_V1.2烧录代固件?

    你好, 我发现ESP32-LyraT-Mini_V1.2开发板有JTAG接口引出,我们想通过这个开发板上面的ESP32-WROVER-B模块做二次开发(UART0串口有它用),请问如何通过JTAG这个接口给板子烧录代固件? 还有这部分的相关资料能推荐下吗。
    发表于 07-02 07:05

    ESP32-LyraT-Mini_V1.2开发板运行ADF例程无法录音要如何解决?

    ESP32-LyraT-Mini_V1.2开发板运行例程无法录音 环境: IDF 4.3 , ADF Git master 和 esp-adf-release-v2.4 例程1: C
    发表于 06-28 07:56

    lyrat-mini-v1.2使用例程pipeline_wav_amr_sdcard录音没有声音怎么解决?

    lyrat-mini-v1.2使用例程pipeline_wav_amr_sdcard录音没有声音,SD卡中有文件,但是没有声音怎么解决啊
    发表于 06-28 06:43

    智谱AI发布全新多模态开源模型GLM-4-9B

    近日,智谱AI在人工智能领域取得重大突破,成功推出全新开源模型GLM-4-9B。这款模型以其卓越的多模态能力,再次刷新了业界对于大型语言模型
    的头像 发表于 06-07 09:17 726次阅读

    微软发布视觉型AI新模型:Phi-3-vision

     据悉,Phi-3-vision 作为微软 Phi-3 家族的首款多模态模型,继承自 Phi-3-mini 的文本理解能力,兼具轻巧便携特性,适用于移动平台/嵌入式终端;模型参数规模达 42 亿,远超 Phi-3-
    的头像 发表于 05-27 15:56 472次阅读

    Bose Soundlink Mini2_维修记录

    Bose Soundlink Mini2_维修记录
    的头像 发表于 04-14 10:11 2947次阅读
    Bose Soundlink <b class='flag-5'>Mini2</b>_维修记录

    微功率电压参考LMx85-1.2 LM385B-1.2数据表

    电子发烧友网站提供《微功率电压参考LMx85-1.2 LM385B-1.2数据表.pdf》资料免费下载
    发表于 04-01 15:41 0次下载
    微功率电压参考LMx85-<b class='flag-5'>1.2</b> LM385<b class='flag-5'>B-1.2</b>数据表

    Meta发布开源大模型Code Llama 70B

    近日,Meta宣布推出了一款新的开源大模型Code Llama 70B,这是其“Code Llama家族中体量最大、性能最好的模型版本”。这款新模型
    的头像 发表于 01-31 09:24 921次阅读

    Stability AI推出迄今为止更小、更高效的1.6B语言模型

    Stability AI 宣布推出迄今为止最强大的小语言模型之一 Stable LM 2 1.6B
    的头像 发表于 01-23 10:11 793次阅读
    Stability AI<b class='flag-5'>推出</b>迄今为止更小、更高效的1.6<b class='flag-5'>B</b>语言<b class='flag-5'>模型</b>