0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Zyphra推出Zamba2-mini 1.2B模型

CHANBAEK 来源:网络整理 作者:网络整理 2024-08-29 18:13 次阅读

近日,AI创新先锋Zyphra公司科技界投下了一颗震撼弹,正式揭晓其最新力作——Zamba2-mini 1.2B模型。这款被誉为端侧SOTA(State-Of-The-Art)级别的小语言模型,以其卓越的性能参数和极致的压缩效率,成为了业界关注的焦点。

Zamba2-mini 1.2B携带着惊人的12亿参数量,却能在严苛的4bit量化条件下,将内存占用控制在惊人的700MB以下,这一成就无疑是对AI模型轻量化探索的一次重大突破。其背后,是Zyphra团队对模型架构的深度优化与大胆创新,成功融合了多种神经网络设计的精髓,既保留了大型密集变压器模型的高质量输出特性,又实现了小模型难以企及的计算与内存效率。

Zamba2-mini 1.2B的问世,不仅为端侧设备提供了更为强大的智能支持,更预示着AI技术在实际应用场景中的广泛落地与深度融合。随着这一技术的不断成熟与普及,我们有理由相信,未来的端侧AI将更加智能、高效,为人们的生活带来更多便利与惊喜。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 变压器
    +关注

    关注

    159

    文章

    7171

    浏览量

    133582
  • AI
    AI
    +关注

    关注

    87

    文章

    29055

    浏览量

    266659
  • 模型
    +关注

    关注

    1

    文章

    3040

    浏览量

    48409
收藏 人收藏

    评论

    相关推荐

    英伟达发布AI模型 Llama-3.1-Nemotron-51B AI模型

    英伟达公司宣布推出 Llama-3.1-Nemotron-51B AI 模型,这个AI大模型是源自 Meta 公司的 Llama-3.1-70B
    的头像 发表于 09-26 17:30 380次阅读

    马斯克旗下xAI对Grok-2-mini进行速度升级

    科技巨头马斯克旗下的xAI公司近日宣布了一项重大进展,其热门语言模型Grok-2-mini成功完成了速度升级。
    的头像 发表于 08-27 15:28 280次阅读

    chatglm2-6b在P40上做LORA微调

    背景: 目前,大模型的技术应用已经遍地开花。最快的应用方式无非是利用自有垂直领域的数据进行模型微调。chatglm2-6b在国内开源的大模型上,效果比较突出。本文章分享的内容是用
    的头像 发表于 08-13 17:12 295次阅读
    chatglm<b class='flag-5'>2-6b</b>在P40上做LORA微调

    如何通过JTAG这个接口给ESP32-LyraT-Mini_V1.2烧录代固件?

    你好, 我发现ESP32-LyraT-Mini_V1.2开发板有JTAG接口引出,我们想通过这个开发板上面的ESP32-WROVER-B模块做二次开发(UART0串口有它用),请问如何通过JTAG这个接口给板子烧录代固件? 还有这部分的相关资料能推荐下吗。
    发表于 07-02 07:05

    ESP32-LyraT-Mini_V1.2开发板运行ADF例程无法录音要如何解决?

    ESP32-LyraT-Mini_V1.2开发板运行例程无法录音 环境: IDF 4.3 , ADF Git master 和 esp-adf-release-v2.4 例程1: C
    发表于 06-28 07:56

    lyrat-mini-v1.2使用例程pipeline_wav_amr_sdcard录音没有声音怎么解决?

    lyrat-mini-v1.2使用例程pipeline_wav_amr_sdcard录音没有声音,SD卡中有文件,但是没有声音怎么解决啊
    发表于 06-28 06:43

    智谱AI发布全新多模态开源模型GLM-4-9B

    近日,智谱AI在人工智能领域取得重大突破,成功推出全新开源模型GLM-4-9B。这款模型以其卓越的多模态能力,再次刷新了业界对于大型语言模型
    的头像 发表于 06-07 09:17 564次阅读

    微软发布视觉型AI新模型:Phi-3-vision

     据悉,Phi-3-vision 作为微软 Phi-3 家族的首款多模态模型,继承自 Phi-3-mini 的文本理解能力,兼具轻巧便携特性,适用于移动平台/嵌入式终端;模型参数规模达 42 亿,远超 Phi-3-
    的头像 发表于 05-27 15:56 393次阅读

    NVIDIA加速微软最新的Phi-3 Mini开源语言模型

    NVIDIA 宣布使用 NVIDIA TensorRT-LLM 加速微软最新的 Phi-3 Mini 开源语言模型。TensorRT-LLM 是一个开源库,用于优化从 PC 到云端的 NVIDIA GPU 上运行的大语言模型推理
    的头像 发表于 04-28 10:36 407次阅读

    Bose Soundlink Mini2_维修记录

    Bose Soundlink Mini2_维修记录
    的头像 发表于 04-14 10:11 2095次阅读
    Bose Soundlink <b class='flag-5'>Mini2</b>_维修记录

    微功率电压参考LMx85-1.2 LM385B-1.2数据表

    电子发烧友网站提供《微功率电压参考LMx85-1.2 LM385B-1.2数据表.pdf》资料免费下载
    发表于 04-01 15:41 0次下载
    微功率电压参考LMx85-<b class='flag-5'>1.2</b> LM385<b class='flag-5'>B-1.2</b>数据表

    Stability AI发布Stable Code Instruct 3B大语言模型,可编译多种编程语言

    据报道,Stability AI公司近期推出了适配程序员使用的Stable Code Instruct 3B大语言模型,此款模型的显著特点是能够实现编程语言间的自如切换。
    的头像 发表于 03-27 10:04 352次阅读

    向成电子科技有限公司新推出3568B2B的核心板

    2024年向成研发部新产品开发迎来了开门红,新推出3568B2B的核心板完成各项测试,满足量产要求。XC3568B2B核心板采用板对板的高速接口,体积小巧,连接稳固,安装便捷同时也方便拆卸。还不
    的头像 发表于 02-19 12:40 290次阅读
    向成电子科技有限公司新<b class='flag-5'>推出</b>3568<b class='flag-5'>B2B</b>的核心板

    Meta发布开源大模型Code Llama 70B

    近日,Meta宣布推出了一款新的开源大模型Code Llama 70B,这是其“Code Llama家族中体量最大、性能最好的模型版本”。这款新模型
    的头像 发表于 01-31 09:24 767次阅读

    Stability AI推出迄今为止更小、更高效的1.6B语言模型

    Stability AI 宣布推出迄今为止最强大的小语言模型之一 Stable LM 2 1.6B
    的头像 发表于 01-23 10:11 653次阅读
    Stability AI<b class='flag-5'>推出</b>迄今为止更小、更高效的1.6<b class='flag-5'>B</b>语言<b class='flag-5'>模型</b>