近日,AI创新先锋Zyphra公司在科技界投下了一颗震撼弹,正式揭晓其最新力作——Zamba2-mini 1.2B模型。这款被誉为端侧SOTA(State-Of-The-Art)级别的小语言模型,以其卓越的性能参数和极致的压缩效率,成为了业界关注的焦点。
Zamba2-mini 1.2B携带着惊人的12亿参数量,却能在严苛的4bit量化条件下,将内存占用控制在惊人的700MB以下,这一成就无疑是对AI模型轻量化探索的一次重大突破。其背后,是Zyphra团队对模型架构的深度优化与大胆创新,成功融合了多种神经网络设计的精髓,既保留了大型密集变压器模型的高质量输出特性,又实现了小模型难以企及的计算与内存效率。
Zamba2-mini 1.2B的问世,不仅为端侧设备提供了更为强大的智能支持,更预示着AI技术在实际应用场景中的广泛落地与深度融合。随着这一技术的不断成熟与普及,我们有理由相信,未来的端侧AI将更加智能、高效,为人们的生活带来更多便利与惊喜。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
-
变压器
+关注
关注
159文章
7171浏览量
133582 -
AI
+关注
关注
87文章
29055浏览量
266659 -
模型
+关注
关注
1文章
3040浏览量
48409
发布评论请先 登录
相关推荐
英伟达发布AI模型 Llama-3.1-Nemotron-51B AI模型
英伟达公司宣布推出 Llama-3.1-Nemotron-51B AI 模型,这个AI大模型是源自 Meta 公司的 Llama-3.1-70B
马斯克旗下xAI对Grok-2-mini进行速度升级
科技巨头马斯克旗下的xAI公司近日宣布了一项重大进展,其热门语言模型Grok-2-mini成功完成了速度升级。
chatglm2-6b在P40上做LORA微调
背景: 目前,大模型的技术应用已经遍地开花。最快的应用方式无非是利用自有垂直领域的数据进行模型微调。chatglm2-6b在国内开源的大模型上,效果比较突出。本文章分享的内容是用
如何通过JTAG这个接口给ESP32-LyraT-Mini_V1.2烧录代固件?
你好,
我发现ESP32-LyraT-Mini_V1.2开发板有JTAG接口引出,我们想通过这个开发板上面的ESP32-WROVER-B模块做二次开发(UART0串口有它用),请问如何通过JTAG这个接口给板子烧录代固件?
还有这部分的相关资料能推荐下吗。
发表于 07-02 07:05
ESP32-LyraT-Mini_V1.2开发板运行ADF例程无法录音要如何解决?
ESP32-LyraT-Mini_V1.2开发板运行例程无法录音
环境: IDF 4.3 , ADF Git master 和 esp-adf-release-v2.4
例程1:
C
发表于 06-28 07:56
lyrat-mini-v1.2使用例程pipeline_wav_amr_sdcard录音没有声音怎么解决?
lyrat-mini-v1.2使用例程pipeline_wav_amr_sdcard录音没有声音,SD卡中有文件,但是没有声音怎么解决啊
发表于 06-28 06:43
智谱AI发布全新多模态开源模型GLM-4-9B
近日,智谱AI在人工智能领域取得重大突破,成功推出全新开源模型GLM-4-9B。这款模型以其卓越的多模态能力,再次刷新了业界对于大型语言模型
微软发布视觉型AI新模型:Phi-3-vision
据悉,Phi-3-vision 作为微软 Phi-3 家族的首款多模态模型,继承自 Phi-3-mini 的文本理解能力,兼具轻巧便携特性,适用于移动平台/嵌入式终端;模型参数规模达 42 亿,远超 Phi-3-
NVIDIA加速微软最新的Phi-3 Mini开源语言模型
NVIDIA 宣布使用 NVIDIA TensorRT-LLM 加速微软最新的 Phi-3 Mini 开源语言模型。TensorRT-LLM 是一个开源库,用于优化从 PC 到云端的 NVIDIA GPU 上运行的大语言模型推理
微功率电压参考LMx85-1.2 LM385B-1.2数据表
电子发烧友网站提供《微功率电压参考LMx85-1.2 LM385B-1.2数据表.pdf》资料免费下载
发表于 04-01 15:41
•0次下载
Stability AI发布Stable Code Instruct 3B大语言模型,可编译多种编程语言
据报道,Stability AI公司近期推出了适配程序员使用的Stable Code Instruct 3B大语言模型,此款模型的显著特点是能够实现编程语言间的自如切换。
向成电子科技有限公司新推出3568B2B的核心板
2024年向成研发部新产品开发迎来了开门红,新推出3568B2B的核心板完成各项测试,满足量产要求。XC3568B2B核心板采用板对板的高速接口,体积小巧,连接稳固,安装便捷同时也方便拆卸。还不
Meta发布开源大模型Code Llama 70B
近日,Meta宣布推出了一款新的开源大模型Code Llama 70B,这是其“Code Llama家族中体量最大、性能最好的模型版本”。这款新模型
评论