把大模型装进小盒子：这个小魔盒直击端侧AIGC的痛点！-电子发烧友网

私有本地化部署：智能硬件的未来

随着当下数字化的高速发展，今年将会迎来“大模型应用爆发元年”。市面上不少大模型产品应运而生，在大模型普惠应用井喷的时代，这类产品的使用存在许多门槛和风险，比如高昂的服务器部署成本、在运行过程中会过度依赖网络状态、以及难以保障数据的安全性等问题。

为了解决大模型产品使用期间所产生的算力成本高、网络波动、数据隐私等问题，Firefly开源团队推出可本地化部署的智能盒子：AIBOX-1684X

Firefly智能新品：智能算力小魔盒

AIBOX-1684X支持主流大模型私有化部署，仅掌心大小的体积就能把智算能力私有化，能够满足个性化的智能部署！其算力高达32Tops，拥有八核2.3GHz处理器，兼具稳定性、私密性、精致小巧等特性。

支持主流大模型

AIBOX-1684X几乎支持目前主流大模型的本地化运行，包括LLaMa3，ChatGLM3，Qwen等语言大模型，SAM等视觉大模型，以及Stable Diffusion 智能绘图。

私有化部署

○ 本地化部署，无惧断网

无需网络即可使用智算的能力，不受网络状态影响，任务运行更稳定。

支持主流

○ 开源透明，安全无风险

使用全开源智能模型部署工具链，透明可信任，做到零安全隐患。

○ 精致小巧，随处部署

仅掌心大小，10cm内的小方盒，表面柔润精致的铝合金切割工艺，在哪部署都合适。

极致性能：快速响应，无需多等

千字文本生成仅需10.2秒

AIBOX在本地运行时，拥有极快的响应时间，能够更好地提升用户体验。例如在Qwen1.5-1.8B模型中，推理性能可达到32.5 token/s，相当于其生成一篇1000字的文章仅需约10.2秒，可实现自然语言的快速问答。

标准图像生成仅需7秒

支持 AIGC 领域的 Stable DiffusionV1.5 图像生成模型，在Stable Diffusion V1.5模型中，生成512* 512尺寸的图片仅需约7秒。

开箱即用：已适配主流大模型

Meta旗下最新开源大模型Llama3运行演示：

清华与智谱合作研发的ChatGLM3-6B演示：

阿里通义千问开源大模型Qwen1.5-1.8B演示：

支持多种深度学习框架

AIBOX支持所有主流大模型深度学习框架，包括TensorFlow、PyTorch、MXNet、PaddlePaddle、ONNX和Darknet，并支持自定义算子开发。

高配硬件性能，运行畅通无阻

搭载SOPHON算能智算处理器BM1684X，最高主频2.3GHz，最高支持32路1080P H.264/H.265的视频解码，32路1080P高清视频全流程处理（解码+智能分析）

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

AI

AI

+关注

关注
87

文章
31890

浏览量
270707
AIGC

AIGC

+关注

关注
1

文章
368

浏览量
1644
大模型

大模型

+关注

关注
2

文章
2666

浏览量
3280

#新年新气象，大家新年快乐！#AIGC入门及鸿蒙入门

人工智能生成内容（AIGC）和鸿蒙系统是当前科技领域的两个热门话题。以下是对它们的入门指南： AIGC入门 1. 基础概念： AIGC，全称Artificial Intelligence

发表于 01-13 10:46

广和通开启端侧AI新时代

AI发展正酣，随着终端芯片算力越来越高、端侧模型能力越来越强、实时响应及隐私保护的端侧应用需求增加，端

发表于 12-12 10:35 •378次阅读

讯飞星火端侧模型发布

参数量小、内存占比小的端侧模型，正成为“兵家必争之地”。

发表于 12-04 16:07 •908次阅读

智谱推出四个全新端侧模型携英特尔按下AI普及加速键

随着AI的发展，端侧AI模型越来越受到广大客户及厂商的关注，业界领先的大模型公司智谱于近日推出了四个全新的端

发表于 12-02 17:13 •288次阅读

2024德国慕展现场直击

2024德国慕展现场直击

发表于 11-16 01:00 •363次阅读

端侧AI应用趋热:NPU如何解决其关键痛点

当前，AI大模型正逐步从云端迁移至边缘，甚至深入至日常生活中的手机、个人电脑（PC）、汽车等终端。在这场变革中，端侧智能正逐渐崭露头角，预示着未来的智能设备将能够更实时、高效地理解和服务用户。在E维

发表于 10-31 15:00 •741次阅读

蔡司工业CT扫描电镜等直击医疗质量痛点

中高端医疗器械往往面临技术复杂度更高、元器件及材料繁多、研发生产及质量保障难度大等挑战。快速、精准、全面、灵活的质量方案已经成为客户广泛关注的热点。＋五大应用展区直击医疗行业质量痛点活动现场，我们5

发表于 09-26 14:35 •959次阅读

基于AX650N/AX630C部署端侧大语言模型Qwen2

本文将分享如何将最新的端侧大语言模型部署到超高性价比SoC上，向业界对端侧大模型部署的开发者提供

发表于 07-06 17:43 •3913次阅读

产品应用 | 小盒子跑大模型！英码科技基于算能BM1684X平台实现大模型私有化部署

应对这些挑战，在边缘侧私有化部署大模型成为了一个有效的解决方案。将大模型部署到边缘侧，不仅能够减少延迟和带宽消耗，使得大模型能够在边缘节点

发表于 06-14 16:29 •855次阅读

【AIBOX】装在小盒子的AI足够强吗？

Firefly推出大语言模型本地部署的产品：AIBOX-1684X，目前已适配主流的大语言模型，包括ChatGLM3-6B，以下是ChatGLM3在AIBOX-1684X上的实机演示

发表于 05-15 08:02 •552次阅读

AI硬件大爆发，这个小魔盒直击端侧AIGC的痛点

私有本地化部署：AI硬件的未来随着当下AI的高速发展，今年将会迎来“大模型应用爆发元年”。市面上不少大模型产品应运而生，在大模型普惠应用井喷的时代，这类产品的使用存在许多门槛和风险，比如高昂的服务器

发表于 05-07 08:02 •490次阅读

商汤发布业内最快推理速度「日日新 5.0 端侧大模型」

现在，就是AI大模型在端侧应用的春天！

发表于 04-29 10:32 •676次阅读

AIBOX-1684X：把大语言模型“装”进小盒子

AIBOX-1684X支持主流大模型私有化部署，算力高达32TOPS，同时也支持CNN、RNN、LSTM等传统网络架构，支持TensorFNNX和Darknet等深度学习架构，并支持自定义算子开发

发表于 04-20 08:02 •1474次阅读