0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

把大模型装进小盒子:这个小魔盒直击端侧AIGC的痛点!

算能开发者社区 2024-05-10 08:33 次阅读

私有本地化部署:智能硬件的未来

随着当下数字化的高速发展,今年将会迎来“大模型应用爆发元年”。市面上不少大模型产品应运而生,在大模型普惠应用井喷的时代,这类产品的使用存在许多门槛和风险,比如高昂的服务器部署成本、在运行过程中会过度依赖网络状态、以及难以保障数据的安全性等问题。

为了解决大模型产品使用期间所产生的算力成本高、网络波动、数据隐私等问题,Firefly开源团队推出可本地化部署的智能盒子:AIBOX-1684X

Firefly智能新品:智能算力小魔盒

AIBOX-1684X支持主流大模型私有化部署,仅掌心大小的体积就能把智算能力私有化,能够满足个性化的智能部署!其算力高达32Tops,拥有八核2.3GHz处理器,兼具稳定性、私密性、精致小巧等特性。

支持主流大模型

AIBOX-1684X几乎支持目前主流大模型的本地化运行,包括LLaMa3,ChatGLM3,Qwen等语言大模型,SAM等视觉大模型,以及Stable Diffusion 智能绘图。

私有化部署

本地化部署,无惧断网

无需网络即可使用智算的能力,不受网络状态影响,任务运行更稳定。

支持主流

开源透明,安全无风险

使用全开源智能模型部署工具链,透明可信任,做到零安全隐患。

f98d6aa0-0e64-11ef-9118-92fbcf53809c.jpg

精致小巧,随处部署

仅掌心大小,10cm内的小方盒,表面柔润精致的铝合金切割工艺,在哪部署都合适。

f9a0fd72-0e64-11ef-9118-92fbcf53809c.jpg

极致性能:快速响应,无需多等

千字文本生成仅需10.2秒

AIBOX在本地运行时,拥有极快的响应时间,能够更好地提升用户体验。例如在Qwen1.5-1.8B模型中,推理性能可达到32.5 token/s,相当于其生成一篇1000字的文章仅需约10.2秒,可实现自然语言的快速问答

f9b256f8-0e64-11ef-9118-92fbcf53809c.png

标准图像生成仅需7秒

支持 AIGC 领域的 Stable DiffusionV1.5 图像生成模型,在Stable Diffusion V1.5模型中,生成512* 512尺寸的图片仅需约7秒。

开箱即用:已适配主流大模型

Meta旗下最新开源大模型Llama3运行演示:


清华与智谱合作研发的ChatGLM3-6B演示:


阿里通义千问开源大模型Qwen1.5-1.8B演示:


支持多种深度学习框架

AIBOX支持所有主流大模型深度学习框架,包括TensorFlow、PyTorch、MXNet、PaddlePaddle、ONNX和Darknet,并支持自定义算子开发。

高配硬件性能,运行畅通无阻

搭载SOPHON算能智算处理器BM1684X,最高主频2.3GHz,最高支持32路1080P H.264/H.265的视频解码,32路1080P高清视频全流程处理(解码+智能分析)

f9e80906-0e64-11ef-9118-92fbcf53809c.jpg

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    30879

    浏览量

    269034
  • AIGC
    +关注

    关注

    1

    文章

    362

    浏览量

    1543
  • 大模型
    +关注

    关注

    2

    文章

    2446

    浏览量

    2693
收藏 人收藏

    评论

    相关推荐

    广和通开启AI新时代

    AI发展正酣,随着终端芯片算力越来越高、模型能力越来越强、实时响应及隐私保护的应用需求增加,
    的头像 发表于 12-12 10:35 192次阅读

    讯飞星火模型发布

    参数量小、内存占比小的模型,正成为“兵家必争之地”。
    的头像 发表于 12-04 16:07 760次阅读

    智谱推出四个全新模型 携英特尔按下AI普及加速键

    随着AI的发展,AI模型越来越受到广大客户及厂商的关注,业界领先的大模型公司智谱于近日推出了四个全新的
    的头像 发表于 12-02 17:13 209次阅读
    智谱推出四个全新<b class='flag-5'>端</b><b class='flag-5'>侧</b><b class='flag-5'>模型</b> 携英特尔按下AI普及加速键

    AIGC系统中多个模型的切换调用方案探索

    作者:京东科技 贾玉龙 1 背景 1.1 现状 AIGC系统中多个模型的切换调用通常指的是在同一个AIGC系统或应用中,可以根据不同的输入条件或任务需求,动态地选择并调用不同的机器学习模型
    的头像 发表于 11-27 11:43 172次阅读
    <b class='flag-5'>AIGC</b>系统中多个<b class='flag-5'>模型</b>的切换调用方案探索

    把握关键节点,美格智能持续推动AI规模化拓展

    当前,AI大模型走向已经是大势所趋,AI的发展将推动人工智能成为影响世界的第四次工业革命。与传统的云端大
    的头像 发表于 11-26 01:00 149次阅读
    把握关键节点,美格智能持续推动<b class='flag-5'>端</b><b class='flag-5'>侧</b>AI规模化拓展

    2024德国慕展现场

    2024德国慕展现场
    的头像 发表于 11-16 01:00 208次阅读
    2024德国慕展现场<b class='flag-5'>直</b><b class='flag-5'>击</b>

    AI应用趋热:NPU如何解决其关键

    当前,AI大模型正逐步从云端迁移至边缘,甚至深入至日常生活中的手机、个人电脑(PC)、汽车等终端。在这场变革中,智能正逐渐崭露头角,预示着未来的智能设备将能够更实时、高效地理解和服务用户。在E维
    的头像 发表于 10-31 15:00 528次阅读

    蔡司工业CT扫描电镜等医疗质量

    中高端医疗器械往往面临技术复杂度更高、元器件及材料繁多、研发生产及质量保障难度大等挑战。快速、精准、全面、灵活的质量方案已经成为客户广泛关注的热点。+五大应用展区直医疗行业质量活动现场,我们5
    的头像 发表于 09-26 14:35 886次阅读
    蔡司工业CT扫描电镜等<b class='flag-5'>直</b><b class='flag-5'>击</b>医疗质量<b class='flag-5'>痛</b><b class='flag-5'>点</b>

    基于AX650N/AX630C部署大语言模型Qwen2

    本文将分享如何将最新的大语言模型部署到超高性价比SoC上,向业界对模型部署的开发者提供
    的头像 发表于 07-06 17:43 3549次阅读
    基于AX650N/AX630C部署<b class='flag-5'>端</b><b class='flag-5'>侧</b>大语言<b class='flag-5'>模型</b>Qwen2

    产品应用 | 小盒子跑大模型!英码科技基于算能BM1684X平台实现大模型私有化部署

    应对这些挑战,在边缘私有化部署大模型成为了一个有效的解决方案。 将大模型部署到边缘,不仅能够减少延迟和带宽消耗,使得大模型能够在边缘节点
    的头像 发表于 06-14 16:29 712次阅读
    产品应用 | <b class='flag-5'>小盒子</b>跑大<b class='flag-5'>模型</b>!英码科技基于算能BM1684X平台实现大<b class='flag-5'>模型</b>私有化部署

    【AIBOX】装在小盒子的AI足够强吗?

    Firefly推出大语言模型本地部署的产品:AIBOX-1684X,目前已适配主流的大语言模型,包括ChatGLM3-6B,以下是ChatGLM3在AIBOX-1684X上的实机演示
    的头像 发表于 05-15 08:02 440次阅读
    【AIBOX】装在<b class='flag-5'>小盒子</b>的AI足够强吗?

    AI硬件大爆发,这个魔盒AIGC

    私有本地化部署:AI硬件的未来随着当下AI的高速发展,今年将会迎来“大模型应用爆发元年”。市面上不少大模型产品应运而生,在大模型普惠应用井喷的时代,这类产品的使用存在许多门槛和风险,比如高昂的服务器
    的头像 发表于 05-07 08:02 418次阅读
    AI硬件大爆发,<b class='flag-5'>这个</b>小<b class='flag-5'>魔盒</b><b class='flag-5'>直</b><b class='flag-5'>击</b><b class='flag-5'>端</b><b class='flag-5'>侧</b><b class='flag-5'>AIGC</b>的<b class='flag-5'>痛</b><b class='flag-5'>点</b>

    商汤发布业内最快推理速度「日日新 5.0 模型

    现在,就是AI大模型应用的春天!
    的头像 发表于 04-29 10:32 581次阅读
    商汤发布业内最快推理速度「日日新 5.0 <b class='flag-5'>端</b><b class='flag-5'>侧</b>大<b class='flag-5'>模型</b>」

    AIBOX-1684X:大语言模型“装”进小盒子

    AIBOX-1684X支持主流大模型私有化部署,算力高达32TOPS,同时也支持CNN、RNN、LSTM等传统网络架构,支持TensorFNNX和Darknet等深度学习架构,并支持自定义算子开发
    的头像 发表于 04-20 08:02 1270次阅读
    AIBOX-1684X:<b class='flag-5'>把</b>大语言<b class='flag-5'>模型</b>“装”进<b class='flag-5'>小盒子</b>

    荣耀引领AI新时代

    在今年的MWC盛会上,荣耀宣布与高通、Meta携手,将70亿参数大模型引入,这一创新举措预示着AI新时代的到来。荣耀终端CEO赵明在
    的头像 发表于 03-01 10:28 637次阅读