0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

如何在 OrangePi 5 Pro 的 NPU 上运行 LLM

香橙派 2024-11-28 14:55 次阅读

OrangePi5 Pro上访问NPU需要安装最新版Ubuntu的定制版本,还需要安装特殊软件,让你能在NPU而不是CPU上运行专门转换的LLM。整个过程肯定要比运行Ollama复杂得多,但如果你愿意迎接挑战,就能获得不菲的收益。所以,如果你感兴趣,就让我们深入了解一下吧!

wKgZO2dIE12AF7wFAAtHJLEEUFE775.png

安装操作系统

首先要安装合适的操作系统。我推荐 GitHub用户Joshua Riek专门为Rockchip SoC定制的Ubuntu。你需要的是24.04版本,因为它拥有运行LLM所需的最新版NPU驱动程序。为OrangePiSD卡上刷新操作系统的方法与Raspberry Pi基本相同,以下是简要介绍:

1.将操作系统镜像下载到你选择的电脑上。

2.打开一个可以帮助闪存 SD卡的程序。在本指南中,我们将使用balenaEtcher。

3.选择 “从文件闪存”,然后选择之前下载的操作系统映像文件。

wKgZO2dIE1yAR--0AAFCLbXx-WE246.png

4.确保已插入 SD卡,然后单击 “选择目标”。

5.从列表中选择 SD卡,然后单击 “选择”。

6.选择 Flash!

wKgZPGdIE1yAdNDNAAD2_342gpU886.png

这个过程可能需要 10分钟才能完成,所以在程序运行时请耐心等待。

成功闪存操作系统后,将 SD卡传输到你的OrangePi中,然后打开电源。确保你手边有键盘和显示器,因为我们需要直接访问我们的 SBC,至少需要足够长的时间来安装SSH。

安装 SSH

在 OPi上完成初始操作系统设置后,按Ctrl + Alt + T键打开终端,在终端中输入sudo apt install openssh-server。这将允许你从另一台电脑访问你的OrangePi。我们之所以要这么麻烦,是因为运行 LLM的程序在桌面上无法运行,但在SSH终端上可以运行。

wKgZPGdIE1yARpoQAAQXdy2TRi0797.png

在离开你的OrangePi之前,记下它的 IP地址,然后通过SSH登录。如果你不喜欢SSH,也可以在你的设备上按照本指南操作,但你必须按Ctrl + Alt + F5退出桌面,只在shell中工作。

wKgZO2dIE1yAALHNAAiwjSbBJuw391.png

安装 RKNN LLM和RKNN工具包2

现在,我们可以开始安装运行 LLM的软件了。RKNN LLM是在我们的机器上运行LLM的程序。RKNN Toolkit 2是让其他软件与NPU通信的软件。我们将使用GitHub用户Pelochus提供的脚本一次性安装这两个软件。在终端中输入:

sudo curl https://raw.githubusercontent.com/Pelochus/ezrknpu/main/install.sh | sudo bash

运行需要 5到10分钟,请耐心等待。

安装 LLM

安装完 RKNN LLM和RKNN Toolkit 2后,就可以安装模型了(这还需要5到10分钟)。为了让LLM利用OrangePi上Rockchip RK3588S SoC的NPU,需要使用RKNN Toolkit 2对其进行转换(这远远超出了本指南的范围)。

幸运的是,Pelochus维护着一个可与RK3588S配合使用的LLM的Hugging Face资源库。遗憾的是,并非所有这些模型都与我们刚刚下载的软件兼容。您需要寻找已使用RKLLM runtime 1.0.1转换的模型。我们要安装的是微软的Phi-3 Mini型号,参数为3.8B。在终端中输入以下命令:

GIT_LFS_SKIP_SMUDGE=1 git clone https://huggingface.co/Pelochus/phi-3-mini-rk3588

命令第一部分的大写字母将确保我们只先克隆较小的文件。如果我们试图一次性克隆整个版本库,可能会出现一些错误。接下来,导航到我们刚刚创建的新目录(cd ~/phi-3-mini-rk3588),然后运行git lfs pull命令。这将下载数千兆字节的大型模型文件。

wKgZO2dIE1yAMgVWAAOtXIHgLQg353.png

在OrangePi5 Pro NPU上运行LLM

如果一切按计划进行,你就可以启动 LLM了。在终端中输入rkllm phi-3-mini-4k-rk3588.rkllm即可。

运行情况如何?它比我们在超频的 Raspberry Pi 5上通过Ollama运行的Phi-3要快得多。它的输出似乎也有硬性限制,如果达到极限,就会中途自断。

wKgZPGdIE1yAR05SAAMEz_9AjAc777.png

OrangePi上的NPU驱动LLM在很大程度上仍处于试验阶段,但没想到响应速度是如此之快。在树莓派上运行的 Phi-3平均响应时间为27秒,中位数为5秒(范围为3-295秒)。在OrangePi5 Pro的NPU上运行的Phi-3均响应时间约为1秒,中位数在1-2秒之间。

如果你有一台配备 RK3588或RK3588S SoC的OrangePi5,如果你喜欢尝试使用LLM,那么这个项目绝对值得你花时间去做,哪怕只是为了大幅提高LLM的响应时间。支持OrangePi上 LLM的社区规模虽小,但非常活跃,我期待看到更多型号不断涌现。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 单片机
    +关注

    关注

    6032

    文章

    44526

    浏览量

    633401
  • 开发板
    +关注

    关注

    25

    文章

    4971

    浏览量

    97240
  • NPU
    NPU
    +关注

    关注

    2

    文章

    274

    浏览量

    18558
  • LLM
    LLM
    +关注

    关注

    0

    文章

    277

    浏览量

    307
收藏 人收藏

    评论

    相关推荐

    请问vee pro 8.5能够在vee pro运行时9运行吗?

    喜。我正在使用vee pro 8.5。该版本的程序能够在vee pro运行时9运行吗? 以上来自于谷歌翻译 以下为原文hi. i am
    发表于 06-14 09:31

    请问openCL并行计算的程序能运行在RK3399ProNPU

    请问openCL并行计算的程序能运行在RK3399ProNPU吗? 有哪位大神可以解答一下吗
    发表于 08-19 16:49

    npu,vop2

    大家好,我在npu使用上遇到了一些问题,请教一下大家,问题如下: 我把内核配置里的vop2驱动裁剪了以后,深度学习模型就不能在npu运行了。可是我如果不裁剪掉vop2,我的核心板就卡
    发表于 11-09 13:51

    何在嵌入式设备运行高性能Java

    何在嵌入式设备运行高性能Java
    发表于 03-28 09:43 16次下载

    关于C程序源代码是如何在硬件运行的?

    C程序源代码是如何在硬件运行的?
    的头像 发表于 02-05 12:37 2841次阅读

    何在xWR1xxx芯片运行mmw demo

    何在xWR1xxx芯片运行mmw demo
    发表于 11-01 08:27 0次下载
    如<b class='flag-5'>何在</b>xWR1xxx芯片<b class='flag-5'>上</b><b class='flag-5'>运行</b>mmw demo

    npu运行需要cpu协助吗

    npu运行需要cpu协助吗  为了回答这个问题,我们需要首先了解什么是NPU和CPU以及它们之间的关系。 NPU是神经处理单元(Neural Processing Unit)的缩写,是
    的头像 发表于 08-27 17:03 1079次阅读

    Ambarella展示了在其CV3-AD芯片运行LLM的能力

    Ambarella前不久展示了在其CV3-AD芯片运行LLM的能力。这款芯片是CV3系列中最强大的,专为自动驾驶设计。
    的头像 发表于 11-28 09:05 1775次阅读
    Ambarella展示了在其CV3-AD芯片<b class='flag-5'>上</b><b class='flag-5'>运行</b><b class='flag-5'>LLM</b>的能力

    利用GPU加速在Orange Pi 5跑LLMs:人工智能爱好者High翻了!

    》引起了我们的注意,这篇文章主要展示了GPU加速的LLM在嵌入式设备以合适的速度顺利运行。具体来说,是在OrangePi5(8G),作者
    的头像 发表于 01-22 15:29 942次阅读
    利用GPU加速在Orange Pi <b class='flag-5'>5</b><b class='flag-5'>上</b>跑LLMs:人工智能爱好者High翻了!

    OrangePi 5 Pro正式开售,树莓派5真正的挑战者来了

    在刚刚举行不久的3.24香橙派开发者大会上,香橙派发布了一款重磅产品OrangePi5Pro,该产品在OrangePi5系列前代产品的基础焕然升级,以其性能引领性、价格颠覆性再次改变全球开发板市场
    的头像 发表于 04-08 13:54 720次阅读
    <b class='flag-5'>OrangePi</b> <b class='flag-5'>5</b> <b class='flag-5'>Pro</b>正式开售,树莓派<b class='flag-5'>5</b>真正的挑战者来了

    树莓派5最大的竞争对手OrangePi 5 Pro ,新增4GB/8GB版本

    OrangePi5Pro被称为树莓派5最大的竞争对手。继OrangePi5Pro(16GB)版本发布一个月之后,香橙派近日再推出OrangePi5Pro4GB/8GB版本。除了在
    的头像 发表于 05-07 10:00 693次阅读
    树莓派<b class='flag-5'>5</b>最大的竞争对手<b class='flag-5'>OrangePi</b> <b class='flag-5'>5</b> <b class='flag-5'>Pro</b> ,新增4GB/8GB版本

    OrangePi 5 Max:树莓派5的劲敌,小巧的 RK3588开发板

    道PCIe3.0,支持Wi-Fi6E。OrangePi5MaxVS树莓派5乍一看,OrangePi5Max在布局与树莓派5类似,但对比来看
    的头像 发表于 08-02 13:52 675次阅读
    <b class='flag-5'>OrangePi</b> <b class='flag-5'>5</b> Max:树莓派<b class='flag-5'>5</b>的劲敌,小巧的 RK3588开发板

    OrangePi 5品牌系列大比拼,哪款更中你的意?

    随着OrangePi5Max的加入,OrangePi5品牌系列的队伍随之壮大。OrangePi5Max是OrangePi5Pro的升级产品,搭载瑞芯微RK35888核64位处理器,4个
    的头像 发表于 08-06 17:59 920次阅读
    <b class='flag-5'>OrangePi</b> <b class='flag-5'>5</b>品牌系列大比拼,哪款更中你的意?

    香橙派OrangePi 5 Pro性能全面测试!

    今天我们来看看OrangePi5Pro。这是OrangePi推出的一款基于RockchipRK3588SSoC的全新SBC。RK3588S与RK3588基本相似。从外形、IO和端口布局来看
    的头像 发表于 10-08 15:58 368次阅读
    香橙派<b class='flag-5'>OrangePi</b> <b class='flag-5'>5</b> <b class='flag-5'>Pro</b>性能全面测试!

    OrangePi KunPeng Pro部署AI模型介绍

    OrangePi Kunpeng Pro是一款香橙派联合华为精心打造的高性能板卡,搭载了鲲鹏处理器,可提供8TOPS INT8计算能力,板卡设计很精致,板载资源也非常多:
    的头像 发表于 11-16 11:03 236次阅读
    <b class='flag-5'>OrangePi</b> KunPeng <b class='flag-5'>Pro</b>部署AI模型介绍