0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

RISC-V 跑大模型(二):LLaMA零基础移植教程

澎峰科技PerfXLab 来源:澎峰科技PerfXLab 作者:澎峰科技PerfXLab 2023-07-17 16:16 次阅读

这是RISC-V跑大模型系列的第二篇文章,主要教大家如何将LLaMA移植到RISC-V环境里。

1. 环境准备

1)最新版Python

2)确保机器有足够的内存加载完整模型(7B模型需要13~15G

3)下载原版LLaMA模型和扩展了的中文模型

LLaMA原版模型:

https://ipfs.io/ipfs/Qmb9y5GCkTG7ZzbBWMu2BXwMkzyCKcUjtEKPpgdZ7GEFKm/

2. 模型下载

从LLaMA原版模型地址上下载下述文件(我们使用的是7B):

wKgaomS097WAaxKzAABR0Iv83Lk708.png

最后文件下载完成后的结果如下:

wKgZomS09-GAdTAMAABac0MziDc336.png

3. 加载并启动

1)这一步需要下载llama.cpp,请输入以下命令进行下载和编译:

git clone https://github.com/ggerganov/llama.cpp && cd llama.cpp && make

2)将第二步下载的文件移到llama.cpp/models/下,使用命令:

python3 convert-pth-to-ggml.py models/7B/ 0

3)将.pth模型权重转换为ggml的FP32格式,生成文件路径为models/7B/ggml-model-f32.bin。

wKgaomS0-H-AEYU2AAPRdhm-gs8988.png

4)运行./main二进制文件,-m命令指定Q4量化模型(也可加载ggml-FP16的模型)。以下是解码参数

./main models/7B/ggml-model-f32.bin --color -f prompts/alpaca.txt -ins -c 256 --temp 0.2 -n 128 --repeat_penalty 1.3

参数解释:

-ins 启动类ChatGPT对话交流的运行模式
-f 指定prompt模板,alpaca模型请加载prompts/alpaca.txt
-c 控制上下文的长度,值越大越能参考更长的对话历史(默认:512)
-n 控制回复生成的最大长度(默认:128)
-t 控制batch size(默认:8),可适当增加
--repeat_penalty 控制线程数量(默认:4),可适当增加
--temp 控制线程数量(默认:4),可适当增加
--top_p, top_k

控制解码采样的相关数据

4.结束

本篇教程到这里就结束了。是不是觉得LLaMA的速度比较慢而且不支持中文,没关系,在下一期中,我们会为LLaMA扩充中文,并优化加速LLaMA,记得继续关注我们哦。

另外,RISC -V跑大模型系列文章计划分为四期:

1.RISC -V跑大模型(一)
2. RISC-V 跑大模型(二):LLaMA零基础移植教程(本篇)
3.LLaMA扩充中文+优化加速(计划)
4. 更多性能优化策略。(计划)

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • RISC-V
    +关注

    关注

    45

    文章

    2322

    浏览量

    46509
  • 大模型
    +关注

    关注

    2

    文章

    2544

    浏览量

    3084
  • LLM
    LLM
    +关注

    关注

    0

    文章

    298

    浏览量

    388
收藏 人收藏

    评论

    相关推荐

    RISC-V 模型(三):LLaMA中文扩展

    这是RISC-V模型系列的第三篇文章,前面我们为大家介绍了如何在RISC-V下运行LLaMA,本篇我们将会介绍如何为
    的头像 发表于 07-17 17:15 865次阅读
    <b class='flag-5'>RISC-V</b> <b class='flag-5'>跑</b>大<b class='flag-5'>模型</b>(三):<b class='flag-5'>LLaMA</b>中文扩展

    开发板上玩GTA,RISC-V多项移植项目成功运作中

    开发板上玩GTA ,RISC-V 多项移植项目成功运作中   RISC-V近期再度掀起了不小的热度,苹果招募RISC-V程序员负责其操作系统的嵌入式子系统,用于机器学习、视觉算法和信号
    的头像 发表于 09-15 09:47 5101次阅读

    安卓上RISC-V移植成最大阻碍

    安卓上RISC-V移植成最大阻碍   RISC-V作为一个开源架构,目前已经被诸多主流开源软件、系统所支持,不少RISC-V厂商都以支持Linux为宣传点。照理说同为开源的安卓系统
    的头像 发表于 10-14 09:47 5819次阅读

    有用risc-v芯片系统的吗?

    risc-v芯片系统有什么需要注意的呢?
    发表于 03-29 21:52

    每日推荐 | HarmonyOS 从入门到大神资料,从开始写RISC-V处理器经验连载

    各位开发者们丰富的学习资源。为了方便大家获取资料,现在只需扫描下面海报维码并回复关键字 “教程” 即可获取大神资料,赶快扫码领取吧!2、从开始写RISC-V处理器之四 实践篇推荐理由:这里只介绍
    发表于 08-23 10:08

    目前国内RISC-V架构的MCU从程序从arm移植RISC-V难度大吗?

    目前国内RISC-V架构的MCU从程序从arm移植RISC-V难度大吗?
    发表于 03-09 10:00

    RISC-VuCLinux或者NO MMU的Linux的项目吗?

    RISC-VuCLinux或者NO MMU的Linux的项目吗?
    发表于 04-03 17:54

    RISC-V规范的演进 RISC-V何时爆发?

    的规范会有怎样的演进?生态建设又会有什么大动作? RISC-V规范的演进 RISC-V基金会CTO Mark I.Himelstein在本周举行的第RISC-V国际开源论坛上分享了
    的头像 发表于 02-11 10:10 3236次阅读

    ​开发板上玩GTA RISC-V多项移植项目成功运作中

    也宣布将以RISC-V架构再度进入CPU市场。 这么多大厂纷纷在RISC-V上展开动作,但RISC-V的软件生态尚未正式进入爆发期。不过近期RISC-V软件社区出现了多个
    的头像 发表于 09-16 11:59 1874次阅读
    ​开发板上玩GTA <b class='flag-5'>RISC-V</b>多项<b class='flag-5'>移植</b>项目成功运作中

    开始写RISC-V处理器

    RISC-V是这两年才开始迅速发展的,因此关于RISC-V的学习参考资料目前还很少,特别是适合入门的资料,因此学习起来进度很缓慢,于是萌生了自己从开始写RISC-V处理器核的想法。
    发表于 03-17 09:46 104次下载

    RISC-V处理器的优势是什么

    本文探讨了 RISC-V 的开源硬件模型背后的好处,讨论了它的寿命、可移植性和可靠性。
    的头像 发表于 05-07 16:43 3668次阅读
    <b class='flag-5'>RISC-V</b>处理器的优势是什么

    基于RISC-V内核单片机移植RTOS实时操作系统(一)

      ARM上移植实时操作系统大家可能比较熟悉,且例程较多,对于RISC-V内核的单片机,可能相对比较陌生。下面结合WCH沁恒微电子的赤菟V103(CH32V103)和赤菟
    的头像 发表于 01-31 12:08 2810次阅读
    基于<b class='flag-5'>RISC-V</b>内核单片机<b class='flag-5'>移植</b>RTOS实时操作系统(一)

    基于RISC-V内核单片机移植RTOS实时操作系统()

      今天聊下移植RTOS时RISC-V内核时单片机任务栈保存哪些内容。
    的头像 发表于 01-31 13:50 1694次阅读
    基于<b class='flag-5'>RISC-V</b>内核单片机<b class='flag-5'>移植</b>RTOS实时操作系统(<b class='flag-5'>二</b>)

    RISC-V模型):LLaMA零基移植教程

    这是RISC-V模型系列的第篇文章,主要教大家如何将LLaMA移植
    的头像 发表于 07-10 10:10 1126次阅读
    <b class='flag-5'>RISC-V</b><b class='flag-5'>跑</b>大<b class='flag-5'>模型</b>(<b class='flag-5'>二</b>):<b class='flag-5'>LLaMA</b><b class='flag-5'>零基</b>础<b class='flag-5'>移植</b>教程

    解锁RISC-V技术力量丨曹英杰:RISC-V与大模型探索

    4月12日,第期“大家来谈芯|解锁RISC-V技术力量”在上海临港新片区顶科永久会址举办,本期沙龙聚焦RISC-V技术,围绕AI时代的RISC-V市场机会、
    的头像 发表于 04-16 08:16 788次阅读
    解锁<b class='flag-5'>RISC-V</b>技术力量丨曹英杰:<b class='flag-5'>RISC-V</b>与大<b class='flag-5'>模型</b>探索