0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

RISC-V跑大模型(二):LLaMA零基础移植教程

perfxlab 来源:RVBoards 2023-07-10 10:10 次阅读

这是RISC-V跑大模型系列的第二篇文章,主要教大家如何将LLaMA移植到RISC-V环境里。

1. 环境准备

1)最新版Python

2)确保机器有足够的内存加载完整模型(7B模型需要13~15G

3)下载原版LLaMA模型和扩展了的中文模型

2. 模型下载

从LLaMA原版模型地址上下载下述文件(我们使用的是7B):

c202fbd8-1d95-11ee-962d-dac502259ad0.png

最后文件下载完成后的结果如下:

c21b31d0-1d95-11ee-962d-dac502259ad0.png

3. 加载并启动

1)这一步需要下载llama.cpp,

2)将第二步下载的文件移到llama.cpp/models/下,使用命令:
python3 convert-pth-to-ggml.py models/7B/ 0
3)将.pth模型权重转换为ggml的FP32格式,生成文件路径为models/7B/ggml-model-f32.bin。

c239f23c-1d95-11ee-962d-dac502259ad0.png

4)运行./main二进制文件,-m命令指定Q4量化模型(也可加载ggml-FP16的模型)。以下是解码参数及示例:
./main models/7B/ggml-model-f32.bin --color -f prompts/alpaca.txt -ins -c 256 --temp 0.2 -n 128 --repeat_penalty 1.3

参数解释:

-ins 启动类ChatGPT对话交流的运行模式
-f 指定prompt模板,alpaca模型请加载prompts/alpaca.txt
-c 控制上下文的长度,值越大越能参考更长的对话历史(默认:512)
-n 控制回复生成的最大长度(默认:128)
-t 控制batch size(默认:8),可适当增加
--repeat_penalty 控制线程数量(默认:4),可适当增加
--temp 温度系数,值越低回复的随机性越小,反之越大
--top_p, top_k 控制解码采样的相关参数






审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 解码器
    +关注

    关注

    9

    文章

    1129

    浏览量

    40632
  • python
    +关注

    关注

    55

    文章

    4766

    浏览量

    84371
  • RISC-V
    +关注

    关注

    44

    文章

    2203

    浏览量

    45952
  • 澎峰科技
    +关注

    关注

    0

    文章

    48

    浏览量

    3156
  • ChatGPT
    +关注

    关注

    29

    文章

    1546

    浏览量

    7348

原文标题:RISC-V 跑大模型(二):LLaMA零基础移植教程

文章出处:【微信号:perfxlab,微信公众号:perfxlab】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    RISC-V 模型):LLaMA零基移植教程

    这是RISC-V模型系列的第篇文章,主要教大家如何将LLaMA移植
    的头像 发表于 07-17 16:16 1336次阅读
    <b class='flag-5'>RISC-V</b> <b class='flag-5'>跑</b>大<b class='flag-5'>模型</b>(<b class='flag-5'>二</b>):<b class='flag-5'>LLaMA</b><b class='flag-5'>零基</b>础<b class='flag-5'>移植</b>教程

    RISC-V 模型(三):LLaMA中文扩展

    这是RISC-V模型系列的第三篇文章,前面我们为大家介绍了如何在RISC-V下运行LLaMA,本篇我们将会介绍如何为
    的头像 发表于 07-17 17:15 766次阅读
    <b class='flag-5'>RISC-V</b> <b class='flag-5'>跑</b>大<b class='flag-5'>模型</b>(三):<b class='flag-5'>LLaMA</b>中文扩展

    开发板上玩GTA,RISC-V多项移植项目成功运作中

    开发板上玩GTA ,RISC-V 多项移植项目成功运作中   RISC-V近期再度掀起了不小的热度,苹果招募RISC-V程序员负责其操作系统的嵌入式子系统,用于机器学习、视觉算法和信号
    的头像 发表于 09-15 09:47 5001次阅读

    安卓上RISC-V移植成最大阻碍

    安卓上RISC-V移植成最大阻碍   RISC-V作为一个开源架构,目前已经被诸多主流开源软件、系统所支持,不少RISC-V厂商都以支持Linux为宣传点。照理说同为开源的安卓系统
    的头像 发表于 10-14 09:47 5701次阅读

    有用risc-v芯片系统的吗?

    risc-v芯片系统有什么需要注意的呢?
    发表于 03-29 21:52

    每日推荐 | HarmonyOS 从入门到大神资料,从开始写RISC-V处理器经验连载

    各位开发者们丰富的学习资源。为了方便大家获取资料,现在只需扫描下面海报维码并回复关键字 “教程” 即可获取大神资料,赶快扫码领取吧!2、从开始写RISC-V处理器之四 实践篇推荐理由:这里只介绍
    发表于 08-23 10:08

    目前国内RISC-V架构的MCU从程序从arm移植RISC-V难度大吗?

    目前国内RISC-V架构的MCU从程序从arm移植RISC-V难度大吗?
    发表于 03-09 10:00

    RISC-VuCLinux或者NO MMU的Linux的项目吗?

    RISC-VuCLinux或者NO MMU的Linux的项目吗?
    发表于 04-03 17:54

    RISC-V规范的演进 RISC-V何时爆发?

    的规范会有怎样的演进?生态建设又会有什么大动作? RISC-V规范的演进 RISC-V基金会CTO Mark I.Himelstein在本周举行的第RISC-V国际开源论坛上分享了
    的头像 发表于 02-11 10:10 3118次阅读

    ​开发板上玩GTA RISC-V多项移植项目成功运作中

    也宣布将以RISC-V架构再度进入CPU市场。 这么多大厂纷纷在RISC-V上展开动作,但RISC-V的软件生态尚未正式进入爆发期。不过近期RISC-V软件社区出现了多个
    的头像 发表于 09-16 11:59 1807次阅读
    ​开发板上玩GTA <b class='flag-5'>RISC-V</b>多项<b class='flag-5'>移植</b>项目成功运作中

    开始写RISC-V处理器

    RISC-V是这两年才开始迅速发展的,因此关于RISC-V的学习参考资料目前还很少,特别是适合入门的资料,因此学习起来进度很缓慢,于是萌生了自己从开始写RISC-V处理器核的想法。
    发表于 03-17 09:46 103次下载

    RISC-V处理器的优势是什么

    本文探讨了 RISC-V 的开源硬件模型背后的好处,讨论了它的寿命、可移植性和可靠性。
    的头像 发表于 05-07 16:43 3518次阅读
    <b class='flag-5'>RISC-V</b>处理器的优势是什么

    基于RISC-V内核单片机移植RTOS实时操作系统(一)

      ARM上移植实时操作系统大家可能比较熟悉,且例程较多,对于RISC-V内核的单片机,可能相对比较陌生。下面结合WCH沁恒微电子的赤菟V103(CH32V103)和赤菟
    的头像 发表于 01-31 12:08 2577次阅读
    基于<b class='flag-5'>RISC-V</b>内核单片机<b class='flag-5'>移植</b>RTOS实时操作系统(一)

    基于RISC-V内核单片机移植RTOS实时操作系统()

      今天聊下移植RTOS时RISC-V内核时单片机任务栈保存哪些内容。
    的头像 发表于 01-31 13:50 1600次阅读
    基于<b class='flag-5'>RISC-V</b>内核单片机<b class='flag-5'>移植</b>RTOS实时操作系统(<b class='flag-5'>二</b>)

    解锁RISC-V技术力量丨曹英杰:RISC-V与大模型探索

    4月12日,第期“大家来谈芯|解锁RISC-V技术力量”在上海临港新片区顶科永久会址举办,本期沙龙聚焦RISC-V技术,围绕AI时代的RISC-V市场机会、
    的头像 发表于 04-16 08:16 598次阅读
    解锁<b class='flag-5'>RISC-V</b>技术力量丨曹英杰:<b class='flag-5'>RISC-V</b>与大<b class='flag-5'>模型</b>探索