这是RISC-V跑大模型系列的第二篇文章,主要教大家如何将LLaMA移植到RISC-V环境里。
1. 环境准备
1)最新版Python
2)确保机器有足够的内存加载完整模型(7B模型需要13~15G)
3)下载原版LLaMA模型和扩展了的中文模型
2. 模型下载
从LLaMA原版模型地址上下载下述文件(我们使用的是7B):
最后文件下载完成后的结果如下:
3. 加载并启动
1)这一步需要下载llama.cpp,
python3 convert-pth-to-ggml.py models/7B/ 03)将.pth模型权重转换为ggml的FP32格式,生成文件路径为models/7B/ggml-model-f32.bin。
4)运行./main二进制文件,-m命令指定Q4量化模型(也可加载ggml-FP16的模型)。以下是解码参数及示例:
./main models/7B/ggml-model-f32.bin --color -f prompts/alpaca.txt -ins -c 256 --temp 0.2 -n 128 --repeat_penalty 1.3
参数解释:
-ins | 启动类ChatGPT对话交流的运行模式 |
-f | 指定prompt模板,alpaca模型请加载prompts/alpaca.txt |
-c | 控制上下文的长度,值越大越能参考更长的对话历史(默认:512) |
-n | 控制回复生成的最大长度(默认:128) |
-t | 控制batch size(默认:8),可适当增加 |
--repeat_penalty | 控制线程数量(默认:4),可适当增加 |
--temp | 温度系数,值越低回复的随机性越小,反之越大 |
--top_p, top_k | 控制解码采样的相关参数 |
审核编辑:刘清
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
-
解码器
+关注
关注
9文章
1129浏览量
40632 -
python
+关注
关注
55文章
4766浏览量
84371 -
RISC-V
+关注
关注
44文章
2203浏览量
45952 -
澎峰科技
+关注
关注
0文章
48浏览量
3156 -
ChatGPT
+关注
关注
29文章
1546浏览量
7348
原文标题:RISC-V 跑大模型(二):LLaMA零基础移植教程
文章出处:【微信号:perfxlab,微信公众号:perfxlab】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
相关推荐
开发板上玩GTA,RISC-V多项移植项目成功运作中
开发板上玩GTA ,RISC-V 多项移植项目成功运作中 RISC-V近期再度掀起了不小的热度,苹果招募RISC-V程序员负责其操作系统的嵌入式子系统,用于机器学习、视觉算法和信号
安卓上RISC-V,移植成最大阻碍
安卓上RISC-V ,移植成最大阻碍 RISC-V作为一个开源架构,目前已经被诸多主流开源软件、系统所支持,不少RISC-V厂商都以支持Linux为宣传点。照理说同为开源的安卓系统
每日推荐 | HarmonyOS 从入门到大神资料,从零开始写RISC-V处理器经验连载
各位开发者们丰富的学习资源。为了方便大家获取资料,现在只需扫描下面海报二维码并回复关键字 “教程” 即可获取大神资料,赶快扫码领取吧!2、从零开始写RISC-V处理器之四 实践篇推荐理由:这里只介绍
发表于 08-23 10:08
RISC-V规范的演进 RISC-V何时爆发?
的规范会有怎样的演进?生态建设又会有什么大动作? RISC-V规范的演进 RISC-V基金会CTO Mark I.Himelstein在本周举行的第二届RISC-V国际开源论坛上分享了
开发板上玩GTA RISC-V多项移植项目成功运作中
也宣布将以RISC-V架构再度进入CPU市场。 这么多大厂纷纷在RISC-V上展开动作,但RISC-V的软件生态尚未正式进入爆发期。不过近期RISC-V软件社区出现了多个
从零开始写RISC-V处理器
RISC-V是这两年才开始迅速发展的,因此关于RISC-V的学习参考资料目前还很少,特别是适合入门的资料,因此学习起来进度很缓慢,于是萌生了自己从零开始写RISC-V处理器核的想法。
发表于 03-17 09:46
•103次下载
基于RISC-V内核单片机移植RTOS实时操作系统(一)
ARM上移植实时操作系统大家可能比较熟悉,且例程较多,对于RISC-V内核的单片机,可能相对比较陌生。下面结合WCH沁恒微电子的赤菟V103(CH32V103)和赤菟
解锁RISC-V技术力量丨曹英杰:RISC-V与大模型探索
4月12日,第二期“大家来谈芯|解锁RISC-V技术力量”在上海临港新片区顶科永久会址举办,本期沙龙聚焦RISC-V技术,围绕AI时代的RISC-V市场机会、
评论