0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

RISC-V 跑大模型(二):LLaMA零基础移植教程

澎峰科技PerfXLab 来源:澎峰科技PerfXLab 作者:澎峰科技PerfXLab 2023-07-17 16:16 1616次阅读

这是RISC-V跑大模型系列的第二篇文章,主要教大家如何将LLaMA移植到RISC-V环境里。

1. 环境准备

1)最新版Python

2)确保机器有足够的内存加载完整模型(7B模型需要13~15G

3)下载原版LLaMA模型和扩展了的中文模型

LLaMA原版模型:

https://ipfs.io/ipfs/Qmb9y5GCkTG7ZzbBWMu2BXwMkzyCKcUjtEKPpgdZ7GEFKm/

2. 模型下载

从LLaMA原版模型地址上下载下述文件(我们使用的是7B):

wKgaomS097WAaxKzAABR0Iv83Lk708.png

最后文件下载完成后的结果如下:

wKgZomS09-GAdTAMAABac0MziDc336.png

3. 加载并启动

1)这一步需要下载llama.cpp,请输入以下命令进行下载和编译:

git clone https://github.com/ggerganov/llama.cpp && cd llama.cpp && make

2)将第二步下载的文件移到llama.cpp/models/下,使用命令:

python3 convert-pth-to-ggml.py models/7B/ 0

3)将.pth模型权重转换为ggml的FP32格式,生成文件路径为models/7B/ggml-model-f32.bin。

wKgaomS0-H-AEYU2AAPRdhm-gs8988.png

4)运行./main二进制文件,-m命令指定Q4量化模型(也可加载ggml-FP16的模型)。以下是解码参数:

./main models/7B/ggml-model-f32.bin --color -f prompts/alpaca.txt -ins -c 256 --temp 0.2 -n 128 --repeat_penalty 1.3

参数解释:

-ins 启动类ChatGPT对话交流的运行模式
-f 指定prompt模板,alpaca模型请加载prompts/alpaca.txt
-c 控制上下文的长度,值越大越能参考更长的对话历史(默认:512)
-n 控制回复生成的最大长度(默认:128)
-t 控制batch size(默认:8),可适当增加
--repeat_penalty 控制线程数量(默认:4),可适当增加
--temp 控制线程数量(默认:4),可适当增加
--top_p, top_k

控制解码采样的相关数据

4.结束

本篇教程到这里就结束了。是不是觉得LLaMA的速度比较慢而且不支持中文,没关系,在下一期中,我们会为LLaMA扩充中文,并优化加速LLaMA,记得继续关注我们哦。

另外,RISC -V跑大模型系列文章计划分为四期:

1.RISC -V跑大模型(一)
2. RISC-V 跑大模型(二):LLaMA零基础移植教程(本篇)
3.LLaMA扩充中文+优化加速(计划)
4. 更多性能优化策略。(计划)

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • RISC-V
    +关注

    关注

    46

    文章

    2463

    浏览量

    48081
  • 大模型
    +关注

    关注

    2

    文章

    2958

    浏览量

    3694
  • LLM
    LLM
    +关注

    关注

    1

    文章

    317

    浏览量

    649
收藏 人收藏
    相关推荐
    热点推荐

    RISC-V 模型(三):LLaMA中文扩展

    这是RISC-V模型系列的第三篇文章,前面我们为大家介绍了如何在RISC-V下运行LLaMA,本篇我们将会介绍如何为
    的头像 发表于 07-17 17:15 1015次阅读
    <b class='flag-5'>RISC-V</b> <b class='flag-5'>跑</b>大<b class='flag-5'>模型</b>(三):<b class='flag-5'>LLaMA</b>中文扩展

    开发板上玩GTA,RISC-V多项移植项目成功运作中

    开发板上玩GTA ,RISC-V 多项移植项目成功运作中   RISC-V近期再度掀起了不小的热度,苹果招募RISC-V程序员负责其操作系统的嵌入式子系统,用于机器学习、视觉算法和信号
    的头像 发表于 09-15 09:47 5269次阅读

    安卓上RISC-V移植成最大阻碍

    安卓上RISC-V移植成最大阻碍   RISC-V作为一个开源架构,目前已经被诸多主流开源软件、系统所支持,不少RISC-V厂商都以支持Linux为宣传点。照理说同为开源的安卓系统
    的头像 发表于 10-14 09:47 5967次阅读

    有用risc-v芯片系统的吗?

    risc-v芯片系统有什么需要注意的呢?
    发表于 03-29 21:52

    每日推荐 | HarmonyOS 从入门到大神资料,从开始写RISC-V处理器经验连载

    各位开发者们丰富的学习资源。为了方便大家获取资料,现在只需扫描下面海报维码并回复关键字 “教程” 即可获取大神资料,赶快扫码领取吧!2、从开始写RISC-V处理器之四 实践篇推荐理由:这里只介绍
    发表于 08-23 10:08

    目前国内RISC-V架构的MCU从程序从arm移植RISC-V难度大吗?

    目前国内RISC-V架构的MCU从程序从arm移植RISC-V难度大吗?
    发表于 03-09 10:00

    RISC-VuCLinux或者NO MMU的Linux的项目吗?

    RISC-VuCLinux或者NO MMU的Linux的项目吗?
    发表于 04-03 17:54

    RISC-V规范的演进 RISC-V何时爆发?

    的规范会有怎样的演进?生态建设又会有什么大动作? RISC-V规范的演进 RISC-V基金会CTO Mark I.Himelstein在本周举行的第RISC-V国际开源论坛上分享了
    的头像 发表于 02-11 10:10 3441次阅读

    ​开发板上玩GTA RISC-V多项移植项目成功运作中

    也宣布将以RISC-V架构再度进入CPU市场。 这么多大厂纷纷在RISC-V上展开动作,但RISC-V的软件生态尚未正式进入爆发期。不过近期RISC-V软件社区出现了多个
    的头像 发表于 09-16 11:59 1982次阅读
    ​开发板上玩GTA <b class='flag-5'>RISC-V</b>多项<b class='flag-5'>移植</b>项目成功运作中

    开始写RISC-V处理器

    RISC-V是这两年才开始迅速发展的,因此关于RISC-V的学习参考资料目前还很少,特别是适合入门的资料,因此学习起来进度很缓慢,于是萌生了自己从开始写RISC-V处理器核的想法。
    发表于 03-17 09:46 112次下载

    RISC-V处理器的优势是什么

    本文探讨了 RISC-V 的开源硬件模型背后的好处,讨论了它的寿命、可移植性和可靠性。
    的头像 发表于 05-07 16:43 3925次阅读
    <b class='flag-5'>RISC-V</b>处理器的优势是什么

    基于RISC-V内核单片机移植RTOS实时操作系统(一)

      ARM上移植实时操作系统大家可能比较熟悉,且例程较多,对于RISC-V内核的单片机,可能相对比较陌生。下面结合WCH沁恒微电子的赤菟V103(CH32V103)和赤菟
    的头像 发表于 01-31 12:08 3159次阅读
    基于<b class='flag-5'>RISC-V</b>内核单片机<b class='flag-5'>移植</b>RTOS实时操作系统(一)

    基于RISC-V内核单片机移植RTOS实时操作系统()

      今天聊下移植RTOS时RISC-V内核时单片机任务栈保存哪些内容。
    的头像 发表于 01-31 13:50 1828次阅读
    基于<b class='flag-5'>RISC-V</b>内核单片机<b class='flag-5'>移植</b>RTOS实时操作系统(<b class='flag-5'>二</b>)

    RISC-V模型):LLaMA零基移植教程

    这是RISC-V模型系列的第篇文章,主要教大家如何将LLaMA移植
    的头像 发表于 07-10 10:10 1261次阅读
    <b class='flag-5'>RISC-V</b><b class='flag-5'>跑</b>大<b class='flag-5'>模型</b>(<b class='flag-5'>二</b>):<b class='flag-5'>LLaMA</b><b class='flag-5'>零基</b>础<b class='flag-5'>移植</b>教程

    解锁RISC-V技术力量丨曹英杰:RISC-V与大模型探索

    4月12日,第期“大家来谈芯|解锁RISC-V技术力量”在上海临港新片区顶科永久会址举办,本期沙龙聚焦RISC-V技术,围绕AI时代的RISC-V市场机会、
    的头像 发表于 04-16 08:16 1050次阅读
    解锁<b class='flag-5'>RISC-V</b>技术力量丨曹英杰:<b class='flag-5'>RISC-V</b>与大<b class='flag-5'>模型</b>探索

    ElfBoard技术贴|如何调整eMMC存储分区

    ELF 2开发板基于瑞芯微RK3588高性能处理器设计,拥有四核ARM Cortex-A76与四核ARM Cortex-A55的CPU架构,主频高达2.4GHz,内置6TOPS算力的NPU,这一设计让它能够轻松驾驭多种深度学习框架,高效处理各类复杂的AI任务。

    ElfBoard
    7小时前
    320

    米尔基于MYD-YG2LX系统启动时间优化应用笔记

    1.概述MYD-YG2LX采用瑞萨RZ/G2L作为核心处理器,该处理器搭载双核Cortex-A55@1.2GHz+Cortex-M33@200MHz处理器,其内部集成高性能3D加速引擎Mail-G31GPU(500MHz)和视频处理单元(支持H.264硬件编解码),16位的DDR4-1600/DDR3L-1333内存控制器、千兆以太网控制器、USB、CAN、

    米尔电子
    14小时前
    235

    运放技术——基本电路分析

    虚短和虚断的概念由于运放的电压放大倍数很大,一般通用型运算放大器的开环电压放大倍数都在80dB以上。而运放的输出电压是有限的,一般在10V~14V。因此运放的差模输入电压不足1mV,两输入端近似等电位,相当于“短路”。开环电压放大倍数越大,两输入端的电位越接近相等。“虚短”是指在分析运算放大器处于线性状态时,可把两输入端视为等电位,这一特性称为虚假短路,简称

    张飞实战电子官方
    1天前
    287

    飞凌嵌入式携手中移物联,谱写全国产化方案新生态

    4月22日,飞凌嵌入式“2025嵌入式及边缘AI技术论坛”在深圳成功举办。中移物联网有限公司(以下简称“中移物联”)携OneOS操作系统与飞凌嵌入式共同推出的工业级核心板亮相会议展区,操作系统产品部高级专家严镭受邀作《OneOS工业操作系统——助力国产化智能制造》主题演讲。

    飞凌嵌入式
    1天前
    614

    ATA-2022B高压放大器在螺栓松动检测中的应用

    实验名称:ATA-2022B高压放大器在螺栓松动检测中的应用实验方向:超声检测实验设备:ATA-2022B高压放大器、函数信号发生器,压电陶瓷片,数据采集卡,示波器,PC等实验内容:本研究基于振动声调制的螺栓松动检测方法,其中低频泵浦波采用单频信号,而高频探测波采用扫频信号,利用泵浦波和探测波在接触面的振动声调制响应对螺栓的松动程度进行检测。通过螺栓松动检测

    Aigtek安泰电子
    2天前
    993

    MOS管驱动电路——电机干扰与防护处理

    此电路分主电路(完成功能)和保护功能电路。MOS管驱动相关知识:1、跟双极性晶体管相比,一般认为使MOS管导通不需要电流,只要GS电压(Vbe类似)高于一定的值,就可以了。MOS管和晶体管向比较c,b,e—–>d(漏),g(栅),s(源)。2、NMOS的特性,Vgs大于一定的值就会导通,适合用于源极接地时的情况(低端驱动),只要栅极电压达到4V或10V就可以

    张飞实战电子官方
    2天前
    332

    压敏(MOV)在电机上的应用剖析

    一前言有刷直流电机是一种较为常见的直流电机。它的主要特点包括:1.结构相对简单,由定子、转子、电刷和换向器等组成;2.通过电刷与换向器的接触来实现电流的换向,从而使电枢绕组中的电流方向周期性改变,保证电机持续运转;3.具有调速性能较好等优点,可以通过改变电压等方式较为方便地调节转速。有刷直流电机在许多领域都有应用,比如一些电动工具、玩具、小型机械等。但它也存

    深圳市韬略科技有限公司
    2天前
    232

    硬件原理图学习笔记

    这一个星期认真学习了硬件原理图的知识,做了一些笔记,方便以后查找。硬件原理图分为三类1.管脚类(gpio)和门电路类输入输出引脚,上拉电阻,三极管与门,或门,非门上拉电阻:正向标志作用,给悬空的引脚一个确定的状态三极管:反向三极管(gpio输出高电平,NP两端导通,被控制端导通,电压为0)->NPN正向三极管(gpio输出低电平,PN两端导通,被控制端导通,

    张飞实战电子官方
    04-30 18:40
    409

    TurMass™ vs LoRa:无线通讯模块的革命性突破

    TurMass™凭借其高传输速率、强大并发能力、双向传输、超强抗干扰能力、超远传输距离、全国产技术、灵活组网方案以及便捷开发等八大优势,在无线通讯领域展现出强大的竞争力。

    道生物联
    2天前
    724

    RZT2H CR52双核BOOT流程和例程代码分析

    RZT2H是多核处理器,启动时,需要一个“主核”先启动,然后主核根据规则,加载和启动其他内核。本文以T2H内部的CR52双核为例,说明T2H多核启动流程。

    RA生态工作室
    04-03 17:14
    2k

    干簧继电器在RF信号衰减中的应用与优势

    在电子测试领域,RF(射频)评估是不可或缺的一部分。无论是研发阶段的性能测试,还是生产环节的质量检测,RF测试设备都扮演着关键角色。然而,要实现精准的RF评估,测试设备需要一种特殊的电路——衰减电路。这些电路的作用是调整RF信号的强度,以便测试设备能够准确地评估RF组件和RF电路的各个方面。衰减器的挑战衰减器的核心功能是校准RF信号的强度。为了实现这一点,衰

    斯丹麦德电子
    04-30 11:33
    725

    ElfBoard嵌入式教育科普|ADC接口全面解析

    当代信息技术体系中,嵌入式系统接口作为数据交互的核心基础设施,构成了设备互联的神经中枢。基于标准化通信协议与接口规范的技术架构,实现了异构设备间的高效数据交换与智能化协同作业。本文选取模数转换接口ADC作为技术解析切入点,通过系统阐释其工作机理、性能特征及重要参数,为嵌入式学习者爱好者构建全维度接口技术认知框架。

    ElfBoard
    04-30 09:34
    388

    深入理解C语言:C语言循环控制

    在C语言编程中,循环结构是至关重要的,它可以让程序重复执行特定的代码块,从而提高编程效率。然而,为了避免程序进入无限循环,C语言提供了多种循环控制语句,如break、continue和goto,用于改变程序的执行流程,使代码更加灵活和可控。本文将详细介绍这些语句的作用及其应用场景,并通过示例代码进行说明。Part.1break语句C语言中break语句有两种

    合众恒跃
    04-29 18:49
    507

    第 21 届(顺德)家电电源与智能控制技术研讨会圆满落幕--其利天下斩获颇丰

    2025年4月25日,其利天下应大比特之邀出席第21届(顺德)家电电源与智能控制技术研讨会,已圆满落幕。一、演讲回顾我司研发总监冯建武先生在研讨会上发表了主题为《重新定义风扇驱动:一套算法兼容百种电机的有效磁链观测器方案》的演讲,介绍了我司研发自适应技术算法(简称),该方案搭载有效磁链观测器,适配百种电机类型,结合FOC算法可实现免调参稳定启动、低速静音控制

    其利天下技术
    04-28 19:29
    1.4k

    来自资深工程师对ELF 2开发板的产品测评

    来自资深工程师对ELF 2开发板的使用测评

    ElfBoard
    04-28 15:03
    538