0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

RISC -V跑大模型(一)

澎峰科技PerfXLab 来源:澎峰科技PerfXLab 作者:澎峰科技PerfXLab 2023-07-17 15:13 次阅读
wKgaomS041GAH9vRAAgQZut24SQ065.png

在我写本文时,刚好是WAIC 2023举行的时候,感觉无处不是大模型。所以,RISC-V怎么能不刷刷大模型呢?废话不多说,先上图:

wKgZomS046iAU-yFAALX_-aQHQs247.png

去年,ChatGPT的出现震惊了全世界,在短短几个月的时间内,ChatGPT的月活跃用户达到了1亿。ChatGPT的成功让许多人第一次知道了大语言模型(Large Language Model)的概念,而今年Meta发布的LLaMA则在ChatGPT的基础上又往前跨了一大步,它大大降低了LLM的使用难度,让LLM真正“走进基层”。那LLaMA是什么呢?

1. LLaMA介绍

在介绍LLaMA之前,首先要介绍一下LLM(Large Language Model)。我们可以将LLM看成一位知识渊博的老师,在经过大量的知识学习(大量文本数据的训练)后,LLM会基于它的知识库,给出问题的最佳答案,我们可以使用LLM来完成文本总结、翻译、情感分析等工作。最近几年,是LLM的高速发展期,很多科技巨头都在LLM投入大量的资金。下面是这几年LLM的成果图:

wKgZomS049eAONycAAJfJvdD89c245.png近年来现有大型语言模型(大小大于10B)的时间表

但对于个人研究者而言,LLM的使用是有一定的门槛,一般的LLM模型对硬件的要求比较高,而一些开发公司出于商业的目的,并不打算将项目的源码进行开源,这都限制了个人研究者从更深的层次去了解LLM,在一定程度上这影响了LLM的发展(Android能有今天地位,离不开开源和方便使用,这为它后来的迅速发展打下了良好的基础)。好在今年Meta发布的LLaMA(Language Learning through Multimodal Autoregressive Models)给了对LLM感兴趣的开发者另一个选项,相较于其他的LLM模型而言,LLaMA优势在于它足够亲民且开源

从亲民的角度来说,LLaMA的规模仅为ChatGPT的“十分之一”,但性能却优于OpenAI的GPT-3模型,而且LLaMA只是一个基础模型,它完全可以使用公开的数据模型进行训练,这都使得LLaMA的使用门槛被大大降低;从开源的角度来说,LLaMA可以说是被迫开源,因为技术方面的问题,Meta暂缓了开源过程,但在发布后的不久,LLaMA的模型文件就被泄露了,那么,问题来了,这究竟是故意的还是不小心的呢?

2. llama.cpp

llama.cpp是由保加利亚索非亚的Georgi Gerganov基于LLaMA模型开发的纯C版本。Georgi Gerganov是一位资深的开源社区开发者,曾经还为OpenAI的自动语音识别模型开发了whisper.cpp。llama.cpp可以让使用者在没有GPU的情况下也能运行LLaMA模型。所以它一经发布,就吸引了大量对LLaMA感兴趣的人下载使用,很快就有人找到了在Windows上运行LLaMA的方法,之后又实现了在手机上的运行。llama.cpp大大降低了LLaMA的使用门槛,通过llama.cpp,LLaMA展现了它无与伦比的语言学习能力,为我们打开了一座探索语言世界的新大门。

值得一提的是,Georgi Gerganov在公布llama.cpp后的几个月就自主创业,成立了ggml.ai公司,这个公司的合伙人有GitHub前CEO Nat Friedman和Y-Combinator的Daniel Gross。ggml.ai的成立也引起了许多业内大佬的注意,或许它之后会为AI的发展带来一些不一样的东西。

3. 硬件平台简介

3.1 RISC-V简介
澎峰科技联合创始人王军辉说“2023年是RISC-V高性能计算元年”。因为2023年算能推出了全球第一颗已量产的RISC-V服务器级64核CPU,这意味RISC-V进入高性能计算领域的未来已经不远了。那么,RISC-V到底是什么?

简单来说,RISC-V和我们熟悉的X86、ARM一样,都是指令集架构,但X86属于复杂指令集(CSIC),RISC-V和ARM属于精简指令集(RISC)。虽然CISC指令丰富功能强大,但随着CISC的逐步发展,过于复杂的指令不仅会导致指令使用率不均衡(效率低),也加大了超大规模集成电路实现的难度。相对的,RISC的优势在于指令简单,使用率均衡,执行效率高。同时,通常基于RISC的芯片易于实现电路设计和大规模集成。

正如文章开篇所展示的,我在基于SG2042的RISC-V平台上完成了LLaMA的移植。LLM和RISC-V都是近两年比较热门的东西,同时又有很大的空白供开发者们探索和建设,所以我觉得把两者结合这是一件很有意思也很有意义的事情。下面简单介绍一下我使用的开发平台。

3.2 平台

RISC-V服务器主板(搭载全球第一颗量产的服务器级64核RISC-V芯片SG2042)

wKgZomS05eiAdJpRAA1z6rBqDng539.png

3.3 基本配置

硬件平台配置
CPU SG2042(64 Core@2.0GHz)
DDR 32GB 3200MHz
Local Storage 1T M.2 NVMe SSD
操作系统配置
OS Ubuntu
Kernel Linux 5.19.17

4. 结束语

本系列文章估计会分为四期:

第一期:RISC -V跑大模型(引言)。

第二期:LLaMA零基础移植教程

第三期:软件优化进行LLaMA加速

第四期:更多性能优化策略。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • RISC-V
    +关注

    关注

    44

    文章

    2227

    浏览量

    46000
  • RISC-V处理器
    +关注

    关注

    0

    文章

    80

    浏览量

    9991
  • ChatGPT
    +关注

    关注

    29

    文章

    1548

    浏览量

    7466
  • 大模型
    +关注

    关注

    2

    文章

    2314

    浏览量

    2447
  • LLM
    LLM
    +关注

    关注

    0

    文章

    272

    浏览量

    304
收藏 人收藏

    评论

    相关推荐

    RISC-V 模型(二):LLaMA零基础移植教程

    这是RISC-V模型系列的第二篇文章,主要教大家如何将LLaMA移植到RISC-V环境里。
    的头像 发表于 07-17 16:16 1349次阅读
    <b class='flag-5'>RISC-V</b> <b class='flag-5'>跑</b>大<b class='flag-5'>模型</b>(二):LLaMA零基础移植教程

    RISC-V 模型(三):LLaMA中文扩展

    这是RISC-V模型系列的第三篇文章,前面我们为大家介绍了如何在RISC-V下运行LLaMA,本篇我们将会介绍如何为LLaMA提供中文支持。
    的头像 发表于 07-17 17:15 785次阅读
    <b class='flag-5'>RISC-V</b> <b class='flag-5'>跑</b>大<b class='flag-5'>模型</b>(三):LLaMA中文扩展

    有用risc-v芯片系统的吗?

    risc-v芯片系统有什么需要注意的呢?
    发表于 03-29 21:52

    如何设计个好的RISC-V

    文章目录写在前面什么是RISC-VRISC-V诞生的背景ISA霸权摩尔定律的穷途末路穷困潦倒的学者不断增长的指令数量RISC-V架构设计思想如何设计个好的ISARISC-V之RV32
    发表于 07-26 06:42

    全志V853常用模型分数据

    V853常用模型分数据序号算法模型FPSBW(MB/s)1inception_v1(224x224)57.371443.312incept
    发表于 12-23 09:28

    RISC-VuCLinux或者NO MMU的Linux的项目吗?

    RISC-VuCLinux或者NO MMU的Linux的项目吗?
    发表于 04-03 17:54

    RISC-V规范的演进 RISC-V何时爆发?

    的最新进展。Mark说:“我们在2019年底的时候增加了些扩展指令集,会放到RVA20、RVM20中。RISC-V基金会的目标
    的头像 发表于 02-11 10:10 3135次阅读

    RISC-V中国峰会:即将发射的中国RISC-V芯片

    RISC-V中国峰会:即将发射的中国RISC-V芯片
    的头像 发表于 06-22 17:49 2536次阅读
    第<b class='flag-5'>一</b>届<b class='flag-5'>RISC-V</b>中国峰会:即将发射的中国<b class='flag-5'>RISC-V</b>芯片

    RISC-V模型

    在我写本文时,刚好是WAIC 2023举行的时候,感觉无处不是大模型
    的头像 发表于 07-10 10:07 432次阅读
    <b class='flag-5'>RISC-V</b><b class='flag-5'>跑</b>大<b class='flag-5'>模型</b>(<b class='flag-5'>一</b>)

    RISC-V模型(二):LLaMA零基础移植教程

    这是RISC-V模型系列的第二篇文章,主要教大家如何将LLaMA移植到RISC-V环境里。
    的头像 发表于 07-10 10:10 1037次阅读
    <b class='flag-5'>RISC-V</b><b class='flag-5'>跑</b>大<b class='flag-5'>模型</b>(二):LLaMA零基础移植教程

    RISC-VRISC-V AI的未来(特邀讲座)

    主题演讲:RISC-VRISC-V AI的未来(特邀讲座)ppt分享
    发表于 07-14 17:15 16次下载

    RISC-V设计支持工具,支持RISC-V技术的基础

    RISC-V设计支持工具,支持RISC-V技术的基础 ppt分享
    发表于 07-14 17:15 12次下载

    解锁RISC-V技术力量丨曹英杰:RISC-V与大模型探索

    助力RISC-V开发等话题,多位业内嘉宾发表了主旨演讲。会上,时擎科技高级技术总监曹英杰以“RISC-V与大模型探索”为题,将大模型作为切入点,探讨了
    的头像 发表于 04-16 08:16 629次阅读
    解锁<b class='flag-5'>RISC-V</b>技术力量丨曹英杰:<b class='flag-5'>RISC-V</b>与大<b class='flag-5'>模型</b>探索

    RISC-V Summit China 2024 青稞RISC-V+接口PHY,赋能RISC-V高效落地

    沁恒在历届峰会上分享RISC-V在MCU领域的创新成果,和大家共同见证了本土RISC-V产业的成长。早在第RISC-V中国峰会上,沁恒就公开了青稞
    的头像 发表于 08-30 18:18 1363次阅读
    <b class='flag-5'>RISC-V</b> Summit China 2024  青稞<b class='flag-5'>RISC-V</b>+接口PHY,赋能<b class='flag-5'>RISC-V</b>高效落地

    加入全球 RISC-V Advocate 行列,共筑 RISC-V 的未来 !

    加入RISC-VAdvocate行列!我们正在寻找来自世界各地的RISC-V爱好者,通过全球推广和参与,成为支持RISC-V进步的关键参与者。作为
    的头像 发表于 09-10 08:08 306次阅读
    加入全球 <b class='flag-5'>RISC-V</b> Advocate 行列,共筑 <b class='flag-5'>RISC-V</b> 的未来 !