0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

爆火Llama 2一周请求下载超15万,有人开源了Rust实现版本

深度学习自然语言处理 来源:机器之心 2023-08-02 16:25 次阅读

研究者对 Llama 2 的二次开发项目是越来越多了。

前些天,Meta 发布的免费可商用版本 Llama 2,可谓在 AI 界引起了巨大的轰动。

Meta 一口气发布了多个模型系列:包含 70 亿、130 亿和 700 亿三种参数变体,此外还训练了一个 340 亿参数变体。

53ab74fa-3076-11ee-9e74-dac502259ad0.png

公布的测评结果显示,Llama 2 在包括推理、编码、精通性和知识测试等许多外部基准测试中都优于其他开源语言模型。

不同于 ChatGPT、GPT-4 等闭源模型,由于 Llama 2 可用于商业目的,一经发布就吸引了一大波 AI 研究人员的注意。由于任何人都可以通过在 Meta 网站上填写表格来请求下载 Llama 2,根据官方消息,自发布以来,Llama 2 一周内就有超过 15 万次的下载请求。Meta 对于这一数字的描述是难以置信,并且用户请求数量还在增长。

Llama 2 请求地址:https://ai.meta.com/resources/models-and-libraries/llama-downloads/

53cfd35e-3076-11ee-9e74-dac502259ad0.png

来源:https://ai.meta.com/blog/llama-2-update/?utm_source=twitter&utm_medium=organic_social&utm_campaign=llama2&utm_content=card

随着 Llama 2 的逐渐走红,大家对它的二次开发开始流行起来。前几天,OpenAI 科学家 Karpathy 利用周末时间开发了一个明星项目 llama2.c,借助 GPT-4,该项目仅用 500 行 C 语言就实现了对 Llama 2 baby 模型的推理。该项目可以在苹果 M1 笔记本上每秒输出 98 个 token。

刚刚,又有一个和 LLaMA 2 相关的项目 llama2.rs 开始得到大家的关注,项目作者是来自康奈尔大学的助理教授 Alexander Rush。

总结而言,该项目主要是用 Rust 实现 Llama2,结果表明,用这种方式实现的 LLaMA 2 非常安全,而且很快。值得一提的是,该项目用到了 Karpathy 的 llama2.c 项目的 Rust 端口

项目地址:https://github.com/srush/llama2.rs

深度学习三巨头之一的 Yann LeCun 也宣传了一波:

54247846-3076-11ee-9e74-dac502259ad0.png

接下来我们看看,如何使用 llama2.rs。

构建 llama2.rs 非常简单,只需一行代码:

> cargo build --release

运行程序如下,显示 tok/s 为 0.92618316:

> target/release/llama2_rs ../llama2.c/llama2_7b.bin 0.0 11 "The only thing"
The only thing that is certain in life is change.
achieved tok/s: 0.92618316

作为对比,下面是作者在电脑上运行原始 llama2.c,显示 tok/s 为 0.139889:

> ./run llama2_7b.bin 0.0 11 "The only thing"
The only thing that is certain in life is change.
achieved tok/s: 0.139889

在谈到为何开发这一项目时,Alexander Rush 表示,自己只是想做一些关于 Rust 的练习,与此同时,学习该如何进行程序移植,比如内存映射、并行处理和一些数学技巧。

接下来,Alexander Rush 打算尝试移植 minitorch,感兴趣的读者可以关注一下了。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 开源
    +关注

    关注

    3

    文章

    3363

    浏览量

    42544
  • 语言模型
    +关注

    关注

    0

    文章

    527

    浏览量

    10287
  • Rust
    +关注

    关注

    1

    文章

    229

    浏览量

    6619

原文标题:爆火Llama 2一周请求下载超15万,有人开源了Rust实现版本

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    一周看懂电路图

    一周看懂电路图
    发表于 04-19 16:54

    发布不到一周,iOS6.1.2已成为北美最流行的版本

    来自Chitika的数据显示,iOS 6.1.2发布不到一周,就已经成为美国和加拿大地区最受欢迎的版本。数据的采集时间为2月19日至24日之间,有数百万iPhone、iPad和iPo
    发表于 02-28 16:19

    一周看懂电路图

    一周看懂电路图
    发表于 09-28 21:59

    一周的工作表情包。

    `一周的工作又开始。。。。。。`
    发表于 08-04 13:12

    一周信创舆情观察(7.13~7.19) 精选资料分享

    一周舆情要点中国移动大规模采集国产数据库,自主可控数据库有望迎来全方位增长。中国移动此次预计采购1500套数据库产品及服务,金额在6000元左右,中标候选人包括南大通用、人大金仓、阿里云、
    发表于 07-23 08:40

    小米AI音箱发布一周年之际,终于实现现货供应

    在小米AI音箱一周年之际,它终于实现「现货供应」,通过小米商城、小米之家、小米有品、京东、天猫、苏京均可现货购买。
    发表于 07-27 14:45 7274次阅读

    拍手开关版本2开源

    电子发烧友网站提供《拍手开关版本2开源.zip》资料免费下载
    发表于 07-19 10:10 0次下载
    拍手开关<b class='flag-5'>版本</b><b class='flag-5'>2</b><b class='flag-5'>开源</b>

    基于Rust语言的高可靠、开源嵌入式Hypervisor

    Rust-Shyper 是北京航空航天大学计算机学院王雷教授团队设计开发的虚拟机监控器,该系统基于 Rust 语言,实现个高可靠、嵌入
    的头像 发表于 05-24 16:31 1822次阅读
    基于<b class='flag-5'>Rust</b>语言的高可靠、<b class='flag-5'>开源</b>嵌入式Hypervisor

    关于Llama 2切资源,我们都帮你整理好了

    Meta 发布的 Llama 2,是新的 SOTA 开源大型语言模型(LLM)。Llama 2 代表着
    的头像 发表于 08-23 15:40 1202次阅读

    如何在Rust项目中使用InfluxDB 2.x

    Rust种系统编程语言,它具有高性能、内存安全和并发性等特点。InfluxDB是开源的时序数据库,它专门用于存储和查询时间序列数据。InfluxDB
    的头像 发表于 09-19 16:33 675次阅读

    “超级品”智己LS6上市一周锁单即突破10,000台!

    智能纯电SUV的“超级品”——智己LS6,上市一周锁单即突破10,000台!“未来智舱”智己LS6上市以来销量持续火爆!
    的头像 发表于 10-22 14:22 1580次阅读

    一周搞定系列之模电数电

    电子发烧友网站提供《一周搞定系列之模电数电.ppt》资料免费下载
    发表于 11-17 10:01 18次下载
    <b class='flag-5'>一周</b>搞定系列之模电数电

    Meta发布开源大模型Code Llama 70B

    近日,Meta宣布推出了款新的开源大模型Code Llama 70B,这是其“Code Llama家族中体量最大、性能最好的模型版本”。这
    的头像 发表于 01-31 09:24 955次阅读

    LLaMA 2是什么?LLaMA 2背后的研究工作

    Meta 发布的 LLaMA 2,是新的 sota 开源大型语言模型 (LLM)。LLaMA 2 代表着
    的头像 发表于 02-21 16:00 1129次阅读

    Meta推出最强开源模型Llama 3 要挑战GPT

    公司这次开源Llama 3 8B与70B两款不同规模的模型,开发者可以免费使用,而Meta公司还将陆续推出系列具备多模态、多语言对话、更长上下文窗口等能力的新模型。 据悉Meta用
    的头像 发表于 04-19 17:00 845次阅读