0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

vLLM项目加入PyTorch生态系统,引领LLM推理新纪元

jf_23871869 来源:jf_23871869 作者:jf_23871869 2024-12-18 17:06 次阅读

近日,vLLM项目宣布正式成为PyTorch生态系统的一部分,标志着该项目与PyTorch的合作进入了一个全新的阶段。本文将从以下几个方面进行介绍,特别提醒:安装方案在第四个部分,可选择性阅读。

vLLM项目概述

vLLM的成就与实际应用

支持流行模型

安装与使用vLLM

总结

一,vLLM项目概述

vLLM是一个为大型语言模型(LLMs)设计的高吞吐量、内存高效的推理和服务引擎。该项目最初基于创新的PagedAttention算法构建,如今已经发展成为一个全面的、最先进的推理引擎。vLLM社区不断为其添加新功能和优化,包括流水线并行处理、分块预填充、推测性解码和分离服务。

wKgZPGdikGaARrC8AAMapEZDw_Y377.png

二,vLLM的成就与实际应用

自发布以来,vLLM获得了超过31,000个GitHub星标,这一成就证明了其受欢迎程度和社区的活力。vLLM与PyTorch的深度集成,使其能够支持包括NVIDIA GPUAMD GPU、Google Cloud TPU在内的多种硬件后端,确保了跨平台的兼容性和性能优化。

在今年的亚马逊Prime Day,vLLM在向数百万用户提供快速响应中发挥了关键作用。它在三个区域的80,000个Trainium和Inferentia芯片上,每分钟处理了300万个令牌,同时保持了P99延迟在1秒以内的首次响应。这意味着,当客户与亚马逊应用中的Rufus聊天时,他们实际上是在与vLLM互动。

三,支持流行模型

vLLM与领先的模型供应商紧密合作,支持包括Meta LLAMA、Mistral、QWen和DeepSeek在内的流行模型。特别值得一提的是,vLLM作为首发合作伙伴,首次启用了LLAMA 3.1(405B)模型,展示了其处理复杂和资源密集型语言模型的能力。

wKgZPGdikH2APXfvAAAutVrtNXY766.png

四,安装与使用vLLM

安装vLLM非常简单,用户只需在命令行中运行:

pip install vllm

vLLM既可以作为OpenAI API兼容服务器运行,也可以作为一个简单的函数使用。以下是如何使用vLLM生成文本的示例代码:

vllm serve meta-llama/Llama-3.1-8B

将vLLM作为简单函数运行:

from vllm import LLM, SamplingParams

五,总结

随着vLLM的加入,PyTorch生态系统更加强大,为LLM服务带来了便捷和高效。期待vLLM在未来解锁更多创新,推动AI技术的普及和发展

如果你有更好的文章,欢迎投稿!

稿件接收邮箱:nami.liu@pasuntech.com

更多精彩内容请关注“算力魔方®”!

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英特尔
    +关注

    关注

    61

    文章

    9949

    浏览量

    171687
  • pytorch
    +关注

    关注

    2

    文章

    807

    浏览量

    13196
  • LLM
    LLM
    +关注

    关注

    0

    文章

    286

    浏览量

    327
收藏 人收藏

    评论

    相关推荐

    Arm KleidiAI助力提升PyTorchLLM推理性能

    生成式人工智能 (AI) 正在科技领域发挥关键作用,许多企业已经开始将大语言模型 (LLM) 集成到云端和边缘侧的应用中。生成式 AI 的引入也使得许多框架和库得以发展。其中,PyTorch 作为
    的头像 发表于 12-03 17:05 721次阅读
    Arm KleidiAI助力提升<b class='flag-5'>PyTorch</b>上<b class='flag-5'>LLM</b><b class='flag-5'>推理</b>性能

    对三星而言开放生态系统是什么

    在过去的五年里,三星投入了大量精力来建立团队、文化和流程,成为开放生态系统的积极贡献者。那么,为什么一家硬件公司会进行这样的投资?其价值何在?我们如何将硬件差异化与开源和标准结合起来?
    的头像 发表于 11-13 15:58 304次阅读

    倒计时1天 | 第三届OpenHarmony技术大会——明天,上海见!

    技术引领生态,万物智联创未来 OpenHarmony 开源生态 繁荣于各方共建,又赋能于千行百业 开创了万物智联的新纪元,开源盛事,亦是开源盛世!
    发表于 10-11 23:29

    跨越地理限制:动态海外住宅IP技术引领全球化网络新纪元

    跨越地理限制:动态海外住宅IP技术引领全球化网络新纪元这一主题,凸显了动态海外住宅IP技术在全球化网络环境中的重要作用。
    的头像 发表于 09-27 08:30 302次阅读

    能耗管理系统新纪元:智能科技引领绿色生活风尚

    能耗管理系统新纪元:智能科技引领绿色生活风尚 在科技日新月异的今天,我们的生活正经历着前所未有的变革,而能耗管理系统作为连接环保与可持续发展的桥梁,正步入一个由智能科技
    的头像 发表于 08-15 18:17 509次阅读

    LLM大模型推理加速的关键技术

    LLM(大型语言模型)大模型推理加速是当前人工智能领域的一个研究热点,旨在提高模型在处理复杂任务时的效率和响应速度。以下是对LLM大模型推理加速关键技术的详细探讨,内容将涵盖模型压缩、
    的头像 发表于 07-24 11:38 850次阅读

    OpenAI草莓项目:引领人工智能向类人推理新纪元迈进

    在人工智能技术的浩瀚星海中,OpenAI正以其独特的“草莓”项目引领着一场前所未有的智能革命。据权威媒体路透社的最新揭秘,这家由微软鼎力支持的初创企业,正秘密酝酿一项旨在极大提升人工智能推理能力的革命性技术,其代号——“草莓”
    的头像 发表于 07-16 14:37 414次阅读

    苹果硬件生态系统丰富,用户黏性大

     苹果以其丰富多元的硬件生态系统,涵盖了从 iPhone 至 Mac 电脑等多种设备,每个设备都有其独特的用户群体。
    的头像 发表于 04-18 11:03 479次阅读

    浅谈AMD Ryzen AI PC生态系统

    AMD与OEM合作伙伴联想和华硕,以及生态系统合作伙伴百川智能、有道、游戏加加、生数、始智AI等共同努力,共庆龙年,并在大中华区扩展了Ryzen AI生态系统
    的头像 发表于 04-11 11:05 748次阅读

    莱迪思举办2024莱迪思技术峰会展示其强大的FPGA合作生态系统

    莱迪思半导体近日在上海举办的2024年莱迪思技术峰会上展示了其强大且不断增长的全球生态系统,该生态系统由客户、IP和参考平台合作伙伴以及致力于推动FPGA创新的开发人员组成。
    的头像 发表于 03-14 15:10 566次阅读

    Meta欲打造巨型AI覆盖视频推荐生态系统

    Meta正计划打造一款巨型AI系统,以全面覆盖其视频推荐生态系统,为旗下产品提供统一的视频推荐引擎。
    的头像 发表于 03-11 11:14 675次阅读

    HTX DAO生态系统加入19个重要建设者,共同为HTX DAO生态做出贡献

    HTX DAO生态系统加入19个重要建设者,共同为HTX DAO生态做出贡献 随着2月2日第十一批HTX DAO生态建设者的加入,目前,H
    的头像 发表于 02-21 16:46 332次阅读
    HTX DAO<b class='flag-5'>生态系统</b>已<b class='flag-5'>加入</b>19个重要建设者,共同为HTX DAO<b class='flag-5'>生态</b>做出贡献

    Renesas Ready生态系统合作伙伴解决方案介绍

    电子发烧友网站提供《Renesas Ready生态系统合作伙伴解决方案介绍.pdf》资料免费下载
    发表于 02-21 09:38 0次下载
    Renesas Ready<b class='flag-5'>生态系统</b>合作伙伴解决方案介绍

    Renesas Ready生态系统合作伙伴解决方案

    电子发烧友网站提供《Renesas Ready生态系统合作伙伴解决方案.pdf》资料免费下载
    发表于 01-14 11:04 0次下载
    Renesas Ready<b class='flag-5'>生态系统</b>合作伙伴解决方案

    芯原携手趣戴科技扩展手表GUI生态系统

    2024年1月9日,美国拉斯维加斯——芯原股份 (芯原,股票代码:688521.SH) 今日宣布专注于提供图形用户界面 (GUI) 软件服务的趣戴科技 (QDay Technology) 已加入其手表GUI生态系统,共同开发适用于各种应用的智能手表GUI解决方案。
    的头像 发表于 01-10 09:06 718次阅读