使用Bottlerocket和Amazon EC2部署AI模型-电子发烧友网

在大规模生产中部署人工智能支持的服务，如基于语音的助手、电子商务产品推荐和呼叫中心自动化，是一项挑战。在降低运营成本的同时提供最佳的最终用户体验需要考虑多个因素。其中包括底层基础设施的组成和性能、基于用户需求扩展资源的灵活性、集群管理开销和安全性。

为了应对大规模部署人工智能的挑战，企业 IT 团队已采用 Kubernetes （ K8s ）进行容器编排和 NVIDIA 加速计算，以满足生产人工智能部署的性能需求。此外，人们越来越关注操作系统（ OS ）在生产基础设施中的作用。生产环境的主机操作系统对安全性、资源利用率以及调配和扩展额外资源所需的时间有直接影响。随着用户需求的增加，这会影响用户体验、安全性和部署成本。

Botterocket ：基于 Linux 的容器优化操作系统

Bottlerocket 是 AWS 开发的基于 Linux 的最小开源操作系统，专门为运行容器而构建。它非常强调安全性，只包括运行容器的基本软件。

这减少了攻击面和漏洞的影响，从而减少了满足节点合规性要求的工作量。此外， Bottlerocket 的最小主机占用空间有助于提高节点资源利用率和引导时间。

对 Bottlerocket 的更新只需一步，必要时可以回滚。这将降低错误率，并改善容器应用程序的正常运行时间。它们还可以使用容器编排服务（如 Amazon 弹性库伯内特斯服务（ EKS ）和 Amazon 弹性容器服务（ ECS ））实现自动化。

在 NVIDIA GPU 支持的 Amazon EC2 实例中使用瓶装火箭

AWS 和 NVIDIA 已经合作，使 Bottlerocket 能够支持所有由 NVIDIA 供电的系统 Amazon EC2 实例包括 P4d 、 P3 、 G4dn 和 G5 。这种支持将 NVIDIA 驱动的 GPU 实例的计算能力与容器优化操作系统的优势结合起来，可以在 K8s 集群上大规模部署 AI 模型。

其结果是增强了安全性和更快的启动时间，尤其是在运行人工智能工作负载时，实时扩展其他基于 GPU 的实例。

对 NVIDIA GPU 的支持以 GPU 优化的 AMI 的形式提供。这包括 NVIDIA 驱动程序、 K8s GPU 设备插件，以及内置在基础映像中的 containerd 运行时。

AMI 提供了提供和注册自我管理节点的一切， NVIDIA 支持的 GPU 实例和 Amazon EKS 集群的虚拟操作系统。

此外，您还可以利用 AWS 市场上的 NVIDIA NGC 目录中的 NVIDIA 优化软件，这是一个用于预训练模型、脚本、掌舵图以及各种 AI 和 HPC 软件的中心。

对于 AWS 上的人工智能推理部署，您可以利用 NVIDIA Triton 推理服务器。使用开源推理服务软件在任何 CPU 或 CPU 基础设施上部署来自多个框架的经过培训的人工智能模型，包括 TensorFlow 、 TensorRT 、 PyTorch 、 ONNX 、 XGBoost 和 Python 。

关于作者

Uttara Kumar 是 NVIDIA 的高级产品营销经理，专注于 GPU - 云计算中的人工智能加速应用。她非常关心让每个人都能获得技术的民主化，让开发者能够利用 NVIDIA 数据中心平台的力量来加快创新步伐。在 NVIDIA 之前，她领导半导体和科学计算软件公司的软件产品营销。她拥有安娜堡密歇根大学的 Eel CTR 工程硕士学位。

审核编辑：郭婷

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

Linux

Linux

+关注

关注
87

文章
11298

浏览量
209388
操作系统

操作系统

+关注

关注
37

文章
6814

浏览量
123308
人工智能

人工智能

+关注

关注
1791

文章
47229

浏览量
238333

企业AI模型部署攻略

当下，越来越多的企业开始探索和实施AI模型，以提升业务效率和竞争力。然而，AI模型的部署并非易事，需要企业在多个层面进行细致的规划和准备。下

发表于 12-23 10:31 •82次阅读

AI模型部署边缘设备的奇妙之旅：目标检测模型

以及边缘计算能力的增强，越来越多的目标检测应用开始直接在靠近数据源的边缘设备上运行。这不仅减少了数据传输延迟，保护了用户隐私，同时也减轻了云端服务器的压力。然而，在边缘端部署高效且准确的目标检测模型

发表于 12-19 14:33

Amazon Bedrock推出多个新模型和全新强大的推理和数据处理功能

亚马逊云科技助力客户加速采用生成式AI 模型扩展规模空前，并新增推理优化工具及额外的数据功能，为客户提供了更大的灵活性和控制力，更快构建和部署生产级生成式AI 亚马逊云科技在2024

发表于 12-07 19:31 •589次阅读

<b class='flag-5'>Amazon</b> Bedrock推出多个新<b class='flag-5'>模型</b>和全新强大的推理和数据处理功能

亚马逊云科技宣布Amazon Trainium2实例正式可用

亚马逊云科技推出新一代AI训练芯片Amazon Trainium3 全新Amazon EC2 Trn2实例采用亚马逊云科技最新的Traini

发表于 12-06 09:15 •157次阅读

亚马逊云科技宣布<b class='flag-5'>Amazon</b> Trainium<b class='flag-5'>2</b>实例正式可用

亚马逊启动“登月”计划，目标部署10万颗自研AI芯片

：Trainium2，目标是在亚马逊自己的数据中心里部署10万颗Trainium2，以提高数据处理效率并降低AI芯片采购成本。近几年，亚马逊一直都在致力于自研芯片以降低数据中心成

发表于 12-02 00:26 •2188次阅读

AI模型部署和管理的关系

AI模型的部署与管理是AI项目成功的两大支柱，它们之间既相互独立又紧密相连，共同推动着AI技术从实验室走向实际应用。

发表于 11-21 10:02 •146次阅读

如何在STM32f4系列开发板上部署STM32Cube.AI，

已下载STM32Cube.AI扩展包，但是无法使用，感觉像是没有部署AI模型，我是想要通过摄像头拍照，上传图像后，经过开发板处理器进行AI

发表于 11-18 09:39

企业AI模型部署怎么做

AI模型部署作为这一转型过程中的关键环节，其成功实施对于企业的长远发展至关重要。在此，AI部落小编为您介绍企业AI

发表于 11-04 10:15 •151次阅读

亚马逊云科技宣布Amazon EC2 P5e实例正式可用由英伟达H200 GPU提供支持

1.7倍，GPU内存宽带提升1.5倍。Amazon EC2 P5e非常适用于复杂的大型语言模型(LLM)和多模态基础模型(FM)的训练、微调和推理，用于支持最苛刻和计算密集型的生成式

发表于 09-19 16:16 •470次阅读

亚马逊云科技宣布基于自研Amazon Graviton4的Amazon EC2 R8g实例正式可用

北京2024年7月15日 /美通社/ -- 亚马逊云科技宣布基于自研芯片Amazon Graviton4处理器的Amazon Elastic Compute Cloud (Amazon EC2

发表于 07-15 16:09 •379次阅读

如何在tx2部署模型

在本文中，我们将详细介绍如何在NVIDIA Jetson TX2上部署深度学习模型。NVIDIA Jetson TX2是一款专为边缘计算和人工智能应用而设计的高性能嵌入式平台。它具有强

发表于 07-09 10:16 •564次阅读

Mistral Large模型现已在Amazon Bedrock上正式可用

Mistral AI的Mistral Large模型现已在Amazon Bedrock上正式可用。今年三月，亚马逊云科技在Amazon Bedrock上引入了法国先锋

发表于 04-08 16:26 •556次阅读

使用CUBEAI部署tflite模型到STM32F0中，模型创建失败怎么解决？

看到CUBE_AI已经支持到STM32F0系列芯片，就想拿来入门嵌入式AI。生成的模型很小，是可以部署到F0上的，但是一直无法创建成功。查阅CUBE

发表于 03-15 08:10

Anthropic领先模型Claude 3系列将基于Amazon Bedrock提供服务

亚马逊云科技（Amazon Web Services）近日宣布，将与致力于AI安全和研究的公司Anthropic展开合作，将其领先的Claude 3系列模型基于Amazon Bedro

发表于 03-11 10:56 •520次阅读

亚马逊云科技与Anthropic加深合作 Amazon Bedrock再添Claude 3模型

北京2024年3月5日 /美通社/ -- 亚马逊云科技宣布，致力于AI安全和研究的公司Anthropic的领先模型Claude 3系列将基于Amazon Bedrock提供服务。Claude 3系列

发表于 03-06 15:45 •383次阅读

搜索历史

使用Bottlerocket和Amazon EC2部署AI模型

评论

企业AI模型部署攻略

AI模型部署边缘设备的奇妙之旅：目标检测模型

Amazon Bedrock推出多个新模型和全新强大的推理和数据处理功能

亚马逊云科技宣布Amazon Trainium2实例正式可用

亚马逊启动“登月”计划，目标部署10万颗自研AI芯片

AI模型部署和管理的关系

如何在STM32f4系列开发板上部署STM32Cube.AI，

企业AI模型部署怎么做

亚马逊云科技宣布Amazon EC2 P5e实例正式可用由英伟达H200 GPU提供支持

亚马逊云科技宣布基于自研Amazon Graviton4的Amazon EC2 R8g实例正式可用

如何在tx2部署模型

Mistral Large模型现已在Amazon Bedrock上正式可用

使用CUBEAI部署tflite模型到STM32F0中，模型创建失败怎么解决？

Anthropic领先模型Claude 3系列将基于Amazon Bedrock提供服务

亚马逊云科技与Anthropic加深合作 Amazon Bedrock再添Claude 3模型