大型模型推理（LMI）容器文档

该文档是为需要在 Amazon SageMaker AI 上部署和优化大型语言模型（LLM）的开发人员、数据科学家和机器学习工程师编写的。它可以帮助您使用由 AWS 提供的 LMI 容器（用于 LLM 推理的专用 Docker 容器）。它提供了概述、部署指南、所支持推理库的用户指南以及高级教程。

通过使用 LMI 容器文档，您可以

Javascript 在您的浏览器中被禁用或不可用。

要使用 Amazon Web Services 文档，必须启用 Javascript。请参阅浏览器的帮助页面以了解相关说明。

模型并行和大型模型推理

LMI 的 SageMaker AI 端点参数