AWS Marketplace 中的机器学习产品的服务限制和限额 - AWS Marketplace

AWS Marketplace 中的机器学习产品的服务限制和限额

本部分介绍 AWS Marketplace 中的机器学习 (ML) 产品的限制和限额。

网络隔离

出于安全目的,当买家订阅您的容器化产品时,Docker 容器在隔离(无网络访问)的环境中运行。在您创建容器时,请勿通过互联网进行传出调用,否则将失败。对 AWS 服务的调用也会失败。

映像大小

您的 Docker 映像大小受 Amazon Elastic Container Registry (Amazon ECR) 服务限额的约束。Docker 映像大小会影响训练作业、批量转换作业和端点创建期间的启动时间。为了获得更好的性能,请保持最佳 Docker 映像大小。

存储大小

在创建端点时,Amazon SageMaker AI 将 Amazon Elastic Block Store(Amazon EBS)存储卷附加到托管该端点的每个 ML 计算实例。(端点也称为实时推理Amazon SageMaker AI 托管服务。) 存储卷的大小取决于实例类型。有关更多信息,请参阅《Amazon SageMaker AI 开发人员指南》中的主机实例存储卷。 

有关批量转换,请参阅《Amazon SageMaker AI 开发人员指南》中的批量转换中的存储

实例大小

SageMaker AI 提供各种不同的实例类型,这些实例类型经过优化,适合不同的 ML 使用案例。实例类型包括 CPU、GPU、内存和网络容量的不同组合。实例类型便于您灵活选择适合构建、训练和部署机器学习模型的资源组合。有关更多信息,请参阅 Amazon SageMaker AI ML 实例类型

推理的有效负载大小

对于端点,将每次调用的输入数据的最大大小限制为 25 MB。此值无法调整。

对于批量转换,每次调用输入数据的最大大小为 100 MB。此值无法调整。

推理的处理时间

对于一个端点,单次调用的最长处理时间为:常规响应 60 秒,流式响应 8 分钟。此值无法调整。

对于批量转换,每次调用的最大处理时间为 60 分钟。此值无法调整。

服务配额

有关与训练和推理相关的限额的更多信息,请参阅 Amazon SageMaker AI 服务配额

异步推理

AWS Marketplace 中发布的模型包和算法无法部署到为 Amazon SageMaker AI 异步推理配置的端点。为异步推理配置的端点要求模型具有网络连接。所有 AWS Marketplace 模型均在网络隔离下运行。有关更多信息,请参阅无网络访问

无服务器推理

AWS Marketplace 中发布的模型包和算法无法部署到为 Amazon SageMaker AI 无服务器推理功能配置的端点。为无服务器推理配置的端点要求模型具有网络连接。所有 AWS Marketplace 模型均在网络隔离下运行。有关更多信息,请参阅无网络访问

托管的竞价型训练

对于 AWS Marketplace 的所有算法,MaxWaitTimeInSeconds 的值设置为 3600 秒(60 分钟),即使实施了托管的竞价型训练的检查点。此值无法调整。

Docker 映像和 AWS 账户

要发布,映像必须存储在卖家 AWS 账户拥有的 Amazon ECR 存储库中。无法发布存储在其他 AWS 账户拥有的存储库中的映像。

从内置算法或 AWS Marketplace 发布模型包

无法发布使用 Amazon SageMaker AI 内置算法或 AWS Marketplace 订阅算法的训练作业创建的模型包。

您仍然可以使用训练作业中的模型构件,但是发布模型包需要您自己的推理映像。

支持发布的 AWS 区域

AWS Marketplace 支持在符合以下条件的 AWS 区域中发布模型包和算法资源:

发布模型包或算法产品所需的所有资产都必须存储在您选择发布的同一区域。这包括以下这些:

  • 在 Amazon SageMaker AI 中创建的模型包和算法资源

  • 上传到 Amazon ECR 存储库的推理和训练映像

  • 存储在 Amazon Simple Storage Service 中并在模型包资源的模型部署期间动态加载的模型构件(如有)

  • 存储在 Amazon S3 中的用于推理和训练验证的测试数据

您可以在 SageMaker AI 支持的任何区域开发和训练产品。但是,在发布之前,您必须将所有资源复制到 AWS Marketplace 支持发布的区域,并在该区域中重新创建资源。