本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
使用 Boto3 部署編譯的模型
如果模型是使用 或 Amazon SageMaker AI 主控台編譯的 適用於 Python (Boto3) 的 AWS SDK AWS CLI,您必須滿足先決條件區段。請遵循以下步驟,使用適用於 Python 的 Amazon Web Services SDK (Boto3)
主題
部署模型
在您符合先決條件之後,請使用 create_model、create_enpoint_config 和 create_endpoint API。
下列範例示範如何使用這些 API 部署使用 Neo 編譯的模型:
import boto3 client = boto3.client('sagemaker') # create sagemaker model create_model_api_response = client.create_model( ModelName='my-sagemaker-model', PrimaryContainer={ 'Image':<insert the ECR Image URI>, 'ModelDataUrl':'s3://path/to/model/artifact/model.tar.gz', 'Environment': {} }, ExecutionRoleArn='ARN for AmazonSageMaker-ExecutionRole') print ("create_model API response", create_model_api_response) # create sagemaker endpoint config create_endpoint_config_api_response = client.create_endpoint_config( EndpointConfigName='sagemaker-neomxnet-endpoint-configuration', ProductionVariants=[ { 'VariantName':<provide your variant name>, 'ModelName':'my-sagemaker-model', 'InitialInstanceCount': 1, 'InstanceType':<provide your instance type here>}, ] ) print ("create_endpoint_config API response", create_endpoint_config_api_response) # create sagemaker endpoint create_endpoint_api_response = client.create_endpoint( EndpointName='provide your endpoint name', EndpointConfigName=<insert your endpoint config name>, ) print ("create_endpoint API response", create_endpoint_api_response)
注意
AmazonSageMakerFullAccess 和 AmazonS3ReadOnlyAccess 政策必須連接到 AmazonSageMaker-ExecutionRole IAM 角色。
如需 create_model、create_endpoint_config 和 create_endpoint API 的完整語法,請分別參閱 create_modelcreate_endpoint_configcreate_endpoint
如果您未使用 SageMaker AI 訓練模型,請指定下列環境變數:
 如果您使用 SageMaker AI 訓練模型,請將環境變數指定SAGEMAKER_SUBMIT_DIRECTORY為包含訓練指令碼的完整 Amazon S3 儲存貯體 URI。