翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
Boto3 を使ってコンパイル済みモデルをデプロイする
モデルが または Amazon SageMaker AI コンソールを使用してコンパイルされている場合は AWS SDK for Python (Boto3) AWS CLI、前提条件セクションを満たす必要があります。Amazon Web Services SDK for Python (Boto3)
トピック
モデルをデプロイする
前提条件を満たしたら、create_model API、create_enpoint_config API、create_endpoint API を使います。
次の例は、これらの API を使って Neo コンパイル済みモデルをデプロイする方法を示しています。
import boto3 client = boto3.client('sagemaker') # create sagemaker model create_model_api_response = client.create_model( ModelName='my-sagemaker-model', PrimaryContainer={ 'Image':<insert the ECR Image URI>, 'ModelDataUrl':'s3://path/to/model/artifact/model.tar.gz', 'Environment': {} }, ExecutionRoleArn='ARN for AmazonSageMaker-ExecutionRole') print ("create_model API response", create_model_api_response) # create sagemaker endpoint config create_endpoint_config_api_response = client.create_endpoint_config( EndpointConfigName='sagemaker-neomxnet-endpoint-configuration', ProductionVariants=[ { 'VariantName':<provide your variant name>, 'ModelName':'my-sagemaker-model', 'InitialInstanceCount': 1, 'InstanceType':<provide your instance type here>}, ] ) print ("create_endpoint_config API response", create_endpoint_config_api_response) # create sagemaker endpoint create_endpoint_api_response = client.create_endpoint( EndpointName='provide your endpoint name', EndpointConfigName=<insert your endpoint config name>, ) print ("create_endpoint API response", create_endpoint_api_response)
注記
AmazonSageMaker-ExecutionRole IAM ロールに AmazonSageMakerFullAccess ポリシーと AmazonS3ReadOnlyAccess ポリシーをアタッチする必要があります。
create_model、create_endpoint_config、create_endpoint API の完全な構文については、それぞれ「create_modelcreate_endpoint_configcreate_endpoint
SageMaker AI を使用してモデルをトレーニングしなかった場合は、次の環境変数を指定します。
SageMaker AI を使用してモデルをトレーニングした場合は、トレーニングスクリプトを含む完全な Amazon S3 バケット URI SAGEMAKER_SUBMIT_DIRECTORYとして環境変数を指定します。