

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 建立端點組態
<a name="serverless-endpoints-create-config"></a>

建立模型後，請建立端點組態。然後，您可以使用端點組態中的規格來部署模型。在組態中，您可以指定要即時或無伺服器端點。若要建立無伺服器端點組態，您可以透過 [Amazon SageMaker AI 主控台](https://console.aws.amazon.com/sagemaker/home)、[CreateEndpointConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateEndpointConfig.html) API 或 AWS CLI。下列各章節概述 API 和主控台方法。

## 建立端點組態 (使用 API)
<a name="serverless-endpoints-create-config-api"></a>

下列範例會使用[適用於 Python 的AWS SDK (Boto3)](https://boto3.amazonaws.com/v1/documentation/api/latest/index.html) 來呼叫 [CreateEndpointConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateEndpointConfig.html) API。指定下列值：
+ 在 `EndpointConfigName`，選擇端點組態的名稱。名稱在您帳戶的區域內應為唯一。
+ （選用） 針對 AWS KMS 您要使用的金鑰`KmsKeyId`，使用金鑰 ID、金鑰 ARN、別名名稱或別名 ARN。SageMaker AI 使用此金鑰來加密您的 Amazon ECR 映像檔。
+ 在 `ModelName` 中，請使用您要部署的模型名稱。應該與您在[建立模型](serverless-endpoints-create-model.md)步驟中使用的模型相同。
+ 在 `ServerlessConfig` 中：
  + 將 `MemorySizeInMB` 設定為 `2048`。在此範例中，我們將記憶體大小設定為 2048 MB，但您可以為記憶體大小選擇以下任意值：1024 MB、2048 MB、3072 MB、4096 MB、5120 MB 或 6144 MB。
  + 將 `MaxConcurrency` 設定為 `20`。在此範例中，我們將並行上限設定為 20。您可以將無伺服器端點的並行調用數量上限設定為 200，並選擇的最小值為 1。
  + (選用) 若要使用佈建並行，請設定 `ProvisionedConcurrency` 為 10。在此範例中，我們將佈建並行設定為 10。無伺服器端點的 `ProvisionedConcurrency` 數量必須小於或等於 `MaxConcurrency` 數字。如果您想要使用隨需無伺服器推論端點，可以將其保留空白。您可以動態擴展佈建並行。如需詳細資訊，請參閱[針對無伺服器端點自動擴展佈建並行](serverless-endpoints-autoscale.md)。

```
response = client.create_endpoint_config(
   EndpointConfigName="{{<your-endpoint-configuration>}}",
   KmsKeyId="arn:aws:kms:us-east-1:123456789012:key/143ef68f-76fd-45e3-abba-ed28fc8d3d5e",
   ProductionVariants=[
        {
            "ModelName": "{{<your-model-name>}}",
            "VariantName": "AllTraffic",
            "ServerlessConfig": {
                "MemorySizeInMB": 2048,
                "MaxConcurrency": 20,
                "ProvisionedConcurrency": 10,
            }
        } 
    ]
)
```

## 建立端點組態 (使用主控台)
<a name="serverless-endpoints-create-config-console"></a>

1. 登入 [Amazon SageMaker AI 主控台](https://console.aws.amazon.com/sagemaker/home)。

1. 在導覽索引標記中，選擇**推論**。

1. 接著，選擇**端點組態**。

1. 選擇 **建立端點組態**。

1. 在**端點組態名稱**中，輸入您在區域帳戶中的唯一名稱。

1. 選取**無伺服器**做為**端點的類型**。  
![在主控台中，端點類型選項的螢幕擷取畫面。](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/serverless-endpoints-endpoint-config.png)

1. 在**生產變體**中，選擇**新增模型**。

1. 在**新增模型**下，從模型清單中選取您要使用的模型，然後選擇**儲存**。

1. 新增模型後，在**動作** 下選擇**編輯**。

1. 在 **記憶體大小** 中，選擇您想要的記憶體大小 (GB)。  
![在主控台中，記憶體大小選項的螢幕擷取畫面。](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/serverless-endpoints-endpoint-config-2.png)

1. 在**最大並行數**中，輸入您所需的端點並行調用上限。您可以輸入的最大值為 200，下限值為 1。

1. (選用) 若要使用佈建並行，請在**佈建並行設定**欄位中輸入所需的並行調用數。佈建並行調用的數量，必須小於或等於並行調用上限數。

1. 選擇**儲存**。

1. (選用) 在**標籤** 中，如果您想要為端點組態建立中繼資料，請輸入鍵值對。

1. 選擇**建立端點組態**。