

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

# Einen SageMaker Clarif-Verarbeitungsjob konfigurieren
<a name="clarify-processing-job-configure-parameters"></a>

Um Ihre Daten und Modelle mit SageMaker Clarify auf Verzerrungen und Erklärbarkeit zu analysieren, müssen Sie einen SageMaker Clarif-Verarbeitungsjob konfigurieren. Diese Anleitung zeigt, wie Sie den Namen des Eingabedatensatzes, den Namen der Analysekonfigurationsdatei und den Ausgabespeicherort für einen Verarbeitungsauftrag angeben. Um den Verarbeitungscontainer, die Auftragseingaben, -ausgaben, Ressourcen und andere Parameter zu konfigurieren, haben Sie zwei Möglichkeiten. Sie können entweder die SageMaker `CreateProcessingJob` KI-API oder die SageMaker AI Python SDK-API `SageMaker ClarifyProcessor` verwenden.

Informationen zu Parametern, die allen Verarbeitungsaufträgen gemeinsam sind, finden Sie in der [Amazon SageMaker API-Referenz](https://docs.aws.amazon.com/sagemaker/latest/APIReference/Welcome.html?icmpid=docs_sagemaker_lp).

## Konfigurieren Sie einen SageMaker Clarif-Verarbeitungsauftrag mithilfe der SageMaker API
<a name="clarify-processing-job-configure-parameters-API"></a>

Die folgenden Anweisungen zeigen, wie Sie jeden Teil der SageMaker Clarify-spezifischen Konfiguration mithilfe der `CreateProcessingJob` API bereitstellen.

1. Geben Sie den Uniform Research Identifier (URI) eines SageMaker Clarif-Container-Images in den `AppSpecification` Parameter ein, wie im folgenden Codebeispiel gezeigt.

   ```
   {
       "ImageUri": "the-clarify-container-image-uri"
   }
   ```
**Anmerkung**  
Die URI muss ein vorgefertigtes SageMaker Clarify-Container-Image identifizieren. `ContainerEntrypoint`und `ContainerArguments` werden nicht unterstützt. Weitere Informationen zu SageMaker Clarif-Container-Images finden Sie unter[Vorgefertigte SageMaker Clarify-Container](clarify-processing-job-configure-container.md).

1. Geben Sie im Parameter sowohl die Konfiguration für Ihre Analyse als auch die `ProcessingInputs` Parameter für Ihren Eingabedatensatz an.

   1. Geben Sie den Speicherort der Konfigurationsdatei für die JSON-Analyse an, die die Parameter für die Verzerrungsanalyse und die Erklärbarkeitsanalyse enthält. Der `InputName` Parameter des `ProcessingInput` Objekts muss **analysis\$1config** wie im folgenden Codebeispiel dargestellt sein.

      ```
      {
          "InputName": "analysis_config",
          "S3Input": {
              "S3Uri": "s3://your-bucket/analysis_config.json",
              "S3DataType": "S3Prefix",
              "S3InputMode": "File",
              "LocalPath": "/opt/ml/processing/input/config"
          }
      }
      ```

      Weitere Informationen zum Schema der Analyse-Konfigurationsdatei finden Sie unter [Analyse-Konfigurationsdateien](clarify-processing-job-configure-analysis.md).

   1. Geben Sie den Speicherort des Eingabedatensatzes an. Der `InputName` Parameter des `ProcessingInput` Objekts muss `dataset` sein. Dieser Parameter ist optional, wenn Sie den „dataset\$1uri“ in der Analysekonfigurationsdatei angegeben haben. Die folgenden Werte sind in der `S3Input` Konfiguration erforderlich.

      1. `S3Uri`kann entweder ein Amazon S3-Objekt oder ein S3-Präfix sein.

      1. `S3InputMode` muss vom Typ **File** sein.

      1. `S3CompressionType` muss vom Typ `None` sein (der Standardwert).

      1. `S3DataDistributionType` muss vom Typ `FullyReplicated` sein (der Standardwert).

      1. `S3DataType` kann `S3Prefix` oder `ManifestFile` sein. Zur Verwendung `ManifestFile` muss der `S3Uri` Parameter den Speicherort einer Manifestdatei angeben, die dem Schema aus dem SageMaker API-Referenzabschnitt [S3Uri](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_S3DataSource.html#sagemaker-Type-S3DataSource-S3Uri) folgt. Diese Manifestdatei muss die S3-Objekte auflisten, die die Eingabedaten für den Auftrag enthalten.

      Der folgende Code zeigt ein Beispiel für eine Eingabekonfiguration.

      ```
      {
          "InputName": "dataset",
          "S3Input": {
              "S3Uri": "s3://your-bucket/your-dataset.csv",
              "S3DataType": "S3Prefix",
              "S3InputMode": "File",
              "LocalPath": "/opt/ml/processing/input/data"
          }
      }
      ```

1. Geben Sie die Konfiguration für die Ausgabe des Verarbeitungsauftrag im `ProcessingOutputConfig` Parameter an. In der `Outputs` Konfiguration ist ein einzelnes `ProcessingOutput` Objekt erforderlich. Folgendes ist für die Ausgabekonfiguration erforderlich:

   1. `OutputName` muss **analysis\$1result** sein.

   1. `S3Uri`muss ein S3-Präfix für den Ausgabespeicherort sein.

   1. muss `S3UploadMode` auf **EndOfJob** festgelegt sein.

   Die folgende Ausgabe des Befehls zeigt ein Beispiel dieses Zustands:

   ```
   {
       "Outputs": [{ 
           "OutputName": "analysis_result",
           "S3Output": { 
               "S3Uri": "s3://your-bucket/result/",
               "S3UploadMode": "EndOfJob",
               "LocalPath": "/opt/ml/processing/output"
            }
        }]
   }
   ```

1. Geben Sie im `ProcessingResources` Parameter die Konfiguration `ClusterConfig` für die Ressourcen an, die Sie in Ihrem Verarbeitungsjob verwenden. Die folgenden Parameter sind innerhalb des `ClusterConfig` Objekts erforderlich.

   1. `InstanceCount` gibt die Anzahl der Rechen-Instances im Cluster an, der den Verarbeitungsauftrag ausführt. Geben Sie einen Wert größer als `1` an, um die verteilte Verarbeitung zu aktivieren.

   1. `InstanceType` bezieht sich auf die Ressourcen, die Ihren Verarbeitungsauftrag ausführen. Da die SageMaker KI-SHAP-Analyse rechenintensiv ist, sollte die Verwendung eines Instanztyps, der für die Datenverarbeitung optimiert ist, die Laufzeit für die Analyse verbessern. Der Verarbeitungsauftrag SageMaker Clarify verwendet nicht. GPUs

   In der folgenden Abbildung sehen Sie ein Beispiel für die Registerkarte Configuration (Konfiguration).

   ```
   {
       "ClusterConfig": {
            "InstanceCount": 1,
            "InstanceType": "ml.m5.xlarge",
            "VolumeSizeInGB": 20
        }
   }
   ```

1. Geben Sie die Konfiguration des Netzwerks, das Sie für Ihren Verarbeitungsauftrag verwenden, innerhalb des `NetworkConfig` Objekts an. Die folgenden Werte sind für die Konfiguration erforderlich.

   1. `EnableNetworkIsolation`muss auf `False` (Standard) gesetzt sein, damit SageMaker Clarify bei Bedarf einen Endpunkt für Vorhersagen aufrufen kann.

   1. Wenn sich das Modell oder der Endpunkt, den Sie für den SageMaker Clarif-Job bereitgestellt haben, in einer Amazon Virtual Private Cloud (Amazon VPC) befindet, muss sich der SageMaker Clarif-Job auch in derselben VPC befinden. Geben Sie die VPC mit [VpcConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_VpcConfig.html)an. Darüber hinaus muss die VPC über Endpunkte für einen Amazon S3 S3-Bucket, einen SageMaker KI-Service und einen SageMaker AI Runtime-Service verfügen.

      Wenn die verteilte Verarbeitung aktiviert ist, müssen Sie auch die Kommunikation zwischen verschiedenen Instances im selben Verarbeitungsjob zulassen. Konfigurieren Sie dazu eine Regel für Ihre Sicherheitsgruppe, mit der eingehende Verbindungen zwischen Mitgliedern derselben Sicherheitsgruppe zugelassen werden. Weitere Informationen finden Sie unter [Gewähren Sie Amazon SageMaker Clarify Jobs Zugriff auf Ressourcen in Ihrer Amazon VPC](clarify-vpc.md). 

   Der folgende Code gibt ein Beispiel für eine Netzwerkkonfiguration.

   ```
   {
       "EnableNetworkIsolation": False,
       "VpcConfig": {
           ...
       }
   }
   ```

1. Legen Sie mithilfe des `StoppingCondition` Parameters die maximale Zeit fest, für die der Auftrag ausgeführt werden soll. Die längste Zeit, die ein SageMaker Clarif-Job ausgeführt werden kann, dauert `7` Tage oder `604800` Sekunden. Wenn der Auftrag nicht innerhalb dieser Frist abgeschlossen werden kann, wird er gestoppt und es werden keine Analyseergebnisse bereitgestellt. Die folgende Konfiguration begrenzt beispielsweise die maximale Zeit, für die der Auftrag ausgeführt werden kann, auf 3600 Sekunden.

   ```
   {
       "MaxRuntimeInSeconds": 3600
   }
   ```

1. Geben Sie eine IAM-Rolle für den `RoleArn` Parameter an. Die Rolle muss ein Vertrauensverhältnis mit Amazon SageMaker AI haben. Sie kann verwendet werden, um die in der folgenden Tabelle aufgeführten SageMaker API-Operationen durchzuführen. Wir empfehlen die Verwendung der verwalteten Amazon SageMaker AIFull Access-Richtlinie, die vollen Zugriff auf SageMaker KI gewährt. Weitere Informationen zu dieser Richtlinie finden Sie unter [AWS verwaltete Richtlinie: AmazonSageMakerFullAccess](security-iam-awsmanpol.md#security-iam-awsmanpol-AmazonSageMakerFullAccess). Wenn Sie Bedenken haben, Vollzugriff zu gewähren, hängen die erforderlichen Mindestberechtigungen davon ab, ob Sie einen Modell- oder einen Endpunktnamen angeben. Die Verwendung eines Endpunktnamens ermöglicht es, SageMaker KI weniger Berechtigungen zu gewähren.

   Die folgende Tabelle enthält API-Operationen, die vom SageMaker Clarif-Verarbeitungsjob verwendet werden. Auf **X** unter **Modellname** und **Endpunktname** wird der API-Vorgang angegeben, der für jede Eingabe erforderlich ist.    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/de_de/sagemaker/latest/dg/clarify-processing-job-configure-parameters.html)

   Weitere Informationen zu erforderlichen Berechtigungen finden Sie unter [Amazon SageMaker AI API-Berechtigungen: Referenz zu Aktionen, Berechtigungen und Ressourcen](api-permissions-reference.md).

   Weitere Informationen zur Übertragung von Rollen an SageMaker KI finden Sie unter[Rollen weitergeben](sagemaker-roles.md#sagemaker-roles-pass-role).

   Nachdem Sie die einzelnen Teile der Konfiguration des Verarbeitungsauftrags erstellt haben, kombinieren Sie sie, um den Auftrag zu konfigurieren.

## Konfigurieren Sie einen SageMaker Clarif-Verarbeitungsjob mit dem AWS SDK für Python
<a name="clarify-processing-job-configure-parameters-SDK"></a>

Das folgende Codebeispiel zeigt, wie ein SageMaker Clarif-Verarbeitungsjob mit dem [AWS SDK für Python](https://aws.amazon.com/sdk-for-python/) gestartet wird.

```
sagemaker_client.create_processing_job(
    ProcessingJobName="your-clarify-job-name",
    AppSpecification={
        "ImageUri": "the-clarify-container-image-uri",
    },
    ProcessingInputs=[{
            "InputName": "analysis_config",
            "S3Input": {
                "S3Uri": "s3://your-bucket/analysis_config.json",
                "S3DataType": "S3Prefix",
                "S3InputMode": "File",
                "LocalPath": "/opt/ml/processing/input/config",
            },
        }, {
            "InputName": "dataset",
            "S3Input": {
                "S3Uri": "s3://your-bucket/your-dataset.csv",
                "S3DataType": "S3Prefix",
                "S3InputMode": "File",
                "LocalPath": "/opt/ml/processing/input/data",
            },
        },
    ],
    ProcessingOutputConfig={
        "Outputs": [{ 
            "OutputName": "analysis_result",
            "S3Output": { 
               "S3Uri": "s3://your-bucket/result/",
               "S3UploadMode": "EndOfJob",
               "LocalPath": "/opt/ml/processing/output",
            },   
        }],
    },
    ProcessingResources={
        "ClusterConfig": {
            "InstanceCount": 1,
            "InstanceType": "ml.m5.xlarge",
            "VolumeSizeInGB": 20,
        },
    },
    NetworkConfig={
        "EnableNetworkIsolation": False,
        "VpcConfig": {
            ...
        },
    },
    StoppingCondition={
        "MaxRuntimeInSeconds": 3600,
    },
    RoleArn="arn:aws:iam::<your-account-id>:role/service-role/AmazonSageMaker-ExecutionRole",
)
```

Ein Beispiel-Notizbuch mit Anweisungen zum Ausführen eines SageMaker Clarif-Verarbeitungsjobs mithilfe des AWS SDK für Python finden Sie unter [Fairness and Explainability with SageMaker Clarify using AWS SDK for](http://github.com/aws/amazon-sagemaker-examples/blob/main/sagemaker-clarify/fairness_and_explainability/fairness_and_explainability_boto3.ipynb) Python. Jeder im Notizbuch verwendete S3-Bucket muss sich in derselben AWS Region befinden wie die Notebook-Instanz, die darauf zugreift.

## Konfigurieren Sie einen SageMaker Clarif-Verarbeitungsjob mit dem SageMaker Python-SDK
<a name="clarify-processing-job-configure-parameters-SM-SDK"></a>

Sie können einen SageMaker Clarif-Verarbeitungsjob auch mithilfe der [SageMaker ClarifyProcessor](https://sagemaker.readthedocs.io/en/stable/api/training/processing.html#sagemaker.clarify.SageMakerClarifyProcessor)in der SageMaker Python SDK API konfigurieren. Weitere Informationen finden Sie unter [Führen Sie SageMaker Clarify Processing Jobs aus, um Verzerrungen zu analysieren und zu erklären](clarify-processing-job-run.md).

**Topics**
+ [Vorgefertigte SageMaker Clarify-Container](clarify-processing-job-configure-container.md)
+ [Analyse-Konfigurationsdateien](clarify-processing-job-configure-analysis.md)
+ [Leitfaden zur Kompatibilität von Datenformaten](clarify-processing-job-data-format.md)