

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

# Configurazione di un processo di elaborazione SageMaker Clarify
<a name="clarify-processing-job-configure-parameters"></a>

Per analizzare i dati e i modelli per verificare eventuali distorsioni e spiegabilità utilizzando SageMaker Clarify, è necessario configurare un processo di elaborazione Clarify. SageMaker Questa guida mostra come specificare il nome del set di dati di input, il nome del file di configurazione dell'analisi e la posizione di output per un processo di elaborazione. Per configurare il container di elaborazione, gli input, gli output, le risorse e altri parametri del processo, sono disponibili due opzioni. Puoi utilizzare l'`CreateProcessingJob`API SageMaker AI o utilizzare l'API SageMaker AI Python SDK, `SageMaker ClarifyProcessor`

Per informazioni sui parametri comuni a tutti i processi di elaborazione, consulta [Amazon SageMaker API Reference](https://docs.aws.amazon.com/sagemaker/latest/APIReference/Welcome.html?icmpid=docs_sagemaker_lp).

## Configura un processo di elaborazione SageMaker Clarify utilizzando l'API SageMaker
<a name="clarify-processing-job-configure-parameters-API"></a>

Le seguenti istruzioni mostrano come fornire ciascuna parte della configurazione specifica di SageMaker Clarify utilizzando l'`CreateProcessingJob`API.

1. Inserite l'Uniform Research Identifier (URI) di un'immagine del contenitore SageMaker Clarify all'interno del `AppSpecification` parametro, come mostrato nel seguente esempio di codice.

   ```
   {
       "ImageUri": "the-clarify-container-image-uri"
   }
   ```
**Nota**  
L'URI deve identificare un'immagine del contenitore SageMaker Clarify predefinita. `ContainerEntrypoint`e non `ContainerArguments` sono supportati. Per ulteriori informazioni sulle immagini dei contenitori SageMaker Clarify, [Contenitori Clarify predefiniti SageMaker](clarify-processing-job-configure-container.md) consultate.

1. Specifica sia la configurazione per l'analisi che i parametri per il set di dati di input all'interno del parametro `ProcessingInputs`.

   1. Specifica la posizione del file di configurazione dell'analisi JSON, che include i parametri per l'analisi dei bias e l'analisi della spiegabilità. Il parametro `InputName` dell'oggetto `ProcessingInput` deve essere **analysis\$1config** come mostrato nel seguente esempio di codice.

      ```
      {
          "InputName": "analysis_config",
          "S3Input": {
              "S3Uri": "s3://your-bucket/analysis_config.json",
              "S3DataType": "S3Prefix",
              "S3InputMode": "File",
              "LocalPath": "/opt/ml/processing/input/config"
          }
      }
      ```

      Per ulteriori informazioni sullo schema del file di configurazione dell’analisi, consulta [File di configurazione dell’analisi](clarify-processing-job-configure-analysis.md).

   1. Specifica la posizione del set di dati di input. Il parametro `InputName` dell'oggetto `ProcessingInput` deve essere `dataset`. Questo parametro è facoltativo se hai fornito "dataset\$1uri" nel file di configurazione dell'analisi. Nella configurazione `S3Input` sono richiesti i seguenti valori.

      1. `S3Uri` può essere un oggetto Amazon S3 o un prefisso S3.

      1. `S3InputMode` deve essere di tipo **File**.

      1. `S3CompressionType` deve essere di tipo `None` (il valore predefinito).

      1. `S3DataDistributionType` deve essere di tipo `FullyReplicated` (il valore predefinito).

      1. `S3DataType` può essere `S3Prefix` o `ManifestFile`. Per utilizzarlo`ManifestFile`, il `S3Uri` parametro deve specificare la posizione di un file manifest che segue lo schema riportato nella sezione [S3Uri](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_S3DataSource.html#sagemaker-Type-S3DataSource-S3Uri) di riferimento all' SageMaker API. Questo file manifest deve elencare gli oggetti S3 che contengono i dati di input per il processo.

      Il codice seguente mostra un esempio di configurazione di input.

      ```
      {
          "InputName": "dataset",
          "S3Input": {
              "S3Uri": "s3://your-bucket/your-dataset.csv",
              "S3DataType": "S3Prefix",
              "S3InputMode": "File",
              "LocalPath": "/opt/ml/processing/input/data"
          }
      }
      ```

1. Specifica la configurazione per l'output del processo di elaborazione all'interno del parametro `ProcessingOutputConfig`. Nella configurazione `Outputs` è richiesto un singolo oggetto `ProcessingOutput`. Per la configurazione di output sono richiesti i seguenti elementi:

   1. `OutputName` deve essere **analysis\$1result**.

   1. `S3Uri` deve essere un prefisso S3 per la posizione di output.

   1. `S3UploadMode` deve essere impostato su **EndOfJob**.

   Il seguente codice mostra un esempio di configurazione di output.

   ```
   {
       "Outputs": [{ 
           "OutputName": "analysis_result",
           "S3Output": { 
               "S3Uri": "s3://your-bucket/result/",
               "S3UploadMode": "EndOfJob",
               "LocalPath": "/opt/ml/processing/output"
            }
        }]
   }
   ```

1. Specifica la configurazione `ClusterConfig` per le risorse utilizzate nel processo di elaborazione all'interno del parametro `ProcessingResources`. I seguenti parametri sono obbligatori all'interno dell'oggetto `ClusterConfig`.

   1. `InstanceCount` specifica il numero di istanze di calcolo nel cluster che esegue il processo di elaborazione. Per attivare l'elaborazione distribuita, specifica un valore maggiore di `1`.

   1. `InstanceType` si riferisce alle risorse che eseguono il processo di elaborazione. Poiché l'analisi SageMaker AI SHAP richiede molte risorse di calcolo, l'utilizzo di un tipo di istanza ottimizzato per il calcolo dovrebbe migliorare il tempo di esecuzione dell'analisi. Il processo di elaborazione SageMaker Clarify non utilizza. GPUs

   Il seguente codice mostra un esempio di configurazione delle risorse.

   ```
   {
       "ClusterConfig": {
            "InstanceCount": 1,
            "InstanceType": "ml.m5.xlarge",
            "VolumeSizeInGB": 20
        }
   }
   ```

1. Specifica la configurazione della rete utilizzata nel processo di elaborazione all'interno dell'oggetto `NetworkConfig`. Nella configurazione sono richiesti i seguenti valori.

   1. `EnableNetworkIsolation`deve essere impostato su `False` (impostazione predefinita) in modo che SageMaker Clarify possa richiamare un endpoint, se necessario, per le previsioni.

   1. Se il modello o l'endpoint che hai fornito al job SageMaker Clarify si trova all'interno di un Amazon Virtual Private Cloud (Amazon VPC), anche il job SageMaker Clarify deve trovarsi nello stesso VPC. Specificare il VPC utilizzando. [VpcConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_VpcConfig.html) Inoltre, il VPC deve disporre di endpoint per un bucket Amazon S3, un servizio AI e un servizio SageMaker AI Runtime. SageMaker 

      Se è attivata l'elaborazione distribuita, è necessario consentire anche la comunicazione tra diverse istanze nello stesso processo di elaborazione. Configura una regola per il gruppo di sicurezza che consente connessioni in entrata tra i membri dello stesso gruppo di sicurezza. Per ulteriori informazioni, consulta [Offri ad Amazon SageMaker Clarify Jobs l'accesso alle risorse nel tuo Amazon VPC](clarify-vpc.md). 

   Il codice seguente mostra un esempio di configurazione della rete.

   ```
   {
       "EnableNetworkIsolation": False,
       "VpcConfig": {
           ...
       }
   }
   ```

1. Imposta il tempo massimo di esecuzione del processo utilizzando il parametro `StoppingCondition`. Il periodo massimo di esecuzione di un job di SageMaker Clarify è di giorni o secondi. `7` `604800` Se il lavoro non può essere completato entro questo limite di tempo, verrà interrotto e non verranno forniti risultati di analisi. Ad esempio, la configurazione seguente limita il tempo massimo di esecuzione del processo a 3600 secondi.

   ```
   {
       "MaxRuntimeInSeconds": 3600
   }
   ```

1. Specifica un ruolo IAM per il parametro `RoleArn`. Il ruolo deve avere un rapporto di fiducia con Amazon SageMaker AI. Può essere utilizzato per eseguire le operazioni SageMaker API elencate nella tabella seguente. Ti consigliamo di utilizzare la policy gestita di Amazon SageMaker AIFull Access, che garantisce l'accesso completo all' SageMaker intelligenza artificiale. Per ulteriori informazioni su questa policy, consulta [AWS politica gestita: AmazonSageMakerFullAccess](security-iam-awsmanpol.md#security-iam-awsmanpol-AmazonSageMakerFullAccess). Se hai dubbi sulla concessione dell'accesso completo, le autorizzazioni minime richieste dipendono dall'eventuale fornitura di un modello o un nome di endpoint. L'utilizzo di un nome di endpoint consente di concedere meno autorizzazioni all'IA. SageMaker 

   La tabella seguente contiene le operazioni API utilizzate dal processo di elaborazione di SageMaker Clarify. **X** in **Nome modello** e **Nome endpoint** indica l'operazione API richiesta per ogni input.    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/it_it/sagemaker/latest/dg/clarify-processing-job-configure-parameters.html)

   Per ulteriori informazioni sulle autorizzazioni richieste, consultare [Autorizzazioni API Amazon SageMaker AI: riferimento ad azioni, autorizzazioni e risorse](api-permissions-reference.md).

   Per ulteriori informazioni sul passaggio di ruoli all' SageMaker IA, consulta. [Passaggio dei ruoli](sagemaker-roles.md#sagemaker-roles-pass-role)

   Dopo aver creato le singole parti della configurazione del processo di elaborazione, combinale per configurare il processo.

## Configurare un processo di elaborazione SageMaker Clarify utilizzando l' AWS SDK per Python
<a name="clarify-processing-job-configure-parameters-SDK"></a>

Il seguente esempio di codice mostra come avviare un processo di elaborazione SageMaker Clarify utilizzando l'[AWS SDK per Python](https://aws.amazon.com/sdk-for-python/).

```
sagemaker_client.create_processing_job(
    ProcessingJobName="your-clarify-job-name",
    AppSpecification={
        "ImageUri": "the-clarify-container-image-uri",
    },
    ProcessingInputs=[{
            "InputName": "analysis_config",
            "S3Input": {
                "S3Uri": "s3://your-bucket/analysis_config.json",
                "S3DataType": "S3Prefix",
                "S3InputMode": "File",
                "LocalPath": "/opt/ml/processing/input/config",
            },
        }, {
            "InputName": "dataset",
            "S3Input": {
                "S3Uri": "s3://your-bucket/your-dataset.csv",
                "S3DataType": "S3Prefix",
                "S3InputMode": "File",
                "LocalPath": "/opt/ml/processing/input/data",
            },
        },
    ],
    ProcessingOutputConfig={
        "Outputs": [{ 
            "OutputName": "analysis_result",
            "S3Output": { 
               "S3Uri": "s3://your-bucket/result/",
               "S3UploadMode": "EndOfJob",
               "LocalPath": "/opt/ml/processing/output",
            },   
        }],
    },
    ProcessingResources={
        "ClusterConfig": {
            "InstanceCount": 1,
            "InstanceType": "ml.m5.xlarge",
            "VolumeSizeInGB": 20,
        },
    },
    NetworkConfig={
        "EnableNetworkIsolation": False,
        "VpcConfig": {
            ...
        },
    },
    StoppingCondition={
        "MaxRuntimeInSeconds": 3600,
    },
    RoleArn="arn:aws:iam::<your-account-id>:role/service-role/AmazonSageMaker-ExecutionRole",
)
```

Per un notebook di esempio con istruzioni per eseguire un processo di elaborazione SageMaker Clarify utilizzando AWS SDK per Python, consulta [Fairness and Explainability with](http://github.com/aws/amazon-sagemaker-examples/blob/main/sagemaker-clarify/fairness_and_explainability/fairness_and_explainability_boto3.ipynb) Clarify using SDK for Python. SageMaker AWS Qualsiasi bucket S3 utilizzato nel notebook deve trovarsi nella stessa regione dell'istanza del notebook che vi accede. AWS 

## Configurare un processo di elaborazione SageMaker Clarify utilizzando l'SDK SageMaker Python
<a name="clarify-processing-job-configure-parameters-SM-SDK"></a>

È inoltre possibile configurare un processo di elaborazione SageMaker Clarify utilizzando l'[SageMaker ClarifyProcessor](https://sagemaker.readthedocs.io/en/stable/api/training/processing.html#sagemaker.clarify.SageMakerClarifyProcessor)API SageMaker Python SDK. Per ulteriori informazioni, consulta [Esegui SageMaker Clarify Processing Jobs per l'analisi e la spiegabilità dei pregiudizi](clarify-processing-job-run.md).

**Topics**
+ [Contenitori Clarify predefiniti SageMaker](clarify-processing-job-configure-container.md)
+ [File di configurazione dell’analisi](clarify-processing-job-configure-analysis.md)
+ [Guida alla compatibilità di formato dei dati](clarify-processing-job-data-format.md)