

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

# Requisiti relativi ai dati di formazione per Clean Rooms ML
<a name="ml-training-data-requirements"></a>

Per creare correttamente un modello simile, i dati di addestramento devono soddisfare i seguenti requisiti:
+ I dati di addestramento devono essere in formato Parquet, CSV o JSON.
**Nota**  
I dati compressi di Parquet Zstandard (ZSTD) non sono supportati.
+ I dati di allenamento devono essere catalogati in. AWS Glue Per ulteriori informazioni, consulta [Getting started with the AWS Glue Data Catalog](https://docs.aws.amazon.com//glue/latest/dg/start-data-catalog.html) nella AWS Glue Developer Guide. Ti consigliamo di utilizzare AWS Glue i crawler per creare le tabelle perché lo schema viene dedotto automaticamente.
+ Il bucket Amazon S3 che contiene i dati di addestramento e i dati iniziali si trova nella stessa AWS regione delle altre risorse Clean Rooms ML.
+ I dati di addestramento devono contenere almeno 100.000 utenti unici IDs con almeno due interazioni tra elementi ciascuno.
+ I dati di allenamento devono contenere almeno 1 milione di record.
+ Lo schema specificato nell'[CreateTrainingDataset](https://docs.aws.amazon.com/cleanrooms-ml/latest/APIReference/API_CreateTrainingDataset.html)azione deve essere allineato allo schema definito al momento della creazione della AWS Glue tabella.
+ I campi obbligatori, come definiti nella tabella fornita, sono definiti nell'[CreateTrainingDataset](https://docs.aws.amazon.com/cleanrooms-ml/latest/APIReference/API_CreateTrainingDataset.html)azione.    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/it_it/clean-rooms/latest/userguide/ml-training-data-requirements.html)
+ Facoltativamente, puoi fornire fino a 10 funzioni categoriali o numeriche totali.

Ecco un esempio di un set di dati di addestramento valido in formato CSV

```
USER_ID,ITEM_ID,TIMESTAMP,EVENT_TYPE(CATEGORICAL FEATURE),EVENT_VALUE (NUMERICAL FEATURE)
196,242,881250949,click,15
186,302,891717742,click,13
22,377,878887116,click,10
244,51,880606923,click,20
166,346,886397596,click,10
```