Contribuire ai dati di formazione in AWS Clean Rooms ML - AWS Clean Rooms

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Contribuire ai dati di formazione in AWS Clean Rooms ML

Dopo che il creatore della collaborazione ha creato la collaborazione e i membri invitati si sono uniti, sei pronto a contribuire con i dati di formazione alla collaborazione. Qualsiasi membro può fornire dati di formazione.

Console
Per fornire dati di allenamento (console)
  1. Accedi a AWS Management Console e apri la AWS Clean Rooms console all'indirizzo https://console.aws.amazon.com/cleanrooms.

  2. Nel riquadro di navigazione a sinistra, selezionare Tables (Tabelle).

  3. Nella pagina Tabelle, scegli Configura nuova tabella.

  4. Per Configura nuova tabella, per Origine dati, scegli Amazon S3, Amazon Athena o Snowflake e completa i seguenti passaggi, in base alla tua origine dati:

    Se stai usando Quindi
    Amazon S3
    1. Scegli un database dall'elenco a discesa, quindi seleziona la tabella dal database.

    2. Per Colonne consentite nelle collaborazioni, scegli Tutte le colonne o Elenco personalizzato.

    3. Per i dettagli della tabella configurata, fornisci il nome e una descrizione facoltativa per questa tabella.

    4. Se desideri riportare le metriche del modello, inserisci il nome delle metriche e l'istruzione Regex che cercherà nei log di output per trovare la metrica.

    5. Se desideri abilitare i tag per la risorsa della tabella configurata, scegli Aggiungi nuovo tag e inserisci la coppia Chiave e Valore.

    Amazon Athena
    1. Scegli un database dall'elenco a discesa, quindi seleziona la tabella dal database.

    2. Per Colonne consentite nelle collaborazioni, scegli Tutte le colonne o Elenco personalizzato.

    3. Per i dettagli della tabella configurata, fornisci il nome e una descrizione facoltativa per questa tabella.

    4. Se desideri riportare le metriche del modello, inserisci il nome delle metriche e l'istruzione Regex che cercherà nei log di output per trovare la metrica.

    5. Se desideri abilitare i tag per la risorsa della tabella configurata, scegli Aggiungi nuovo tag e inserisci la coppia Chiave e Valore.

    Snowflake
    1. Specificate le credenziali Snowflake utilizzando un ARN segreto esistente o memorizzando un nuovo segreto per questa tabella.

    2. Per i dettagli della tabella e dello schema Snowflake, inserisci i dettagli manualmente o importa automaticamente i dettagli.

    3. Per lo schema, inserisci il nome della colonna e scegli il tipo di dati dall'elenco a discesa.

    4. Se desideri abilitare i tag per la risorsa della tabella configurata, scegli Aggiungi nuovo tag, quindi inserisci la coppia Chiave e Valore.

  5. Scegli Configura nuova tabella.

  6. Nella pagina dei dettagli della tabella, scegli Configura regola di analisi per configurare una regola di analisi personalizzata per questa tabella. Una regola di analisi personalizzata limita l'accesso ai dati. Puoi consentire una serie specifica di query preautorizzate sui tuoi dati o consentire a un set specifico di account di interrogare i tuoi dati.

    1. Per il tipo di regola di analisi, scegli Personalizzato e per Metodo di creazione, scegli Flusso guidato.

    2. Scegli Next (Successivo).

    3. Per Specificare i controlli di analisi, scegli tra Rivedi ogni nuova analisi e Consenti qualsiasi analisi da parte di collaboratori specifici.

    4. Scegli Next (Successivo).

    5. (Facoltativo) Per Specificare i controlli dei risultati dell'analisi, per Colonne non consentite nell'output, specificate se desiderate escludere eventuali colonne dall'output. Se scegliete Nessuno, nessuna colonna viene esclusa dall'output. Se scegli Elenco personalizzato, puoi specificare determinate colonne che verranno rimosse dall'output.

    6. Per Analisi aggiuntive applicate all'output, specificate se desiderate consentire, negare o richiedere un'analisi aggiuntiva prima della generazione dei risultati.

    7. Scegli Next (Successivo).

    8. (Facoltativo) Per Imposta la privacy differenziale, scegliete Disattiva.

    9. Scegli Next (Successivo).

    10. Rivedi le informazioni nella pagina Rivedi e configura, quindi scegli Configura regola di analisi.

  7. Dalla pagina dei dettagli della tabella, scegli Associa alla collaborazione.

  8. Nella finestra di dialogo Associa tabella, selezionate la collaborazione a cui desiderate associare questa tabella e scegliete Scegli collaborazione.

  9. Nella pagina Associa tabella, esamina e verifica le informazioni in Dettagli di associazione alle tabelle, Accesso ai servizi e Tag. Scegliete Associa tabella.

  10. Nella tabella Tabelle associate alla tua tabella, seleziona il pulsante di opzione accanto alla tabella che hai appena associato. Dal menu Azioni, scegliete Configura nel gruppo di regole di analisi della collaborazione.

  11. Nella pagina Configura la regola di analisi della collaborazione, per Analisi aggiuntive consentite, scegli se i membri della collaborazione o membri specifici della collaborazione possono eseguire analisi aggiuntive.

    Per la consegna dei risultati, scegli quali membri sono autorizzati a ricevere i risultati dagli output delle query.

  12. Scegli Configura regola di analisi.

API

Per contribuire ai dati di formazione (API)

  1. Configura una AWS Glue tabella esistente da utilizzare in AWS Clean Rooms fornendo la tabella e le colonne che possono essere utilizzate.

    Esegui il codice seguente con i tuoi parametri specifici.

    import boto3 acr_client= boto3.client('cleanrooms') acr_client.create_configured_table( name='configured_table_name', tableReference= { 'glue': { 'tableName': 'glue_table_name', 'databaseName': 'glue_database_name' } }, analysisMethod="DIRECT_QUERY", allowedColumns=["column1", "column2", "column3",...] )
  2. Configura una regola di analisi personalizzata che limiti l'accesso ai tuoi dati. Puoi consentire una serie specifica di query preautorizzate sui tuoi dati o consentire a un set specifico di account di interrogare i tuoi dati.

    Esegui il codice seguente con i tuoi parametri specifici.

    import boto3 acr_client= boto3.client('cleanrooms') acr_client.create_configured_table_analysis_rule( configuredTableIdentifier='configured_table_id', analysisRuleType='CUSTOM', analysisRulePolicy= { 'v1': { 'custom': { 'allowedAnalyses': ['ANY_QUERY'], 'allowedAnalysisProviders': ['query_runner_account'], 'additionalAnalyses': "REQUIRED" } } } )

    In questo esempio, un account specifico può eseguire qualsiasi query sui dati ed è necessaria un'analisi aggiuntiva.

  3. Associa una tabella configurata alla collaborazione e fornisci un ruolo di accesso al servizio alle AWS Glue tabelle.

    Esegui il codice seguente con i tuoi parametri specifici.

    import boto3 acr_client= boto3.client('cleanrooms') acr_client.create_configured_table_association( name='configured_table_association_name', membershipIdentifier='membership_id', configuredTableIdentifier='configured_table_id', roleArn='arn:aws:iam::account:role/role_name' )
    Nota

    Questo ruolo di servizio dispone delle autorizzazioni per le tabelle. Il ruolo di servizio può essere assunto solo eseguendo AWS Clean Rooms le query consentite per conto del membro che può eseguire le query. Nessun membro della collaborazione (diverso dal proprietario dei dati) ha accesso alle tabelle sottostanti della collaborazione. Il proprietario dei dati può disattivare la privacy differenziale per rendere le proprie tabelle disponibili per l'interrogazione da parte di altri membri.

  4. Infine, aggiungi una regola di analisi all'associazione di tabelle configurata.

    Esegui il codice seguente con i tuoi parametri specifici.

    import boto3 acr_client= boto3.client('cleanrooms') acr_client.create_configured_table_association_analysis_rule( configuredTableAssociationIdentifier='configured_table_association_identifier', membershipIdentifier='membership_id', configuredTableIdentifier='configured_table_id', analysisRuleType = 'CUSTOM', analysisRulePolicy= { 'v1': { 'custom': { 'allowedAdditionalAnalyses': ['configured_model_algorithm_association_arns'], 'allowedResultReceivers': ['query_runner_account'] } } } )