Bereitstellung von Trainingsdaten in AWS Clean Rooms ML - AWS Clean Rooms

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Bereitstellung von Trainingsdaten in AWS Clean Rooms ML

Nachdem der Ersteller der Kollaboration die Kollaboration erstellt hat und eingeladene Mitglieder ihr beigetreten sind, sind Sie bereit, Trainingsdaten zur Kollaboration beizutragen. Jedes Mitglied kann Trainingsdaten beisteuern.

Console
Um Trainingsdaten beizutragen (Konsole)
  1. Melden Sie sich bei https://console.aws.amazon.com/cleanrooms an AWS Management Console und öffnen Sie die AWS Clean Rooms Konsole.

  2. Wählen Sie im linken Navigationsbereich Tables (Tabellen) aus.

  3. Wählen Sie auf der Seite Tabellen die Option Neue Tabelle konfigurieren aus.

  4. Wählen Sie unter Neue Tabelle konfigurieren für Datenquelle Amazon S3, Amazon Athena oder Snowflake aus und führen Sie je nach Datenquelle die folgenden Schritte aus:

    Wenn Sie verwenden Dann
    Amazon S3
    1. Wählen Sie eine Datenbank aus der Dropdownliste und wählen Sie dann die Tabelle aus der Datenbank aus.

    2. Wählen Sie für Spalten, die in Kollaborationen zulässig sind, entweder Alle Spalten oder Benutzerdefinierte Liste aus.

    3. Geben Sie für Details zur konfigurierten Tabelle den Namen und optional eine Beschreibung für diese Tabelle an.

    4. Wenn Sie Modellmetriken melden möchten, geben Sie den Namen der Metriken und die Regex-Anweisung ein, mit der die Ausgabeprotokolle nach der Metrik durchsucht werden.

    5. Wenn Sie Tags für die konfigurierte Tabellenressource aktivieren möchten, wählen Sie Neues Tag hinzufügen aus und geben Sie dann das Schlüssel - und Wertepaar ein.

    Amazon Athena
    1. Wählen Sie eine Datenbank aus der Dropdownliste und wählen Sie dann die Tabelle aus der Datenbank aus.

    2. Wählen Sie für Spalten, die in Kollaborationen zulässig sind, entweder Alle Spalten oder Benutzerdefinierte Liste aus.

    3. Geben Sie für Details zur konfigurierten Tabelle den Namen und optional eine Beschreibung für diese Tabelle an.

    4. Wenn Sie Modellmetriken melden möchten, geben Sie den Namen der Metriken und die Regex-Anweisung ein, mit der die Ausgabeprotokolle nach der Metrik durchsucht werden.

    5. Wenn Sie Tags für die konfigurierte Tabellenressource aktivieren möchten, wählen Sie Neues Tag hinzufügen aus und geben Sie dann das Schlüssel - und Wertepaar ein.

    Snowflake
    1. Geben Sie die Snowflake-Anmeldeinformationen mithilfe eines vorhandenen geheimen ARN an oder speichern Sie ein neues Geheimnis für diese Tabelle.

    2. Geben Sie für Snowflake-Tabellen- und Schemadetails die Details manuell ein oder importieren Sie die Details automatisch.

    3. Geben Sie für das Schema den Spaltennamen ein und wählen Sie den Datentyp aus der Dropdownliste aus.

    4. Wenn Sie Tags für die konfigurierte Tabellenressource aktivieren möchten, wählen Sie Neues Tag hinzufügen und geben Sie dann das Schlüssel - und Wertepaar ein.

  5. Wählen Sie Neue Tabelle konfigurieren aus.

  6. Wählen Sie auf der Seite mit den Tabellendetails die Option Analyseregel konfigurieren aus, um eine benutzerdefinierte Analyseregel für diese Tabelle zu konfigurieren. Eine benutzerdefinierte Analyseregel schränkt den Zugriff auf Ihre Daten ein. Sie können entweder eine bestimmte Gruppe von vorab autorisierten Abfragen Ihrer Daten zulassen oder einer bestimmten Gruppe von Konten erlauben, Ihre Daten abzufragen.

    1. Wählen Sie als Regeltyp für die Analyse die Option Benutzerdefiniert und für Erstellungsmethode die Option Geführter Ablauf aus.

    2. Wählen Sie Weiter aus.

    3. Wählen Sie unter „Analysekontrollen angeben“ zwischen „Jede neue Analyse überprüfen“ und „Alle Analysen durch bestimmte Mitarbeiter zulassen“.

    4. Wählen Sie Weiter aus.

    5. (Optional) Geben Sie unter „Steuerelemente für Analyseergebnisse angeben“ für Spalten, die in der Ausgabe nicht zulässig sind, an, ob Sie Spalten von der Ausgabe ausschließen möchten. Wenn Sie Keine wählen, werden keine Spalten von der Ausgabe ausgeschlossen. Wenn Sie Benutzerdefinierte Liste wählen, können Sie bestimmte Spalten angeben, die aus der Ausgabe entfernt werden.

    6. Geben Sie für zusätzliche Analysen, die auf die Ausgabe angewendet werden, an, ob Sie eine zusätzliche Analyse zulassen, verweigern oder erfordern möchten, bevor die Ergebnisse generiert werden.

    7. Wählen Sie Weiter aus.

    8. (Optional) Wählen Sie unter Differentiellen Datenschutz festlegen die Option Ausschalten aus.

    9. Wählen Sie Weiter aus.

    10. Überprüfen Sie die Informationen auf der Seite Überprüfen und konfigurieren und wählen Sie dann Analyseregel konfigurieren aus.

  7. Wählen Sie auf der Seite mit den Tabellendetails die Option Mit Kollaboration verknüpfen aus.

  8. Wählen Sie im Dialogfeld Tabelle zuordnen die Kollaboration aus, der Sie diese Tabelle zuordnen möchten, und wählen Sie Kollaboration auswählen aus.

  9. Überprüfen und verifizieren Sie auf der Seite Tabelle zuordnen die Informationen in den Bereichen Tabellenzuordnungsdetails, Servicezugriff und Tags. Wählen Sie Tabelle zuordnen aus.

  10. Wählen Sie in der Tabelle „Mit Ihrer Tabelle verknüpfte Tabellen“ das Optionsfeld neben der Tabelle aus, die Sie gerade verknüpft haben. Wählen Sie im Menü Aktionen in der Regelgruppe Kollaborationsanalyse die Option Konfigurieren aus.

  11. Wählen Sie auf der Seite Regel für Kollaborationsanalyse konfigurieren unter Zulässige zusätzliche Analysen aus, ob Mitglieder der Kollaboration oder bestimmte Mitglieder der Kollaboration zusätzliche Analysen durchführen können.

    Wählen Sie für die Bereitstellung von Ergebnissen aus, welche Mitglieder Ergebnisse aus Abfrageausgaben erhalten dürfen.

  12. Wählen Sie Analyseregel konfigurieren aus.

API

Um Trainingsdaten beizutragen (API)

  1. Konfigurieren Sie eine vorhandene AWS Glue Tabelle für die Verwendung in, AWS Clean Rooms indem Sie die Tabelle und die Spalten angeben, die verwendet werden können.

    Führen Sie den folgenden Code mit Ihren spezifischen Parametern aus.

    import boto3 acr_client= boto3.client('cleanrooms') acr_client.create_configured_table( name='configured_table_name', tableReference= { 'glue': { 'tableName': 'glue_table_name', 'databaseName': 'glue_database_name' } }, analysisMethod="DIRECT_QUERY", allowedColumns=["column1", "column2", "column3",...] )
  2. Konfigurieren Sie eine benutzerdefinierte Analyseregel, die den Zugriff auf Ihre Daten einschränkt. Sie können entweder eine bestimmte Gruppe von vorab autorisierten Abfragen Ihrer Daten zulassen oder einer bestimmten Gruppe von Konten erlauben, Ihre Daten abzufragen.

    Führen Sie den folgenden Code mit Ihren spezifischen Parametern aus.

    import boto3 acr_client= boto3.client('cleanrooms') acr_client.create_configured_table_analysis_rule( configuredTableIdentifier='configured_table_id', analysisRuleType='CUSTOM', analysisRulePolicy= { 'v1': { 'custom': { 'allowedAnalyses': ['ANY_QUERY'], 'allowedAnalysisProviders': ['query_runner_account'], 'additionalAnalyses': "REQUIRED" } } } )

    In diesem Beispiel darf ein bestimmtes Konto jede Abfrage der Daten ausführen, und eine zusätzliche Analyse ist erforderlich.

  3. Ordnen Sie der Kollaboration eine konfigurierte Tabelle zu und weisen Sie den AWS Glue Tabellen eine Dienstzugriffsrolle zu.

    Führen Sie den folgenden Code mit Ihren spezifischen Parametern aus.

    import boto3 acr_client= boto3.client('cleanrooms') acr_client.create_configured_table_association( name='configured_table_association_name', membershipIdentifier='membership_id', configuredTableIdentifier='configured_table_id', roleArn='arn:aws:iam::account:role/role_name' )
    Anmerkung

    Diese Servicerolle hat Berechtigungen für die Tabellen. Die Servicerolle kann nur übernommen werden AWS Clean Rooms , um zulässige Abfragen im Namen des Mitglieds auszuführen, das Abfragen durchführen kann. Keine Kollaborationsmitglieder (außer dem Datenbesitzer) haben Zugriff auf die zugrunde liegenden Tabellen in der Kollaboration. Der Datenbesitzer kann den differenziellen Datenschutz deaktivieren, um seine Tabellen für Abfragen durch andere Mitglieder verfügbar zu machen.

  4. Fügen Sie abschließend der konfigurierten Tabellenzuordnung eine Analyseregel hinzu.

    Führen Sie den folgenden Code mit Ihren spezifischen Parametern aus.

    import boto3 acr_client= boto3.client('cleanrooms') acr_client.create_configured_table_association_analysis_rule( configuredTableAssociationIdentifier='configured_table_association_identifier', membershipIdentifier='membership_id', configuredTableIdentifier='configured_table_id', analysisRuleType = 'CUSTOM', analysisRulePolicy= { 'v1': { 'custom': { 'allowedAdditionalAnalyses': ['configured_model_algorithm_association_arns'], 'allowedResultReceivers': ['query_runner_account'] } } } )