Erstellen eines trainierten Modells in AWS Clean Rooms ML

Voraussetzungen:

Und AWS-Konto mit Zugriff auf AWS Clean Rooms
Eine Zusammenarbeit wurde eingerichtet in AWS Clean Rooms
Ein konfigurierter Modellalgorithmus, der mit der Zusammenarbeit verknüpft ist
Mindestens ein konfigurierter ML-Eingangskanal
Entsprechende Berechtigungen zum Erstellen und Verwalten von ML-Modellen in der Zusammenarbeit

Nachdem Sie den konfigurierten Modellalgorithmus einer Kollaboration zugeordnet und anschließend einen ML-Eingangskanal erstellt und konfiguriert haben, können Sie ein trainiertes Modell erstellen. Ein trainiertes Modell wird von Mitgliedern einer Kollaboration verwendet, um ihre Daten gemeinsam zu analysieren.

Mit dem folgenden Verfahren können Sie ein trainiertes Modell erstellen.

Alternativ können Sie inkrementelles Training verwenden, um ein vorhandenes Modell mit neuen Daten zu verbessern, oder verteiltes Training, um Modelle über mehrere Recheninstanzen hinweg zu trainieren.

Themen

Console

Um ein trainiertes Modell zu erstellen (Konsole)

Melden Sie sich bei https://console.aws.amazon.com/cleanrooms an AWS-Managementkonsole und öffnen Sie die AWS Clean Rooms Konsole.
Wählen Sie im linken Navigationsbereich Collaborations aus.
Wählen Sie auf der Seite Kollaborationen die Kollaboration aus, für die Sie ein trainiertes Modell erstellen möchten.
Wählen Sie nach dem Öffnen der Kollaboration die Registerkarte ML-Modelle aus.
Wählen Sie unter Benutzerdefinierte ML-Modelle im Abschnitt Trainierte Modelle die Option Trainiertes Modell erstellen aus.
Geben Sie auf der Seite Trainiertes Modell erstellen für Algorithmus für Zugeordnetes Modell den Algorithmus an.
Geben Sie für Details zum trainierten Modell Folgendes ein:
1. Geben Sie unter Name einen eindeutigen Namen für das Modell in der Kollaboration ein.
2. (Optional) Geben Sie unter Beschreibung eine Beschreibung des trainierten Modells ein.
3. Wählen Sie für den Eingabemodus Trainingsdaten eine der folgenden Optionen:
  - Wählen Sie Datei aus, wenn Sie über einen kleineren Datensatz verfügen, der auf das ML-Speichervolumen passt, und Sie für Ihr Trainingsskript den herkömmlichen Dateisystemzugriff bevorzugen.
  - Wählen Sie Pipe für große Datensätze, um Daten direkt aus S3 zu streamen, sodass Sie nicht alles auf die Festplatte herunterladen müssen, was die Trainingsgeschwindigkeit verbessern und den Speicherbedarf reduzieren kann.
  - Wählen Sie aus, FastFileob Sie die Vorteile des Streamings von S3 mit dem Dateisystemzugriff kombinieren möchten, insbesondere für sequentiell gelesene Daten oder wenn Sie mit weniger Dateien arbeiten müssen, um die Startzeiten zu verkürzen.
Gehen Sie wie folgt vor, um Einzelheiten zum ML-Eingangskanal zu erhalten:
1. Geben Sie für den ML-Eingangskanal den ML-Eingangskanal an, der Daten für den Modellalgorithmus bereitstellt.
  
  Um einen weiteren Kanal hinzuzufügen, wählen Sie „Weiteren ML-Eingangskanal hinzufügen“. Sie können bis zu 19 zusätzliche ML-Eingangskanäle hinzufügen.
2. Geben Sie als Kanalname den Namen des ML-Eingangskanals ein.
3. Wählen Sie für den Amazon S3 S3-Datenverteilungstyp eine der folgenden Optionen:
  - Wählen Sie Vollständig repliziert aus, um jeder Trainingsinstanz eine vollständige Kopie Ihres Datensatzes zu geben. Dies funktioniert am besten, wenn Ihr Datensatz klein genug ist, um in den Arbeitsspeicher zu passen, oder wenn jede Instanz Zugriff auf alle Daten benötigt.
  - Wählen Sie Sharded by S3 Key aus, um Ihren Datensatz anhand von S3-Schlüsseln auf Trainingsinstanzen aufzuteilen. Jede Instanz empfängt etwa 1/n der gesamten S3-Objekte, wobei 'n' für die Anzahl der Instanzen steht. Dies funktioniert am besten für große Datensätze, die Sie parallel verarbeiten möchten.
  Anmerkung
  Berücksichtigen Sie bei der Auswahl eines Verteilungstyps Ihre Datensatzgröße und Ihre Trainingsanforderungen. Vollständig repliziert bietet vollständigen Datenzugriff, benötigt jedoch mehr Speicherplatz, während Sharded by S3 Key die verteilte Verarbeitung großer Datensätze ermöglicht.
Wählen Sie für Maximale Trainingsdauer die maximale Dauer aus, für die Sie Ihr Modell trainieren möchten.
Geben Sie für Hyperparameter alle algorithmusspezifischen Parameter und ihre beabsichtigten Werte an. Hyperparameter sind spezifisch für das trainierte Modell und werden zur Feinabstimmung des Modelltrainings verwendet.
Geben Sie für Umgebungsvariablen alle algorithmusspezifischen Variablen und ihre beabsichtigten Werte an. Umgebungsvariablen werden im Docker-Container festgelegt.
Um eine benutzerdefinierte Verschlüsselung zu verwenden AWS KMS key, aktivieren Sie das Kontrollkästchen Geheimnis mit einem benutzerdefinierten KMS-Schlüssel verschlüsseln.
Geben Sie für die EC2-Ressourcenkonfiguration Informationen zu den Rechenressourcen an, die für das Modelltraining verwendet werden.
1. Wählen Sie unter Instanztyp den Instanztyp aus, den Sie ausführen möchten.
2. Geben Sie unter Anzahl der Instanzen die Anzahl der Instanzen ein.
3. Geben Sie für Volumengröße in GB die Größe des ML-Speichervolumens ein.
Wählen Sie Trainiertes Modell erstellen aus.

API

Um ein trainiertes Modell (API) zu erstellen

Das Mitglied, das ein Modell trainieren kann, beginnt mit dem Training, indem es den ML-Eingangskanal und den Modellalgorithmus auswählt.

Führen Sie den folgenden Code mit Ihren spezifischen Parametern aus:


import boto3 
acr_ml_client= boto3.client('cleanroomsml')

acr_ml_client.create_trained_model(
    membershipIdentifier= 'membership_id',
    configuredModelAlgorithmAssociationArn = 'arn:aws:cleanrooms-ml:region:account:membership/membershipIdentifier/configured-model-algorithm-association/identifier',
    name='trained_model_name',
    resourceConfig={
        'instanceType': "ml.m5.xlarge",
        'volumeSizeInGB': 1
    },
    dataChannels=[
        {
            "mlInputChannelArn": channel_arn_1,
            "channelName": "channel_name"
        },
        {
            "mlInputChannelArn": channel_arn_2,
            "channelName": "channel_name"
        }
    ]
)

Anmerkung

Nachdem das trainierte Modell erstellt wurde, können Sie es nicht mehr bearbeiten. Um Änderungen vorzunehmen, löschen Sie das trainierte Modell und erstellen Sie ein neues.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Einen ML-Eingangskanal erstellen

Inkrementelles Training verwenden