Amazon Redshift unterstützt ab dem 1. November 2025 nicht mehr die Erstellung neuer Python-UDFs. Wenn Sie Python-UDFs verwenden möchten, erstellen Sie die UDFs vor diesem Datum. Bestehende Python-UDFs funktionieren weiterhin wie gewohnt. Weitere Informationen finden Sie im Blog-Posting
Nutzungshinweise
Wenn Sie CREATE MODEL verwenden, beachten Sie Folgendes:
-
Die Anweisung CREATE MODELL arbeitet in einem asynchronen Modus und kehrt beim Export von Trainingsdaten nach Amazon S3 zurück. Die verbleibenden Trainingsschritte in Amazon SageMaker AI finden im Hintergrund statt. Während des Trainings ist die entsprechende Inferenzfunktion sichtbar, kann aber nicht ausgeführt werden. Sie können STV_ML_MODEL_INFO abfragen, um den Trainingsstand anzusehen.
-
Das Training kann bis zu 90 Minuten im Hintergrund laufen, standardmäßig im Auto-Modell, und kann verlängert werden. Um das Training abzubrechen, führen Sie einfach den Befehl DROP MODEL aus.
-
Der Amazon-Redshift-Cluster, den Sie zum Erstellen des Modells verwenden, und der Amazon S3 Bucket, der zur Bereitstellung der Trainingsdaten und Modellartefakte verwendet wird, müssen sich in derselben AWS-Region befinden.
-
Während des Modelltrainings speichern Amazon Redshift und SageMaker AI Zwischenartefakte im Amazon-S3-Bucket, den Sie bereitstellen. Standardmäßig führt Amazon Redshift die Garbage Collection am Ende des CREATE MODEL-Vorgangs durch. Amazon Redshift entfernt diese Objekte aus Amazon S3. Um diese Artefakte in Amazon S3 beizubehalten, legen Sie die Option S3_GARBAGE COLLECT OFF fest.
-
Sie müssen mindestens 500 Zeilen in den Trainingsdaten verwenden, die mit der FROM-Klausel bereitgestellt werden.
-
Bei Verwendung der CREATE MODEL-Anweisung können Sie in der Klausel FROM { table_name | ( select_query ) } nur bis zu 256 Merkmalsspalten für die Eingabe angeben.
-
Für AUTO ON können Sie folgende Spaltentypen als Trainingssatz verwenden: SMALLINT, INTEGER, BIGINT, DECIMAL, REAL, DOUBLE, BOOLEAN, CHAR, VARCHAR, DATE, TIME, TIMETZ, TIMESTAMP und TIMESTAMPTZ. Für AUTO OFF können Sie folgende Spaltentypen als Trainingssatz verwenden: SMALLINT, INTEGER, BIGINT, DECIMAL, REAL, DOUBLE und BOOLEAN.
-
Sie können nicht DECIMAL, DATE, TIME, TIMETZ, TIMESTAMP, TIMESTAMPTZ, GEOMETRY, GEOGRAPHY, HLLSKETCH, SUPER oder VARBYTE als Zielspaltentyp verwenden.
-
Um die Modellgenauigkeit zu verbessern, gehen Sie wie folgt vor:
-
Fügen Sie so viele relevante Spalten wie möglich in den Befehl CREATE MODEL ein, wenn Sie die Trainingsdaten in der FROM-Klausel angeben.
-
Verwenden Sie einen größeren Wert für MAX_RUNTIME und MAX_CELLS. Größere Werte für diesen Parameter erhöhen die Kosten für das Training eines Modells.
-
-
Die Ausführung der CREATE MODEL-Anweisung wird zurückgegeben, sobald die Trainingsdaten berechnet und in den Amazon S3 Bucket exportiert werden. Danach können Sie den Status des Trainings mit dem Befehl SHOW MODEL überprüfen. Wenn ein Modell, das im Hintergrund trainiert wird, fehlschlägt, können Sie den Fehler mit SHOW MODEL überprüfen. Sie können ein fehlerhaftes Modell nicht wiederholen. Verwenden Sie DROP MODELL, um ein fehlerhaftes Modell zu entfernen und ein neues Modell neu zu erstellen Weitere Hinweise zu SHOW MODEL finden Sie unter SHOW MODEL.
-
Lokales BYOM unterstützt die gleichen Modelle, die Amazon Redshift ML für Nicht-BYOM-Fälle unterstützt. Amazon Redshift unterstützt einfache XGBoost-Modelle (mit XGBoost-Version 1.0 oder höher), KMEANS-Modelle ohne Präprozessoren und XGBOOST-/MLP-/Linear-Learner-Modelle, die von Amazon SageMaker AI Autopilot trainiert wurden. Die Lösung unterstützt letztere mit von Autopilot angegebenen Präprozessoren, die auch von Amazon SageMaker AI Neo unterstützt werden.
-
Wenn Ihr Amazon-Redshift-Cluster über ein erweitertes Routing für Ihre Virtual Private Cloud (VPC) verfügt, stellen Sie sicher, dass Sie einen VPC-Endpunkt von Amazon S3 und einen VPC-Endpunkt von SageMaker AI für die VPC erstellen, in der sich Ihr Cluster befindet. Auf diese Weise kann der Datenverkehr zwischen diesen Diensten während der Ausführung von CREATE MODEL durch Ihre VPC laufen. Weitere Informationen finden Sie unter Aufträge von SageMaker AI Clarify für Amazon-VPC-Subnetze und -Sicherheitsgruppen.