Nutzungshinweise - Amazon Redshift

Amazon Redshift wird UDFs ab dem 1. November 2025 die Erstellung von neuem Python nicht mehr unterstützen. Wenn Sie Python verwenden möchten UDFs, erstellen Sie das UDFs vor diesem Datum liegende. Bestehendes Python UDFs wird weiterhin wie gewohnt funktionieren. Weitere Informationen finden Sie im Blogbeitrag.

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Nutzungshinweise

Wenn Sie CREATE MODEL verwenden, beachten Sie Folgendes:

  • Die Anweisung CREATE MODELL arbeitet in einem asynchronen Modus und kehrt beim Export von Trainingsdaten nach Amazon S3 zurück. Die verbleibenden Trainingsschritte in Amazon SageMaker AI finden im Hintergrund statt. Während des Trainings ist die entsprechende Inferenzfunktion sichtbar, kann aber nicht ausgeführt werden. Sie können STV_ML_MODEL_INFO abfragen, um den Trainingsstand anzusehen.

  • Das Training kann bis zu 90 Minuten im Hintergrund laufen, standardmäßig im Auto-Modell, und kann verlängert werden. Um das Training abzubrechen, führen Sie einfach den Befehl DROP MODEL aus.

  • Der Amazon-Redshift-Cluster, den Sie zum Erstellen des Modells verwenden, und der Amazon S3 Bucket, der zur Bereitstellung der Trainingsdaten und Modellartefakte verwendet wird, müssen sich in derselben AWS -Region befinden.

  • Während des Modelltrainings speichern Amazon Redshift und SageMaker KI Zwischenartefakte in dem von Ihnen bereitgestellten Amazon S3 S3-Bucket. Standardmäßig führt Amazon Redshift die Garbage Collection am Ende des CREATE MODEL-Vorgangs durch. Amazon Redshift entfernt diese Objekte aus Amazon S3. Um diese Artefakte in Amazon S3 beizubehalten, legen Sie die Option S3_GARBAGE COLLECT OFF fest.

  • Sie müssen mindestens 500 Zeilen in den Trainingsdaten verwenden, die mit der FROM-Klausel bereitgestellt werden.

  • Bei Verwendung der CREATE MODEL-Anweisung können Sie in der Klausel FROM { table_name | ( select_query ) } nur bis zu 256 Merkmalsspalten für die Eingabe angeben.

  • Für AUTO ON können Sie folgende Spaltentypen als Trainingssatz verwenden: SMALLINT, INTEGER, BIGINT, DECIMAL, REAL, DOUBLE, BOOLEAN, CHAR, VARCHAR, DATE, TIME, TIMETZ, TIMESTAMP und TIMESTAMPTZ. Für AUTO OFF können Sie folgende Spaltentypen als Trainingssatz verwenden: SMALLINT, INTEGER, BIGINT, DECIMAL, REAL, DOUBLE und BOOLEAN.

  • Sie können nicht DECIMAL, DATE, TIME, TIMETZ, TIMESTAMP, TIMESTAMPTZ, GEOMETRY, GEOGRAPHY, HLLSKETCH, SUPER oder VARBYTE als Zielspaltentyp verwenden.

  • Um die Modellgenauigkeit zu verbessern, gehen Sie wie folgt vor:

    • Fügen Sie so viele relevante Spalten wie möglich in den Befehl CREATE MODEL ein, wenn Sie die Trainingsdaten in der FROM-Klausel angeben.

    • Verwenden Sie einen größeren Wert für MAX_RUNTIME und MAX_CELLS. Größere Werte für diesen Parameter erhöhen die Kosten für das Training eines Modells.

  • Die Ausführung der CREATE MODEL-Anweisung wird zurückgegeben, sobald die Trainingsdaten berechnet und in den Amazon S3 Bucket exportiert werden. Danach können Sie den Status des Trainings mit dem Befehl SHOW MODEL überprüfen. Wenn ein Modell, das im Hintergrund trainiert wird, fehlschlägt, können Sie den Fehler mit SHOW MODEL überprüfen. Sie können ein fehlerhaftes Modell nicht wiederholen. Verwenden Sie DROP MODELL, um ein fehlerhaftes Modell zu entfernen und ein neues Modell neu zu erstellen Weitere Hinweise zu SHOW MODEL finden Sie unter SHOW MODEL.

  • Lokales BYOM unterstützt die gleichen Modelle, die Amazon Redshift ML für Nicht-BYOM-Fälle unterstützt. Amazon Redshift unterstützt einfache XGBoost (mit XGBoost Version 1.0 oder höher), KMEANS-Modelle ohne Präprozessoren und XGBOOST/MLP/Linear Learner-Modelle, die von Trained by Amazon AI Autopilot trainiert wurden. SageMaker Letzteres wird mit von Autopilot spezifizierten Präprozessoren unterstützt, die auch von Amazon SageMaker AI Neo unterstützt werden.

  • Wenn in Ihrem Amazon Redshift Redshift-Cluster erweitertes Routing für Ihre Virtual Private Cloud (VPC) aktiviert ist, stellen Sie sicher, dass Sie einen Amazon S3 S3-VPC-Endpunkt und einen SageMaker AI-VPC-Endpunkt für die VPC erstellen, in der sich Ihr Cluster befindet. Auf diese Weise kann der Datenverkehr zwischen diesen Diensten während der Ausführung von CREATE MODEL durch Ihre VPC laufen. Weitere Informationen finden Sie unter SageMaker AI Clarify Job Amazon VPC Subnets and Security Groups.