Amazon Redshift unterstützt ab dem 1. November 2025 nicht mehr die Erstellung neuer Python-UDFs. Wenn Sie Python-UDFs verwenden möchten, erstellen Sie die UDFs vor diesem Datum. Bestehende Python-UDFs funktionieren weiterhin wie gewohnt. Weitere Informationen finden Sie im Blog-Posting
Machine Learning
Amazon Redshift Machine Learning (Amazon Redshift ML) ist ein robuster, cloudbasierter Service, der Analysten und Datenwissenschaftlern aller Kenntnisstufen die Arbeit mit Machine-Learning-Technologien erleichtert. Amazon Redshift ML verwendet ein Modell, um Ergebnisse zu generieren. Sie können Modelle auf folgende Weisen verwenden:
Sie können die Daten, die Sie zum Trainieren eines Modells verwenden möchten, sowie Metadaten, die mit Dateneingaben verknüpft sind, für Amazon Redshift bereitstellen. Daraufhin erstellt Amazon Redshift ML Modelle in Amazon SageMaker AI, die Muster in den Eingabedaten erfassen. Durch die Verwendung eigener Daten für das Modell können Sie mithilfe von Amazon Redshift ML Trends in den Daten identifizieren, z. B. Abwanderungsprognosen, Customer Lifetime Value oder Umsatzprognosen. Sie können diese Modelle verwenden, um Prognosen für neue Eingabedaten zu generieren, ohne dass zusätzliche Kosten entstehen.
Sie können eines der von Amazon Bedrock bereitgestellten Basismodelle (FM) wie Claude oder Amazon Titan verwenden. Mit Amazon Bedrock können Sie in wenigen Schritten die Leistungsfähigkeit großer Sprachmodelle (LLMs) in Verbindung mit Ihren Analytikdaten in Amazon Redshift nutzen. Durch die Nutzung eines externen großen Sprachmodells (LLM) können Sie Amazon Redshift für die natürliche Sprachverarbeitung (NLP) Ihrer Daten verwenden. Sie können NLP für Anwendungen wie Textgenerierung, Stimmungsanalyse oder Übersetzung verwenden. Weitere Informationen zur Verwendung von Amazon Bedrock mit Amazon Redshift finden Sie unter Integration von Amazon Redshift ML mit Amazon Bedrock.
Anmerkung
Abmeldung von der Verwendung Ihrer Daten zur Serviceverbesserung
Wenn Sie Amazon-Bedrock-Modelle verwenden, empfehlen wir Ihnen, die AWS-Richtlinien zur Verarbeitung Ihrer Daten durch Amazon Bedrock zu lesen. Sie sollten feststellen, ob Sie eine Abmelderichtlinie verwenden müssen, um zu verhindern, dass der Service Ihre Daten für Modell- oder Serviceverbesserungen verwendet, falls Amazon Bedrock eine solche Funktionalität in der Zukunft implementiert. Verwenden Sie die allgemeine AWS-Abmelderichtlinie, um sicherzustellen, dass der Service Ihre Daten nicht für solche Zwecke verwendet.
Weitere Informationen finden Sie hier:
Anmerkung
LLMs können falsche oder unvollständige Informationen generieren. Wir empfehlen, die von LLMs erstellten Informationen zu überprüfen, um sicherzustellen, dass sie korrekt und vollständig sind.
Funktionsweise von Amazon Redshift ML mit Amazon SageMaker AI
Amazon Redshift kann zusammen mit Amazon SageMaker AI Autopilot verwendet werden, um automatisch das beste Modell abzurufen und die Prognosefunktion in Amazon Redshift verfügbar zu machen.
Das folgende Diagramm veranschaulicht, wie Amazon Redshift ML funktioniert.
Im Allgemeinen sieht der Workflow wie folgt aus:
-
Amazon Redshift exportiert die Trainingsdaten in Amazon S3.
-
Amazon SageMaker AI Autopilot übernimmt die Vorverarbeitung der Trainingsdaten. Die Vorverarbeitung umfasst wichtige Funktionen, wie zum Beispiel die Imputation fehlender Werte. Im Rahmen der Vorverarbeitung werden außerdem kategorische Spalten (zum Beispiel die Postleitzahl) erfasst und für das Training formatiert sowie weitere Funktionen durchgeführt. Die Auswahl der besten Präprozessoren für den Trainingsdatensatz ist eine Herausforderung an sich und Amazon SageMaker AI Autopilot automatisiert die Lösung des Problems.
-
Amazon SageMaker AI Autopilot ermittelt den Algorithmus und die Algorithmus-Hyperparameter, die das Modell mit den genauesten Prognosen liefern.
-
Amazon Redshift registriert die Prognosefunktion als SQL-Funktion in Ihrem Amazon-Redshift-Cluster.
-
Wenn Sie CREATE-MODEL-Anweisungen ausführen, verwendet Amazon Redshift Amazon SageMaker AI für das Training. Daher fallen Kosten für das Training Ihres Modells an. Dies ist ein separater Posten für Amazon SageMaker AI in ihrer AWS-Rechnung. Sie zahlen außerdem für den Speicher, der in Amazon S3 für die Speicherung Ihrer Trainingsdaten verwendet wird. Inferenzen mit Modellen, die mit CREATE MODEL erstellt wurden, die Sie kompilieren und auf Ihrem Redshift-Cluster ausführen können, werden nicht berechnet. Es fallen keine zusätzlichen Amazon-Redshift-Gebühren für die Verwendung von Amazon Redshift ML an.