Erstellen und Ausführen von Rezepten für die Datenvorbereitung in einem visuellen AWS Glue ETL-Job - AWS Glue

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Erstellen und Ausführen von Rezepten für die Datenvorbereitung in einem visuellen AWS Glue ETL-Job

In diesem Szenario können Sie Rezepte für die Datenvorbereitung erstellen, ohne sie zuerst in erstellen zu müssen DataBrew. Bevor Sie mit dem Verfassen von Rezepten beginnen können, muss:

  • eine aktive Datenvorschau-Sitzung ausgeführt werden. Wenn die Datenvorschau-Sitzung BEREIT ist, wird Rezept verfassen aktiv, und Sie können mit dem Verfassen oder Bearbeiten Ihres Rezepts beginnen.

    Der Screenshot zeigt, dass die Datenvorschau-Sitzung abgeschlossen ist.
  • Vergewissern Sie sich, dass der Schalter für Glue-Bibliotheken automatisch importieren aktiviert ist.

    Der Screenshot zeigt, dass die Option „Glue-Bibliotheken automatisch importieren“ aktiviert ist.

    Sie können dies tun, indem Sie im Datenvorschau-Bereich auf das Zahnradsymbol klicken.

    Der Screenshot zeigt, dass die Option „Glue-Bibliotheken automatisch importieren“ aktiviert ist.
So verfassen Sie ein Datenvorbereitungsrezept in AWS Glue Studio:
  1. Fügen Sie die Transformation Datenvorbereitungsrezept Ihrem Auftrags-Canvas hinzu. Ihre Transformation sollte mit einem übergeordneten Datenquellenknoten verbunden sein. Wenn Sie den Knoten Datenvorbereitungsrezept hinzufügen, wird der Knoten mit den richtigen Bibliotheken neu gestartet, und Sie werden sehen, dass der Datenrahmen vorbereitet wird.

    Der Screenshot zeigt das Laden des Datenrahmens nach dem Hinzufügen des Datenvorbereitungsrezepts.
  2. Sobald die Datenvorschausitzung fertig ist, werden die Daten mit allen zuvor angewendeten Schritten am unteren Bildschirmrand angezeigt.

  3. Wählen Sie Rezept verfassen aus. Auf diese Weise können Sie ein neues Rezept in starten AWS Glue Studio.

    Der Screenshot zeigt das Bedienfeld „Transformieren“ mit den Feldern für Name und für übergeordnete Knoten sowie mit der Option „Rezept verfassen“.
  4. Geben Sie im Bedienfeld Transformieren rechts neben dem Auftrags-Canvas einen Namen für Ihr Datenvorbereitungsrezept ein.

  5. Auf der linken Seite wird der Canvas durch eine Rasteransicht Ihrer Daten ersetzt. Auf der rechten Seite ändert sich das Bedienfeld Transformieren und zeigt Ihnen die Rezeptschritte an. Wählen Sie Schritt hinzufügen aus, um Ihrem Rezept den ersten Schritt hinzuzufügen.

    Der Screenshot zeigt das Bedienfeld „Transformieren“ nach der Auswahl von „Schritt hinzufügen“. Wenn Sie eine Spalte auswählen, ändern sich die Optionen dynamisch. Sie können wählen, ob Sie die Spalte sortieren, eine Aktion für die Spalte ausführen oder Werte filtern möchten.
  6. Wählen Sie im Bedienfeld Transformieren aus, ob Sie die Spalte sortieren, eine Aktion für die Spalte ausführen oder Werte filtern möchten. Wählen Sie beispielsweise Spalte umbenennen aus.

    Der Screenshot zeigt das Bedienfeld „Transformieren“ nach der Auswahl von „Schritt hinzufügen“. Wenn Sie eine Spalte auswählen, ändern sich die Optionen dynamisch. Sie können wählen, ob Sie die Spalte sortieren, eine Aktion für die Spalte ausführen oder Werte filtern möchten.
  7. Im Bedienfeld „Transformieren“ auf der rechten Seite können Sie mit den Optionen zum Umbenennen einer Spalte die Quellspalte auswählen, die Sie umbenennen möchten, und den neuen Spaltennamen eingeben. Sobald Sie dies getan haben, wählen Sie Anwenden aus.

    Sie können für jeden Schritt eine Vorschau anzeigen, einen Schritt rückgängig machen, die Schritte neu anordnen und eines der Aktionssymbole wie Filtern, Sortieren, Teilen, Zusammenführen und so weiter verwenden. Wenn Sie Aktionen im Datenraster ausführen, werden die Schritte dem Rezept im Bedienfeld „Transformieren“ hinzugefügt.

    Der Screenshot zeigt das Vorschau-Datenraster mit hervorgehobener Symbolleiste. Sie können eine Aktion mit einem der Symbole anwenden. Sie wird dann dem Rezept im Bedienfeld „Transformieren“ auf der rechten Seite hinzugefügt.

    Wenn Sie eine Änderung vornehmen müssen, können Sie dies im Vorschaufenster machen, indem Sie eine Vorschau des Ergebnisses jedes Schritts anzeigen, einen Schritt rückgängig machen und die Schritte neu anordnen. Beispiel:

    • Undo/redo Schritt — machen Sie einen Schritt rückgängig, indem Sie das Rückgängig-Symbol wählen. Sie können einen Schritt wiederholen, indem Sie auf das Symbol Wiederholen klicken.

      Der Screenshot zeigt das Symbol „Mehr“.
    • Schritt neu anordnen — Wenn Sie einen Schritt neu anordnen, AWS Glue Studio wird jeder Schritt validiert und Sie werden darüber informiert, ob der Schritt ungültig ist.

  8. Sobald Sie einen Schritt angewendet haben, sehen Sie im Bedienfeld „Transformieren“ alle Schritte in Ihrem Rezept. Sie können alle Schritte löschen, um von vorne zu beginnen, weitere Schritte hinzufügen, indem Sie auf das Symbol „Hinzufügen“ klicken oder Verfassen von Rezept abgeschlossen auswählen.

    Der Screenshot zeigt das Bedienfeld „Transformieren“ mit Schritten, die Ihrem Rezept hinzugefügt wurden. Wenn Sie fertig sind, wählen Sie Verfassen von Rezept abgeschlossen aus oder klicken Sie auf das Symbol „Hinzufügen“, um dem Rezept weitere Schritte hinzuzufügen.
  9. Wählen Sie oben rechts auf dem Bildschirm Speichern aus. Ihre Rezeptschritte werden erst gespeichert, nachdem Sie Ihren Auftrag gespeichert haben.