Bearbeiten von Datenflussschritten - Amazon SageMaker KI

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Bearbeiten von Datenflussschritten

In Amazon SageMaker Canvas können Sie einzelne Schritte in Ihren Datenflüssen bearbeiten, um Ihren Datensatz zu transformieren, ohne einen neuen Datenfluss erstellen zu müssen. Auf der folgenden Seite wird beschrieben, wie Sie die Schritte zum Verknüpfen und Verketten sowie die Schritte zur Datenquelle bearbeiten.

Bearbeiten der Schritte zum Verknüpfen und Verketten

Innerhalb Ihrer Datenflüsse haben Sie die Flexibilität, Ihre Schritte zum Verknüpfen und Verketten zu bearbeiten. Sie können die erforderlichen Anpassungen an Ihrem Datenverarbeitungs-Workflow vornehmen und sicherstellen, dass Ihre Daten ordnungsgemäß kombiniert und transformiert werden, ohne den gesamten Datenfluss neu erstellen zu müssen.

Um einen Verknüpfungs- oder Verkettungsschritt in Ihrem Datenfluss zu bearbeiten, gehen Sie wie folgt vor:

  1. Öffnen Sie Ihren Datenfluss.

  2. Wählen Sie das Plussymbol (+) neben dem Verknüpfungs- oder Verkettungsknoten aus, den Sie bearbeiten möchten.

  3. Klicken Sie im Kontextmenü auf Edit (Bearbeiten).

  4. Ein Seitenbereich wird geöffnet, in dem Sie die Details Ihrer Verknüpfung oder Verkettung bearbeiten können. Ändern Sie Ihre Schrittfelder, z. B. die Art der Verknüpfung. Um einen Datenknoten auszutauschen und einen anderen zum Verbinden oder Verketten auszuwählen, klicken Sie auf das Löschsymbol neben dem Knoten und wählen Sie dann in der Datenflussansicht den neuen Knoten aus, den Sie in Ihre Transformation einbeziehen möchten.

    Anmerkung

    Wenn Sie während des Bearbeitungsvorgangs einen Knoten austauschen, können Sie nur Schritte auswählen, die vor dem Verknüpfen oder Verketten ausgeführt wurden. Sie können entweder den linken oder den rechten Knoten austauschen, jedoch immer nur einen Knoten gleichzeitig. Außerdem können Sie keinen Quellknoten als Ersatz auswählen.

  5. Wählen Sie Vorschau aus, um das Ergebnis des Kombinationsvorgangs anzuzeigen.

  6. Wählen Sie Aktualisieren aus, um Ihre Änderungen zu speichern.

Ihr Datenfluss sollte nun aktualisiert sein.

Bearbeiten oder Ersetzen eines Datenquellenschritts

Möglicherweise müssen Sie Änderungen an Ihrer Datenquelle oder Ihrem Datensatz vornehmen, ohne die auf Ihre Originaldaten angewendeten Transformationen und Datenflussschritte zu löschen. In Data Wrangler können Sie Ihre Datenquellenkonfiguration bearbeiten oder ersetzen, während die Schritte Ihres Datenflusses beibehalten werden. Beim Bearbeiten einer Datenquelle können Sie die Importeinstellungen ändern, beispielsweise die Sampling-Größe oder -Methode sowie alle erweiterten Einstellungen. Sie können auch weitere Dateien mit demselben Schema hinzufügen oder bei abfragebasierten Datenquellen wie Amazon Athena die Abfrage bearbeiten. Beim Ersetzen einer Datenquelle haben Sie die Möglichkeit, einen anderen Datensatz auszuwählen oder sogar Daten aus einer völlig anderen Datenquelle zu importieren, sofern das Schema der neuen Daten mit den Originaldaten übereinstimmt.

Um eine Datenquellenkonfiguration zu bearbeiten, gehen Sie wie folgt vor:

  1. Rufen Sie in der Canvas-Anwendung die Seite Data Wrangler auf.

  2. Wählen Sie Ihren Datenfluss aus, um ihn anzuzeigen.

  3. Suchen Sie auf der Registerkarte Datenfluss, auf der Ihre Datenflussschritte angezeigt werden, den Quellknoten, den Sie bearbeiten möchten.

  4. Wählen Sie das Ellipsensymbol neben dem Quellknoten aus.

  5. Klicken Sie im Kontextmenü auf Edit (Bearbeiten).

  6. Für Amazon-S3-Datenquellen und lokale Uploads haben Sie die Möglichkeit, weitere Dateien mit dem gleichen Schema wie Ihre Originaldaten auszuwählen oder hochzuladen. Bei abfragebasierten Datenquellen wie Amazon Athena können Sie im visuellen Abfrage-Builder verschiedene Tabellen entfernen und auswählen oder die SQL-Abfrage direkt bearbeiten. Wählen Sie abschließend Weiter.

  7. Nehmen Sie für die Importeinstellungen die gewünschten Änderungen vor.

  8. Wenn Sie fertig sind, wählen Sie Änderungen speichern aus.

Ihre Datenquelle sollte nun aktualisiert sein.

Um eine Datenquelle zu ersetzen, führen Sie die folgenden Schritte aus:

  1. Rufen Sie in der Canvas-Anwendung die Seite Data Wrangler auf.

  2. Wählen Sie Ihren Datenfluss aus, um ihn anzuzeigen.

  3. Suchen Sie auf der Registerkarte Datenfluss, auf der Ihre Datenflussschritte angezeigt werden, den Quellknoten, den Sie bearbeiten möchten.

  4. Wählen Sie das Ellipsensymbol neben dem Quellknoten aus.

  5. Wählen Sie im Kontextmenü die Option Ersetzen aus.

  6. Führen Sie die Schritte zum Erstellen eines Datenflusses durch, um eine andere Datenquelle und andere Daten auszuwählen.

  7. Wenn Sie Ihre Daten ausgewählt haben und bereit sind, den Quellknoten zu aktualisieren, wählen Sie Speichern aus.

Der Quellknoten sollte nun in Ihrem Datenfluss aktualisiert worden sein.