AWS Data Pipeline ist für Neukunden nicht mehr verfügbar. Bestandskunden von AWS Data Pipeline können den Service weiterhin wie gewohnt nutzen. Weitere Informationen
Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Arbeiten mit Task Runner
Task Runner ist eine Task-Agent-Anwendung, die geplante Aufgaben abfragt AWS Data Pipeline und sie auf Amazon EC2 EC2-Instances, Amazon EMR-Clustern oder anderen Rechenressourcen ausführt und dabei den Status meldet. Je nach Anwendung können Sie:
-
Erlauben AWS Data Pipeline Sie, eine oder mehrere Task Runner-Anwendungen für Sie zu installieren und zu verwalten. Wenn eine Pipeline aktiviert ist, wird automatisch der Standard
Ec2Instanceoder dasEmrClusterObjekt erstellt, auf das ein RunsOn-Feld der Aktivität verweist. AWS Data Pipeline kümmert sich um die Installation von Task Runner auf einer EC2-Instance oder auf dem Master-Knoten eines EMR-Clusters. In diesem Muster AWS Data Pipeline kann der Großteil der Instance- oder Clusterverwaltung für Sie erledigt werden. -
Führen Sie alle oder Teile einer Pipeline für von Ihnen verwaltete Ressourcen aus. Zu den potenziellen Ressourcen gehören eine Amazon EC2 EC2-Instance mit langer Laufzeit, ein Amazon EMR-Cluster oder ein physischer Server. Sie können einen Task-Runner (der entweder Task Runner oder ein benutzerdefinierter Task-Agent Ihres eigenen Geräts sein kann) fast überall installieren, vorausgesetzt, er kann mit dem Webservice kommunizieren. AWS Data Pipeline In diesem Muster übernehmen Sie fast die vollständige Kontrolle darüber, welche Ressourcen verwendet und wie sie verwaltet werden, und Sie müssen Task Runner manuell installieren und konfigurieren. Verwenden Sie dazu die Verfahren in diesem Abschnitt, wie in Arbeiten an vorhandenen Ressourcen mit Task Runner ausführen beschrieben.