Steuern des Flusses von Datenobjekten, die an Auftragnehmer gesendet werden - Amazon SageMaker KI

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Steuern des Flusses von Datenobjekten, die an Auftragnehmer gesendet werden

Abhängig von der Art des von Ihnen erstellten Kennzeichnungsauftrags sendet Amazon SageMaker Ground Truth Datenobjekte stapelweise oder im Streaming-Modus an Mitarbeiter. Sie können den Fluss von Datenobjekten an Worker wie folgt steuern:

  • Bei beiden Arten von Kennzeichnungsaufträgen können Sie mit MaxConcurrentTaskCount die Gesamtzahl der Datenobjekte steuern, die allen Workern zu einem bestimmten Zeitpunkt, zu dem der Kennzeichnungsauftrag ausgeführt wird, zur Verfügung stehen.

  • Bei Streaming-Kennzeichnungsaufträgen können Sie den Fluss von Datenobjekten an Worker steuern, indem Sie die Anzahl der Datenobjekte überwachen und kontrollieren, die an den Amazon SQS gesendet werden, der mit Ihrem Kennzeichnungsauftrag verknüpft ist.

In den folgenden Abschnitten erfahren Sie mehr über diese Optionen.

Wird verwendet MaxConcurrentTaskCount , um den Fluss von Datenobjekten zu steuern

MaxConcurrentTaskCount definiert die maximale Anzahl von Datenobjekten, die gleichzeitig in der Aufgabenwarteschlange des Auftragnehmerportals verfügbar sind. Wenn Sie die Konsole verwenden, ist dieser Parameter auf 1.000 festgelegt. Wenn Sie CreateLabelingJob verwenden, können Sie diesen Parameter auf eine beliebige Ganzzahl zwischen 1 und 5 000 setzen.

Das folgende Beispiel hilft Ihnen besser zu verstehen, wie die Anzahl der Einträge in Ihrer Manifestdatei, die MaxConcurrentTaskCount und die NumberOfHumanWorkersPerDataObject definieren, welche Aufgaben Mitarbeitern in ihrer Aufgabenwarteschlange auf der Benutzeroberfläche des Auftragnehmerportals angezeigt werden.

  1. Sie haben eine Eingabe-Manifestdatei mit 600 Einträgen.

  2. Für jeden Eintrag in Ihrer Eingabe-Manifestdatei können Sie mit NumberOfHumanWorkersPerDataObject die Anzahl der menschlichen Auftragnehmer definieren, die einen Eintrag aus Ihrer Eingabe-Manifestdatei kennzeichnen. In diesem Beispiel setzen Sie den Wert für NumberOfHumanWorkersPerDataObject auf 3. Dadurch werden 3 verschiedene Aufgaben für jeden Eintrag in Ihrer Eingabemanifestdatei erstellt. Um als erfolgreich gekennzeichnet markiert zu werden, müssen mindestens 3 verschiedene Auftragnehmer das Objekt kennzeichnen. Dadurch entstehen insgesamt 1 800 Aufgaben (600 x 3), die von Auftragnehmern erledigt werden müssen.

  3. Sie möchten, dass Auftragnehmern in ihrer Warteschlange in der Benutzeroberfläche des Auftragnehmerportals jeweils nur 100 Aufgaben angezeigt werden. Hierfür setzen Sie den Wert für MaxConcurrentTaskCount auf 100. Ground Truth füllt dann die Aufgabenwarteschlange im Auftragnehmerportal mit 100 Aufgaben pro Auftragnehmer.

  4. Der nächste Schritt hängt von der Art des von Ihnen erstellten Kennzeichnungsauftrags ab und davon, ob es sich um einen Streaming-Kennzeichnungsauftrag handelt.

    • Streaming-Kennzeichnungsauftrag: Solange die Gesamtzahl der Objekte, die Workern zur Verfügung stehen, MaxConcurrentTaskCount entspricht, werden alle verbleibenden Datensatzobjekte in Ihrer Eingabe-Manifestdatei und Datensatzobjekte, die Sie mit Amazon SNS in Echtzeit senden, in eine Amazon SQS-Warteschlange gestellt. Wenn die Gesamtzahl der für Worker verfügbaren Objekte unter MaxConcurrentTaskCount minus NumberOfHumanWorkersPerDataObject fällt, wird ein neues Datenobjekt aus der Warteschlange verwendet, um NumberOfHumanWorkersPerDataObject-Aufgaben zu erstellen, die in Echtzeit an Worker gesendet werden.

    • Kennzeichnungsauftrag ohne Streaming: Wenn Worker mit der Kennzeichnung einer Gruppe von Objekten fertig sind, werden bis zu MaxConcurrentTaskCount mal NumberOfHumanWorkersPerDataObject so viele neue Aufgaben an Worker gesendet. Dieser Vorgang wird wiederholt, bis alle Datenobjekte in der Eingabe-Manifestdatei gekennzeichnet sind.

Verwenden von Amazon SQS, um den Fluss von Datenobjekten zu Streaming-Kennzeichnungsaufträgen zu steuern

Wenn Sie einen Streaming-Kennzeichnungsauftrag erstellen, wird in Ihrem Konto automatisch eine Amazon SQS-Warteschlange erstellt. Datenobjekte werden der Amazon SQS-Warteschlange nur hinzugefügt, wenn die Gesamtzahl der an Worker gesendeten Objekte über MaxConcurrentTaskCount liegt. Andernfalls werden Objekte direkt an Worker gesendet.

Sie können diese Warteschlange zum Verwalten des Flusses von Datenobjekten zu Ihrem Kennzeichnungsauftrag verwenden. Weitere Informationen hierzu finden Sie unter Verwalten von Kennzeichnungsanfragen mit einer Amazon SQS-Warteschlange.