Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

# Eingabedaten
<a name="sms-data-input"></a>

Die Eingabedaten sind die Datenobjekte, die Sie an Ihre Arbeitskräfte zur Kennzeichnung senden. Es gibt zwei Möglichkeiten, Datenobjekte zur Kennzeichnung an Ground Truth zu senden: 
+ Senden Sie mithilfe einer Eingabemanifestdatei eine Liste von Datenobjekten, die beschriftet werden müssen.
+ Senden Sie einzelne Datenobjekte in Echtzeit an einen ständig laufenden Streaming-Kennzeichnungsauftrag. 

Wenn Sie einen Datensatz haben, der einmal beschriftet werden muss, und Sie keinen fortlaufenden Kennzeichnungsauftrag benötigen, erstellen Sie einen Standard-Kennzeichnungsauftrag mithilfe einer Eingabemanifestdatei. 

Wenn Sie regelmäßig neue Datenobjekte an Ihren Kennzeichnungsauftrag senden möchten, nachdem dieser gestartet wurde, erstellen Sie einen Streaming-Kennzeichnungsauftrag. Wenn Sie einen Streaming-Kennzeichnungsauftrag erstellen, können Sie optional eine Eingabemanifestdatei verwenden, um eine Gruppe von Daten anzugeben, die sofort beim Start des Auftrags beschriftet werden sollen. Sie können fortlaufend neue Datenobjekte an einen Streaming-Kennzeichnungsauftrag senden, solange dieser aktiv ist. 

**Anmerkung**  
 SageMaker Streaming-Labeling-Jobs werden nur über die API unterstützt. Sie können mit der SageMaker AI-Konsole keinen Streaming-Labeling-Job erstellen.

Für die folgenden Aufgabentypen gelten spezielle Anforderungen und Optionen für Eingabedaten:
+ Informationen zu den Anforderungen an die Eingabedaten für den [3D-Punktwolken-](https://docs.aws.amazon.com/sagemaker/latest/dg/sms-point-cloud.html)Kennzeichnungsauftrag finden Sie unter [3D-Punktwolkeneingabedaten](sms-point-cloud-input-data.md). 
+ Informationen zu den Anforderungen an die Eingabedaten für [Video-Frame](https://docs.aws.amazon.com/sagemaker/latest/dg/sms-video-task-types.html)-Kennzeichnungsaufträge finden Sie unter[Videoframe-Eingabedaten](sms-video-frame-input-data-overview.md).

**Topics**
+ [Eingabemanifestdateien](sms-input-data-input-manifest.md)
+ [Automatisieren der Dateneinrichtung für Kennzeichnungsaufträge](sms-console-create-manifest-file.md)
+ [Unterstützte Datumsformate](sms-supported-data-formats.md)
+ [Ground Truth Streaming-Kennzeichnungsaufträge](sms-streaming-labeling-job.md)
+ [Eingabedatenkontingente](input-data-limits.md)
+ [Auswahl der Daten für die Kennzeichnung](sms-data-filtering.md)

# Eingabemanifestdateien
<a name="sms-input-data-input-manifest"></a>

Jede Zeile in einer Eingabemanifestdatei ist ein Eintrag, der ein Objekt oder eine Referenz auf ein Objekt enthält, das beschriftet werden soll. Ein Eintrag kann auch Bezeichnungen aus früheren Aufträgen und bei einigen Aufgabentypen zusätzliche Informationen enthalten. 

Eingabedaten und die Manifestdatei müssen in Amazon Simple Storage Service (Amazon S3) gespeichert werden. Jeder verfügt über spezifische Speicher- und Zugriffsanforderungen, und zwar wie folgt:
+ Der Amazon S3 S3-Bucket, der die Eingabedaten enthält, muss sich in derselben AWS Region befinden, in der Sie Amazon SageMaker Ground Truth ausführen. Sie müssen Amazon SageMaker AI Zugriff auf die im Amazon S3-Bucket gespeicherten Daten gewähren, damit Amazon AI diese lesen kann. Weitere Informationen zu Amazon-S3-Buckets finden Sie unter [Arbeiten mit Amazon-S3-Buckets](https://docs.aws.amazon.com/AmazonS3/latest/dev/UsingBucket.html). 
+ Die Manifestdatei muss sich in derselben AWS Region wie die Datendateien befinden, sie muss sich jedoch nicht am selben Speicherort wie die Datendateien befinden. Es kann in jedem Amazon S3 S3-Bucket gespeichert werden, auf den die AWS Identity and Access Management (IAM) -Rolle zugegriffen werden kann, die Sie Ground Truth bei der Erstellung des Labeling-Jobs zugewiesen haben.

**Anmerkung**  
Für die [Aufgabentypen](https://docs.aws.amazon.com/sagemaker/latest/dg/sms-task-types.html) 3D-Punktwolke und Video-Frame gelten unterschiedliche Anforderungen und Attribute für das Eingabemanifest.   
Informationen zu [3D-Punktwolken-Aufgabentypen](https://docs.aws.amazon.com/sagemaker/latest/dg/sms-point-cloud.html) finden Sie unter [Eingabemanifestdateien für 3D-Punktwolken-Kennzeichnungsaufträge](sms-point-cloud-input-manifest.md).  
Informationen zu [Video-Frame-Aufgabentypen](https://docs.aws.amazon.com/sagemaker/latest/dg/sms-video-task-types.html) finden Sie unter [Erstellen einer Videoframe-Eingangsmanifestdatei](sms-video-manual-data-setup.md#sms-video-create-manifest).

Das Manifest ist eine gemäß UTF-8 kodierte Datei, in der jede Zeile ein vollständiges und gültiges JSON-Objekt ist. Jede Zeile wird durch einen Standardzeilenumbruch getrennt, \$1n oder \$1r\$1n. Da jede Zeile ein gültiges JSON-Objekt sein muss, sind Zeilenumbruchzeichen, die nicht durch Escape-Zeichen geschützt sind, nicht zulässig. Weitere Informationen zum Datenformat finden Sie unter [JSON Lines (JSON-Zeilen)](http://jsonlines.org/).

Jedes JSON-Objekt in der Manifestdatei darf nicht größer als 100.000 Zeichen sein. Kein einzelnes Attribut innerhalb eines Objekts darf größer als 20.000 Zeichen sein. Attributnamen können nicht mit `$` (Dollarzeichen) beginnen.

Jedes JSON-Objekt in der Manifestdatei muss einen der folgenden Schlüssel enthalten: `source-ref` oder `source`. Der Wert der Schlüssel wird wie folgt festgelegt:
+ `source-ref` – Die Quelle des Objekts ist das im Wert angegebene Amazon-S3-Objekt. Verwenden Sie diesen Wert, wenn es sich bei dem Objekt um ein binäres Objekt handelt, z. B. ein Bild.
+ `source` – Die Quelle des Objekts ist der Wert. Verwenden Sie diesen Wert, wenn das Objekt ein Textwert ist.


Nachfolgend finden Sie ein Beispiel einer Manifestdatei für Dateien, die in einem Amazon-S3-Bucket gespeichert sind:

```
{"source-ref": "S3 bucket location 1"}
{"source-ref": "S3 bucket location 2"}
   ...
{"source-ref": "S3 bucket location n"}
```

Sie verwenden den Schlüssel `source-ref` für Bilddateien für Begrenzungsrahmen, Bildklassifizierung (Single- und Multi-Label), semantische SegmentierungsLabeling-Aufgaben und Videoclips für Kennzeichnungsaufträge zur Videoklassifizierung. 3D-Punktwolken- und Videoframe-Kennzeichnungsaufträge verwenden ebenfalls den Schlüssel `source-ref`, aber für diese Kennzeichnungsaufträge sind zusätzliche Informationen in der Eingabemanifestdatei erforderlich. Weitere Informationen finden Sie unter [3D-Punktwolkeneingabedaten](sms-point-cloud-input-data.md) und [Videoframe-Eingabedaten](sms-video-frame-input-data-overview.md).

Im Folgenden finden Sie ein Beispiel für eine Manifestdatei mit den Eingabedaten, die im Manifest gespeichert sind:

```
{"source": "Lorem ipsum dolor sit amet"}
{"source": "consectetur adipiscing elit"}
   ...
{"source": "mollit anim id est laborum"}
```

Sie verwenden den `source`-Schlüssel für Single- und Multi-Label-Labeling-Aufgaben für Textklassifizierung und benannte Entitätserkennung, wenn der Text, den Sie kennzeichnen möchten, direkt in der Eingabemanifestdatei aufgelistet wird. 

Sie können auch andere Schlüssel-Wert-Paare in der Manifestdatei einschließen. Diese werden unverändert an die Ausgabedatei weitergeleitet. Dies ist nützlich, wenn Sie Informationen zwischen Ihren Anwendungen übertragen möchten. Weitere Informationen finden Sie unter [Ausgabedaten von Kennzeichnungsaufträgen](sms-data-output.md).

# Automatisieren der Dateneinrichtung für Kennzeichnungsaufträge
<a name="sms-console-create-manifest-file"></a>

Sie können die automatisierte Dateneinrichtung verwenden, um Manifestdateien für Ihre Kennzeichnungsaufträge in der Ground-Truth-Konsole mithilfe von Bildern, Videos, Video-Frames, Textdateien (.txt) und Dateien mit durch Kommas getrennten Werten (.csv) zu erstellen, die in Amazon S3 gespeichert sind. Wenn Sie die automatisierte Dateneinrichtung verwenden, geben Sie einen Amazon-S3-Speicherort an, an dem Ihre Eingabedaten gespeichert werden, und den Eingabedatentyp. Ground Truth sucht dann an dem von Ihnen angegebenen Speicherort nach den Dateien, die diesem Typ entsprechen.

**Anmerkung**  
Ground Truth verwendet keinen AWS KMS Schlüssel, um auf Ihre Eingabedaten zuzugreifen oder die Eingabemanifestdatei in den von Ihnen angegebenen Amazon S3 S3-Speicherort zu schreiben. Der Benutzer oder die Rolle, die den Kennzeichnungsauftrag erstellt, muss über Zugriffsberechtigungen für Ihre Eingabedatenobjekte in Amazon S3 verfügen.

Stellen Sie vor dem folgenden Verfahren sicher, dass die Eingabebilder oder -dateien korrekt formatiert sind:
+ Bilddateien – Bilddateien müssen die Größen- und Auflösungsgrenzen erfüllen, die in den Tabellen unter [Größenkontingent für Eingabedateien](input-data-limits.md#input-file-size-limit) aufgeführt sind. 
+ Textdateien – Textdaten können in einer oder mehreren TXT-Dateien gespeichert werden. Jedes Element, das gekennzeichnet werden soll, muss durch einen Standardzeilenumbruch getrennt werden. 
+ CSV-Dateien – Textdaten können in einer oder mehreren CSV-Dateien gespeichert werden. Jedes Element, das gekennzeichnet werden soll, muss sich in einer separaten Zeile befinden.
+ Videos – Videodateien können eines der folgenden Formate haben: .mp4, .ogg und .webm. Informationen zum Extrahieren von Video-Frames aus Ihren Videodateien zur Objekterkennung oder Objektverfolgung finden Sie unter [Videodateien zur Verfügung stellen](sms-point-cloud-video-input-data.md#sms-point-cloud-video-frame-extraction).
+ Video-Frames – Video-Frames sind Bilder, die aus Videos extrahiert wurden. Alle aus einem einzelnen Video extrahierten Bilder werden als *Sequenz von Video-Frames* bezeichnet. Jede Sequenz von Video-Frames muss in Amazon S3 eindeutige Präfixschlüssel haben. Siehe [Stellen Sie Videoframes bereit](sms-point-cloud-video-input-data.md#sms-video-provide-frames). Informationen zu diesem Datentyp finden Sie unter [Einrichten automatisierter Video-Frame-Eingabedaten](sms-video-automated-data-setup.md).

**Wichtig**  
Informationen zur Erkennung von Video-Frame-Objekten und für Kennzeichnungsaufträge zur Video-Frame-Objekterkennung finden Sie unter [Einrichten automatisierter Video-Frame-Eingabedaten](sms-video-automated-data-setup.md). Hier erfahren Sie, wie Sie die automatisierte Dateneinrichtung verwenden. 

Verwenden Sie diese Anweisungen, um Ihre Eingabedatensatz-Verbindung mit Ground Truth automatisch einzurichten.

**Automatisches Verbinden Ihrer Daten in Amazon S3 mit Ground Truth**

1. Navigieren Sie in der Amazon SageMaker AI-Konsole zur Seite „**Labeling-Job erstellen**“ unter [https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/). 

   Über diesen Link gelangen Sie in die Region North Virginia (US-East-1) AWS . Wenn sich Ihre Eingabedaten in einem Amazon-S3-Bucket in einer anderen Region befinden, wechseln Sie in diese Region. Um Ihre AWS Region zu ändern, wählen Sie in der [Navigationsleiste](https://docs.aws.amazon.com/awsconsolehelpdocs/latest/gsg/getting-started.html#select-region) den Namen der aktuell angezeigten Region aus.

1. Wählen Sie **Beschriftungsauftrag erstellen** aus.

1. Geben Sie einen **Auftragsnamen** ein. 

1. Wählen Sie im Abschnitt **Einrichtung der Eingabedaten** die Option **Automatisierte Dateneinrichtung** aus.

1. Geben Sie eine Amazon-S3-URI für **S3-Standort für Eingabedatensätze** ein. 

1. Geben Sie Ihren **S3-Standort für Ausgabedatensätze** an. Dies ist der Ort, an dem Ihre Ausgabedaten gespeichert werden. 

1. Wählen Sie Ihren **Datentyp** mithilfe der Dropdown-Liste aus.

1. Verwenden Sie das Dropdown-Menü unter **IAM-Rolle**, um eine Ausführungsrolle auszuwählen. Wenn Sie **Eine neue Rolle erstellen** auswählen, geben Sie die Amazon-S3-Buckets an, auf die Sie dieser Rolle Zugriff gewähren möchten. Diese Rolle muss über die Zugriffsberechtigung für die S3-Buckets verfügen, die Sie in den Schritten 5 und 6 angegeben haben.

1. Wählen Sie **Dateneinrichtung fertigstellen** aus.

Dadurch wird ein Eingabemanifest am Amazon-S3-Speicherort für Eingabedatensätze erstellt, die Sie in Schritt 5 angegeben haben. Wenn Sie einen Label-Job mithilfe der SageMaker API, oder eines AWS SDK erstellen AWS CLI, verwenden Sie den Amazon S3 S3-URI für diese Eingabe-Manifestdatei als Eingabe für den Parameter`ManifestS3Uri`. 

Das folgende GIF zeigt, wie Sie die automatisierte Dateneinrichtung für Bilddaten verwenden können. In diesem Beispiel wird eine Datei `dataset-YYMMDDTHHMMSS.manifest` im Amazon-S3-Bucket `example-groundtruth-images` erstellt, wobei `YYMMDDTHHmmSS` das Jahr (`YY`), den Monat (`MM`), den Tag (`DD`) und die Uhrzeit in Stunden (`HH`), Minuten (`mm`) und Sekunden (`ss`) angibt, zu der die Eingabemanifestdatei erstellt wurde. 

![\[GIF, das zeigt, wie Sie die automatisierte Dateneinrichtung für Bilddaten verwenden können\]](http://docs.aws.amazon.com/de_de/sagemaker/latest/dg/images/sms/gifs/automated-data-setup.gif)


# Unterstützte Datumsformate
<a name="sms-supported-data-formats"></a>

Wenn Sie manuell eine Eingabemanifestdatei für einen [integrierten Aufgabentyp](https://docs.aws.amazon.com/sagemaker/latest/dg/sms-task-types.html) erstellen, müssen Ihre Eingabedaten in einem der folgenden unterstützten Dateiformate für den jeweiligen Eingabedatentyp vorliegen. Weitere Informationen zur automatisierten Dateneinrichtung finden Sie unter [Automatisieren der Dateneinrichtung für Kennzeichnungsaufträge](sms-console-create-manifest-file.md).

**Tipp**  
Wenn Sie die automatisierte Dateneinrichtung verwenden, können zusätzliche Formate verwendet werden, um eine Eingabemanifestdatei für Video-Frame- und textbasierte Aufgabentypen zu generieren.


****  

| Aufgabentypen | Eingabedatentyp | Unterstützte Formate | Beispiel für eine Zeile mit einem Eingabemanifest | 
| --- | --- | --- | --- | 
|  Begrenzungsrahmen, semantische Segmentierung, Bildklassifizierung (Single-Label und Multi-Label), Bezeichnungen überprüfen und anpassen  |  Image  |  .jpg, .jpeg, .png  |  <pre>{"source-ref": "s3://amzn-s3-demo-bucket1/example-image.png"}</pre>  | 
|  Erkennung benannter Entitäten, Textklassifizierung (Single- und Multi-Label)  | Text | Rohtext |  <pre>{"source": "Lorem ipsum dolor sit amet"}</pre>  | 
|  Videoklassifizierung  | Videoclips | .mp4, .ogg und .webm |  <pre>{"source-ref": "s3:///example-video.mp4"}</pre>  | 
| Erkennung von Video-Frame-Objekten, Verfolgung von Video-Frame-Objekten (Begrenzungsrahmen, Polylinien, Polygone oder Schlüsselpunkte) | Video-Frames und Video-Frame-Sequenzdateien (für die Objektverfolgung) |  **Video-Frames**: .jpg, .jpeg, .png **Sequenzdateien**: .json  | Weitere Informationen finden Sie unter [Erstellen einer Videoframe-Eingangsmanifestdatei](sms-video-manual-data-setup.md#sms-video-create-manifest). | 
|  Semantische 3D-Punktwolken-Segmentierung, 3D-Punktwolken-Objekterkennung, 3D-Punktwolken-Objektverfolgung  | Punktwolken und Punktwolken-Sequenzdateien (für die Objektverfolgung) |  **Punktwolken**: Binäres Paketformat und ASCII. Weitere Informationen finden Sie unter [Akzeptierte 3D-Rohdatenformate](sms-point-cloud-raw-data-types.md). **Sequenzdateien**: .json  | Weitere Informationen finden Sie unter [Eingabemanifestdateien für 3D-Punktwolken-Kennzeichnungsaufträge](sms-point-cloud-input-manifest.md). | 

# Ground Truth Streaming-Kennzeichnungsaufträge
<a name="sms-streaming-labeling-job"></a>

Wenn Sie ständig neue Datenobjekte zur Kennzeichnung an Amazon SageMaker Ground Truth senden möchten, verwenden Sie einen Streaming-Labeling-Job. Streaming-Kennzeichnungsaufträge ermöglichen Ihnen Folgendes:
+ Sie können mithilfe eines ständig laufenden Kennzeichnungsauftrags neue Datensatz-Objekte in Echtzeit an Auftragnehmer senden. Auftragnehmer erhalten kontinuierlich neue Datenobjekte zum Beschriften, solange der Kennzeichnungsauftrag aktiv ist und neue Objekte an ihn gesendet werden.
+ Sie können sich einen Überblick über die Anzahl der Objekte verschaffen, die sich in der Warteschlange befinden und darauf warten, beschriftet zu werden. Verwenden Sie diese Informationen, um den Fluss der Datenobjekte zu steuern, die an Ihren Kennzeichnungsauftrag gesendet werden.
+ Sie können Bezeichnungsdaten für einzelne Datenobjekte in Echtzeit erhalten, wenn Auftragnehmer die Bezeichnungen beendet haben. 

Ground Truth Streaming-Kennzeichnungsaufträge bleiben aktiv, bis sie manuell gestoppt werden oder länger als 10 Tage inaktiv waren. Sie können zeitweise neue Datenobjekte an Auftragnehmer senden, solange der Kennzeichnungsauftrag aktiv ist.

Wenn Sie ein neuer Benutzer von Ground Truth Streaming-Kennzeichnungsaufträgen sind, wird empfohlen, [Funktionsweise](#sms-streaming-how-it-works) zu lesen. 

Mithilfe von [Erstellen eines Streaming-Beschriftungsjobs](sms-streaming-create-job.md) erfahren Sie, wie Sie einen Streaming-Kennzeichnungsauftrag erstellen.

**Anmerkung**  
Ground Truth Streaming-Labeling-Jobs werden nur über die SageMaker API unterstützt.

## Funktionsweise
<a name="sms-streaming-how-it-works"></a>

Wenn Sie einen Ground Truth Streaming-Kennzeichnungsauftrag erstellen, bleibt der Auftrag aktiv, bis er manuell gestoppt wird, länger als 10 Tage inaktiv ist oder nicht auf Eingabedatenquellen zugreifen kann. Sie können zeitweise neue Datenobjekte an Auftragnehmer senden, solange der Vorgang aktiv ist. Ein Auftragnehmer kann weiterhin neue Datenobjekte in Echtzeit empfangen, solange die Gesamtzahl der Aufgaben, die dem Auftragnehmer derzeit zur Verfügung stehen, geringer ist als der Wert in [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_HumanTaskConfig.html#sagemaker-Type-HumanTaskConfig-MaxConcurrentTaskCount](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_HumanTaskConfig.html#sagemaker-Type-HumanTaskConfig-MaxConcurrentTaskCount). Andernfalls wird das Datenobjekt zur späteren Verarbeitung an eine Warteschlange gesendet, die Ground Truth in Ihrem Namen in [Amazon Simple Queue Service](https://docs.aws.amazon.com/AWSSimpleQueueService/latest/SQSDeveloperGuide/welcome.html) (Amazon SQS) erstellt. Diese Aufgaben werden an Auftragnehmer gesendet, sobald die Gesamtzahl der Aufgaben, die einem Auftragnehmer derzeit zur Verfügung stehen, `MaxConcurrentTaskCount` unterschreitet. Wenn ein Datenobjekt nach 14 Tagen nicht an einen Auftragnehmer gesendet wird, läuft es ab. Sie können die Anzahl der ausstehenden Aufgaben in der Warteschlange anzeigen und die Anzahl der Objekte anpassen, die Sie an den Kennzeichnungsauftrag senden. Sie können beispielsweise die Geschwindigkeit verringern, mit der Sie Objekte an den Kennzeichnungsauftrag senden, wenn der Backlog an ausstehenden Objekten einen Schwellenwert überschreitet. 

**Topics**
+ [Funktionsweise](#sms-streaming-how-it-works)
+ [Senden von Daten an einen Streaming-Kennzeichnungsauftrag](sms-streaming-how-it-works-send-data.md)
+ [Verwalten von Kennzeichnungsanfragen mit einer Amazon SQS-Warteschlange](sms-streaming-how-it-works-sqs.md)
+ [Empfangen von Ausgabedaten aus einem Streaming-Kennzeichnungsauftrag](sms-streaming-how-it-works-output-data.md)
+ [Umgang mit doppelten Nachrichten](sms-streaming-impotency.md)

# Senden von Daten an einen Streaming-Kennzeichnungsauftrag
<a name="sms-streaming-how-it-works-send-data"></a>

Sie können optional einmalig Eingabedaten an einen Streaming-Kennzeichnungsauftrag senden, wenn Sie den Kennzeichnungsauftrag mithilfe einer Eingabemanifestdatei erstellen. Sobald der Kennzeichnungsauftrag gestartet wurde und der Status `InProgress` lautet, können Sie mithilfe Ihres Amazon SNS-Eingabethemas und der Amazon-S3-Ereignisbenachrichtigungen in Echtzeit neue Datenobjekte an den Kennzeichnungsauftrag senden. 

***Reichen Sie Datenobjekte ein, wenn Sie den Kennzeichnungsauftrag starten (einmalig):***
+ **Eine Eingabemanifestdatei verwenden** – Sie können optional eine Eingabemanifestdatei mit Amazon-S3-URI in `ManifestS3Uri` angeben, wenn Sie den Streaming-Labeling-Auftrag erstellen. Ground Truth sendet jedes Datenobjekt in der Manifestdatei zur Kennzeichnung an die Mitarbeiter, sobald der Kennzeichnungsauftrag gestartet wird. Weitere Informationen hierzu finden Sie unter [Erstellen Sie eine Manifestdatei (optional)](sms-streaming-manifest.md).

  Nachdem Sie eine Anforderung zur Erstellung des Streaming-Kennzeichnungsauftrags abgesendet haben, lautet der Status `Initializing`. Sobald der Kennzeichnungsauftrag aktiv ist, ändert sich der Status in `InProgress`. Sie können dann Echtzeitoptionen verwenden, um zusätzliche Datenobjekte zur Kennzeichnung zu senden. 

***Datenobjekte in Echtzeit senden:***
+ **Datenobjekte mithilfe von Amazon SNS-Nachrichten** senden – Sie können Ground Truth neue Datenobjekte zur Kennzeichnung senden, indem Sie eine Amazon SNS-Nachricht senden. Sie senden diese Nachricht an ein Amazon SNS-Eingabethema, das Sie bei der Erstellung des Streaming-Kennzeichnungsauftrags erstellen und angeben. Weitere Informationen finden Sie unter [Senden von Datenobjekten mit Amazon SNS](#sms-streaming-how-it-works-sns).
+ **Datenobjekte senden, indem Sie sie in einem Amazon-S3-Bucket platzieren** – Jedes Mal, wenn Sie einem Amazon-S3-Bucket ein neues Datenobjekt hinzufügen, können Sie Ground Truth auffordern, dieses Objekt zur Kennzeichnung zu verarbeiten. Dazu fügen Sie dem Bucket eine Ereignisbenachrichtigung hinzu, sodass Ihr Amazon SNS-Eingabethema jedes Mal benachrichtigt wird, wenn ein neues Objekt zu diesem Bucket hinzugefügt (oder *in diesem erstellt*) wird. Weitere Informationen finden Sie unter [Senden von Datenobjekten mit Amazon S3](#sms-streaming-how-it-works-s3). Diese Option ist nicht für textbasierte Labeling-Aufgaben wie Textklassifizierung und Erkennung benannter Entitäten verfügbar. 
**Wichtig**  
Wenn Sie die Amazon-S3-Konfiguration verwenden, verwenden Sie nicht denselben Amazon-S3-Speicherort für Ihre Eingabedatenkonfiguration und Ihre Ausgabedaten. Sie geben das S3-Präfix für Ihre Ausgabedaten an, wenn Sie einen Kennzeichnungsauftrag erstellen.

## Senden von Datenobjekten mit Amazon SNS
<a name="sms-streaming-how-it-works-sns"></a>

Mit Amazon Simple Notification Service (Amazon SNS) können Sie Datenobjekte an Ihren Streaming-Kennzeichnungsauftrag senden. Amazon SNS ist ein Webservice, der die Zustellung von Nachrichten an und von *Endpunkten* (z. B. eine E-Mail-Adresse oder AWS Lambda Funktion) koordiniert und verwaltet. Ein Amazon SNS-*Thema* fungiert als Kommunikationskanal zwischen zwei oder mehr Endpunkten. Sie verwenden Amazon SNS, um neue Datenobjekte an das im [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateLabelingJob.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateLabelingJob.html)-Parameter `SnsTopicArn` in `InputConfig` angegebene Thema zu senden oder zu *veröffentlichen*. Das Format dieser Nachrichten entspricht dem einer einzelnen Zeile aus einer [Eingabemanifestdatei](https://docs.aws.amazon.com/sagemaker/latest/dg/sms-data-input.html). 

Sie können beispielsweise einen Text an einen aktiven Kennzeichnungsauftrag der Textklassifizierung senden, indem Sie ihn in Ihrem Eingabethema veröffentlichen. Die von Ihnen veröffentlichte Nachricht könnte wie folgt aussehen:

```
{"source": "Lorem ipsum dolor sit amet"}
```

Um ein neues Bildobjekt an einen Kennzeichnungsauftrag der Bildklassifizierung zu senden, könnte Ihre Nachricht wie folgt aussehen:

```
{"source-ref": "s3://amzn-s3-demo-bucket/example-image.jpg"}
```

**Anmerkung**  
Sie können Ihren Amazon SNS SNS-Nachrichten auch benutzerdefinierte IDs Deduplizierungs- und Deduplizierungsschlüssel hinzufügen. Weitere Informationen hierzu finden Sie unter [Umgang mit doppelten Nachrichten](sms-streaming-impotency.md).

Wenn Ground Truth Ihren Streaming-Kennzeichnungsauftrag erstellt, abonniert es Ihr Amazon SNS-Eingabethema. 

## Senden von Datenobjekten mit Amazon S3
<a name="sms-streaming-how-it-works-s3"></a>

Sie können ein oder mehrere neue Datenobjekte an einen Streaming-Kennzeichnungsauftrag senden, indem Sie sie in einem Amazon-S3-Bucket platzieren, der mit einer Amazon SNS-Ereignisbenachrichtigung konfiguriert ist. Sie können ein Ereignis so einrichten, dass Ihr Amazon SNS-Eingabethema jedes Mal benachrichtigt wird, wenn in Ihrem Bucket ein neues Objekt erstellt wird. Sie müssen dasselbe Amazon SNS-Eingabethema im [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateLabelingJob.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateLabelingJob.html)-Parameter `SnsTopicArn` in `InputConfig` angeben.

Jedes Mal, wenn Sie einen Amazon-S3-Bucket so konfigurieren, dass er Benachrichtigungen an Amazon SNS sendet, veröffentlicht Ground Truth ein Testereignis, `"s3:TestEvent"`, um sicherzustellen, dass das Thema existiert und der Besitzer des angegebenen Amazon-S3-Buckets berechtigt ist, zu dem angegebenen Thema zu veröffentlichen. Es wird empfohlen, dass die Amazon-S3-Verbindung mit Amazon SNS einzurichten, bevor Sie einen Streaming-Kennzeichnungsauftrag starten. Wenn Sie dies nicht tun, kann dieses Testereignis als Datenobjekt registriert und zur Kennzeichnung an Ground Truth gesendet werden. 

**Wichtig**  
Wenn Sie die Amazon-S3-Konfiguration verwenden, verwenden Sie nicht denselben Amazon-S3-Speicherort für Ihre Eingabedatenkonfiguration und Ihre Ausgabedaten. Sie geben das S3-Präfix für Ihre Ausgabedaten an, wenn Sie einen Kennzeichnungsauftrag erstellen.  
Bei bildbasierten Kennzeichnungsaufträge verlangt Ground Truth, dass an alle S3-Buckets eine CORS-Richtlinie angefügt wird. Weitere Informationen hierzu finden Sie unter [CORS-Anforderung für Eingabebilddaten](sms-cors-update.md).

Sobald Sie Ihren Amazon-S3-Bucket konfiguriert und Ihren Kennzeichnungsauftrag erstellt haben, können Sie Ihrem Bucket Objekte hinzufügen. Ground Truth sendet dieses Objekt dann entweder an Auftragnehmer oder platziert es in Ihrer Amazon SQS-Warteschlange. 

Weitere Informationen hierzu finden Sie unter [Erstellen von Amazon-S3-basierten Bucket-Ereignisbenachrichtigungen gemäß dem in Ihrem Labeling-Job definierten Amazon SNS](sms-streaming-s3-setup.md).

**Wichtig**  
Diese Option ist nicht für textbasierte Kennzeichnungsaufträge wie Textklassifizierung und Erkennung benannter Entitäten verfügbar.

# Verwalten von Kennzeichnungsanfragen mit einer Amazon SQS-Warteschlange
<a name="sms-streaming-how-it-works-sqs"></a>

Wenn Ground Truth Ihren Streaming-Labeling-Job erstellt, erstellt es eine Amazon SQS SQS-Warteschlange in dem AWS Konto, das zur Erstellung des Labeling-Jobs verwendet wurde. Der Warteschlangenname ist `GroundTruth-labeling_job_name`, wobei `labeling_job_name` der Name Ihres Kennzeichnungsauftrags in Kleinbuchstaben ist. Wenn Sie Datenobjekte an Ihren Kennzeichnungsauftrag senden, sendet Ground Truth die Datenobjekte entweder direkt an Auftragnehmer oder stellt die Aufgabe zur späteren Verarbeitung in Ihre Warteschlange. Wenn ein Datenobjekt nach 14 Tagen nicht an einen Auftragnehmer gesendet wird, läuft es ab und wird aus der Warteschlange entfernt. Sie können in Amazon SQS einen Alarm einrichten, um zu erkennen, wann Objekte ablaufen. Mit diesem Mechanismus können Sie die Menge der Objekte steuern, die Sie an Ihren Kennzeichnungsauftrag senden.

**Wichtig**  
Das Ändern, Löschen oder Senden von Objekten direkt an die Amazon-SQS-Warteschlange, die mit Ihrem Streaming-Kennzeichnungsauftrag verknüpft ist, kann zu Auftragsfehlern führen. 

# Empfangen von Ausgabedaten aus einem Streaming-Kennzeichnungsauftrag
<a name="sms-streaming-how-it-works-output-data"></a>

Ihr Amazon-S3-Ausgabe-Bucket wird regelmäßig mit neuen Ausgabedaten aus Ihrem Streaming-Kennzeichnungsauftrag aktualisiert. Optional können Sie ein Amazon-SNS-Ausgabethema angeben. Jedes Mal, wenn ein Auftragnehmer ein beschriftetes Objekt sendet, wird eine Benachrichtigung mit den Ausgabedaten an dieses Thema gesendet. Sie können einen Endpunkt für Ihr SNS-Ausgabethema abonnieren, um Benachrichtigungen zu erhalten oder Ereignisse auszulösen, wenn Sie Ausgabedaten von einer Labeling-Aufgabe erhalten. Verwenden Sie ein Amazon-SNS-Ausgabethema, wenn Sie in Echtzeit eine Verkettung mit einem anderen Kennzeichnungsauftrag durchführen und jedes Mal, wenn ein Datenobjekt von einem Auftragnehmer gesendet wird, eine Amazon-SNS-Benachrichtigung erhalten möchten.

Weitere Informationen hierzu finden Sie unter [Abonnieren Sie einen Endpunkt für Ihr Amazon SNS-Ausgabe-Thema](sms-create-sns-input-topic.md#sms-streaming-subscribe-output-topic).

# Umgang mit doppelten Nachrichten
<a name="sms-streaming-impotency"></a>

Bei Datenobjekten, die in Echtzeit gesendet werden, garantiert Ground-Truth-Idempotenz, indem sichergestellt wird, dass jedes eindeutige Objekt nur einmal zur Kennzeichnung gesendet wird, auch wenn die auf dieses Objekt bezogene Eingabenachricht mehrfach empfangen wird (doppelte Nachrichten). Zu diesem Zweck wird jedem Datenobjekt, das an einen Streaming-Kennzeichnungsauftrag gesendet wird, eine *Deduplizierungs-ID* zugewiesen, die mit einem *Deduplizierungsschlüssel* identifiziert wird. Wenn Sie Ihre Anfragen zur Kennzeichnung von Datenobjekten direkt über Ihr Amazon SNS SNS-Eingabethema mithilfe von Amazon SNS SNS-Nachrichten senden, können Sie optional einen benutzerdefinierten Deduplizierungsschlüssel und eine Deduplizierung für Ihre Objekte wählen. IDs Weitere Informationen finden Sie unter [Angeben eines Deduplizierungsschlüssels und einer ID in einer Amazon-SNS-Nachricht](sms-streaming-impotency-create.md).

Wenn Sie keinen eigenen Deduplizierungsschlüssel bereitstellen oder die Amazon-S3-Konfiguration verwenden, um Datenobjekte an Ihren Kennzeichnungsauftrag zu senden, verwendet Ground Truth eine der folgenden Optionen für die Deduplizierungs-ID:
+ Für Nachrichten, die direkt an Ihr Amazon-SNS-Eingabethema gesendet werden, verwendet Ground Truth die SNS-Nachrichten-ID. 
+ Für Nachrichten, die aus einer Amazon-S3-Konfiguration stammen, erstellt Ground Truth eine Deduplizierungs-ID, indem es den Amazon-S3-URI des Objekts mit dem [Sequencer-Token](https://docs.aws.amazon.com/AmazonS3/latest/dev/notification-content-structure.html) in der Nachricht kombiniert.

# Angeben eines Deduplizierungsschlüssels und einer ID in einer Amazon-SNS-Nachricht
<a name="sms-streaming-impotency-create"></a>

Wenn Sie mithilfe einer Amazon-SNS-Nachricht ein Datenobjekt an Ihren Streaming-Kennzeichnungsauftrag senden, haben Sie die Möglichkeit, Ihren Deduplizierungsschlüssel und Ihre Deduplizierungs-ID auf eine der folgenden Arten anzugeben. Identifizieren Sie in all diesen Szenarien Ihren Deduplizierungsschlüssel mit `dataset-objectid-attribute-name`.

**Mitbringen eines eigenen Deduplizierungsschlüssels und einer eigenen Deduplizierungs-ID**

Erstellen Sie einen eigenen Deduplizierungsschlüssel und eine eigene Deduplizierungs-ID, indem Sie Ihre Amazon -SNS-Nachricht wie folgt konfigurieren. Ersetzen Sie `byo-key` durch Ihren Schlüssel und `UniqueId` durch die Deduplizierungs-ID für dieses Datenobjekt.

```
{
    "source-ref":"s3://amzn-s3-demo-bucket/prefix/object1", 
    "dataset-objectid-attribute-name":"byo-key",
    "byo-key":"UniqueId" 
}
```

Ihr Deduplizierungsschlüssel kann bis zu 140 Zeichen enthalten. Folgende Muster werden unterstützt: `"^[$a-zA-Z0-9](-*[a-zA-Z0-9])*"`.

Ihre Deduplizierungs-ID kann bis zu 1.024 Zeichen enthalten. Folgende Muster werden unterstützt: `^(https|s3)://([^/]+)/?(.*)$`.

**Verwenden eines vorhandenen Schlüssels als Deduplizierungsschlüssel**

Sie können einen vorhandenen Schlüssel in Ihrer Nachricht als Deduplizierungsschlüssel verwenden. In diesem Fall wird der mit diesem Schlüssel verknüpfte Wert für die Deduplizierungs-ID verwendet. 

Sie können beispielsweise angeben, den `source-ref`-Schlüssel als Deduplizierungsschlüssel zu verwenden, indem Sie Ihre Nachricht wie folgt formatieren: 

```
{
    "source-ref":"s3://amzn-s3-demo-bucket/prefix/object1",
    "dataset-objectid-attribute-name":"source-ref" 
}
```

In diesem Beispiel verwendet Ground Truth `"s3://amzn-s3-demo-bucket/prefix/object1"` als Deduplizierungs-ID.

# Suchen des Deduplizierungsschlüssels und der ID in Ihren Ausgabedaten
<a name="sms-streaming-impotency-output"></a>

Sie können den Deduplizierungsschlüssel und die ID in Ihren Ausgabedaten sehen. Der Deduplizierungsschlüssel wird durch `dataset-objectid-attribute-name` identifiziert. Wenn Sie einen eigenen benutzerdefinierten Deduplizierungsschlüssel verwenden, sieht Ihre Ausgabe ungefähr so aus:

```
"dataset-objectid-attribute-name": "byo-key",
"byo-key": "UniqueId",
```

Wenn Sie keinen Schlüssel angeben, finden Sie die Deduplizierungs-ID, die Ground Truth Ihrem Datenobjekt zugewiesen hat, wie folgt. Der Parameter `$label-attribute-name-object-id` identifiziert Ihre Deduplizierungs-ID. 

```
{
    "source-ref":"s3://bucket/prefix/object1", 
    "dataset-objectid-attribute-name":"$label-attribute-name-object-id"
    "label-attribute-name" :0,
    "label-attribute-name-metadata": {...},
    "$label-attribute-name-object-id":"<service-generated-key>"
}
```

Wenn das Datenobjekt eine Amazon-S3-Konfiguration durchlaufen hat, fügt Ground Truth für `<service-generated-key>` einen eindeutigen Wert hinzu, der vom Service verwendet wird, und gibt ein neues Feld aus, das durch `$sequencer` gekennzeichnet ist, das den verwendeten Amazon-S3-Sequencer anzeigt. Wenn das Objekt direkt an SNS gesendet wurde, verwendet Ground Truth die SNS-Nachrichten-ID.

**Anmerkung**  
Verwenden Sie das `$`-Zeichen nicht im Kennzeichnungsattributnamen. 

# Eingabedatenkontingente
<a name="input-data-limits"></a>

Eingabedatensätze, die in Labeling-Aufträgen der semantischen Segmentierung verwendet werden, haben ein Kontingent von 20.000 Elementen. Für alle anderen Kennzeichnungsauftragstypen beträgt das Größenkontingent für den Datensatz 100.000 Elemente. Um eine Erhöhung des Kontingents für andere Kennzeichnungsaufträge als semantische Segmentierungsaufträge zu beantragen, schauen Sie sich die Verfahren in [AWS -Service Quotas](https://docs.aws.amazon.com/general/latest/gr/aws_service_limits.html) an, um eine Kontingenterhöhung anzufordern.

Eingabe-Image-Daten für aktive und nicht-aktive Lern-Kennzeichnungsaufträge dürfen die Größen- und Auflösungskontingente nicht überschreiten. *Aktives Lernen* bezieht sich auf Labeling-Aufträge, die [automatisiertes Daten-Labeling](https://docs.aws.amazon.com/sagemaker/latest/dg/sms-automated-labeling.html) verwenden. *Nicht-aktives Lernen* bezieht sich auf Kennzeichnungsaufträge, die kein automatisiertes Daten-Labeling verwenden.

Zusätzliche Kontingente gelten für Kennzeichnungskategorien für alle Aufgabentypen und für Eingabedaten und Attribute der Kennzeichnungskategorie für 3D-Punktwolken- und Video-Frame-Aufgabentypen. 

## Größenkontingent für Eingabedateien
<a name="input-file-size-limit"></a>

Eingabedateien dürfen die folgenden Größenkontingente sowohl für aktive als auch für nicht-aktive Lern-Kennzeichnungsaufträge nicht überschreiten. Es gibt kein Größenkontingent für Eingabedateien für Videos, die bei Kennzeichnungsaufträgen zur [Videoklassifizierung](https://docs.aws.amazon.com/sagemaker/latest/dg/sms-video-classification.html) verwendet werden.


| Aufgabentyp des Kennzeichnungsauftrags | Größenkontingent für Eingabedateien | 
| --- | --- | 
| Bildklassifizierung | 40 MB | 
| Begrenzungsrahmen (Objekterkennung) | 40 MB | 
| Semantische Segmentierung | 40 MB | 
| Anpassen des Begrenzungsrahmens (Objekterkennung) | 40 MB | 
| Anpassen der semantischen Segmentierungskennzeichnung | 40 MB | 
| Verifizieren des Begrenzungsrahmens (Objekterkennung) | 40 MB | 
| Verifizieren der semantischen Segmentierungskennzeichnung | 40 MB | 

## Kontingente für die Eingabebildauflösung
<a name="non-active-learning-input-data-limits"></a>

Die Bilddateiauflösung bezieht sich auf die Anzahl der Pixel in einem Bild und bestimmt die Detailgenauigkeit eines Bildes. Die Kontingente für die Bildauflösung unterscheiden sich je nach Art des Labeling-Auftrags und dem SageMaker verwendeten integrierten KI-Algorithmus. In der folgenden Tabelle sind die Auflösungskontingente für Bilder aufgeführt, die in aktiven und nicht-aktiven Lern-Kennzeichnungsaufträgen verwendet werden.


| Aufgabentyp des Kennzeichnungsauftrags | **Auflösungskontingent – nicht-aktives Lernen** | Auflösungskontingent – aktives Lernen | 
| --- | --- | --- | 
| Bildklassifizierung | 100 Millionen Pixel | 3840 x 2160 Pixel (4 KB) | 
| Begrenzungsrahmen (Objekterkennung) | 100 Millionen Pixel | 3840 x 2160 Pixel (4 KB) | 
| Semantische Segmentierung | 100 Millionen Pixel | 1.920 x 1.080 Pixel (1080 p) | 
| Anpassen der Objekterkennungskennzeichnung | 100 Millionen Pixel | 3840 x 2160 Pixel (4 KB) | 
| Anpassen der semantischen Segmentierungskennzeichnung | 100 Millionen Pixel | 1.920 x 1.080 Pixel (1080 p) | 
| Verifizieren der Objekterkennungskennzeichnung | 100 Millionen Pixel | Nicht verfügbar | 
| Verifizieren der semantischen Segmentierungskennzeichnung | 100 Millionen Pixel | Nicht verfügbar | 

## Kontingente für Kennzeichnungskategorien
<a name="sms-label-quotas"></a>

Jeder Aufgabentyp für Kennzeichnungsaufträge hat ein Kontingent für die Anzahl der Kennzeichnungskategorien, die Sie angeben können. Auftragnehmer wählen Kennzeichnungskategorien aus, um Anmerkungen zu erstellen. Sie können beispielsweise die Kennzeichnungskategorien *Auto*, *Fußgänger* und *Fahrradfahrer* angeben, wenn Sie einen Kennzeichnungsauftrag mit Begrenzungsrahmen erstellen. Die Auswahl wählen dann die Kategorie *Auto* aus, bevor sie Begrenzungsrahmen um Autos zeichnen.

**Wichtig**  
Namen von Kennzeichnungskategorien dürfen max. 256 Zeichen lang sein.   
Alle Kennzeichnungskategorien müssen eindeutig sein. Sie dürfen keine doppelten Kennzeichnungskategorien angeben. 

Die folgenden Beschränkungen für Kennzeichnungskategorien gelten für Kennzeichnungsaufträge. Die Kontingente für Label-Kategorien hängen davon ab, ob Sie den SageMaker API-Vorgang `CreateLabelingJob` oder die Konsole verwenden, um einen Labeling-Job zu erstellen.


****  

| Aufgabentyp des Kennzeichnungsauftrags | Kontingent für Kennzeichnungskategorien – API | Kontingent für Kennzeichnungskategorie – Konsole | 
| --- | --- | --- | 
| Bildklassifizierung (Multi-Label) | 50 | 50 | 
| Bildklassifizierung (Einzelne Bezeichnung) | Unbegrenzt | 30 | 
| Begrenzungsrahmen (Objekterkennung) | 50 | 50 | 
| Kennzeichnungsverifizierung | Unbegrenzt | 30 | 
| Semantische Segmentierung (mit aktivem Lernen) | 20 | 10 | 
| Semantische Segmentierung (ohne aktives Lernen) | Unbegrenzt | 10 | 
| Erkennung benannter Entitäten | Unbegrenzt | 30 | 
| Textklassifizierung (Multi-Label) | 50 | 50 | 
| Textklassifizierung (Single-Label) | Unbegrenzt | 30 | 
| Videoklassifizierung | 30 | 30 | 
| Video-Frame-Objekterkennung | 30 | 30 | 
| Video-Frame-Objektverfolgung | 30 | 30 | 
| 3D-Punktwolken-Objekterkennung | 30 | 30 | 
| 3D-Punktwolken-Objektverfolgung | 30 | 30 | 
| Semantische 3D-Punktwolkensegmentierung | 30 | 30 | 

## Kontingente für Kennzeichnungsaufträge mit generativer KI
<a name="gen-ai-labeling-job-quotas"></a>

Die folgenden Kontingente gelten für Frage-Antwort-Paare, die Sie in der Kennzeichnungsanwendung angeben.


| Art des Kontingents | Datenkontingent | 
| --- | --- | 
| Frage-Antwort-Paare | mindestens ein Paar, maximal 20 Paare | 
| Wortzahl einer Frage | mindestens ein Wort, maximal 200 Wörter | 
| Wortzahl einer Antwort | mindestens ein Wort, maximal 200 Wörter | 

## Kontingente für 3D-Punktwolken- und Video-Frame-Kennzeichnungsaufträge
<a name="sms-input-data-quotas-other"></a>

Die folgenden Kontingente gelten für Eingabedaten für 3D-Punktwolken- und Video-Frame-Kennzeichnungsaufträge.


****  

| Aufgabentyp des Kennzeichnungsauftrags | Eingabedatenkontingent | 
| --- | --- | 
| Video-Frame-Objekterkennung  |  2.000 Video-Frames (Bilder) pro Sequenz  | 
| Video-Frame-Objekterkennung  |  10 Video-Frame-Sequenzen pro Manifestdatei | 
| Video-Frame-Objektverfolgung |  2.000 Video-Frames (Bilder) pro Sequenz  | 
| Video-Frame-Objektverfolgung |  10 Video-Frame-Sequenzen pro Manifestdatei | 
| 3D-Punktwolken-Objekterkennung |  100.000 Punktwolken-Frames pro Kennzeichnungsauftrag | 
| 3D-Punktwolken-Objektverfolgung |  100.000 Punktwolken-Frame-Sequenzen pro Kennzeichnungsauftrag | 
| 3D-Punktwolken-Objektverfolgung |  500 Punktwolken-Frames in jeder Sequenzdatei | 

Wenn Sie einen Video-Frame- oder 3D-Punktwolken-Kennzeichnungsauftrag erstellen, können Sie jeder von Ihnen angegebenen Kennzeichnungskategorie ein oder mehrere *Kennzeichnungskategorieattribute* hinzufügen, damit Auftragnehmer weitere Informationen über eine Anmerkung bereitstellen können.

Jedes Kennzeichnungskategorieattribut verfügt über ein einzelnes Kennzeichnungskategorieattribut `name` und eine Liste mit einer oder mehreren Optionen (Werten), aus denen Sie wählen können. Weitere Informationen über 3D-Punktwolken-Kennzeichnungsaufträge finden Sie unter [Benutzeroberfläche (UI) für Auftragnehmer](sms-point-cloud-general-information.md#sms-point-cloud-worker-task-ui) und über Video-Frame-Kennzeichnungsaufträge unter [Benutzeroberfläche (UI) für Auftragnehmer](sms-video-overview.md#sms-video-worker-task-ui). 

 Die folgenden Kontingente gelten für die Anzahl der Attribute und Namen für Kennzeichnungskategorien, die Sie für Kennzeichnungsaufträge angeben können.


****  

| Aufgabentyp des Kennzeichnungsauftrags | Kontingent für Kennzeichnungskategorieattribute (Name) | Quote für Kennzeichnungskategorie-Attributwerte | 
| --- | --- | --- | 
| Video-Frame-Objekterkennung  | 10 | 10 | 
| Video-Frame-Objektverfolgung | 10 | 10 | 
| 3D-Punktwolken-Objekterkennung | 10 | 10 | 
| 3D-Punktwolken-Objektverfolgung | 10 | 10 | 
| Semantische 3D-Punktwolkensegmentierung | 10 | 10 | 

# Auswahl der Daten für die Kennzeichnung
<a name="sms-data-filtering"></a>

Sie können die Amazon SageMaker AI-Konsole verwenden, um einen Teil Ihres Datensatzes für die Kennzeichnung auszuwählen. Die Daten müssen in einem Amazon–S3-Bucket gespeichert sein. Sie haben drei Möglichkeiten:
+ Verwenden Sie den vollständigen Datensatz.
+ Wählen Sie eine zufällig ausgewählte Stichprobe des Datensatzes.
+ Geben Sie eine Teilmenge des Datensatzes unter Verwendung einer Abfrage an.

Die folgenden Optionen sind im Bereich **Labeling-Jobs** der [SageMaker AI-Konsole](https://console.aws.amazon.com/sagemaker/groundtruth) verfügbar, nachdem Sie **Labeling-Job erstellen** ausgewählt haben. Weitere Informationen zum Erstellen eines Kennzeichnungsauftrags in der Konsole finden Sie unter [Erste Schritte: Erstellen eines Kennzeichnungsauftrags mit Begrenzungsrahmen über Ground Truth](sms-getting-started.md). Um den Datensatz zu konfigurieren, das Sie für die Kennzeichnung verwenden, wählen Sie im Abschnitt **Auftragsübersicht** die Option **Zusätzliche Konfiguration** aus.

## Verwenden des vollständigen Datensatzes
<a name="sms-full-dataset"></a>

Wenn Sie den **vollständigen Datensatz** verwenden, müssen Sie eine Manifestdatei für Ihre Datenobjekte bereitstellen. Sie können den Pfad des Amazon S3 S3-Buckets angeben, der die Manifestdatei enthält, oder die SageMaker AI-Konsole verwenden, um die Datei zu erstellen. Weitere Informationen zum Erstellen einer Manifestdatei mithilfe der Konsole finden Sie unter [Automatisieren der Dateneinrichtung für Kennzeichnungsaufträge](sms-console-create-manifest-file.md). 

## Auswählen einer zufälligen Stichprobe
<a name="sms-random-dataset"></a>

Wenn Sie eine zufällige Teilmenge Ihrer Daten kennzeichnen wollen, wählen Sie **Random sample (zufällige Stichprobe)**. Der Datensatz wird in dem S3-Bucket gespeichert, der im Feld **Speicherort der Eingabedaten** angegeben ist. 

Nachdem Sie den Prozentsatz der Datenobjekte angegeben haben, die Sie in die Stichprobe aufnehmen möchten, wählen Sie **Create subset** aus. SageMaker KI wählt nach dem Zufallsprinzip die Datenobjekte für Ihren Labeling-Job aus. Nachdem die Objekte ausgewählt wurden, klicken Sie auf **Use this subset (Diese Teilmenge verwenden)**. 

SageMaker AI erstellt eine Manifestdatei für die ausgewählten Datenobjekte. Außerdem wird der Wert im Feld **Input dataset location (Speicherort des Eingabedatensatzes)** so geändert, dass er auf die neue Manifestdatei verweist.

## Angeben einer Teilmenge
<a name="sms-select-dataset"></a>

**Amazon S3 Select**  
Amazon S3 Select ist für Neukunden nicht mehr verfügbar. Bestandskunden von Amazon S3 Select können das Feature weiterhin wie gewohnt nutzen. Weitere Informationen finden Sie unter [So optimieren Sie die Abfrage Ihrer Daten in Amazon S3](https://aws.amazon.com/blogs/storage/how-to-optimize-querying-your-data-in-amazon-s3/).

Mithilfe einer Amazon–S3–`SELECT`-Abfrage für die Objektdateinamen können Sie eine Teilmenge Ihrer Datenobjekte angeben. 

Die `SELECT`-Anweisung der SQL-Abfrage wird für Sie definiert. Sie stellen die `WHERE`-Klausel bereit, um anzugeben, welche Datenobjekte zurückgegeben werden sollen.

Weitere Informationen über die Amazon-S3–`SELECT`Anweisung finden Sie unter [Auswählen von Inhalten aus Objekten](https://docs.aws.amazon.com/AmazonS3/latest/dev/selecting-content-from-objects.html).

Wählen Sie **Create subset (Teilmenge erstellen)** zum Starten der Auswahl und wählen Sie dann **Use this subset (Diese Teilmenge verwenden)** zur Verwendung der ausgewählten Daten. 

SageMaker AI erstellt eine Manifestdatei für die ausgewählten Datenobjekte. Außerdem wird der Wert im Feld **Input dataset location (Speicherort des Eingabedatensatzes)** aktualisiert, damit er auf die neue Manifestdatei verweist.