Mappatura degli oggetti COCO su una riga JSON di Custom Labels Mappatura dei campi dell'oggetto COCO ai campi di un oggetto di riga JSON Custom Labels

Trasformazione di un set di dati COCO in un formato di file manifesto

COCO è un formato per specificare set di dati di rilevamento, segmentazione e didascalia di oggetti su larga scala. Questo esempio Python mostra come trasformare un set di dati in formato di rilevamento di oggetti COCO in un file manifest in formato riquadro di delimitazione di Amazon Rekognition Custom Labels. Questa sezione contiene anche informazioni che si possono utilizzare per scrivere il proprio codice.

Un file JSON in formato COCO è composto da cinque sezioni che forniscono informazioni per un intero set di dati. Per ulteriori informazioni, consulta Il formato del set di dati COCO.

info: informazioni generali sul set di dati.
licenses : informazioni sulla licenza per le immagini nel set di dati.
images: un elenco di immagini nel set di dati.
annotations: un elenco di annotazioni (compresi i riquadri di delimitazione) presenti in tutte le immagini del set di dati.
categories: un elenco di categorie di etichette.

Sono necessarie le informazioni delle liste images, annotations e categories per creare un file manifest di Amazon Rekognition Custom Labels.

Un file manifest di Amazon Rekognition Custom Labels è in formato righe JSON, in cui ogni riga contiene il riquadro di delimitazione e le informazioni sull'etichetta per uno o più oggetti in un'immagine. Per ulteriori informazioni, consulta Localizzazione di oggetti nei file manifest.

Mappatura degli oggetti COCO su una riga JSON di Custom Labels

Per trasformare un set di dati in formato COCO, mappare il set di dati COCO a un file manifest di Amazon Rekognition Custom Labels per posizionare gli oggetti. Per ulteriori informazioni, consulta Localizzazione di oggetti nei file manifest. Per creare una riga JSON per ogni immagine, il file manifest deve mappare il set di dati COCO e il campo dell'oggettoimage. annotation category IDs

Di seguito è riportato un esempio del file manifest CSV. Per ulteriori informazioni, consulta Il formato del set di dati COCO.


{
    "info": {
        "description": "COCO 2017 Dataset","url": "http://cocodataset.org","version": "1.0","year": 2017,"contributor": "COCO Consortium","date_created": "2017/09/01"
    },
    "licenses": [
        {"url": "http://creativecommons.org/licenses/by/2.0/","id": 4,"name": "Attribution License"}
    ],
    "images": [
        {"id": 242287, "license": 4, "coco_url": "http://images.cocodataset.org/val2017/xxxxxxxxxxxx.jpg", "flickr_url": "http://farm3.staticflickr.com/2626/xxxxxxxxxxxx.jpg", "width": 426, "height": 640, "file_name": "xxxxxxxxx.jpg", "date_captured": "2013-11-15 02:41:42"},
        {"id": 245915, "license": 4, "coco_url": "http://images.cocodataset.org/val2017/nnnnnnnnnnnn.jpg", "flickr_url": "http://farm1.staticflickr.com/88/xxxxxxxxxxxx.jpg", "width": 640, "height": 480, "file_name": "nnnnnnnnnn.jpg", "date_captured": "2013-11-18 02:53:27"}
    ],
    "annotations": [
        {"id": 125686, "category_id": 0, "iscrowd": 0, "segmentation": [[164.81, 417.51,......167.55, 410.64]], "image_id": 242287, "area": 42061.80340000001, "bbox": [19.23, 383.18, 314.5, 244.46]},
        {"id": 1409619, "category_id": 0, "iscrowd": 0, "segmentation": [[376.81, 238.8,........382.74, 241.17]], "image_id": 245915, "area": 3556.2197000000015, "bbox": [399, 251, 155, 101]},
        {"id": 1410165, "category_id": 1, "iscrowd": 0, "segmentation": [[486.34, 239.01,..........495.95, 244.39]], "image_id": 245915, "area": 1775.8932499999994, "bbox": [86, 65, 220, 334]}
    ],
    "categories": [
        {"supercategory": "speaker","id": 0,"name": "echo"},
        {"supercategory": "speaker","id": 1,"name": "echo dot"}
    ]
}

Il seguente diagramma mostra come le liste set di dati COCO per un set di dati mappino le righe JSON di Amazon Rekognition Custom Labels di un’immagine. Ogni riga JSON per un'immagine possiede un campo di metadati source-ref, job e job. I colori corrispondenti indicano le informazioni per una singola immagine. Nota che nel manifesto una singola immagine può avere più annotazioni e metadati/categorie.

Diagramma che mostra la struttura di Coco Manifest, con immagini, annotazioni e categorie contenute al suo interno.

Ottenere gli oggetti COCO per una singola riga JSON

Per ogni immagine dell'elenco delle immagini, recuperarne l'annotazione dalla lista in cui il valore del campo di annotazione corrisponde al campo image_id dell'immagine id.
Per ogni annotazione corrispondente al passaggio 1, leggere l'elenco categories e ottenere ogni category in cui il valore di category del campo id corrisponde al campo annotation dell'oggetto category_id.
Creare una riga JSON per l'immagine utilizzando gli oggetti image, annotation e category corrispondenti. Per mappare i campi, confrontare Mappatura dei campi dell'oggetto COCO ai campi di un oggetto di riga JSON Custom Labels.
Ripetere i passaggi da 1 a 3 fino a creare le righe JSON per ogni image oggetto della lista images.

Per il codice di esempio, consulta Trasformazione di un set di dati COCO.

Mappatura dei campi dell'oggetto COCO ai campi di un oggetto di riga JSON Custom Labels

Dopo aver identificato gli oggetti COCO per una riga JSON di Amazon Rekognition Custom Labels, si devono mappare i campi dell'oggetto COCO ai rispettivi campi di oggetto di riga JSON di Amazon Rekognition Custom Labels. L'esempio seguente di riga JSON di Amazon Rekognition Custom Labels mappa un'immagine (id=000000245915) al precedente esempio COCO JSON. Osservare le seguenti informazioni.

source-ref è la posizione dell'immagine in un bucket Amazon S3. Se le immagini COCO non sono archiviate in un bucket Amazon S3, è necessario spostarle in questo.
La listaannotations contiene un oggetto annotation per ogni oggetto dell'immagine. Un oggetto annotation include informazioni sul riquadro di delimitazione (top,left,width,height) e un identificatore di etichetta (class_id).
L'identificatore dell'etichetta (class_id) viene mappato alla lista class-map dei metadati. Elenca le etichette utilizzate nell'immagine.


{
	"source-ref": "s3://custom-labels-bucket/images/000000245915.jpg",
	"bounding-box": {
		"image_size": {
			"width": 640,
			"height": 480,
			"depth": 3
		},
		"annotations": [{
			"class_id": 0,
			"top": 251,
			"left": 399,
			"width": 155,
			"height": 101
		}, {
			"class_id": 1,
			"top": 65,
			"left": 86,
			"width": 220,
			"height": 334
		}]
	},
	"bounding-box-metadata": {
		"objects": [{
			"confidence": 1
		}, {
			"confidence": 1
		}],
		"class-map": {
			"0": "Echo",
			"1": "Echo Dot"
		},
		"type": "groundtruth/object-detection",
		"human-annotated": "yes",
		"creation-date": "2018-10-18T22:18:13.527256",
		"job-name": "my job"
	}
}

Utilizzare le seguenti informazioni per mappare i campi del file manifest di Amazon Rekognition Custom Labels ai campi JSON del set di dati COCO.

source-ref

L'URL in formato S3 per la posizione dell'immagine. L’immagine deve essere archiviata in un bucket S3. Per ulteriori informazioni, consulta source-ref. Se il campo coco_url COCO punta a una posizione del bucket S3, si può utilizzare il valore di coco_url per il valore di source-ref. In alternativa, si può mappare source-ref il campo file_name (COCO) e aggiungere, nel codice di trasformazione, il percorso S3 richiesto in cui è archiviata l'immagine.

`bounding-box`

Un nome di attributo dell'etichetta a scelta. Per ulteriori informazioni, consulta bounding-box.

image_size

Le dimensioni dell'immagine in pixel. Mappare su un image oggetto nell'elenco delle immagini.

height-> image.height
width-> image.width
depth-> Non utilizzare Amazon Rekognition Custom Labels, ma è necessario fornire un valore.

annotations

Elenco di oggetti annotation. C’è un’ annotation per ogni oggetto dell'immagine.

annotazione

Contiene informazioni sul riquadro di delimitazione per un'istanza di un oggetto dell'immagine.

class_id-> mappatura numerica degli ID della lista class-map di Custom Label.
top -> bbox[1]
left -> bbox[0]
width -> bbox[2]
height -> bbox[3]

`bounding-box`-metadati

Metadati per l'attributo etichetta. Includere le etichette e gli identificatori delle etichette. Per ulteriori informazioni, consulta bounding-box-metadati.

Oggetti

Un array di oggetti nell’immagine. Mappare l'elenco annotations per indice.

Oggetto

confidence->Non utilizzato da Amazon Rekognition Custom Labels, ma è richiesto il valore (1).

class-map

Una mappa delle etichette (classi) che si applicano agli oggetti rilevati nell'immagine. Mappare gli oggetti delle categorie nell'elenco delle categorie.

id -> category.id
id value -> category.name

tipo

Deve essere groundtruth/object-detection

annotato dall'uomo

Specificare yes o no. Per ulteriori informazioni, consulta bounding-box-metadati.

creation-date -> image .date_capture

La data e l’ora di creazione dell’immagine. Mappare al campo image.date_capture di un'immagine nell'elenco delle immagini COCO. Amazon Rekognition Custom Labels prevede che il formato creation-date sia Y-M-DTH:M:S.

job-name

Un nome del lavoro a scelta.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Conversione di altri formati in un file manifesto

Il formato del set di dati COCO