Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Trasformazione di un set di dati COCO in un formato di file manifesto
COCO
Un file JSON in formato COCO è composto da cinque sezioni che forniscono informazioni per un intero set di dati. Per ulteriori informazioni, consulta Il formato del set di dati COCO.
-
info: informazioni generali sul set di dati. -
licenses: informazioni sulla licenza per le immagini nel set di dati. -
images: un elenco di immagini nel set di dati.
-
annotations: un elenco di annotazioni (compresi i riquadri di delimitazione) presenti in tutte le immagini del set di dati.
-
categories: un elenco di categorie di etichette.
Sono necessarie le informazioni delle liste images, annotations e categories per creare un file manifest di Amazon Rekognition Custom Labels.
Un file manifest di Amazon Rekognition Custom Labels è in formato righe JSON, in cui ogni riga contiene il riquadro di delimitazione e le informazioni sull'etichetta per uno o più oggetti in un'immagine. Per ulteriori informazioni, consulta Localizzazione di oggetti nei file manifest.
Mappatura degli oggetti COCO su una riga JSON di Custom Labels
Per trasformare un set di dati in formato COCO, mappare il set di dati COCO a un file manifest di Amazon Rekognition Custom Labels per posizionare gli oggetti. Per ulteriori informazioni, consulta Localizzazione di oggetti nei file manifest. Per creare una riga JSON per ogni immagine, il file manifest deve mappare il set di dati COCO e il campo dell'oggettoimage. annotation category IDs
Di seguito è riportato un esempio del file manifest CSV. Per ulteriori informazioni, consulta Il formato del set di dati COCO.
{ "info": { "description": "COCO 2017 Dataset","url": "http://cocodataset.org","version": "1.0","year": 2017,"contributor": "COCO Consortium","date_created": "2017/09/01" }, "licenses": [ {"url": "http://creativecommons.org/licenses/by/2.0/","id": 4,"name": "Attribution License"} ], "images": [ {"id": 242287, "license": 4, "coco_url": "http://images.cocodataset.org/val2017/xxxxxxxxxxxx.jpg", "flickr_url": "http://farm3.staticflickr.com/2626/xxxxxxxxxxxx.jpg", "width": 426, "height": 640, "file_name": "xxxxxxxxx.jpg", "date_captured": "2013-11-15 02:41:42"}, {"id": 245915, "license": 4, "coco_url": "http://images.cocodataset.org/val2017/nnnnnnnnnnnn.jpg", "flickr_url": "http://farm1.staticflickr.com/88/xxxxxxxxxxxx.jpg", "width": 640, "height": 480, "file_name": "nnnnnnnnnn.jpg", "date_captured": "2013-11-18 02:53:27"} ], "annotations": [ {"id": 125686, "category_id": 0, "iscrowd": 0, "segmentation": [[164.81, 417.51,......167.55, 410.64]], "image_id": 242287, "area": 42061.80340000001, "bbox": [19.23, 383.18, 314.5, 244.46]}, {"id": 1409619, "category_id": 0, "iscrowd": 0, "segmentation": [[376.81, 238.8,........382.74, 241.17]], "image_id": 245915, "area": 3556.2197000000015, "bbox": [399, 251, 155, 101]}, {"id": 1410165, "category_id": 1, "iscrowd": 0, "segmentation": [[486.34, 239.01,..........495.95, 244.39]], "image_id": 245915, "area": 1775.8932499999994, "bbox": [86, 65, 220, 334]} ], "categories": [ {"supercategory": "speaker","id": 0,"name": "echo"}, {"supercategory": "speaker","id": 1,"name": "echo dot"} ] }
Il seguente diagramma mostra come le liste set di dati COCO per un set di dati mappino le righe JSON di Amazon Rekognition Custom Labels di un’immagine. Ogni riga JSON per un'immagine possiede un campo di metadati source-ref, job e job. I colori corrispondenti indicano le informazioni per una singola immagine. Nota che nel manifesto una singola immagine può avere più annotazioni e metadati/categorie.
Ottenere gli oggetti COCO per una singola riga JSON
-
Per ogni immagine dell'elenco delle immagini, recuperarne l'annotazione dalla lista in cui il valore del campo di annotazione corrisponde al campo
image_iddell'immagineid. -
Per ogni annotazione corrispondente al passaggio 1, leggere l'elenco
categoriese ottenere ognicategoryin cui il valore dicategorydel campoidcorrisponde al campoannotationdell'oggettocategory_id. -
Creare una riga JSON per l'immagine utilizzando gli oggetti
image,annotationecategorycorrispondenti. Per mappare i campi, confrontare Mappatura dei campi dell'oggetto COCO ai campi di un oggetto di riga JSON Custom Labels. -
Ripetere i passaggi da 1 a 3 fino a creare le righe JSON per ogni
imageoggetto della listaimages.
Per il codice di esempio, consulta Trasformazione di un set di dati COCO.
Mappatura dei campi dell'oggetto COCO ai campi di un oggetto di riga JSON Custom Labels
Dopo aver identificato gli oggetti COCO per una riga JSON di Amazon Rekognition Custom Labels, si devono mappare i campi dell'oggetto COCO ai rispettivi campi di oggetto di riga JSON di Amazon Rekognition Custom Labels. L'esempio seguente di riga JSON di Amazon Rekognition Custom Labels mappa un'immagine (id=000000245915) al precedente esempio COCO JSON. Osservare le seguenti informazioni.
-
source-refè la posizione dell'immagine in un bucket Amazon S3. Se le immagini COCO non sono archiviate in un bucket Amazon S3, è necessario spostarle in questo. -
La lista
annotationscontiene un oggettoannotationper ogni oggetto dell'immagine. Un oggettoannotationinclude informazioni sul riquadro di delimitazione (top,left,width,height) e un identificatore di etichetta (class_id). -
L'identificatore dell'etichetta (
class_id) viene mappato alla listaclass-mapdei metadati. Elenca le etichette utilizzate nell'immagine.
{ "source-ref": "s3://custom-labels-bucket/images/000000245915.jpg", "bounding-box": { "image_size": { "width": 640, "height": 480, "depth": 3 }, "annotations": [{ "class_id": 0, "top": 251, "left": 399, "width": 155, "height": 101 }, { "class_id": 1, "top": 65, "left": 86, "width": 220, "height": 334 }] }, "bounding-box-metadata": { "objects": [{ "confidence": 1 }, { "confidence": 1 }], "class-map": { "0": "Echo", "1": "Echo Dot" }, "type": "groundtruth/object-detection", "human-annotated": "yes", "creation-date": "2018-10-18T22:18:13.527256", "job-name": "my job" } }
Utilizzare le seguenti informazioni per mappare i campi del file manifest di Amazon Rekognition Custom Labels ai campi JSON del set di dati COCO.
source-ref
L'URL in formato S3 per la posizione dell'immagine. L’immagine deve essere archiviata in un bucket S3. Per ulteriori informazioni, consulta source-ref. Se il campo coco_url COCO punta a una posizione del bucket S3, si può utilizzare il valore di coco_url per il valore di source-ref. In alternativa, si può mappare source-ref il campo file_name (COCO) e aggiungere, nel codice di trasformazione, il percorso S3 richiesto in cui è archiviata l'immagine.
bounding-box
Un nome di attributo dell'etichetta a scelta. Per ulteriori informazioni, consulta bounding-box.
image_size
Le dimensioni dell'immagine in pixel. Mappare su un image oggetto nell'elenco delle immagini.
annotations
Elenco di oggetti annotation. C’è un’ annotation per ogni oggetto dell'immagine.
annotazione
Contiene informazioni sul riquadro di delimitazione per un'istanza di un oggetto dell'immagine.
bounding-box-metadati
Metadati per l'attributo etichetta. Includere le etichette e gli identificatori delle etichette. Per ulteriori informazioni, consulta bounding-box-metadati.
Oggetti
Un array di oggetti nell’immagine. Mappare l'elenco annotations per indice.
Oggetto
-
confidence->Non utilizzato da Amazon Rekognition Custom Labels, ma è richiesto il valore (1).
class-map
Una mappa delle etichette (classi) che si applicano agli oggetti rilevati nell'immagine. Mappare gli oggetti delle categorie nell'elenco delle categorie.
tipo
Deve essere groundtruth/object-detection
annotato dall'uomo
Specificare yes o no. Per ulteriori informazioni, consulta bounding-box-metadati.
creation-date -> image .date_capture
La data e l’ora di creazione dell’immagine. Mappare al campo image.date_capture di un'immagine nell'elenco delle immagini COCO. Amazon Rekognition Custom Labels prevede che il formato creation-date sia Y-M-DTH:M:S.
job-name
Un nome del lavoro a scelta.