Localização de objetos em arquivos de manifesto - Rekognition

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Localização de objetos em arquivos de manifesto

Você pode importar imagens rotuladas com informações de localização de objetos adicionando linhas JSON no formato SageMaker AI Ground Truth Bounding Box Job Output a um arquivo de manifesto.

As informações de localização representam a localização de um objeto em uma imagem. A localização é representada por uma caixa delimitadora que circunda o objeto. A estrutura da caixa delimitadora contém as coordenadas no canto superior esquerdo da caixa delimitadora e a largura e altura da caixa delimitadora. Uma linha JSON em formato de caixa delimitadora inclui caixas delimitadoras para a localização de um ou mais objetos em uma imagem e a classe de cada objeto na imagem.

Um arquivo de manifesto é feito de uma ou mais linhas JSON, cada linha contém as informações de uma única imagem.

Para criar um arquivo de manifesto para localização de objetos
  1. Crie um arquivo de texto vazio.

  2. Adicione uma linha JSON para cada imagem que você deseja importar. Cada linha deve ser semelhante à linha a seguir.

    {"source-ref": "s3://bucket/images/IMG_1186.png", "bounding-box": {"image_size": [{"width": 640, "height": 480, "depth": 3}], "annotations": [{ "class_id": 1, "top": 251, "left": 399, "width": 155, "height": 101}, {"class_id": 0, "top": 65, "left": 86, "width": 220, "height": 334}]}, "bounding-box-metadata": {"objects": [{ "confidence": 1}, {"confidence": 1}], "class-map": {"0": "Echo", "1": "Echo Dot"}, "type": "groundtruth/object-detection", "human-annotated": "yes", "creation-date": "2013-11-18T02:53:27", "job-name": "my job"}}
  3. Salve o arquivo. É possível usar a extensão .manifest, mas ela não é obrigatória.

  4. Crie um conjunto de dados usando o arquivo que você criou. Para obter mais informações, consulte Para criar um conjunto de dados usando um arquivo de manifesto no formato SageMaker AI Ground Truth (console).

Linhas JSON da caixa delimitadora de objetos

Nesta seção, é mostrado como criar uma linha JSON para uma única imagem. A imagem a seguir mostra as caixas delimitadoras ao redor de dispositivos Amazon Echo e um Amazon Echo Dot.

Dois alto-falantes inteligentes da Amazon, um com caixa delimitadora verde e um com caixa delimitadora azul, em uma superfície de madeira.

A seguir está a linha JSON da caixa delimitadora da imagem anterior.

{ "source-ref": "s3://custom-labels-bucket/images/IMG_1186.png", "bounding-box": { "image_size": [{ "width": 640, "height": 480, "depth": 3 }], "annotations": [{ "class_id": 1, "top": 251, "left": 399, "width": 155, "height": 101 }, { "class_id": 0, "top": 65, "left": 86, "width": 220, "height": 334 }] }, "bounding-box-metadata": { "objects": [{ "confidence": 1 }, { "confidence": 1 }], "class-map": { "0": "Echo", "1": "Echo Dot" }, "type": "groundtruth/object-detection", "human-annotated": "yes", "creation-date": "2013-11-18T02:53:27", "job-name": "my job" } }

Observe as seguintes informações:

source-ref

(Obrigatório) O local no Amazon S3 da imagem. O formato é "s3://BUCKET/OBJECT_PATH". As imagens em um conjunto de dados importado devem ser armazenadas no mesmo bucket do Amazon S3.

bounding-box

(Obrigatório) O atributo do rótulo. Escolha o nome do campo. Contém o tamanho da imagem e as caixas delimitadoras de cada objeto detectado na imagem. Deve haver metadados correspondentes identificados pelo nome do campo com -metadata anexado. Por exemplo, ."bounding-box-metadata"

image_size

(Obrigatório) Uma matriz de elementos únicos contendo o tamanho da imagem em pixels.

  • height: (obrigatória) a altura da imagem em pixels.

  • width: (obrigatório) a profundidade da imagem em pixels.

  • depth: (obrigatório) o número de canais na imagem. Para imagens RGB, o valor é 3. Não é usado pelo Amazon Rekognition Custom Labels neste momento, mas um valor é obrigatório.

anotações

(Obrigatório) Uma matriz de informações da caixa delimitadora para cada objeto detectado na imagem.

  • class_id (obrigatório) mapeia para o rótulo no class-map. No exemplo anterior, o objeto com o class_id de 1 é o Echo Dot na imagem.

  • top: (obrigatório) a distância da parte superior da imagem à parte superior da caixa delimitadora, em pixels.

  • left: (obrigatório) a distância da esquerda da imagem à esquerda da caixa delimitadora, em pixels.

  • width: (obrigatório) a largura da caixa delimitadora em pixels.

  • height: (obrigatória) a altura da caixa delimitadora em pixels.

bounding-box-metadados

(Obrigatório) Metadados sobre o atributo do rótulo. O nome do campo deve ser o mesmo do atributo do rótulo com -metadata anexado. Uma matriz de informações da caixa delimitadora para cada objeto detectado na imagem.

Objetos

(Obrigatório) Uma matriz de objetos que estão na imagem. Mapeia para a matriz de anotações por índice. O atributo de confiança não é usado pelo Amazon Rekognition Custom Labels.

class-map

(Obrigatório) Um mapa das classes que se aplicam aos objetos detectados na imagem.

tipo

(Obrigatório) O tipo de trabalho de classificação. "groundtruth/object-detection" identifica o trabalho como detecção de objetos.

creation-date

(Obrigatório) A data e hora do Tempo Universal Coordenado (UTC) em que o rótulo foi criado.

human-annotated

(Obrigatório) Especifique "yes" se a anotação foi preenchida por um humano. Caso contrário, "no".

job-name

(Opcional) O nome do trabalho que processa a imagem.