Como funciona a classificação de imagens - SageMaker IA da Amazon

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Como funciona a classificação de imagens

O algoritmo de classificação de imagens pega uma imagem como entrada e a classifica em uma das categorias de saída. O deep learning revolucionou o domínio da classificação de imagens e obteve excelente desempenho. Várias redes de aprendizado profundo, como a ResNet, a DenseNet, a Inception e assim por diante, foram desenvolvidas para serem altamente precisas na classificação de imagens. Ao mesmo tempo, houve esforços para coletar dados de imagem rotulados que são essenciais para treinar essas redes. O ImageNet é um grande conjunto de dados que tem mais de 11 milhões de imagens com aproximadamente 11.000 categorias. Assim que uma rede é treinada com os dados ImageNet, ela pode ser usada para fazer iterações com outros conjuntos de dados também, com simples reajuste ou aperfeiçoamento. Nessa abordagem de aprendizagem de transferência, uma rede é inicializada com pesos (nesse exemplo, treinada no ImageNet), que podem ser posteriormente aperfeiçoados para uma tarefa de classificação de imagens em um conjunto de dados diferente.

A classificação de imagens no Amazon SageMaker AI pode ser executada em dois modos: treinamento completo e aprendizado por transferência. No modo de treinamento completo, a rede é inicializada com pesos aleatórios e treinada nos dados do usuário do zero. No modo de aprendizagem de transferência, a rede é inicializada com pesos pré-treinados, e apenas a camada superior totalmente conectada é inicializada com pesos aleatórios. Em seguida, toda a rede é aperfeiçoada com novos dados. Nesse modo, o treinamento pode ser obtido mesmo com um conjunto de dados menor. Isso ocorre porque a rede já está treinada e, portanto, pode ser usada em situações de dados de treinamento insuficientes.