Como usar a classificação de texto - TensorFlow Works - SageMaker IA da Amazon

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Como usar a classificação de texto - TensorFlow Works

O algoritmo de classificação de texto - TensorFlow considera o texto conforme o classifica em um dos rótulos da classe de saída. Redes de aprendizado profundo, como o BERT, são altamente precisas para classificação de textos. Também existem redes de aprendizado profundo treinadas em grandes conjuntos de dados de texto, como o TextNet, que tem mais de 11 milhões de textos com cerca de 11.000 categorias. Depois que uma rede é treinada com dados do TextNet, você pode então ajustar a rede em um conjunto de dados com um foco específico para realizar tarefas de classificação de texto mais específicas. O algoritmo de classificação de texto TensorFlow do Amazon SageMaker AI permite usar o aprendizado por transferência em muitos modelos pré-treinados disponíveis no TensorFlow Hub.

De acordo com o número de rótulos de classe em seus dados de treinamento, uma camada de classificação de texto é anexada ao modelo TensorFlow pré-treinado de sua escolha. A camada de classificação consiste em uma camada suspensa, uma camada densa e uma camada totalmente conectada com regularização de duas normas e é inicializada com pesos aleatórios. Você pode alterar os valores dos hiperparâmetros para a taxa de eliminação da camada de eliminação e o fator de regularização L2 para a camada densa.

Você pode ajustar toda a rede (incluindo o modelo pré-treinado) ou somente a camada de classificação superior nos novos dados de treinamento. Com esse método de transferência de aprendizado, é possível treinar com conjuntos de dados menores.