

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# BlazingText Hiperparâmetros
<a name="blazingtext_hyperparameters"></a>

Ao iniciar um trabalho de treinamento com uma solicitação `CreateTrainingJob`, você especifica um algoritmo de treinamento. Você também pode especificar hiperparâmetros específicos do algoritmo como mapas. string-to-string Os hiperparâmetros do BlazingText algoritmo dependem do modo usado: Word2Vec (não supervisionado) e Classificação de texto (supervisionado).

## Hiperparâmetros do Word2Vec
<a name="blazingtext_hyperparameters_word2vec"></a>

A tabela a seguir lista os hiperparâmetros do algoritmo de treinamento BlazingText Word2Vec fornecido pela Amazon AI. SageMaker 


| Nome do parâmetro | Description | 
| --- | --- | 
| mode | A arquitetura do Word2vec usada para treinamento.<br />**Obrigatório**<br />Valores válidos: `batch_skipgram`, `skipgram` ou `cbow` | 
| batch\_size | O tamanho de cada lote quando `mode` está definido como `batch_skipgram`. Defina um número de 10 a 20.<br />**Opcional**<br />Valores válidos: inteiro positivo<br />Valor padrão: 11 | 
| buckets | O número de buckets de hash a serem usados para subpalavras.<br />**Opcional**<br />Valores válidos: inteiro positivo<br />Valor padrão: 2000000 | 
| epochs | O número de passagens completas pelos dados de treinamento.<br />**Opcional**<br />Valores válidos: inteiro positivo<br />Valor padrão: 5 | 
| evaluation | Se o modelo treinado é avaliado usando o teste [WordSimilarity-353](http://www.gabrilovich.com/resources/data/wordsim353/wordsim353.html).<br />**Opcional**<br />Valores válidos: (booleano) `True` ou `False`<br />Valor padrão: `True` | 
| learning\_rate | O tamanho da etapa usado para atualizações de parâmetros.<br />**Opcional**<br />Valores válidos: flutuante positivo<br />Valor padrão: 0.05 | 
| min\_char | O número mínimo de caracteres a ser usado para subpalavras/n-gramas de caracteres.<br />**Opcional**<br />Valores válidos: inteiro positivo<br />Valor padrão: 3 | 
| min\_count | Palavras que aparecem menos de `min_count` vezes são descartadas.<br />**Opcional**<br />Valores válidos: inteiro não negativo<br />Valor padrão: 5 | 
| max\_char | O número máximo de caracteres a serem usados para subpalavras/n-gramas de caracteres<br />**Opcional**<br />Valores válidos: inteiro positivo<br />Valor padrão: 6 | 
| negative\_samples | O número de amostras negativas para a estratégia de compartilhamento de amostras negativas.<br />**Opcional**<br />Valores válidos: inteiro positivo<br />Valor padrão: 5 | 
| sampling\_threshold | O limite para a ocorrência de palavras. Palavras que aparecem com maior frequência nos dados de treinamento são amostradas aleatoriamente.<br />**Opcional**<br />Valores válidos: fração positiva. O intervalo recomendado é (0, 1e-3]<br />Valor padrão: 0.0001 | 
| subwords | Se incorporações de subpalavras devem ou não ser aprendidas.<br />**Opcional**<br />Valores válidos: (booleano) `True` ou `False`<br />Valor padrão: `False` | 
| vector\_dim | A dimensão dos vetores de palavra que o algoritmo aprende.<br />**Opcional**<br />Valores válidos: inteiro positivo<br />Valor padrão: 100 | 
| window\_size | O tamanho da janela de contexto. Janela de contexto é o número de palavras em torno da palavra de destino usada para treinamento.<br />**Opcional**<br />Valores válidos: inteiro positivo<br />Valor padrão: 5 | 

## Hiperparâmetros de classificação de texto
<a name="blazingtext_hyperparameters_text_class"></a>

A tabela a seguir lista os hiperparâmetros do algoritmo de treinamento de classificação de texto fornecido pela Amazon SageMaker AI.

**nota**  
Embora alguns dos parâmetros sejam comuns entre os modos de Classificação de texto e Word2Vec, eles podem ter significados diferentes dependendo do contexto.


| Nome do parâmetro | Description | 
| --- | --- | 
| mode | O modo de treinamento.<br />**Obrigatório**<br />Valores válidos: `supervised` | 
| buckets | O número de buckets de hash a serem usados para n-gramas de palavras.<br />**Opcional**<br />Valores válidos: inteiro positivo<br />Valor padrão: 2000000 | 
| early\_stopping | Se o treinamento deve ou não ser interrompido caso a precisão de validação não melhore depois de um `patience` número de epochs. Observe que um canal de validação é obrigatório se a parada antecipada for usada.<br />**Opcional**<br />Valores válidos: (booleano) `True` ou `False`<br />Valor padrão: `False` | 
| epochs | O número máximo de passagens completas pelos dados de treinamento.<br />**Opcional**<br />Valores válidos: inteiro positivo<br />Valor padrão: 5 | 
| learning\_rate | O tamanho da etapa usado para atualizações de parâmetros.<br />**Opcional**<br />Valores válidos: flutuante positivo<br />Valor padrão: 0.05 | 
| min\_count | Palavras que aparecem menos de `min_count` vezes são descartadas.<br />**Opcional**<br />Valores válidos: inteiro não negativo<br />Valor padrão: 5 | 
| min\_epochs | O número mínimo de epochs a treinar antes que a lógica de interrupção precoce seja invocada.<br />**Opcional**<br />Valores válidos: inteiro positivo<br />Valor padrão: 5 | 
| patience | O número de epochs a aguardar antes de aplicar a interrupção precoce quando nenhum progresso é feito no conjunto de validação. Usado somente quando `early_stopping` é `True`.<br />**Opcional**<br />Valores válidos: inteiro positivo<br />Valor padrão: 4 | 
| vector\_dim | A dimensão da camada de incorporação.<br />**Opcional**<br />Valores válidos: inteiro positivo<br />Valor padrão: 100 | 
| word\_ngrams | O número de recursos de n-gramas de palavras a serem usados.<br />**Opcional**<br />Valores válidos: inteiro positivo<br />Valor padrão: 2 | 