Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Iperparametri BlazingText
Quando avvii un processo di addestramento con una richiesta CreateTrainingJob, specifichi un algoritmo di addestramento. Puoi anche specificare gli iperparametri specifichi dell'algoritmo come mappe stringa a stringa. Gli iperparametri per l'algoritmo BlazingText dipendono dalla modalità che usi: Word2Vec (non supervisionata) e classificazione del testo (supervisionata).
Iperparametri Word2Vec
Nella tabella seguente sono elencati gli iperparametri per l’algoritmo di addestramento Word2Vec BlazingText fornito da Amazon SageMaker AI.
| Nome parametro | Descrizione |
|---|---|
mode |
L'architettura Word2vec utilizzata per l’addestramento. Campo obbligatorio Valori validi: |
batch_size |
La dimensione di ogni batch quando Opzionale Valori validi: numeri interi positivi Valore predefinito: 11 |
buckets |
Il numero di bucket hash da utilizzare per le parole secondarie. Opzionale Valori validi: numeri interi positivi Valore predefinito: 2000000 |
epochs |
Il numero di pass completi tramite i dati di addestramento. Opzionale Valori validi: numeri interi positivi Valore predefinito: 5 |
evaluation |
Se il modello preparato viene valutato utilizzando il test WordSimilarity-353 Opzionale Valori validi: (booleani) Valore predefinito: |
learning_rate |
L'incremento utilizzato per gli aggiornamenti dei parametri. Opzionale Valori validi: float positivi Valore predefinito: 0,05 |
min_char |
Il numero minimo di caratteri da utilizzare per n-grammi di parole secondarie/caratteri. Opzionale Valori validi: numeri interi positivi Valore predefinito: 3 |
min_count |
Le parole che appaiono meno di Opzionale Valori validi: numeri interi non negativi Valore predefinito: 5 |
max_char |
Il numero massimo di caratteri da utilizzare per n-grammi di parole secondarie/caratteri. Opzionale Valori validi: numeri interi positivi Valore predefinito: 6 |
negative_samples |
Il numero di Negative Sample per la strategia Negative Sample Sharing. Opzionale Valori validi: numeri interi positivi Valore predefinito: 5 |
sampling_threshold |
Il limite di occorrenza delle parole. Le parole che appaiono con maggiore frequenza nei dati di addestramento sono casualmente sottocampionate. Opzionale Valori validi: frazioni positive. L'intervallo consigliato è (0, 1e-3) Valore predefinito: 0.0001 |
subwords |
Indica se eseguire o meno l’addestramento degli incorporamenti delle parole secondarie. Opzionale Valori validi: (booleani) Valore predefinito: |
vector_dim |
La dimensione dei vettori di parola che l'algoritmo impara. Opzionale Valori validi: numeri interi positivi Valore predefinito: 100 |
window_size |
Le dimensioni della finestra contestuale. La finestra contestuale è il numero di parole che circondano la parola di target utilizzata per l’addestramento. Opzionale Valori validi: numeri interi positivi Valore predefinito: 5 |
Iperparametri di classificazione del testo
La tabella seguente elenca gli iperparametri per l’algoritmo di addestramento Classificazione del testo fornito da Amazon SageMaker AI.
Nota
Sebbene alcuni parametri siano comuni tra la modalità di classificazione del testo e Word2Vec, potrebbero avere significati diversi a seconda del contesto.
| Nome parametro | Descrizione |
|---|---|
mode |
La modalità di addestramento. Campo obbligatorio Valori validi: |
buckets |
Il numero di bucket hash da utilizzare per n-grammi di parole. Opzionale Valori validi: numeri interi positivi Valore predefinito: 2000000 |
early_stopping |
Indica se interrompere l’addestramento nel caso in cui l'accuratezza della convalida non migliora dopo a numero Opzionale Valori validi: (booleani) Valore predefinito: |
epochs |
Il numero massimo di pass completi tramite i dati di addestramento. Opzionale Valori validi: numeri interi positivi Valore predefinito: 5 |
learning_rate |
L'incremento utilizzato per gli aggiornamenti dei parametri. Opzionale Valori validi: float positivi Valore predefinito: 0,05 |
min_count |
Le parole che appaiono meno di Opzionale Valori validi: numeri interi non negativi Valore predefinito: 5 |
min_epochs |
Il numero minimo di epoche (Unix epochs) da addestrare prima che venga richiamata la logica di arresto precoce. Opzionale Valori validi: numeri interi positivi Valore predefinito: 5 |
patience |
Il numero di epoche (Unix epochs) da attendere prima di applicare l'arresto precoce quando non viene effettuato alcun progresso sul set di convalida. Usato solo quando Opzionale Valori validi: numeri interi positivi Valore predefinito: 4 |
vector_dim |
La dimensione del livello di incorporamento. Opzionale Valori validi: numeri interi positivi Valore predefinito: 100 |
word_ngrams |
Il numero di caratteristiche n-gramma di parole da utilizzare. Opzionale Valori validi: numeri interi positivi Valore predefinito: 2 |