Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
TabTransformer-Hyperparameter
Die folgende Tabelle enthält die Teilmenge der Hyperparameter, die für den TabTransformer-Algorithmus von Amazon SageMaker AI erforderlich sind oder am häufigsten verwendet werden. Dies sind Parameter, die von Benutzern festgelegt werden, um die Schätzung der Modellparameter aus Daten zu erleichtern. Der TabTransformer-Algorithmus von SageMaker AI ist eine Implementierung des Open-Source-Pakets TabTransformer
Anmerkung
Die Standard-Hyperparameter basieren auf Beispieldatensätzen in der TabTransformer-Beispiel-Notebooks.
Der TabTransformer-Algorithmus von SageMaker AI wählt automatisch eine Bewertungsmetrik und eine Zielfunktion auf der Grundlage der Art des Klassifizierungsproblems aus. Der TabTransformer-Algorithmus erkennt die Art des Klassifizierungsproblems anhand der Anzahl der Beschriftungen in Ihren Daten. Bei Regressionsproblemen ist die Bewertungsmetrik das Quadrat r und die Zielfunktion der quadratische Mittelwert. Bei binären Klassifikationsproblemen entsprechen die Bewertungsmetrik und die Zielfunktion beide der binären Kreuzentropie. Bei Klassifikationsproblemen mit mehreren Klassen entsprechen die Bewertungsmetrik und die Zielfunktion beide einer Mehrklassen-Kreuzentropie.
Anmerkung
Die Bewertungsmetrik und die Zielfunktionen von TabTransformer sind derzeit nicht als Hyperparameter verfügbar. Stattdessen erkennt der integrierte TabTransformer-Algorithmus von SageMaker AI anhand der Anzahl der eindeutigen Ganzzahlen in der Beschriftungsspalte automatisch den Typ der Klassifikationsaufgabe (Regression, Binär oder Mehrklasse) und weist eine Bewertungsmetrik und eine Zielfunktion zu.
| Name des Parameters | Beschreibung |
|---|---|
n_epochs |
Anzahl der Epochen, in denen das tiefe neuronale Netzwerk trainiert werden soll. Gültige Werte: Ganzzahl, Bereich: Positive Ganzzahl. Standardwert: |
patience |
Das Training wird beendet, wenn sich eine Metrik eines Validierungsdatenpunkts in der letzten Gültige Werte: Ganzzahl, Bereich: ( Standardwert: |
learning_rate |
Die Geschwindigkeit, mit der die Modellgewichte aktualisiert werden, nachdem die einzelnen Trainingsbeispiele durchgearbeitet wurden. Gültige Werte: float, range: Positive float. Standardwert: |
batch_size |
Die Anzahl der Beispiele, die im Netzwerk verbreitet wurden. Gültige Werte: Ganzzahl, Bereich: ( Standardwert: |
input_dim |
Die Dimension der Einbettungen zur Kodierung der kategorialen und/oder kontinuierlichen Spalten. Gültige Werte: String, einer der folgenden Werte: Standardwert: |
n_blocks |
Die Anzahl der Transformer-Encoder-Blöcke. Gültige Werte: Ganzzahl, Bereich: ( Standardwert: |
attn_dropout |
Die Dropout-Rate wurde auf die Multi-Head Attention-Ebenen angewendet. Gültige Werte: Float, Bereich: ( Standardwert: |
mlp_dropout |
Die Dropout-Rate wird auf das FeedForward-Netzwerk innerhalb der Encoder-Schichten und die letzten MLP-Schichten über den Transformer-Encodern angewendet. Gültige Werte: Float, Bereich: ( Standardwert: |
frac_shared_embed |
Der Anteil der Einbettungen, die sich alle verschiedenen Kategorien für eine bestimmte Spalte teilen. Gültige Werte: Float, Bereich: ( Standardwert: |