Optimieren eines IP Insights-Modells
Die automatische Modelloptimierung, auch als Hyperparameteroptimierung bezeichnet, sucht die beste Version eines Modells durch Ausführen vieler Aufträge, die eine Reihe von Hyperparametern in Ihrem Datensatz testen. Sie wählen die optimierbaren Hyperparameter, eine Reihe von Werten für jeden Parameter und eine objektive Metrik aus. Sie wählen die objektive Metrik aus den Metriken aus, die der Algorithmus berechnet. Die automatische Modelloptimierung durchsucht die ausgewählten Hyperparameter nach der Kombination von Werten, die das Modell ergeben, das die objektive Metrik optimiert.
Mehr Informationen über die Modelloptimierung finden Sie unter Automatische Modelloptimierung mit SageMaker AI.
Vom IP Insights-Algorithmus berechnete Metriken
Der IP-Insights-Algorithmus von Amazon SageMaker AI ist ein unüberwachter Lernalgorithmus, der Assoziationen zwischen IP-Adressen und Entitäten lernt. Der Algorithmus trainiert ein Diskriminatormodell, das lernt, separate beobachtete Datenpunkte (positive Stichproben) von zufällig generierte Datenpunkten (negative Stichproben) zu trennen. Die automatische Modelloptimierung in IP Insights unterstützt Sie dabei, das Modell zu finden, das zwischen unbezeichneten Validierungsdaten und automatisch generierten negativen Stichproben genau unterscheiden kann. Die Modellgenauigkeit im Validierungsdatensatz wird anhand der Fläche unter der Receiver Operating Characteristic-Kurve gemessen. Diese validation:discriminator_auc-Metrik kann Werte zwischen 0,0 und 1,0 annehmen, wobei 1,0 perfekte Genauigkeit bedeutet.
Der IP Insights-Algorithmus berechnet eine validation:discriminator_auc-Metrik während der Validierung. Der entsprechende Wert wird als objektive Funktion zur Unterstützung der Hyperparameter-Optimierung verwendet.
| Metrikname | Beschreibung | Optimierungsrichtung |
|---|---|---|
validation:discriminator_auc |
Die Fläche unter der Receiver Operating Characteristic-Kurve auf dem Validierungsdatensatz. Der Validierungsdatensatz ist nicht bezeichnet. Die Fläche unter der Kurve (Area Under the Curve, AUC) ist eine Metrik zur Beschreibung der Fähigkeit des Modells, Validierungsdatenpunkte von zufällig generierten Datenpunkten zu unterscheiden. |
Maximieren |
Optimierbare IP Insights-Hyperparameter
Sie können die folgenden Hyperparameter für den IP-Insights-Algorithmus von SageMaker AI abstimmen.
| Name des Parameters | Parametertyp | Empfohlene Bereiche |
|---|---|---|
epochs |
IntegerParameterRange |
MinValue: 1, MaxValue: 100 |
learning_rate |
ContinuousParameterRange |
MinValue: 1e-4, MaxValue: 0.1 |
mini_batch_size |
IntegerParameterRanges |
MinValue: 100, MaxValue: 50000 |
num_entity_vectors |
IntegerParameterRanges |
MinValue: 10000, MaxValue: 1000000 |
num_ip_encoder_layers |
IntegerParameterRanges |
MinValue: 1, MaxValue: 10 |
random_negative_sampling_rate |
IntegerParameterRanges |
MinValue: 0, MaxValue: 10 |
shuffled_negative_sampling_rate |
IntegerParameterRanges |
MinValue: 0, MaxValue: 10 |
vector_dim |
IntegerParameterRanges |
MinValue: 8, MaxValue: 256 |
weight_decay |
ContinuousParameterRange |
MinValue: 0,0, MaxValue: 1,0 |