Optimieren eines IP Insights-Modells - Amazon SageMaker AI

Optimieren eines IP Insights-Modells

Die automatische Modelloptimierung, auch als Hyperparameteroptimierung bezeichnet, sucht die beste Version eines Modells durch Ausführen vieler Aufträge, die eine Reihe von Hyperparametern in Ihrem Datensatz testen. Sie wählen die optimierbaren Hyperparameter, eine Reihe von Werten für jeden Parameter und eine objektive Metrik aus. Sie wählen die objektive Metrik aus den Metriken aus, die der Algorithmus berechnet. Die automatische Modelloptimierung durchsucht die ausgewählten Hyperparameter nach der Kombination von Werten, die das Modell ergeben, das die objektive Metrik optimiert.

Mehr Informationen über die Modelloptimierung finden Sie unter Automatische Modelloptimierung mit SageMaker AI.

Vom IP Insights-Algorithmus berechnete Metriken

Der IP-Insights-Algorithmus von Amazon SageMaker AI ist ein unüberwachter Lernalgorithmus, der Assoziationen zwischen IP-Adressen und Entitäten lernt. Der Algorithmus trainiert ein Diskriminatormodell, das lernt, separate beobachtete Datenpunkte (positive Stichproben) von zufällig generierte Datenpunkten (negative Stichproben) zu trennen. Die automatische Modelloptimierung in IP Insights unterstützt Sie dabei, das Modell zu finden, das zwischen unbezeichneten Validierungsdaten und automatisch generierten negativen Stichproben genau unterscheiden kann. Die Modellgenauigkeit im Validierungsdatensatz wird anhand der Fläche unter der Receiver Operating Characteristic-Kurve gemessen. Diese validation:discriminator_auc-Metrik kann Werte zwischen 0,0 und 1,0 annehmen, wobei 1,0 perfekte Genauigkeit bedeutet.

Der IP Insights-Algorithmus berechnet eine validation:discriminator_auc-Metrik während der Validierung. Der entsprechende Wert wird als objektive Funktion zur Unterstützung der Hyperparameter-Optimierung verwendet.

Metrikname Beschreibung Optimierungsrichtung
validation:discriminator_auc

Die Fläche unter der Receiver Operating Characteristic-Kurve auf dem Validierungsdatensatz. Der Validierungsdatensatz ist nicht bezeichnet. Die Fläche unter der Kurve (Area Under the Curve, AUC) ist eine Metrik zur Beschreibung der Fähigkeit des Modells, Validierungsdatenpunkte von zufällig generierten Datenpunkten zu unterscheiden.

Maximieren

Optimierbare IP Insights-Hyperparameter

Sie können die folgenden Hyperparameter für den IP-Insights-Algorithmus von SageMaker AI abstimmen.

Name des Parameters Parametertyp Empfohlene Bereiche
epochs

IntegerParameterRange

MinValue: 1, MaxValue: 100

learning_rate

ContinuousParameterRange

MinValue: 1e-4, MaxValue: 0.1

mini_batch_size

IntegerParameterRanges

MinValue: 100, MaxValue: 50000

num_entity_vectors

IntegerParameterRanges

MinValue: 10000, MaxValue: 1000000

num_ip_encoder_layers

IntegerParameterRanges

MinValue: 1, MaxValue: 10

random_negative_sampling_rate

IntegerParameterRanges

MinValue: 0, MaxValue: 10

shuffled_negative_sampling_rate

IntegerParameterRanges

MinValue: 0, MaxValue: 10

vector_dim

IntegerParameterRanges

MinValue: 8, MaxValue: 256

weight_decay

ContinuousParameterRange

MinValue: 0,0, MaxValue: 1,0