Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Bildklassifizierungsauftrag mit der AutoML-API erstellen
Die folgenden Anweisungen zeigen, wie Sie mithilfe der SageMaker-API-Referenz einen Amazon SageMaker Autopilot-Auftrag als Pilotexperiment für Bildklassifizierung-Problemtypen erstellen.
Anmerkung
Aufgaben wie Text- und Bildklassifizierung, Zeitreihenprognosen und Feinabstimmung umfangreicher Sprachmodelle stehen nur über Version 2 der AutoML-REST-API zur Verfügung. Wenn Ihre bevorzugte Sprache Python ist, können Sie direkt auf AWS SDK für Python (Boto3)
Benutzer, die den Komfort einer Benutzeroberfläche bevorzugen, können Amazon SageMaker Canvas verwenden, um auf vortrainierte Modelle und Basismodelle mit generativer AI zuzugreifen oder benutzerdefinierte Modelle zu erstellen, die auf spezifische Text-, Bildklassifizierungs- oder Prognoseanforderungen zugeschnitten sind.
Sie können programmatisch ein Autopilot-Experiment erstellen, indem Sie die CreateAutoMLJobV2 API-Aktion in einer beliebigen Sprache aufrufen, die von Amazon SageMaker Autopilot oder AWS CLI unterstützt wird.
Weitere Informationen darüber, wie diese API-Aktion in eine Funktion in der Sprache Ihrer Wahl übersetzt wird, finden Sie im Abschnitt Siehe auch von CreateAutoMLJobV2 und wählen Sie ein SDK aus. Als Beispiel für Python-Benutzer finden Sie die vollständige Anforderungssyntax von create_auto_ml_job_v2 in AWS SDK für Python (Boto3).
Im Folgenden finden Sie eine Sammlung obligatorischer und optionaler Eingabeanforderungsparameter für die CreateAutoMLJobV2 API-Aktion, die bei der Bildklassifizierung verwendet wird.
Erforderliche Parameter
Wenn Sie CreateAutoMLJobV2 aufrufen, um ein Autopilot-Experiment zur Bildklassifizierung zu erstellen, müssen Sie die folgenden Werte angeben:
-
Ein
AutoMLJobName, um den Namen Ihres Auftrags anzugeben. -
Mindestens eine
AutoMLJobChannelinAutoMLJobInputDataConfigum Ihre Datenquelle anzugeben. -
Ein
AutoMLProblemTypeConfigvom TypImageClassificationJobConfig. -
Ein
OutputDataConfigzur Angabe des Amazon S3-Ausgabepfads zum Speichern der Artefakte Ihren AutoML-Job. -
Ein
RoleArn, zur Angabe der ARN der Rolle, die für den Zugriff auf Ihre Daten verwendet wird.
Alle anderen Parameter sind optional.
Optionale Parameter
Die folgenden Abschnitte enthalten Einzelheiten zu einigen optionalen Parametern, die Sie an Ihren AutoML-Auftrag zur Bildklassifizierung übergeben können.
Sie können Ihren eigenen Validierungsdatensatz und ein benutzerdefiniertes Datenteilungsverhältnis angeben oder den Datensatz automatisch von Autopilot teilen lassen.
Jedes AutoMLJobChannel-Objekt (siehe den erforderlichen Parameter autoMLJobInputDataConfig) hat eine ChannelType, die entweder auf training oder validation Werte gesetzt werden kann, die angeben, wie die Daten beim Erstellen eines Modells für Machine Learning verwendet werden sollen.
Es muss mindestens eine Datenquelle bereitgestellt werden, und es sind maximal zwei Datenquellen zulässig: eine für Trainingsdaten und eine für Validierungsdaten. Wie Sie die Daten in Trainings- und Validierungsdatensätze aufteilen, hängt davon ab, ob Sie über eine oder zwei Datenquellen verfügen.
Wie Sie die Daten in Trainings- und Validierungsdatensätze aufteilen, hängt davon ab, ob Sie über eine oder zwei Datenquellen verfügen.
-
Wenn Sie nur über eine Datenquelle verfügen, wird die
ChannelTypestandardmäßig auftrainingeingestellt und muss diesen Wert haben.-
Wenn der Wert
ValidationFractioninAutoMLDataSplitConfignicht festgelegt ist, werden standardmäßig 0,2 (20%) der Daten aus dieser Quelle für die Validierung verwendet. -
Wenn für
ValidationFractionein Wert zwischen 0 und 1 festgelegt wird, wird der Datensatz anhand des angegebenen Wertes aufgeteilt. Dabei gibt der Wert den Anteil des Datensatzes an, der für die Validierung verwendet wird.
-
-
Wenn Sie über zwei Datenquellen verfügen, muss der
ChannelTypefür eines derAutoMLJobChannelObjekte auftraininggesetzt werden, den Standardwert. DerChannelTypeder anderen Datenquelle muss aufvalidationgesetzt werden. Die beiden Datenquellen müssen dasselbe Format haben, entweder CSV oder Parquet, und dasselbe Schema. In diesem Fall dürfen Sie den Wert fürValidationFractionnicht festlegen, da alle Daten aus jeder Quelle entweder für das Training oder für die Validierung verwendet werden. Wenn dieser Wert festgelegt wird, verursacht dies einen Fehler.
Um die automatische Bereitstellung für den besten Modellkandidaten eines AutoML-Auftrags zu ermöglichen, fügen Sie eine ModelDeployConfig in die AutoML-Auftragsanfrage hinzu. Dies ermöglicht die Bereitstellung des besten Modells auf einem SageMaker-AI-Endpunkt. Im Folgenden finden Sie die verfügbaren Konfigurationen für die Anpassung.
-
Damit Autopilot den Endpunktnamen generieren kann, stellen Sie
AutoGenerateEndpointNameaufTrueein. -
Um Ihren eigenen Namen für den Endpunkt anzugeben, legen Sie
AutoGenerateEndpointName tofest.Falseand provide a name of your choice in EndpointName