Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Datenformate für Object2Vec-Inferenzen
Auf der folgenden Seite werden die Eingabeanforderungs- und Ausgabeantwortformate für das Abrufen von Bewertungsinferenzen aus dem Amazon SageMaker AI Object2Vec-Modell beschrieben.
GPU-Optimierung: Klassifizierung oder Regression
Aufgrund der GPU-Speicherknappheit kann die Umgebungsvariable INFERENCE_PREFERRED_MODE zur Optimierung angegeben werden, ob die Klassifizierung/Regression oder das Ausgabe: Encoder-Einbettungen-Inferenznetzwerk in die GPU geladen wird. Wenn Ihre Inferenz größtenteils für die Klassifizierung oder Regression bestimmt ist, geben Sie INFERENCE_PREFERRED_MODE=classification an. Im Folgenden finden Sie ein Batch-Transform-Beispiel für die Verwendung von 4 Instanzen von p3.2xlarge, das für Inferenz optimiert ist: classification/regression
transformer = o2v.transformer(instance_count=4, instance_type="ml.p2.xlarge", max_concurrent_transforms=2, max_payload=1, # 1MB strategy='MultiRecord', env={'INFERENCE_PREFERRED_MODE': 'classification'}, # only useful with GPU output_path=output_s3_path)
Eingabe: Klassifizierung oder Regression – Anforderungsformat
Inhaltstyp: application/json
{ "instances" : [ {"in0": [6, 17, 606, 19, 53, 67, 52, 12, 5, 10, 15, 10178, 7, 33, 652, 80, 15, 69, 821, 4], "in1": [16, 21, 13, 45, 14, 9, 80, 59, 164, 4]}, {"in0": [22, 1016, 32, 13, 25, 11, 5, 64, 573, 45, 5, 80, 15, 67, 21, 7, 9, 107, 4], "in1": [22, 32, 13, 25, 1016, 573, 3252, 4]}, {"in0": [774, 14, 21, 206], "in1": [21, 366, 125]} ] }
Inhaltstyp: application/jsonlines
{"in0": [6, 17, 606, 19, 53, 67, 52, 12, 5, 10, 15, 10178, 7, 33, 652, 80, 15, 69, 821, 4], "in1": [16, 21, 13, 45, 14, 9, 80, 59, 164, 4]} {"in0": [22, 1016, 32, 13, 25, 11, 5, 64, 573, 45, 5, 80, 15, 67, 21, 7, 9, 107, 4], "in1": [22, 32, 13, 25, 1016, 573, 3252, 4]} {"in0": [774, 14, 21, 206], "in1": [21, 366, 125]}
Für Klassifizierungsprobleme entspricht die Länge des Bewertungsvektors num_classes. Für Regressionsprobleme ist die Länge 1.
Ausgabe: Klassifizierung oder Regressionsformat
Akzeptiert: application/json.
{ "predictions": [ { "scores": [ 0.6533935070037842, 0.07582679390907288, 0.2707797586917877 ] }, { "scores": [ 0.026291321963071823, 0.6577019095420837, 0.31600672006607056 ] } ] }
Akzeptiert: application/jsonlines
{"scores":[0.195667684078216,0.395351558923721,0.408980727195739]} {"scores":[0.251988261938095,0.258233487606048,0.489778339862823]} {"scores":[0.280087798833847,0.368331134319305,0.351581096649169]}
Im Klassifizierungs- wie auch im Regressionsformat entspricht die Bewertung der jeweiligen Bezeichnung.