Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Opzioni endpoint avanzate per l’inferenza con Amazon SageMaker AI
Con l'inferenza in tempo reale, puoi ottimizzare ulteriormente le prestazioni e i costi con le seguenti opzioni di inferenza avanzate:
-
Endpoint multi-modello: scegli questa opzione se disponi di più modelli che utilizzano lo stesso framework e puoi condividere un container. Questa opzione consente di ottimizzare i costi migliorando l'utilizzo degli endpoint e riducendo il sovraccarico di implementazione.
-
Endpoint multi-container: scegli questa opzione se disponi di più modelli che utilizzano framework diversi e richiedono un container separato. Otterrai molti dei vantaggi offerti dagli endpoint multi-modello e potrai implementare vari framework e modelli.
-
Pipeline di inferenza seriale: utilizza questa opzione se desideri ospitare modelli con logica di pre-elaborazione e post-elaborazione su un endpoint. Le pipeline di inferenza sono completamente gestite da SageMaker AI e offrono una latenza inferiore perché tutti i container sono ospitati sulle stesse istanze Amazon EC2.