Opzioni endpoint avanzate per l'inferenza con Amazon AI SageMaker

Con l'inferenza in tempo reale, puoi ottimizzare ulteriormente le prestazioni e i costi con le seguenti opzioni di inferenza avanzate:

Endpoint multi-modello: scegli questa opzione se disponi di più modelli che utilizzano lo stesso framework e puoi condividere un container. Questa opzione consente di ottimizzare i costi migliorando l'utilizzo degli endpoint e riducendo il sovraccarico di implementazione.
Endpoint multi-container: scegli questa opzione se disponi di più modelli che utilizzano framework diversi e richiedono un container separato. Otterrai molti dei vantaggi offerti dagli endpoint multi-modello e potrai implementare vari framework e modelli.
Pipeline di inferenza seriale: utilizza questa opzione se desideri ospitare modelli con logica di pre-elaborazione e post-elaborazione su un endpoint. Le pipeline di inferenza sono completamente gestite dall' SageMaker intelligenza artificiale e offrono una latenza inferiore perché tutti i contenitori sono ospitati sulle stesse istanze Amazon EC2.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Opzioni di inferenza

Fasi successive