Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Imposta l'inferenza per un modello personalizzato
Dopo aver creato un modello personalizzato, puoi impostare l'inferenza utilizzando una delle seguenti opzioni:
-
Acquista Provisioned Throughput: acquista Provisioned Throughput per il tuo modello per configurare una capacità di elaborazione dedicata con throughput garantito per prestazioni costanti e una latenza inferiore.
Per ulteriori informazioni su Provisioned Throughput, consulta. Velocità di trasmissione effettiva assegnata Per ulteriori informazioni sull'utilizzo di modelli personalizzati con Provisioned Throughput, vedere. Acquista Provisioned Throughput per un modello personalizzato
-
Distribuisci un modello personalizzato per l'inferenza su richiesta: per configurare l'inferenza su richiesta, distribuisci il modello con una distribuzione del modello personalizzata. Dopo aver distribuito il modello, lo si richiama utilizzando l'ARN per la distribuzione del modello personalizzato. Con l'inferenza su richiesta, paghi solo per ciò che utilizzi e non devi configurare risorse di elaborazione assegnate.
Per ulteriori informazioni sulla distribuzione di modelli personalizzati per l'inferenza su richiesta, consulta. Implementa un modello personalizzato per l'inferenza su richiesta