Impostazione dell’inferenza per un modello personalizzato

Dopo aver creato un modello personalizzato, puoi configurare l’inferenza utilizzando una delle opzioni seguenti:

Acquisto di throughput assegnato: acquista throughput assegnato per il tuo modello al fine di configurare una capacità di elaborazione dedicata con throughput garantito per prestazioni costanti e una latenza inferiore.

Per ulteriori informazioni sull’acquisto di throughput assegnato, consulta Aumenta la capacità di invocazione del modello con Provisioned Throughput in Amazon Bedrock. Per ulteriori informazioni sull’utilizzo di modelli personalizzati con throughput assegnato, consulta. Acquisto di throughput allocato per un modello personalizzato
Implementazione di un modello personalizzato per l’inferenza on demand: per configurare l’inferenza on demand, è necessario distribuire il modello attraverso un’implementazione personalizzata. Dopo aver implementato il modello, è possibile invocarlo utilizzando l’ARN per l’implementazione del modello personalizzato. Con l’inferenza on demand, paghi solo per ciò che usi e non devi configurare risorse di calcolo allocate.

Per ulteriori informazioni sull’implementazione di modelli personalizzati per l’inferenza on demand, consulta Implementazione di un modello personalizzato per l’inferenza on demand.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Visualizzare i dettagli su un modello personalizzato

Acquisto di throughput allocato per un modello personalizzato