Impostazione dell’inferenza per un modello personalizzato - Amazon Bedrock

Impostazione dell’inferenza per un modello personalizzato

Dopo aver creato un modello personalizzato, puoi configurare l’inferenza utilizzando una delle opzioni seguenti:

  • Acquisto di throughput assegnato: acquista throughput assegnato per il tuo modello al fine di configurare una capacità di elaborazione dedicata con throughput garantito per prestazioni costanti e una latenza inferiore.

    Per ulteriori informazioni sull’acquisto di throughput assegnato, consulta Throughput allocato. Per ulteriori informazioni sull’utilizzo di modelli personalizzati con throughput assegnato, consulta. Acquisto di throughput allocato per un modello personalizzato

  • Implementazione di un modello personalizzato per l’inferenza on demand: per configurare l’inferenza on demand, è necessario distribuire il modello attraverso un’implementazione personalizzata. Dopo aver implementato il modello, è possibile invocarlo utilizzando l’ARN per l’implementazione del modello personalizzato. Con l’inferenza on demand, paghi solo per ciò che usi e non devi configurare risorse di calcolo allocate.

    Per ulteriori informazioni sull’implementazione di modelli personalizzati per l’inferenza on demand, consulta Implementazione di un modello personalizzato per l’inferenza on demand.