Imposta l'inferenza per un modello personalizzato - Amazon Bedrock

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Imposta l'inferenza per un modello personalizzato

Dopo aver creato un modello personalizzato, puoi impostare l'inferenza utilizzando una delle seguenti opzioni:

  • Acquista Provisioned Throughput: acquista Provisioned Throughput per il tuo modello per configurare una capacità di elaborazione dedicata con throughput garantito per prestazioni costanti e una latenza inferiore.

    Per ulteriori informazioni su Provisioned Throughput, consulta. Aumenta la capacità di invocazione del modello con Provisioned Throughput in Amazon Bedrock Per ulteriori informazioni sull'utilizzo di modelli personalizzati con Provisioned Throughput, vedere. Acquista Provisioned Throughput per un modello personalizzato

  • Distribuisci un modello personalizzato per l'inferenza su richiesta (solo Amazon Nova modelli): per configurare l'inferenza su richiesta, distribuisci il modello con una distribuzione del modello personalizzata. Dopo aver distribuito il modello, lo si richiama utilizzando l'ARN per la distribuzione del modello personalizzato. Con l'inferenza su richiesta, paghi solo per ciò che utilizzi e non devi configurare risorse di elaborazione assegnate.

    Per ulteriori informazioni sulla distribuzione di modelli personalizzati per l'inferenza su richiesta, consulta. Implementa un modello personalizzato per l'inferenza su richiesta