Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Implementa un modello personalizzato per l'inferenza su richiesta
Dopo aver creato un modello personalizzato con un processo di personalizzazione del modello o importato un Amazon Nova modello personalizzato SageMaker addestrato all'intelligenza artificiale, puoi impostare l'inferenza su richiesta per il modello. Con l'inferenza su richiesta, paghi solo per ciò che utilizzi e non devi configurare risorse di calcolo assegnate.
Per configurare l'inferenza su richiesta per un modello personalizzato, lo si distribuisce con una distribuzione di modello personalizzata. Dopo aver distribuito il modello personalizzato, utilizzi l'Amazon Resource Name (ARN) della distribuzione come modelId
parametro per inviare richieste e generare risposte con inferenza del modello.
Per informazioni sui prezzi di inferenza su richiesta, consulta i prezzi di Amazon Bedrock
-
Stati Uniti orientali (Virginia settentrionale)
Argomenti
Modelli base supportati
È possibile configurare l'inferenza su richiesta per i seguenti modelli di base:
-
Amazon Nova Lite
-
Amazon NovaMicro
-
Amazon Nova Pro