Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Rendimiento aprovisionado
Cuando configura el rendimiento aprovisionado para un modelo, recibe un nivel de rendimiento a un costo fijo.
Puede utilizar el rendimiento aprovisionado con modelos básicos de Amazon y de terceros, así como con modelos personalizados.
El precio del rendimiento aprovisionado varía según el modelo que utilice y el nivel de compromiso que elija. Recibirá una tarifa con descuento si se compromete a un periodo de tiempo más largo. Para obtener más información sobre los precios de cada modelo, consulte la página de Proveedores de modelos
Las opciones de rendimiento de un modelo varían en función de si realiza la inferencia en un modelo básico o en un modelo personalizado.
nota
En la AWS GovCloud (US) región, solo puede comprar Provisioned Throughput para modelos personalizados sin compromiso.
Opciones de precios | Modelo básico | Modelo personalizado |
---|---|---|
Rendimiento aprovisionado, sin compromiso (precio por hora) | No disponible | Disponible (máximo 2 rendimientos aprovisionados por cuenta) |
Rendimiento aprovisionado, compromiso de 1 mes | Disponible | Disponible |
Rendimiento aprovisionado, compromiso de 6 meses | Disponible | Disponible |
El rendimiento aprovisionado se especifica en unidades modelo (MU). Una unidad modelo ofrece un nivel de rendimiento específico para el modelo especificado. El nivel de rendimiento de una MU para un modelo de texto determinado especifica lo siguiente:
El número total de identificadores de entrada por minuto: el número de identificadores de entrada que una MU puede procesar en todas las solicitudes en un lapso de un minuto.
El número total de identificadores de salida por minuto: el número de identificadores de salida que una MU puede generar en todas las solicitudes en un lapso de un minuto.
Las cuotas unitarias del modelo dependen del nivel de compromiso que se especifique para el rendimiento aprovisionado.
-
Para los modelos personalizados sin compromiso, hay disponible una cuota de una unidad modelo por cada rendimiento aprovisionado. Puede crear hasta dos rendimientos aprovisionados por cuenta.
-
Para los modelos básicos o personalizados con compromiso, hay una cuota predeterminada de 0 unidades de modelo. Para solicitar un aumento, utilice el formulario de aumento de límites
.