Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Command R
Cohere — Comando R
Detalles del modelo
Command R es el LLM escalable de Cohere, optimizado para la generación con recuperación aumentada y el uso de herramientas en aplicaciones empresariales con una ventana de contexto de 128 K. Para obtener más información sobre el desarrollo y el rendimiento de los modelos, consulte la tarjeta de modelo/servicio.
Fecha de lanzamiento del modelo: agosto de 2024
Fecha de caducidad del modelo: N/A
Acuerdos de licencia de usuario final y condiciones de uso: Ver
Ciclo de vida del modelo: activo
Ventana de contexto: 128 000 fichas
Número máximo de tokens de salida: 4K
Límite de conocimiento: marzo de 2024
| Modalidades de entrada | Modalidades de salida | APIs compatible | Puntos finales compatibles |
|---|---|---|---|
Responses | bedrock-runtime | ||
Chat Completions | bedrock-mantle | ||
Invoke | |||
Converse | |||
Precios
Para conocer los precios, consulta la página de precios de Amazon Bedrock
Acceso programático
Utilice el siguiente modelo IDs y punto final URLs para acceder a este modelo mediante programación. Para obtener más información sobre los puntos de conexión disponibles APIs y los puntos de conexión, consulte los puntos de conexión APIs compatibles y los puntos de conexión compatibles.
| Punto de conexión | ID del modelo | URL del punto final de la región | ID de geoinferencia | ID de inferencia global |
|---|---|---|---|---|
bedrock-runtime |
cohere.command-r-v1:0 |
https://bedrock-runtime.{region}.amazonaws.com |
No admitido | No admitido |
Por ejemplo, si la región es us-east-1 (Virginia del Norte), la URL del punto final de bedrock-runtime será "» y para bedrock-mantle será https://bedrock-runtime.us-east-1.amazonaws.com "https://bedrock-mantle.us-east-1.api.aws/v1 «.
Niveles de servicio
Amazon Bedrock ofrece varios niveles de servicio para adaptarse a sus requisitos de carga de trabajo. El estándar proporciona pay-per-token acceso sin compromiso. Priority ofrece un mayor rendimiento con un compromiso basado en el tiempo. Flex proporciona un acceso de menor costo para cargas de trabajo flexibles. non-time-sensitive Reserved ofrece un rendimiento específico con un compromiso a largo plazo para cargas de trabajo predecibles. Para obtener más información, consulte los niveles de servicio.
| Estándar | Priority (Prioridad) | Flexible | Reservado |
|---|---|---|---|
Disponibilidad regional
La disponibilidad regional de un vistazo
Bedrock ofrece tres opciones de inferencia: In-Region mantiene las solicitudes dentro de una sola región para garantizar un cumplimiento estricto, las rutas georegionales entre regiones de una geografía (EE. UU., UE, etc.) para obtener un mayor rendimiento y respetar la residencia de los datos, y las rutas globales entre regiones a cualquier parte del mundo para obtener el máximo rendimiento cuando no hay restricciones de residencia. Consulte la página para obtener más información. Disponibilidad regional
| Region | Dentro de la región | Geo | Global |
|---|---|---|---|
us-east-1(Virginia del Norte) | |||
us-west-2(Oregón) |
Cuotas y límites
Su cuenta de AWS tiene cuotas predeterminadas para mantener el rendimiento del servicio y garantizar un uso adecuado de Amazon Bedrock. Las cuotas predeterminadas asignadas a una cuenta pueden actualizarse en función de factores regionales, el historial de pagos, el uso fraudulento o la and/or aprobación de una solicitud de aumento de cuota. Para obtener más información, consulte la Cuotas para Amazon Bedrock documentación y consulte los límites del modelo.
Código de muestra
Paso 1: Cuenta de AWS: si ya tiene una cuenta de AWS, omita este paso. Si es la primera vez que utiliza AWS, regístrese para obtener una cuenta de AWS
Paso 2: Clave de API: vaya a la consola de Amazon Bedrock
Paso 3: Obtenga el SDK: para usar esta guía de introducción, debe tener Python ya instalado. A continuación, instale el software correspondiente en función del APIs que esté utilizando.
pip install boto3
Paso 4: Defina las variables de entorno: configure su entorno para que utilice la clave API para la autenticación.
AWS_BEARER_TOKEN_BEDROCK="<provide your Bedrock API key>"
Paso 5: Ejecute su primera solicitud de inferencia: guarde el archivo como bedrock-first-request.py