As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Comando R
Cohere — Comando R
Detalhes do modelo
O Command R é o LLM escalável da Cohere, otimizado para geração com recuperação aumentada e uso de ferramentas em aplicativos corporativos com uma janela de contexto de 128K. Para obter mais informações sobre desenvolvimento e desempenho de modelos, consulte o modelo/cartão de serviço
Data de lançamento do modelo: agosto de 2024
Data EOL do modelo: N/A
Contratos de licença de usuário final e termos de uso: Exibir
Ciclo de vida do modelo: Ativo
Janela de contexto: 128K tokens
Tokens de saída máximos: 4K
Limite de conhecimento: março de 2024
| Modalidades de entrada | Modalidades de saída | APIs suportado | Endpoints suportados |
|---|---|---|---|
Responses | bedrock-runtime | ||
Chat Completions | bedrock-mantle | ||
Invoke | |||
Converse | |||
Preços
Para obter os preços, consulte a página de preços do Amazon Bedrock
Acesso programático
Use o modelo IDs e o endpoint URLs a seguir para acessar esse modelo programaticamente. Para obter mais informações sobre os endpoints disponíveis APIs , consulte APIs suportados e Endpoints suportados.
| Endpoint | ID do modelo | URL do endpoint na região | ID de inferência geográfica | ID de inferência global |
|---|---|---|---|---|
bedrock-runtime |
cohere.command-r-v1:0 |
https://bedrock-runtime.{region}.amazonaws.com |
Sem compatibilidade | Sem compatibilidade |
Por exemplo, se a região for us-east-1 (Norte da Virgínia), a URL do endpoint bedrock-runtime será "" e para bedrock-mantle será https://bedrock-runtime.us-east-1.amazonaws.com "https://bedrock-mantle.us-east-1.api.aws/v1”.
Níveis de serviço
O Amazon Bedrock oferece vários níveis de serviço para atender às suas necessidades de carga de trabalho. O padrão fornece pay-per-token acesso sem compromisso. O Priority oferece maior produtividade com um compromisso baseado em tempo. O Flex fornece acesso de baixo custo para cargas de trabalho flexíveis. non-time-sensitive O Reserved fornece taxa de transferência dedicada com um compromisso de longo prazo para cargas de trabalho previsíveis. Para obter mais informações, consulte níveis de serviço.
| Padrão | Priority | Flexionar | Reservado |
|---|---|---|---|
Disponibilidade regional
Visão geral da disponibilidade regional
A Bedrock oferece três opções de inferência: In-Region mantém as solicitações em uma única região para conformidade estrita, rotas geográficas entre regiões dentro de uma geografia (EUA, UE, etc.) para maior produtividade, respeitando a residência dos dados, e rotas globais entre regiões em qualquer lugar do mundo para máxima produtividade quando não há restrições de residência. Consulte a Disponibilidade regional página para obter mais detalhes.
| Região | Na região | Geo | Global |
|---|---|---|---|
us-east-1(Norte da Virgínia) | |||
us-west-2(Oregon) |
Cotas e limites
Sua conta da AWS tem cotas padrão para manter o desempenho do serviço e garantir o uso adequado do Amazon Bedrock. As cotas padrão atribuídas a uma conta podem ser atualizadas dependendo de fatores regionais, histórico de pagamentos, uso fraudulento e and/or aprovação de uma solicitação de aumento de cota. Para obter mais detalhes, consulte a Cotas do Amazon Bedrock documentação e veja os limites do modelo.
Código de exemplo
Etapa 1 - Conta da AWS: se você já tem uma conta da AWS, pule esta etapa. Se você é novo na AWS, cadastre-se em uma conta da AWS
Etapa 2 - Chave de API: acesse o console do Amazon Bedrock
Etapa 3 - Obtenha o SDK: para usar este guia de introdução, você deve ter o Python já instalado. Em seguida, instale o software relevante, dependendo do APIs que você está usando.
pip install boto3
Etapa 4 - Definir variáveis de ambiente: configure seu ambiente para usar a chave de API para autenticação.
AWS_BEARER_TOKEN_BEDROCK="<provide your Bedrock API key>"
Etapa 5 - Execute sua primeira solicitação de inferência: salve o arquivo como bedrock-first-request.py