Intégrer v4 - Amazon Bedrock

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Intégrer v4

Cohere — Intégrer la version v4

Détails du modèle

Embed v4 est le modèle d'intégration multimodal unifié de Cohere qui traite le texte, les images et le contenu mixte dans un seul modèle pour la recherche et le RAG. Pour plus d'informations sur le développement et les performances des modèles, consultez la fiche modèle/service.

  • Date de lancement du modèle : 15 avril 2025

  • Date EOL du modèle : N/A

  • Contrats de licence utilisateur final et conditions d'utilisation : Afficher

  • Cycle de vie du modèle : actif

  • Fenêtre contextuelle : 128 000 jetons

Modalités de saisie Modalités de sortie APIs pris en charge Endpoints pris en charge
NoAudioYesIntégrationNo ResponsesYes bedrock-runtime
YesImageNoImageNo Chat CompletionsNo bedrock-mantle
NoDiscoursNoDiscoursYes Invoke
YesTexteNoTexteNo Converse
NoVidéoNoVidéo

Capacités et fonctionnalités

Caractéristiques de Bedrock

Fonctionnalités prises en charge avec bedrock-runtime Endpoint

Tarification

Pour connaître les tarifs, consultez la page de tarification d'Amazon Bedrock.

Accès programmatique

Utilisez le modèle IDs et le point de terminaison suivants URLs pour accéder à ce modèle par programmation. Pour plus d'informations sur les terminaux disponibles APIs et les points de terminaison, consultez les sections APIs Supportés et Terminaux pris en charge.

Point de terminaison ID du modèle URL du point de terminaison régional Identifiant d'inférence géographique ID d'inférence global
bedrock-runtime cohere.embed-v4:0 https://bedrock-runtime.{region}.amazonaws.com

us.cohere.embed-v4:0

eu.cohere.embed-v4:0

global.cohere.embed-v4:0

Par exemple, si la région est us-east-1 (Virginie du Nord), l'URL du point de terminaison de bedrock-runtime sera « » et celle de bedrock-mantle sera https://bedrock-runtime.us-east-1.amazonaws.com « https://bedrock-mantle.us-east-1.api.aws/v1 ».

Niveaux de service

Amazon Bedrock propose plusieurs niveaux de service pour répondre à vos exigences en matière de charge de travail. Standard fournit pay-per-token un accès sans engagement. Priority offre un débit plus élevé avec un engagement basé sur le temps. Flex fournit un accès à moindre coût pour des charges de non-time-sensitive travail flexibles. Reserved fournit un débit dédié avec un engagement à terme pour des charges de travail prévisibles. Pour plus d'informations, consultez la section niveaux de service.

Standard Priorité Flex Réservé
Yes No No No

Disponibilité par région

La disponibilité régionale en un coup d'œil

Bedrock propose trois options d'inférence : les itinéraires régionaux conservent les demandes au sein d'une même région pour une conformité stricte, les itinéraires géo-interrégionaux à travers les régions d'une même zone géographique (États-Unis, UE, etc.) pour un débit plus élevé tout en respectant la résidence des données, et les itinéraires interrégionaux mondiaux partout dans le monde pour un débit maximal en l'absence de contraintes de résidence. Reportez-vous à la Disponibilité par région page pour plus de détails.

Région Dans la région Géo Solution internationale
us-east-1(Virginie du Nord)YesYesYes
us-east-2(Ohio)NoYesYes
us-west-1(Californie du Nord)NoYesYes
us-west-2(Oregon)NoYesYes
ca-central-1(Canada)NoNoYes
eu-central-1(Francfort)NoYesYes
eu-central-2(Zürich)NoYesYes
eu-north-1(Stockholm)NoYesYes
eu-south-1(Milan)NoYesYes
eu-south-2(Espagne)NoYesYes
eu-west-1(Irlande)YesYesYes
eu-west-2(Londres)NoYesYes
eu-west-3(Paris)NoYesYes
ap-northeast-1(Tokyo)YesNoYes
ap-northeast-2(Séoul)NoNoYes
ap-northeast-3(Osaka)NoNoYes
ap-south-1(Bombay)NoNoYes
ap-south-2(Hyderâbâd)NoNoYes
ap-southeast-1(Singapour)NoNoYes
ap-southeast-2(Sydney)NoNoYes
ap-southeast-3(Jakarta)NoNoYes
ap-southeast-4(Melbourne)NoNoYes
sa-east-1(Sao Paulo)NoNoYes

Détails de la géo-inférence

Géo : États-Unis

Identifiant d'inférence géographique : us.cohere.embed-v4:0

Région source Régions de destination
us-east-1 (Virginie du Nord)us-east-1 (Virginie du Nord), us-east-2 (Ohio), us-west-2 (Oregon)
us-east-2 (Ohio)us-east-1 (Virginie du Nord), us-east-2 (Ohio), us-west-2 (Oregon)
us-west-1 (Californie du Nord)us-east-1 (Virginie du Nord), us-east-2 (Ohio), us-west-1 (Californie du Nord), us-west-2 (Oregon)
us-west-2 (Oregon)us-east-1 (Virginie du Nord), us-east-2 (Ohio), us-west-2 (Oregon)

Géo : UE

Identifiant d'inférence géographique : eu.cohere.embed-v4:0

Région source Régions de destination
eu-central-1 (Francfort)eu-central-1 (Francfort), eu-north-1 (Stockholm), eu-south-1 (Milan), eu-south-2 (Espagne), eu-west-1 (Irlande), eu-west-3 (Paris)
eu-central-2 (Zürich)eu-central-1 (Francfort), eu-central-2 (Zurich), eu-nord-1 (Stockholm), eu-south-1 (Milan), eu-south-2 (Espagne), eu-west-1 (Irlande), eu-west-3 (Paris)
eu-north-1 (Stockholm)eu-central-1 (Francfort), eu-north-1 (Stockholm), eu-south-1 (Milan), eu-south-2 (Espagne), eu-west-1 (Irlande), eu-west-3 (Paris)
eu-south-1 (Milan)eu-central-1 (Francfort), eu-north-1 (Stockholm), eu-south-1 (Milan), eu-south-2 (Espagne), eu-west-1 (Irlande), eu-west-3 (Paris)
eu-south-2 (Espagne)eu-central-1 (Francfort), eu-north-1 (Stockholm), eu-south-1 (Milan), eu-south-2 (Espagne), eu-west-1 (Irlande), eu-west-3 (Paris)
eu-west-1 (Irlande)eu-central-1 (Francfort), eu-north-1 (Stockholm), eu-south-1 (Milan), eu-south-2 (Espagne), eu-west-1 (Irlande), eu-west-3 (Paris)
eu-west-2 (Londres)eu-central-1 (Francfort), eu-nord-1 (Stockholm), eu-sud-1 (Milan), eu-south-2 (Espagne), eu-west-1 (Irlande), eu-west-2 (Londres), eu-west-3 (Paris)
eu-west-3 (Paris)eu-central-1 (Francfort), eu-north-1 (Stockholm), eu-south-1 (Milan), eu-south-2 (Espagne), eu-west-1 (Irlande), eu-west-3 (Paris)

Détails de l'inférence globale

ID d'inférence global Amériques EMEA Asie-Pacifique
global.cohere.embed-v 4:0
  • us-east-1 (Virginie du Nord)

  • us-east-2 (Ohio)

  • us-west-1 (Californie du Nord)

  • us-west-2 (Oregon)

  • ca-central-1 (Canada)

  • sa-east-1 (São Paulo)

  • eu-central-1 (Francfort)

  • eu-central-2 (Zürich)

  • eu-north-1 (Stockholm)

  • eu-south-1 (Milan)

  • eu-south-2 (Espagne)

  • eu-west-1 (Irlande)

  • eu-west-2 (Londres)

  • eu-west-3 (Paris)

  • ap-northeast-1 (Tokyo)

  • ap-northeast-2 (Séoul)

  • ap-northeast-3 (Ōsaka)

  • ap-south-1 (Bombay)

  • ap-south-2 (Hyderabad)

  • ap-southeast-1 (Singapour)

  • ap-southeast-2 (Sydney)

  • ap-southeast-3 (Jakarta)

  • ap-southeast-4 (Melbourne)

Quotas et limites

Votre compte AWS dispose de quotas par défaut pour maintenir les performances du service et garantir une utilisation appropriée d'Amazon Bedrock. Les quotas par défaut attribués à un compte peuvent être mis à jour en fonction de facteurs régionaux, de l'historique des paiements, de l'utilisation frauduleuse ou de and/or l'approbation d'une demande d'augmentation de quota. Pour plus de détails, reportez-vous à Quotas pour Amazon Bedrock la documentation et aux limites du modèle.

Exemple de code

Étape 1 - Compte AWS : si vous possédez déjà un compte AWS, ignorez cette étape. Si vous utilisez AWS pour la première fois, créez un compte AWS.

Étape 2 - Clé d'API : accédez à la console Amazon Bedrock et générez une clé d'API à long terme.

Étape 3 - Téléchargez le SDK : pour utiliser ce guide de démarrage, Python doit déjà être installé. Installez ensuite le logiciel approprié en fonction de celui APIs que vous utilisez.

pip install boto3

Étape 4 - Définissez les variables d'environnement : configurez votre environnement pour utiliser la clé API pour l'authentification.

AWS_BEARER_TOKEN_BEDROCK="<provide your Bedrock API key>"

Étape 5 - Exécutez votre première demande d'inférence : enregistrez le fichier sous bedrock-first-request.py

Invoke API
import json import boto3 client = boto3.client('bedrock-runtime', region_name='us-east-1') response = client.invoke_model( modelId='cohere.embed-v4:0', body=json.dumps({ 'messages': [{ 'role': 'user', 'content': 'Can you explain the features of Amazon Bedrock?'}], 'max_tokens': 1024 }) ) print(json.loads(response['body'].read()))