Incorpora v4 - Amazon Bedrock

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Incorpora v4

Cohere — Incorpora v4

Dettagli del modello

Embed v4 è il modello di incorporamento multimodale unificato di Cohere che elabora testo, immagini e contenuti misti in un unico modello per la ricerca e il RAG. Per ulteriori informazioni sullo sviluppo e sulle prestazioni del modello, consulta la model/service card.

  • Data di lancio del modello: 15 aprile 2025

  • Data EOL del modello: N/A

  • Contratti di licenza con l'utente finale e condizioni d'uso: Visualizza

  • Ciclo di vita del modello: attivo

  • Finestra contestuale: 128K token

Modalità di input Modalità di output APIs supportate Endpoint supportati
NoAudioYesIncorporamentoNo ResponsesYes bedrock-runtime
YesImmagineNoImmagineNo Chat CompletionsNo bedrock-mantle
NoDiscorsoNoDiscorsoYes Invoke
YesTestoNoTestoNo Converse
NoVideoNoVideo

Funzionalità e caratteristiche

Caratteristiche di base

Funzionalità supportate tramite endpoint bedrock-runtime

Prezzi

Per i prezzi, consulta la pagina dei prezzi di Amazon Bedrock.

Accesso programmatico

Utilizza il modello IDs e l'endpoint seguenti URLs per accedere a questo modello a livello di codice. Per ulteriori informazioni sugli endpoint disponibili, consulta APIs APIs Supported ed Endpoints supportati.

Endpoint ID del modello URL dell'endpoint locale ID di inferenza geografica ID di inferenza globale
bedrock-runtime cohere.embed-v4:0 https://bedrock-runtime.{region}.amazonaws.com

us.cohere.embed-v4:0

eu.cohere.embed-v4:0

global.cohere.embed-v4:0

Ad esempio, se la regione è us-east-1 (Virginia settentrionale), l'URL dell'endpoint bedrock-runtime sarà "" e per bedrock-mantle sarà https://bedrock-runtime.us-east-1.amazonaws.com "https://bedrock-mantle.us-east-1.api.aws/v1».

Livelli di servizio

Amazon Bedrock offre diversi livelli di servizio per soddisfare i tuoi requisiti di carico di lavoro. Standard fornisce pay-per-token l'accesso senza impegno. Priority offre una maggiore produttività con un impegno basato sul tempo. Flex offre un accesso a basso costo per carichi di lavoro flessibili. non-time-sensitive Reserved offre un throughput dedicato con un impegno a termine per carichi di lavoro prevedibili. Per ulteriori informazioni, consulta i livelli di servizio.

Standard Priorità Flex riservato
Yes No No No

Disponibilità regionale

Disponibilità regionale a colpo d'occhio

Bedrock offre tre opzioni di inferenza: In-Region mantiene le richieste all'interno di un'unica regione per garantire la massima conformità, percorsi geografici interregionali tra regioni all'interno di un'area geografica (Stati Uniti, UE, ecc.) per una maggiore velocità di trasmissione nel rispetto della residenza dei dati e rotte globali interregionali in tutto il mondo per la massima produttività quando non ci sono vincoli di residenza. Disponibilità regionaleConsulta la pagina per maggiori dettagli.

Region All'interno della regione Geo Globale
us-east-1(Virginia settentrionale)YesYesYes
us-east-2(Ohio)NoYesYes
us-west-1(California settentrionale)NoYesYes
us-west-2(Oregon)NoYesYes
ca-central-1(Canada)NoNoYes
eu-central-1(Francoforte)NoYesYes
eu-central-2(Zurigo)NoYesYes
eu-north-1(Stoccolma)NoYesYes
eu-south-1(Milano)NoYesYes
eu-south-2(Spagna)NoYesYes
eu-west-1(Irlanda)YesYesYes
eu-west-2(Londra)NoYesYes
eu-west-3(Parigi)NoYesYes
ap-northeast-1(Tokyo)YesNoYes
ap-northeast-2(Seul)NoNoYes
ap-northeast-3(Osaka)NoNoYes
ap-south-1(Mumbai)NoNoYes
ap-south-2(Hyderabad)NoNoYes
ap-southeast-1(Singapore)NoNoYes
ap-southeast-2(Sidney)NoNoYes
ap-southeast-3(Giacarta)NoNoYes
ap-southeast-4(Melbourne)NoNoYes
sa-east-1(San Paolo)NoNoYes

Dettagli di geo-inferenza

Geo: USA

ID di inferenza geografica: us.cohere.embed-v4:0

Regione di origine Regioni di destinazione
us-east-1 (Virginia settentrionale)us-east-1 (Virginia settentrionale), us-east-2 (Ohio), us-west-2 (Oregon)
us-east-2 (Ohio)us-east-1 (Virginia settentrionale), us-east-2 (Ohio), us-west-2 (Oregon)
us-west-1 (California settentrionale)us-east-1 (Virginia settentrionale), us-east-2 (Ohio), us-west-1 (California settentrionale), us-west-2 (Oregon)
us-west-2 (Oregon)us-east-1 (Virginia settentrionale), us-east-2 (Ohio), us-west-2 (Oregon)

Geografia: UE

ID di inferenza geografica: eu.cohere.embed-v4:0

Regione di origine Regioni di destinazione
eu-central-1 (Francoforte)eu-central-1 (Francoforte), eu-north-1 (Stoccolma), eu-south-1 (Milano), eu-south-2 (Spagna), eu-west-1 (Irlanda), eu-west-3 (Parigi)
eu-central-2 (Zurigo)eu-central-1 (Francoforte), eu-central-2 (Zurigo), eu-north-1 (Stoccolma), eu-south-1 (Milano), eu-south-2 (Spagna), eu-west-1 (Irlanda), eu-west-3 (Parigi)
eu-north-1 (Stoccolma)eu-central-1 (Francoforte), eu-north-1 (Stoccolma), eu-south-1 (Milano), eu-south-2 (Spagna), eu-west-1 (Irlanda), eu-west-3 (Parigi)
eu-south-1 (Milano)eu-central-1 (Francoforte), eu-north-1 (Stoccolma), eu-south-1 (Milano), eu-south-2 (Spagna), eu-west-1 (Irlanda), eu-west-3 (Parigi)
eu-south-2 (Spagna)eu-central-1 (Francoforte), eu-north-1 (Stoccolma), eu-south-1 (Milano), eu-south-2 (Spagna), eu-west-1 (Irlanda), eu-west-3 (Parigi)
eu-west-1 (Irlanda)eu-central-1 (Francoforte), eu-north-1 (Stoccolma), eu-south-1 (Milano), eu-south-2 (Spagna), eu-west-1 (Irlanda), eu-west-3 (Parigi)
eu-west-2 (Londra)eu-central-1 (Francoforte), eu-north-1 (Stoccolma), eu-south-1 (Milano), eu-south-2 (Spagna), eu-west-1 (Irlanda), eu-west-2 (Londra), eu-west-3 (Parigi)
eu-west-3 (Parigi)eu-central-1 (Francoforte), eu-north-1 (Stoccolma), eu-south-1 (Milano), eu-south-2 (Spagna), eu-west-1 (Irlanda), eu-west-3 (Parigi)

Dettagli di inferenza globale

ID di inferenza globale Americhe EMEA Asia-Pacifico
global.cohere.embed-v 4:0
  • us-east-1 (Virginia settentrionale)

  • us-east-2 (Ohio)

  • us-west-1 (California settentrionale)

  • us-west-2 (Oregon)

  • ca-central-1 (Canada)

  • sa-east-1 (San Paolo)

  • eu-central-1 (Francoforte)

  • eu-central-2 (Zurigo)

  • eu-north-1 (Stoccolma)

  • eu-south-1 (Milano)

  • eu-south-2 (Spagna)

  • eu-west-1 (Irlanda)

  • eu-west-2 (Londra)

  • eu-west-3 (Parigi)

  • ap-northeast-1 (Tokyo)

  • ap-northeast-2 (Seoul)

  • ap-northeast-3 (Osaka)

  • ap-south-1 (Mumbai)

  • ap-south-2 (Hyderabad)

  • ap-southeast-1 (Singapore)

  • ap-southeast-2 (Sydney)

  • ap-southeast-3 (Giacarta)

  • ap-southeast-4 (Melbourne)

Quote e limiti

Il tuo account AWS dispone di quote predefinite per mantenere le prestazioni del servizio e garantire un uso appropriato di Amazon Bedrock. Le quote predefinite assegnate a un account potrebbero essere aggiornate in base a fattori regionali, alla cronologia dei pagamenti, all'utilizzo fraudolento, all' and/or approvazione di una richiesta di aumento delle quote. Per maggiori dettagli, consulta la Quote per Amazon Bedrock documentazione e consulta i limiti del modello.

Codice di esempio

Fase 1 - Account AWS: se hai già un account AWS, salta questo passaggio. Se non conosci AWS, registrati per un account AWS.

Fase 2 - Chiave API: vai alla console Amazon Bedrock e genera una chiave API a lungo termine.

Passaggio 3 - Scarica l'SDK: per utilizzare questa guida introduttiva, devi avere Python già installato. Quindi installa il software pertinente a seconda di APIs quello che stai utilizzando.

pip install boto3

Passaggio 4 - Imposta le variabili di ambiente: configura l'ambiente per utilizzare la chiave API per l'autenticazione.

AWS_BEARER_TOKEN_BEDROCK="<provide your Bedrock API key>"

Passaggio 5 - Esegui la tua prima richiesta di inferenza: salva il file come bedrock-first-request.py

Invoke API
import json import boto3 client = boto3.client('bedrock-runtime', region_name='us-east-1') response = client.invoke_model( modelId='cohere.embed-v4:0', body=json.dumps({ 'messages': [{ 'role': 'user', 'content': 'Can you explain the features of Amazon Bedrock?'}], 'max_tokens': 1024 }) ) print(json.loads(response['body'].read()))