Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Titan Text Embeddings V2
Amazon — Incorporamenti di testo Titan V2
Dettagli del modello
Titan Text Embeddings V2 è il modello di incorporamento di testo di seconda generazione di Amazon con dimensioni di output configurabili e maggiore precisione per le attività di recupero. Per ulteriori informazioni sullo sviluppo e sulle prestazioni del modello, consulta la scheda. model/service
Data di lancio del modello: 30 aprile 2024
Data di fine del modello: non prima del /2024 4/30
Contratti di licenza con l'utente finale e condizioni d'uso: Visualizza
Ciclo di vita del modello: attivo
Finestra contestuale: 8K token
| Modalità di input | Modalità di output | API supportate | Endpoint supportati |
|---|---|---|---|
Responses | bedrock-runtime | ||
Chat Completions | bedrock-mantle | ||
Invoke | |||
Converse | |||
Prezzi
Per i prezzi, consulta la pagina dei prezzi di Amazon Bedrock
Accesso programmatico
Utilizza i seguenti ID di modello e URL degli endpoint per accedere a questo modello a livello di codice. Per ulteriori informazioni sulle API e sugli endpoint disponibili, consulta API supportate e Endpoint supportati.
| Endpoint | ID del modello | In-Region URL dell'endpoint | ID di inferenza geografica | ID di inferenza globale |
|---|---|---|---|---|
bedrock-runtime |
amazon.titan-embed-text-v2:0 |
https://bedrock-runtime.{region}.amazonaws.com |
Non supportata | Non supportata |
Ad esempio, se region è us-east-1 (Virginia settentrionale), l'URL dell'endpoint bedrock-runtime sarà "" e per bedrock-mantle sarà https://bedrock-runtime.us-east-1.amazonaws.com "». https://bedrock-mantle.us-east-1.api.aws/v1
Livelli di servizio
Amazon Bedrock offre diversi livelli di servizio per soddisfare i tuoi requisiti di carico di lavoro. Standard offre un accesso pay-per-token senza impegno. Priority offre un throughput più elevato con un impegno basato sul tempo. Flex offre un accesso a basso costo per carichi di lavoro flessibili e non urgenti. Reserved offre un throughput dedicato con un impegno a termine per carichi di lavoro prevedibili. Per ulteriori informazioni, consulta i livelli di servizio.
| Standard | Priorità | Flex | riservato |
|---|---|---|---|
Disponibilità regionale
Disponibilità regionale a colpo d'occhio
Bedrock offre tre opzioni di inferenza: In-Regionmantiene le richieste all'interno di una singola regione per garantire la massima conformità, instradamenti Cross-Regiongeografici tra regioni all'interno di un'area geografica (Stati Uniti, UE, ecc.) per una maggiore velocità di trasmissione nel rispetto della residenza dei dati e Cross-Region percorsi globali ovunque in tutto il mondo per la massima velocità di trasmissione quando non ci sono vincoli di residenza. Consulta la pagina per maggiori dettagli. Disponibilità regionale
| Region | In-Region | Geo | Globale |
|---|---|---|---|
us-east-1(Virginia settentrionale) | |||
us-east-2(Ohio) | |||
us-west-2(Oregon) | |||
us-gov-east-1 (GovCloud) | |||
us-gov-west-1 (GovCloud) | |||
ca-central-1(Canada) | |||
eu-central-1(Francoforte) | |||
eu-central-2(Zurigo) | |||
eu-north-1(Stoccolma) | |||
eu-south-1(Milano) | |||
eu-south-2(Spagna) | |||
eu-west-1(Irlanda) | |||
eu-west-2(Londra) | |||
eu-west-3(Parigi) | |||
ap-northeast-1(Tokyo) | |||
ap-northeast-2(Seul) | |||
ap-northeast-3(Osaka) | |||
ap-south-1(Mumbai) | |||
ap-south-2(Hyderabad) | |||
ap-southeast-2(Sidney) | |||
sa-east-1(San Paolo) |
Quote e limiti
Il tuo account AWS dispone di quote predefinite per mantenere le prestazioni del servizio e garantire un uso appropriato di Amazon Bedrock. Le quote predefinite assegnate a un account potrebbero essere aggiornate in base a fattori regionali, alla cronologia dei pagamenti, all'utilizzo fraudolento, all' and/or approvazione di una richiesta di aumento delle quote. Per maggiori dettagli, consulta la Quote per Amazon Bedrock documentazione e consulta i limiti del modello.
Codice di esempio
Fase 1 - Account AWS: se hai già un account AWS, salta questo passaggio. Se non conosci AWS, registrati per un account AWS
Fase 2 - Chiave API: vai alla console Amazon Bedrock
Passaggio 3 - Scarica l'SDK: per utilizzare questa guida introduttiva, devi avere Python già installato. Quindi installa il software pertinente in base alle API che stai utilizzando.
pip install boto3
Passaggio 4 - Imposta le variabili di ambiente: configura l'ambiente per utilizzare la chiave API per l'autenticazione.
AWS_BEARER_TOKEN_BEDROCK="<provide your Bedrock API key>"
Passaggio 5 - Esegui la tua prima richiesta di inferenza: salva il file come bedrock-first-request.py