內嵌 v4 - Amazon Bedrock

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

內嵌 v4

Cohere — 內嵌 v4

模型詳細資訊

內嵌 v4 是 Cohere 的統一多模式內嵌模型,可在單一模型中處理文字、影像和混合內容,以供搜尋和 RAG 使用。如需模型開發和效能的詳細資訊,請參閱模型/服務卡

  • 模型啟動日期:2025 年 4 月 15 日

  • 模型 EOL 日期:不適用

  • 最終使用者授權合約和使用條款:檢視

  • 模型生命週期:作用中

  • 內容視窗:128K 權杖

輸入模式 輸出模式 支援的 APIs 支援的端點
No 音訊Yes 內嵌No ResponsesYes bedrock-runtime
Yes 影像No 影像No Chat CompletionsNo bedrock-mantle
No 語音No 語音Yes Invoke
Yes 文字No 文字No Converse
No 影片No 影片

功能和功能

Bedrock 功能

使用bedrock-runtime端點支援的功能

定價

如需定價,請參閱 Amazon Bedrock 定價頁面。

程式設計存取

使用以下模型 IDs和端點 URLs以程式設計方式存取此模型。如需可用 APIs和端點的詳細資訊,請參閱支援的 APIs支援的端點

端點 模型 ID 區域端點 URL 地理推論 ID 全域推論 ID
bedrock-runtime cohere.embed-v4:0 https://bedrock-runtime.{region}.amazonaws.com

us.cohere.embed-v4:0

eu.cohere.embed-v4:0

global.cohere.embed-v4:0

例如,如果區域是 us-east-1 (維吉尼亞北部),則 bedrock-runtime 端點 URL 將為 "https://bedrock-runtime.us-east-1.amazonaws.com",而 bedrock-mantle 則為 "https://bedrock-mantle.us-east-1.api.aws/v1"。

服務層

Amazon Bedrock 提供多種服務層,以符合您的工作負載需求。Standard pay-per-token存取,無需任何承諾。優先順序透過以時間為基礎的承諾提供更高的輸送量。Flex 為彈性、non-time-sensitive工作負載提供較低成本的存取。預留提供專用輸送量,並承諾可預測工作負載的期限。如需詳細資訊,請參閱 服務方案

標準 優先順序 Flex 預留
Yes No No No

區域可用性

區域可用性一目了然

Bedrock 提供三種推論選項:為嚴格合規,區域內將請求保留在單一 區域內,地理位置 (美國、歐洲等) 內區域間的地理跨區域路由可提高輸送量,同時遵守資料駐留,而全球跨區域路由則可在無駐留限制的情況下,在全球任何地方提供最大輸送量。如需詳細資訊,請參閱 區域可用性頁面。

區域 區域內 地理 全域
us-east-1 (維吉尼亞北部)YesYesYes
us-east-2 (俄亥俄)NoYesYes
us-west-1 (加利佛尼亞北部)NoYesYes
us-west-2 (奧勒岡)NoYesYes
ca-central-1 (加拿大)NoNoYes
eu-central-1 (法蘭克福)NoYesYes
eu-central-2 (蘇黎世)NoYesYes
eu-north-1 (斯德哥爾摩)NoYesYes
eu-south-1 (米蘭)NoYesYes
eu-south-2 (西班牙)NoYesYes
eu-west-1 (愛爾蘭)YesYesYes
eu-west-2 (倫敦)NoYesYes
eu-west-3 (巴黎)NoYesYes
ap-northeast-1 (東京)YesNoYes
ap-northeast-2 (首爾)NoNoYes
ap-northeast-3 (大阪)NoNoYes
ap-south-1 (孟買)NoNoYes
ap-south-2 (海德拉巴)NoNoYes
ap-southeast-1 (新加坡)NoNoYes
ap-southeast-2 (雪梨)NoNoYes
ap-southeast-3 (雅加達)NoNoYes
ap-southeast-4 (墨爾本)NoNoYes
sa-east-1 (聖保羅)NoNoYes

地理推論詳細資訊

地理:美國

地理推論 ID: us.cohere.embed-v4:0

來源區域 目的地區域
us-east-1(維吉尼亞北部)us-east-1 (維吉尼亞北部)、us-east-2 (俄亥俄)、us-west-2 (奧勒岡)
us-east-2(俄亥俄)us-east-1 (維吉尼亞北部)、us-east-2 (俄亥俄)、us-west-2 (奧勒岡)
us-west-1 (加利佛尼亞北部)us-east-1 (維吉尼亞北部)、us-east-2 (俄亥俄)、us-west-1 (加利佛尼亞北部)、us-west-2 (奧勒岡)
us-west-2(奧勒岡)us-east-1 (維吉尼亞北部)、us-east-2 (俄亥俄)、us-west-2 (奧勒岡)

地理:歐洲

地理推論 ID: eu.cohere.embed-v4:0

來源區域 目的地區域
eu-central-1(法蘭克福)eu-central-1 (法蘭克福)、eu-north-1 (斯德哥爾摩)、eu-south-1 (米蘭)、eu-south-2 (西班牙)、eu-west-1 (愛爾蘭)、eu-west-3 (巴黎)
eu-central-2 (蘇黎世)eu-central-1 (法蘭克福)、eu-central-2 (蘇黎世)、eu-north-1 (斯德哥爾摩)、eu-south-1 (米蘭)、eu-south-2 (西班牙)、eu-west-1 (愛爾蘭)、eu-west-3 (巴黎)
eu-north-1(斯德哥爾摩)eu-central-1 (法蘭克福)、eu-north-1 (斯德哥爾摩)、eu-south-1 (米蘭)、eu-south-2 (西班牙)、eu-west-1 (愛爾蘭)、eu-west-3 (巴黎)
eu-south-1 (米蘭)eu-central-1 (法蘭克福)、eu-north-1 (斯德哥爾摩)、eu-south-1 (米蘭)、eu-south-2 (西班牙)、eu-west-1 (愛爾蘭)、eu-west-3 (巴黎)
eu-south-2 (西班牙)eu-central-1 (法蘭克福)、eu-north-1 (斯德哥爾摩)、eu-south-1 (米蘭)、eu-south-2 (西班牙)、eu-west-1 (愛爾蘭)、eu-west-3 (巴黎)
eu-west-1(愛爾蘭)eu-central-1 (法蘭克福)、eu-north-1 (斯德哥爾摩)、eu-south-1 (米蘭)、eu-south-2 (西班牙)、eu-west-1 (愛爾蘭)、eu-west-3 (巴黎)
eu-west-2(倫敦)eu-central-1 (法蘭克福)、eu-north-1 (斯德哥爾摩)、eu-south-1 (米蘭)、eu-south-2 (西班牙)、eu-west-1 (愛爾蘭)、eu-west-2 (倫敦)、eu-west-3 (巴黎)
eu-west-3(巴黎)eu-central-1 (法蘭克福)、eu-north-1 (斯德哥爾摩)、eu-south-1 (米蘭)、eu-south-2 (西班牙)、eu-west-1 (愛爾蘭)、eu-west-3 (巴黎)

全域推論詳細資訊

全域推論 ID 美洲 EMEA 亞太區域
global.cohere.embed-v4:0
  • us-east-1(維吉尼亞北部)

  • us-east-2(俄亥俄)

  • us-west-1 (加利佛尼亞北部)

  • us-west-2(奧勒岡)

  • ca-central-1 (加拿大)

  • sa-east-1(聖保羅)

  • eu-central-1(法蘭克福)

  • eu-central-2 (蘇黎世)

  • eu-north-1(斯德哥爾摩)

  • eu-south-1 (米蘭)

  • eu-south-2 (西班牙)

  • eu-west-1(愛爾蘭)

  • eu-west-2(倫敦)

  • eu-west-3(巴黎)

  • ap-northeast-1(東京)

  • ap-northeast-2(首爾)

  • ap-northeast-3 (大阪)

  • ap-south-1(孟買)

  • ap-south-2 (海德拉巴)

  • ap-southeast-1(新加坡)

  • ap-southeast-2(雪梨)

  • ap-southeast-3 (雅加達)

  • ap-southeast-4 (墨爾本)

配額和限制

您的 AWS 帳戶具有預設配額來維持服務的效能,並確保適當使用 Amazon Bedrock。指派給帳戶的預設配額可能會根據區域因素、付款歷史記錄、詐騙使用量和/或配額增加請求的核准而更新。如需詳細資訊,請參閱 Amazon Bedrock 的配額 文件並查看模型的限制

範例程式碼

步驟 1 - AWS 帳戶:如果您已經有 AWS 帳戶,請略過此步驟。如果您是初次使用 AWS,請註冊 AWS 帳戶

步驟 2 - API 金鑰:前往 Amazon Bedrock 主控台並產生長期 API 金鑰。

步驟 3 - 取得 SDK:若要使用此入門指南,您必須已安裝 Python。然後,根據您使用的 APIs相關軟體。

pip install boto3

步驟 4 - 設定環境變數:設定您的環境以使用 API 金鑰進行身分驗證。

AWS_BEARER_TOKEN_BEDROCK="<provide your Bedrock API key>"

步驟 5 - 執行您的第一個推論請求:將檔案儲存為 bedrock-first-request.py

Invoke API
import json import boto3 client = boto3.client('bedrock-runtime', region_name='us-east-1') response = client.invoke_model( modelId='cohere.embed-v4:0', body=json.dumps({ 'messages': [{ 'role': 'user', 'content': 'Can you explain the features of Amazon Bedrock?'}], 'max_tokens': 1024 }) ) print(json.loads(response['body'].read()))