Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Geografische regionsübergreifende Inferenz
Regionsübergreifende geografische Inferenz hält die Datenverarbeitung innerhalb bestimmter geografischer Grenzen (USA, EU, APAC usw.) und bietet gleichzeitig einen höheren Durchsatz als Inferenz mit einer einzelnen Region. Diese Option ist ideal für Unternehmen mit Anforderungen an die Datenresidenz und Compliance-Vorschriften.
Überlegungen zu regionsübergreifenden Inferenzen
Beachten Sie die folgenden Informationen zur regionsübergreifenden geographischen Inferenz:
-
Cross-Region Inferenzanfragen für ein an eine bestimmte Region gebundenes Inferenzprofil (z. B. USA, EU und APAC) werden innerhalb der Region gespeichert, die Teil der Region ist AWS-Regionen , in der sich die Daten ursprünglich befinden. Beispielsweise wird eine in den USA gestellte Anfrage innerhalb der USA aufbewahrt. AWS-Regionen Obwohl die Daten nur in der Quellregion gespeichert bleiben, können Ihre Prompts und Ausgabeergebnisse bei Verwendung der regionsübergreifenden Inferenz sich möglicherweise außerhalb der Quellregion bewegen. Alle Daten werden bei der Übertragung über das sichere Netzwerk von Amazon verschlüsselt.
-
Die Standardkontingente für den regionsübergreifenden Durchsatz bei der Verwendung von Inferenzprofilen, die an eine bestimmte Region gebunden sind (z. B. USA, EU und APAC), finden Sie in der Allgemeinen Referenz unter Cross-region Modellinferenzanfragen pro Minute für $ {Model} und Cross-region Modellinferenz-Token pro Minute für $ {Model} -Werte in Amazon Bedrock Service-Kontingente.AWS
IAM-Richtlinienanforderungen für geografische regionsübergreifende Inferenz
Damit ein IAM-Benutzer oder eine IAM-Rolle ein regionsübergreifendes geografisches Inferenzprofil aufrufen kann, müssen Sie Zugriff auf die folgenden Ressourcen gewähren:
-
Das geografiespezifische regionsübergreifende Inferenzprofil (diese Profile haben geografische Präfixe wie,,)
useuapac -
Das Basismodell in der Quellregion
-
Das Gründungsmodell in allen Zielregionen, die im geografischen Profil aufgeführt sind
Die folgende Beispielrichtlinie gewährt die erforderlichen Berechtigungen zur Verwendung des Claude Sonnet 4.5-Foundation-Modells mit einem geografisch übergreifenden Inferenzprofil für die USA, wobei sich die Quellregion us-east-1 und die Zielregionenus-east-1,, us-east-2 und befinden: us-west-2
{ "Version": "2012-10-17", "Statement": [ { "Sid": "GrantGeoCrisInferenceProfileAccess", "Effect": "Allow", "Action": "bedrock:InvokeModel", "Resource": [ "arn:aws:bedrock:us-east-1:<ACCOUNT_ID>:inference-profile/us.anthropic.claude-sonnet-4-5-20250929-v1:0" ] }, { "Sid": "GrantGeoCrisModelAccess", "Effect": "Allow", "Action": "bedrock:InvokeModel", "Resource": [ "arn:aws:bedrock:us-east-1::foundation-model/anthropic.claude-sonnet-4-5-20250929-v1:0", "arn:aws:bedrock:us-east-2::foundation-model/anthropic.claude-sonnet-4-5-20250929-v1:0", "arn:aws:bedrock:us-west-2::foundation-model/anthropic.claude-sonnet-4-5-20250929-v1:0" ], "Condition": { "StringEquals": { "bedrock:InferenceProfileArn": "arn:aws:bedrock:us-east-1:<ACCOUNT_ID>:inference-profile/us.anthropic.claude-sonnet-4-5-20250929-v1:0" } } } ] }
Die erste Anweisung gewährt bedrock:InvokeModel API-Zugriff auf das Geographic Cross-Region-Inferenzprofil für Anfragen, die aus der anfragenden Region stammen. Die zweite Anweisung gewährt bedrock:InvokeModel API-Zugriff auf das Foundation-Modell sowohl in der anfragenden Region als auch in allen im Inferenzprofil aufgeführten Zielregionen.
Anforderungen an die Service Control-Richtlinie für geografische regionsübergreifende Inferenzen
Viele Organizations implementieren regionale Zugriffskontrollen im Rahmen von Service Control Policies in AWS Organisationen aus Sicherheits- und Compliance-Gründen. Wenn die Sicherheitsrichtlinie Ihrer Organisation SCPs verwendet, um ungenutzte Regionen zu blockieren, müssen Sie sicherstellen, dass Ihre Region-specific SCP-Bedingungen den Zugriff auf alle Zielregionen zulassen, die im geografisch übergreifenden Inferenzprofil für Ihre Quellregion aufgeführt sind.
Für regionsübergreifende geografische Inferenzen müssen Sie die Beziehung zwischen Ihrer Quellregion (wo Sie den API-Aufruf tätigen) und den Zielregionen (an die Anfragen weitergeleitet werden können) verstehen. Lesen Sie in der Dokumentation zum Inferenzprofil nach, um alle Zielregionen für Ihre Quellregion zu identifizieren, und stellen Sie dann sicher, dass Ihre SCPs den Zugriff auf all diese Zielregionen ermöglichen.
Wenn Sie beispielsweise von us-east-1 (Quellregion) aus anrufen und das geografische Profil US Anthropic Claude Sonnet 4.5 verwenden, können Anfragen an us-east-1, us-east-2 und us-west-2 (Zielregionen) weitergeleitet werden. Wenn ein SCP den Zugriff nur auf us-east-1 einschränkt, schlägt die regionsübergreifende Inferenz fehl, wenn versucht wird, nach us-east-2 oder us-west-2 zu routen. Daher müssen Sie alle drei Zielregionen in Ihrem SCP zulassen, unabhängig davon, aus welcher Region Sie anrufen.
Denken Sie bei der Konfiguration von SCPs für den Ausschluss von Regionen daran, dass das Blockieren einer beliebigen Zielregion im Inferenzprofil verhindert, dass regionsübergreifende Inferenzen ordnungsgemäß funktionieren, selbst wenn Ihre Quellregion weiterhin zugänglich ist. Informationen zu den SCP-Anforderungen für globale regionsübergreifende Inferenz finden Sie unter. Anforderungen an die Service Control-Richtlinie für globale regionsübergreifende Inferenz
Um die Sicherheit zu erhöhen, sollten Sie erwägen, die bedrock:InferenceProfileArn Bedingung zu verwenden, um den Zugriff auf bestimmte Inferenzprofile zu beschränken. Auf diese Weise können Sie Zugriff auf die erforderlichen Regionen gewähren und gleichzeitig einschränken, welche Inferenzprofile verwendet werden können.
Verwenden Sie geografische regionsübergreifende Inferenz
Um die regionsübergreifende geografische Inferenz zu verwenden, fügen Sie ein Inferenzprofil hinzu, wenn Sie die Modellinferenz auf folgende Weise ausführen:
-
On-demand Modellinferenz — Geben Sie die ID des Inferenzprofils an, die
modelIdbeim Senden einer InvokeModel, InvokeModelWithResponseStreamConverse oder -Anforderung verwendet wird. ConverseStream Ein Inferenzprofil definiert eine oder mehrere Regionen, an die es Inferenzanforderungen weiterleiten kann, die aus Ihrer Quellregion stammen. Die Verwendung von regionenübergreifender Inferenz erhöht den Durchsatz und die Leistung, indem Modellaufrufanforderungen dynamisch an die im Inferenzprofil definierten Regionen weitergeleitet werden. Routing beeinflusst den Benutzerverkehr, den Bedarf und die Nutzung von Ressourcen. Weitere Informationen finden Sie unter Inferenzanfragen stellen. -
Batch-Inferenz — Senden Sie Anfragen asynchron mit Batch-Inferenz, indem Sie beim Senden einer Anfrage die ID des Inferenzprofils
modelIdals die angeben. CreateModelInvocationJob Durch die Verwendung eines Inferenzprofils können Sie die Rechenleistung für mehrere Aufgaben verwenden AWS-Regionen und so schnellere Verarbeitungszeiten für Ihre Batch-Jobs erzielen. Nach Abschluss des Auftrags können Sie die Ausgabedateien aus dem Amazon-S3-Bucket in der Quellregion abrufen. -
Agenten – Geben Sie die ID des Inferenzprofils in das Feld
foundationModelder Anforderung CreateAgent ein. Weitere Informationen finden Sie unter Manuelles Erstellen und Konfigurieren von Agenten. -
Generierung von Antworten in der Wissensdatenbank – Sie können eine regionenübergreifende Inferenz verwenden, wenn Sie nach der Abfrage einer Wissensdatenbank eine Antwort generieren. Weitere Informationen finden Sie unter Testen Ihrer Wissensdatenbank mit Abfragen und Antworten.
-
Modellbewertung – Sie können ein Inferenzprofil als Modell zur Bewertung senden, wenn Sie einen Auftrag zur Modellbewertung übermitteln. Weitere Informationen finden Sie unter Die Leistung von Amazon-Bedrock-Ressourcen bewerten.
-
Prompt-Management – Sie können eine regionenübergreifende Inferenz verwenden, wenn Sie eine Antwort für einen Prompt generieren, die Sie im Prompt-Management erstellt haben. Weitere Informationen finden Sie unter Erstellen und Speichern wiederverwendbarer Prompts mit dem Prompt-Management in Amazon Bedrock.
-
Prompt-Abläufe – Sie können eine regionenübergreifende Inferenz verwenden, wenn Sie eine Antwort für einen Prompt generieren, die Sie inline in einem Prompt-Knoten in einem Prompt-Ablauf definiert haben. Weitere Informationen finden Sie unter Erstellen eines durchgängigen Workflows mit generativer KI mit Amazon Bedrock Flows.
Weitere Informationen zur Verwendung eines Inferenzprofils zum Senden von Modellaufrufanforderungen über Regionen hinweg finden Sie unter So verwenden Sie ein Inferenzprofil beim Modellaufruf.
Weitere Informationen zur regionsübergreifenden Inferenz finden Sie unter Erste Schritte mit regionsübergreifender Inferenz in Amazon Bedrock
Ausführliche Informationen zur globalen regionsübergreifenden Inferenz, einschließlich IAM-Einrichtung und Verwaltung von Servicekontingenten, finden Sie unter. Globale regionsübergreifende Inferenz