

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

# Erhöhen des Durchsatzes mit regionenübergreifender Inferenz
<a name="cross-region-inference"></a>

Bei regionenübergreifender Inferenz können Sie entweder ein mit einer bestimmten Region (z. B. USA oder EU) verknüpftes regionenübergreifendes Inferenzprofil oder ein globales Inferenzprofil auswählen. Wenn Sie ein Inferenzprofil auswählen, das an eine bestimmte Region gebunden ist, wählt Amazon Bedrock automatisch den optimalen Werbespot AWS-Region innerhalb dieser Region aus, um Ihre Inferenzanfrage zu bearbeiten. Bei globalen Inferenzprofilen wählt Amazon Bedrock automatisch die optimale kommerzielle AWS-Region für die Verarbeitung der Anforderung aus, wodurch die verfügbaren Ressourcen optimiert werden und der Modelldurchsatz erhöht wird.

Beide Arten von regionsübergreifender Inferenz basieren auf [Inferenzprofilen](inference-profiles.md), die ein Basismodell (FM) definieren und festlegen, AWS-Regionen an welches Anfragen weitergeleitet werden können. Wenn Sie eine Modellinferenz im On-Demand-Modus ausführen, können Ihre Anforderungen durch Service Quotas oder während Zeiten mit starker Auslastung eingeschränkt werden. Durch regionsübergreifende Inferenz können Sie ungeplante Datenfluten problemlos bewältigen, indem Sie Rechenleistung auf verschiedene Arten nutzen. AWS-Regionen

Sie können den Durchsatz für ein Modell auch erhöhen, indem Sie einen [bereitgestellten Durchsatz](prov-throughput.md) erwerben. Inferenzprofile unterstützen den bereitgestellten Durchsatz derzeit nicht.

Weitere Informationen zu den Regionen und Modellen, mit denen Sie Inferenzprofile zum Ausführen von regionsübergreifenden Inferenzen verwenden können, finden Sie unter [Unterstützte Regionen und Modelle für Inferenzprofile](inference-profiles-support.md).

**Topics**
+ [Wählen Sie zwischen geografischer und globaler regionsübergreifender Inferenz](#cross-region-inference-comparison)
+ [Allgemeine Überlegungen](#cross-region-inference-general-considerations)
+ [Geografische regionsübergreifende Inferenz](geographic-cross-region-inference.md)
+ [Globale regionsübergreifende Inferenz](global-cross-region-inference.md)

## Wählen Sie zwischen geografischer und globaler regionsübergreifender Inferenz
<a name="cross-region-inference-comparison"></a>

Amazon Bedrock bietet zwei Arten von regionsübergreifenden Inferenzprofilen, die jeweils für unterschiedliche Anwendungsfälle und Compliance-Anforderungen konzipiert sind:


| Feature | Geografische regionsübergreifende Inferenz | Globale regionsübergreifende Inferenz | Empfehlung | 
| --- | --- | --- | --- | 
| Datenresidenz | Innerhalb geografischer Grenzen (USA, EU, APAC usw.) | Jede unterstützte AWS Handelsregion weltweit | Wählen Sie „Geografisch“ für Compliance-Anforderungen | 
| Durchsatz | Höher als eine einzelne Region | Höchster verfügbarer | Wählen Sie Global für maximale Leistung | 
| Cost (Kosten) | Standardpreise | Ungefähr 10% Ersparnis | Wählen Sie Global für die Kostenoptimierung | 
| SCP-Anforderungen | Alle Zielregionen im Profil zulassen | Erlauben "aws:RequestedRegion": "unspecified" | Konfigurieren Sie auf der Grundlage Ihrer Unternehmensrichtlinien | 
| Am besten geeignet für | Organizations mit Vorschriften zur Aufbewahrung von Daten | Organizations, die Kosten und Leistung priorisieren | Beurteilen Sie Ihre Compliance- und Leistungsanforderungen | 

Wählen Sie Geographic Cross-Regional Inference, wenn Sie Anforderungen an die Datenresidenz haben und sicherstellen müssen, dass die Datenverarbeitung innerhalb bestimmter geografischer Grenzen erfolgt. Wählen Sie Global Cross-Regional Inference, wenn Sie maximalen Durchsatz und Kosteneinsparungen ohne geografische Einschränkungen erzielen möchten.

## Allgemeine Überlegungen
<a name="cross-region-inference-general-considerations"></a>

Beachten Sie die folgenden Informationen zur regionsübergreifenden Inferenz:
+ Für die Nutzung von regionenübergreifender Inferenz fallen keine zusätzlichen Routing-Kosten an. Der Preis wird anhand der Region berechnet, von der aus Sie ein Inferenzprofil aufrufen. Weitere Informationen zur Preisgestaltung finden Sie unter [Amazon Bedrock – Preise](https://aws.amazon.com/bedrock/pricing/).
+ Durch regionsübergreifende Inferenz können Anfragen weitergeleitet werden AWS-Regionen , die in Ihrem nicht manuell aktiviert wurden. AWS-Konto Eine manuelle Aktivierung von Regionen ist nicht erforderlich, damit die regionsübergreifende Inferenz funktioniert.
+ Alle Daten, die während regionsübergreifender Operationen übertragen werden, verbleiben im AWS Netzwerk und werden nicht über das öffentliche Internet übertragen. Daten werden bei der Übertragung zwischen verschlüsselt. AWS-Regionen
+ Alle regionsübergreifenden Inferenzanfragen werden CloudTrail in Ihrer Quellregion protokolliert. Suchen Sie nach dem `additionalEventData.inferenceRegion` Feld, in dem angegeben ist, wo Anfragen bearbeitet wurden.
+ AWS Dienste, die von Amazon Bedrock bereitgestellt werden, können auch CRIS verwenden. Weitere Informationen finden Sie in der servicespezifischen Dokumentation.

# Geografische regionsübergreifende Inferenz
<a name="geographic-cross-region-inference"></a>

Regionsübergreifende geografische Inferenz hält die Datenverarbeitung innerhalb bestimmter geografischer Grenzen (USA, EU, APAC usw.) und bietet gleichzeitig einen höheren Durchsatz als Inferenz mit einer einzelnen Region. Diese Option ist ideal für Unternehmen mit Anforderungen an die Datenresidenz und Compliance-Vorschriften.

## Überlegungen zu regionsübergreifenden Inferenzen
<a name="geographic-cris-considerations"></a>

Beachten Sie die folgenden Informationen zur regionsübergreifenden geographischen Inferenz:
+ Regionsübergreifende Inferenzanfragen für ein an eine bestimmte Region gebundenes Inferenzprofil (z. B. USA, EU und APAC) werden innerhalb der Region gespeichert, die Teil der Region ist AWS-Regionen , in der sich die Daten ursprünglich befinden. Beispielsweise wird eine in den USA gestellte Anfrage innerhalb der USA aufbewahrt. AWS-Regionen Obwohl die Daten nur in der Quellregion gespeichert bleiben, können Ihre Prompts und Ausgabeergebnisse bei Verwendung der regionsübergreifenden Inferenz sich möglicherweise außerhalb der Quellregion bewegen. Alle Daten werden bei der Übertragung über das sichere Netzwerk von Amazon verschlüsselt.
+ Die Standardkontingente für den regionsübergreifenden Durchsatz bei der Verwendung von Inferenzprofilen, die mit einer Region verknüpft sind (z. B. USA, Europa und Asien-Pazifik), können Sie den Werten für **Regionsübergreifende Modellinferenz-Anfragen pro Minute für \$1\$1Model\$1** und **Regionsübergreifende Modellinferenz-Token pro Minute für \$1\$1Model\$1** unter [Service Quotas von Amazon Bedrock](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#limits_bedrock) in der *Allgemeinen AWS -Referenz* entnehmen.

## IAM-Richtlinienanforderungen für geografische regionsübergreifende Inferenzen
<a name="geographic-cris-iam-setup"></a>

Damit ein IAM-Benutzer oder eine IAM-Rolle ein regionsübergreifendes geografisches Inferenzprofil aufrufen kann, müssen Sie Zugriff auf die folgenden Ressourcen gewähren:

1. Das geografiespezifische regionsübergreifende Inferenzprofil (diese Profile haben geografische Präfixe wie,,) `us` `eu` `apac`

1. Das Basismodell in der Quellregion

1. Das Gründungsmodell in allen Zielregionen, die im geografischen Profil aufgeführt sind

Die folgende Beispielrichtlinie gewährt die erforderlichen Berechtigungen zur Verwendung des Claude Sonnet 4.5-Foundation-Modells mit einem geografisch übergreifenden Inferenzprofil für die USA, wobei sich die Quellregion `us-east-1` und die Zielregionen`us-east-1`,, `us-east-2` und befinden: `us-west-2`

```
{
    "Version": "2012-10-17"		 	 	 ,
    "Statement": [
        {
            "Sid": "GrantGeoCrisInferenceProfileAccess",
            "Effect": "Allow",
            "Action": "bedrock:InvokeModel",
            "Resource": [
                "arn:aws:bedrock:us-east-1:<ACCOUNT_ID>:inference-profile/us.anthropic.claude-sonnet-4-5-20250929-v1:0"
            ]
        },
        {
            "Sid": "GrantGeoCrisModelAccess",
            "Effect": "Allow",
            "Action": "bedrock:InvokeModel",
            "Resource": [
                "arn:aws:bedrock:us-east-1::foundation-model/anthropic.claude-sonnet-4-5-20250929-v1:0",
                "arn:aws:bedrock:us-east-2::foundation-model/anthropic.claude-sonnet-4-5-20250929-v1:0",
                "arn:aws:bedrock:us-west-2::foundation-model/anthropic.claude-sonnet-4-5-20250929-v1:0"
            ],
            "Condition": {
                "StringEquals": {
                    "bedrock:InferenceProfileArn": "arn:aws:bedrock:us-east-1:<ACCOUNT_ID>:inference-profile/us.anthropic.claude-sonnet-4-5-20250929-v1:0"
                }
            }
        }
    ]
}
```

Die erste Anweisung gewährt `bedrock:InvokeModel` API-Zugriff auf das Geographic Cross-Region-Inferenzprofil für Anfragen, die aus der anfragenden Region stammen. Die zweite Anweisung gewährt `bedrock:InvokeModel` API-Zugriff auf das Foundation-Modell sowohl in der anfragenden Region als auch in allen im Inferenzprofil aufgeführten Zielregionen.

## Anforderungen der Service Control-Richtlinie für geografische regionsübergreifende Inferenzen
<a name="geographic-cris-scp-setup"></a>

Viele Organizations implementieren regionale Zugriffskontrollen im Rahmen von Service Control Policies in AWS Organisationen aus Sicherheits- und Compliance-Gründen. Wenn die Sicherheitsrichtlinie Ihres Unternehmens ungenutzte Regionen blockiert, müssen Sie sicherstellen, dass Ihre regionsspezifischen SCP-Bedingungen den Zugriff auf alle Zielregionen zulassen, die im Regionsübergreifenden Inferenzprofil für Ihre Quellregion aufgeführt sind. SCPs 

Für regionsübergreifende geografische Inferenzen müssen Sie die Beziehung zwischen Ihrer Quellregion (in die Sie den API-Aufruf tätigen) und den Zielregionen (an die Anfragen weitergeleitet werden können) verstehen. Lesen Sie in der Dokumentation zum Inferenzprofil nach, um alle Zielregionen für Ihre Quellregion zu identifizieren, und stellen Sie dann sicher, dass Sie den Zugriff auf all diese Zielregionen SCPs zulassen.

Wenn Sie beispielsweise von us-east-1 (Quellregion) aus anrufen und das geografische Profil US Anthropic Claude Sonnet 4.5 verwenden, können Anfragen an us-east-1, us-east-2 und us-west-2 (Zielregionen) weitergeleitet werden. Wenn ein SCP den Zugriff nur auf us-east-1 einschränkt, schlägt die regionsübergreifende Inferenz fehl, wenn versucht wird, nach us-east-2 oder us-west-2 zu routen. Daher müssen Sie alle drei Zielregionen in Ihrem SCP zulassen, unabhängig davon, aus welcher Region Sie anrufen.

Denken Sie bei der Konfiguration SCPs für den Ausschluss von Regionen daran, dass das Blockieren einer beliebigen Zielregion im Inferenzprofil verhindert, dass regionsübergreifende Inferenzen ordnungsgemäß funktionieren, selbst wenn Ihre Quellregion weiterhin zugänglich ist. Informationen zu den SCP-Anforderungen für globale regionsübergreifende Inferenz finden Sie unter. [Anforderungen an die Service Control-Richtlinie für globale regionsübergreifende Inferenz](global-cross-region-inference.md#global-cris-scp-setup)

Um die Sicherheit zu erhöhen, sollten Sie erwägen, die `bedrock:InferenceProfileArn` Bedingung zu verwenden, um den Zugriff auf bestimmte Inferenzprofile zu beschränken. Auf diese Weise können Sie Zugriff auf die erforderlichen Regionen gewähren und gleichzeitig einschränken, welche Inferenzprofile verwendet werden können.

## Verwenden Sie geografische regionsübergreifende Inferenz
<a name="geographic-cris-usage"></a>

Um die regionsübergreifende geografische Inferenz zu verwenden, fügen Sie ein [Inferenzprofil hinzu, wenn Sie die Modellinferenz auf](inference-profiles.md) folgende Weise ausführen:
+ **Modellinferenz auf Abruf** [— Geben Sie die ID des Inferenzprofils an, die `modelId` beim Senden einer [InvokeModel](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModel.html), [InvokeModelWithResponseStream](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModelWithResponseStream.html)Converse oder -Anforderung verwendet wird. [ConverseStream](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_ConverseStream.html)](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_Converse.html) Ein Inferenzprofil definiert eine oder mehrere Regionen, an die es Inferenzanforderungen weiterleiten kann, die aus Ihrer Quellregion stammen. Die Verwendung von regionenübergreifender Inferenz erhöht den Durchsatz und die Leistung, indem Modellaufrufanforderungen dynamisch an die im Inferenzprofil definierten Regionen weitergeleitet werden. Das Routing beeinflusst den Benutzerdatenverkehr, den Bedarf und die Ressourcennutzung. Weitere Informationen finden Sie unter [So senden Sie Prompts und generieren Antworten mithilfe der Modellinferenz](inference.md).
+ **Batch-Inferenz** — Senden Sie Anfragen asynchron mit Batch-Inferenz, indem Sie beim Senden einer Anfrage die ID des Inferenzprofils `modelId` als die angeben. [CreateModelInvocationJob](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_CreateModelInvocationJob.html) Durch die Verwendung eines Inferenzprofils können Sie die Rechenleistung in mehreren AWS-Regionen nutzen und so schnellere Verarbeitungszeiten für Ihre Batch-Aufträge erzielen. Nach Abschluss des Auftrags können Sie die Ausgabedateien aus dem Amazon-S3-Bucket in der Quellregion abrufen.
+ **Agenten** – Geben Sie die ID des Inferenzprofils in das Feld `foundationModel` der Anforderung [https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_CreateAgent.html](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_CreateAgent.html) ein. Weitere Informationen finden Sie unter [Manuelles Erstellen und Konfigurieren von Agenten](agents-create.md).
+ **Generierung von Antworten in der Wissensdatenbank** – Sie können eine regionenübergreifende Inferenz verwenden, wenn Sie nach der Abfrage einer Wissensdatenbank eine Antwort generieren. Weitere Informationen finden Sie unter [Testen Ihrer Wissensdatenbank mit Abfragen und Antworten](knowledge-base-test.md).
+ **Modellbewertung** – Sie können ein Inferenzprofil als Modell zur Bewertung senden, wenn Sie einen Auftrag zur Modellbewertung übermitteln. Weitere Informationen finden Sie unter [Die Leistung von Amazon-Bedrock-Ressourcen bewerten](evaluation.md).
+ **Prompt-Management** – Sie können eine regionenübergreifende Inferenz verwenden, wenn Sie eine Antwort für einen Prompt generieren, die Sie im Prompt-Management erstellt haben. Weitere Informationen finden Sie unter [Erstellen und Speichern wiederverwendbarer Prompts mit dem Prompt-Management in Amazon Bedrock](prompt-management.md).
+ **Prompt-Abläufe** – Sie können eine regionenübergreifende Inferenz verwenden, wenn Sie eine Antwort für einen Prompt generieren, die Sie inline in einem Prompt-Knoten in einem Prompt-Ablauf definiert haben. Weitere Informationen finden Sie unter [Erstellen Sie mit Amazon Bedrock Flows einen end-to-end generativen KI-Workflow](flows.md).

Weitere Informationen zur Verwendung eines Inferenzprofils zum Senden von Modellaufrufanforderungen über Regionen hinweg finden Sie unter [So verwenden Sie ein Inferenzprofil beim Modellaufruf](inference-profiles-use.md).

Weitere Informationen zur regionsübergreifenden Inferenz finden Sie unter [Erste Schritte mit regionsübergreifender Inferenz in Amazon Bedrock](https://aws.amazon.com/blogs/machine-learning/getting-started-with-cross-region-inference-in-amazon-bedrock/).

Ausführliche Informationen zur globalen regionsübergreifenden Inferenz, einschließlich IAM-Einrichtung und Verwaltung von Servicekontingenten, finden Sie unter. [Globale regionsübergreifende Inferenz](global-cross-region-inference.md)

# Globale regionsübergreifende Inferenz
<a name="global-cross-region-inference"></a>

Die globale regionsübergreifende Inferenz erweitert die regionsübergreifende Inferenz über geografische Grenzen hinaus und ermöglicht die Weiterleitung von Inferenzanfragen an unterstützte kommerzielle Anbieter auf der AWS-Regionen ganzen Welt, wodurch die verfügbaren Ressourcen optimiert und ein höherer Modelldurchsatz ermöglicht wird.

## Vorteile globaler regionsübergreifender Inferenz
<a name="global-cris-benefits"></a>

Die globale regionsübergreifende Inferenz für Claude Sonnet 4.5 von Anthropic bietet mehrere Vorteile gegenüber herkömmlichen geografischen regionenübergreifenden Inferenzprofilen:
+ **Verbesserter Durchsatz bei Spitzennachfrage — Die** globale regionsübergreifende Inferenz verbessert die Widerstandsfähigkeit in Zeiten hoher Nachfrage, indem Anfragen automatisch an die verfügbaren Kapazitäten weitergeleitet werden. AWS-Regionen Dieses dynamische Routing erfolgt nahtlos ohne zusätzliche Konfiguration oder Eingriffe von Entwicklern. Im Gegensatz zu herkömmlichen Ansätzen, die möglicherweise einen komplexen clientseitigen Lastenausgleich erfordern AWS-Regionen, verarbeitet die globale regionsübergreifende Inferenz Verkehrsspitzen automatisch. Dies ist besonders wichtig für geschäftskritische Anwendungen, bei denen Ausfallzeiten oder Leistungseinbußen erhebliche finanzielle oder Reputationsschäden haben können.
+ **Kosteneffizienz** — Die globale regionsübergreifende Inferenz für Claude Sonnet 4.5 von Anthropic bietet im Vergleich zu regionsübergreifenden Inferenzen etwa 10% Einsparungen bei den Preisen für Input- und Output-Tokens. Der Preis wird auf der Grundlage der Adresse berechnet, AWS-Region von der aus die Anfrage gestellt wurde (Quelle). AWS-Region Dies bedeutet, dass Unternehmen von einer verbesserten Widerstandsfähigkeit bei noch geringeren Kosten profitieren können. Dieses Preismodell macht globale regionsübergreifende Inferenz zu einer kostengünstigen Lösung für Unternehmen, die ihre generativen KI-Implementierungen optimieren möchten. Durch die Verbesserung der Ressourcennutzung und die Erzielung eines höheren Durchsatzes ohne zusätzliche Kosten unterstützt es Unternehmen dabei, den Wert ihrer Investition in Amazon Bedrock zu maximieren.
+ **Optimierte Überwachung** — Wenn Sie globale regionsübergreifende Inferenz verwenden, sollten Sie CloudTrail weiterhin Protokolleinträge in Ihrer Quelle aufzeichnen, was die Beobachtbarkeit CloudWatch und AWS-Region Verwaltung vereinfacht. Auch wenn Ihre Anfragen AWS-Regionen weltweit an verschiedenen Orten bearbeitet werden, behalten Sie mit Ihren vertrauten Überwachungstools einen zentralen Überblick über die Leistung und die Nutzungsmuster Ihrer Anwendung. AWS 
+ **Kontingentflexibilität auf Abruf — Dank** globaler regionsübergreifender Inferenz sind Ihre Workloads nicht mehr durch individuelle regionale Kapazitäten begrenzt. Anstatt auf die in einem bestimmten Bereich verfügbare Kapazität beschränkt zu sein AWS-Region, können Ihre Anfragen dynamisch über die globale Infrastruktur weitergeleitet werden. AWS Dies ermöglicht den Zugriff auf einen viel größeren Ressourcenpool und macht es weniger kompliziert, umfangreiche Workloads und plötzliche Verkehrsspitzen zu bewältigen.

## Überlegungen zu globalen regionsübergreifenden Inferenzen
<a name="global-cris-considerations"></a>

Beachten Sie die folgenden Informationen zur globalen regionsübergreifenden Inferenz:
+ Globale regionenübergreifende Inferenzprofile bieten einen höheren Durchsatz als ein Inferenzprofil, das mit einer bestimmten Region verknüpft ist. Ein mit einer bestimmten Region verknüpftes Inferenzprofil bietet einen höheren Durchsatz als eine einzelregionale Inferenz.
+ Die Standardkontingente für den regionsübergreifenden Durchsatz bei der Verwendung von globalen Inferenzprofilen können Sie den Werten für **Regionsübergreifende Modellinferenz-Anfragen pro Minute für \$1\$1Model\$1** und **Regionsübergreifende Modellinferenz-Token pro Minute für \$1\$1Model\$1** unter [Service Quotas von Amazon Bedrock](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#limits_bedrock) in der *Allgemeinen AWS -Referenz* entnehmen.

  Sie können Kontingente für das Global Cross-Region Inference Profile über die [Service Quotas Quotas-Konsole](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas) oder mithilfe von AWS CLI-Befehlen in Ihrer **Quellregion** anfordern, anzeigen und verwalten.

## IAM-Richtlinienanforderungen für globale regionsübergreifende Inferenz
<a name="global-cris-iam-setup"></a>

Um globale regionsübergreifende Inferenzen für Ihre Benutzer zu ermöglichen, müssen Sie eine dreiteilige IAM-Richtlinie auf die Rolle anwenden. Im Folgenden finden Sie ein Beispiel für eine IAM-Richtlinie zur gezielten Steuerung. Sie können die Beispielrichtlinie durch die Richtlinie ersetzen, `<REQUESTING REGION>` in der AWS-Region Sie arbeiten.

```
{
    "Version": "2012-10-17"		 	 	 ,
    "Statement": [
        {
            "Sid": "GrantGlobalCrisInferenceProfileRegionAccess",
            "Effect": "Allow",
            "Action": "bedrock:InvokeModel",
            "Resource": [
                "arn:aws:bedrock:<REQUESTING REGION>:<ACCOUNT>:inference-profile/global.<MODEL NAME>"
            ],
            "Condition": {
                "StringEquals": {
                    "aws:RequestedRegion": "<REQUESTING REGION>"
                }
            }
        },
        {
            "Sid": "GrantGlobalCrisInferenceProfileInRegionModelAccess",
            "Effect": "Allow",
            "Action": "bedrock:InvokeModel",
            "Resource": [
                "arn:aws:bedrock:<REQUESTING REGION>::foundation-model/<MODEL NAME>"
            ],
            "Condition": {
                "StringEquals": {
                    "aws:RequestedRegion": "<REQUESTING REGION>",
                    "bedrock:InferenceProfileArn": "arn:aws:bedrock:<REQUESTING REGION>:<ACCOUNT>:inference-profile/global.<MODEL NAME>"
                }
            }
        },
        {
            "Sid": "GrantGlobalCrisInferenceProfileGlobalModelAccess",
            "Effect": "Allow",
            "Action": "bedrock:InvokeModel",
            "Resource": [
                "arn:aws:bedrock:::foundation-model/<MODEL NAME>"
            ],
            "Condition": {
                "StringEquals": {
                    "aws:RequestedRegion": "unspecified",
                    "bedrock:InferenceProfileArn": "arn:aws:bedrock:<REQUESTING REGION>:<ACCOUNT>:inference-profile/global.<MODEL NAME>"
                }
            }
        }
    ]
}
```

Der erste Teil der Richtlinie gewährt Zugriff auf das regionale Inferenzprofil in Ihrer Anfrage. AWS-Region Der zweite Teil bietet Zugriff auf die regionale FM-Ressource. Der dritte Teil gewährt Zugriff auf die globale FM-Ressource, wodurch die Fähigkeit zum regionenübergreifenden Routing aktiviert wird.

Stellen Sie bei der Implementierung dieser Richtlinien sicher, dass alle drei Amazon-Ressourcennamen (ARNs) in Ihren IAM-Kontoauszügen enthalten sind:
+ Das regionale Inferenzprofil ARN folgt dem Muster`arn:aws:bedrock:REGION:ACCOUNT:inference-profile/global.MODEL-NAME`. Dies wird verwendet, um Zugriff auf das globale Inferenzprofil in der Quelle zu gewähren. AWS-Region
+ Das regionale FM verwendet`arn:aws:bedrock:REGION::foundation-model/MODEL-NAME`. Dies wird verwendet, um Zugriff auf das FM in der Quelle zu gewähren AWS-Region.
+ Das globale FM erfordert`arn:aws:bedrock:::foundation-model/MODEL-NAME`. Dies wird verwendet, um den Zugriff auf das FM in verschiedenen globalen Umgebungen zu ermöglichen AWS-Regionen.

Für den globalen FM-ARN ist kein AWS-Region Konto angegeben, was beabsichtigt und für die regionsübergreifende Funktionalität erforderlich ist.

### Deaktivieren Sie die globale regionsübergreifende Inferenz
<a name="global-cris-iam-disable"></a>

Sie können zwischen zwei Hauptansätzen wählen, um Ablehnungsrichtlinien für globale CRIS für bestimmte IAM-Rollen zu implementieren, die jeweils unterschiedliche Anwendungsfälle und Auswirkungen haben:
+ **Eine IAM-Richtlinie entfernen** — Bei der ersten Methode werden eine oder mehrere der drei erforderlichen IAM-Richtlinien aus den Benutzerberechtigungen entfernt. Da Global CRIS voraussetzt, dass alle drei Richtlinien funktionieren, führt das Entfernen einer Richtlinie dazu, dass der Zugriff verweigert wird.
+ **Implementierung einer Ablehnungsrichtlinie** — Der zweite Ansatz besteht darin, eine explizite Ablehnungsrichtlinie zu implementieren, die speziell auf globale CRIS-Inferenzprofile abzielt. Diese Methode bietet eine klare Dokumentation Ihrer Sicherheitsabsicht und stellt sicher, dass die ausdrückliche Ablehnung auch dann Vorrang hat, wenn jemand später versehentlich die erforderlichen Zulassungsrichtlinien hinzufügt. Die Ablehnungsrichtlinie sollte eine `StringEquals` Bedingung verwenden, die dem Muster `"aws:RequestedRegion": "unspecified"` entspricht. Dieses Muster zielt speziell auf Inferenzprofile mit dem `global` Präfix ab.

Bei der Implementierung von Deny-Policies ist es wichtig zu verstehen, dass das globale CRIS das Verhalten in der `aws:RequestedRegion` Branche verändert. AWS-Region Herkömmliche Ablehnungsrichtlinien, die `StringEquals` Bedingungen mit bestimmten AWS-Region Namen verwenden, wie `"aws:RequestedRegion": "us-west-2"` z. B., funktionieren bei Global CRIS nicht wie erwartet, weil der Dienst dieses Feld auf das tatsächliche Ziel festlegt und `global` nicht auf das tatsächliche Ziel. AWS-Region Wie bereits erwähnt, `"aws:RequestedRegion": "unspecified"` wird dies jedoch zum Negativ-Effekt führen.

## Anforderungen an die Service Control-Richtlinie für globale regionsübergreifende Inferenz
<a name="global-cris-scp-setup"></a>

Wenn die Sicherheitsrichtlinie Ihres Unternehmens ungenutzte Regionen blockiert, müssen Sie für globale regionsübergreifende Inferenz Ihre regionsspezifischen SCP-Bedingungen aktualisieren, SCPs um den Zugriff auf zu ermöglichen. `"aws:RequestedRegion": "unspecified"` Diese Bedingung ist spezifisch für Amazon Bedrock Global Cross-Region Inference und stellt sicher, dass Anfragen an alle unterstützten Handelsregionen weitergeleitet werden können. AWS 

Das folgende Beispiel für SCP blockiert alle AWS API-Aufrufe außerhalb der zugelassenen Regionen und erlaubt gleichzeitig Amazon Bedrock Global Cross-Region-Inferenzrufe, die `"unspecified"` als Region für das globale Routing verwendet werden:

```
{
    "Version": "2012-10-17"		 	 	 ,
    "Statement": [
        {
            "Sid": "DenyAllOutsideApprovedRegions",
            "Effect": "Deny",
            "Action": "*",
            "Resource": "*",
            "Condition": {
                "StringNotEquals": {
                    "aws:RequestedRegion": [
                        "us-east-1",
                        "us-east-2",
                        "us-west-2",
                        "unspecified"
                    ]
                }
            }
        }
    ]
}
```

### Deaktivieren Sie die globale regionsübergreifende Inferenz
<a name="global-cris-disable"></a>

Organizations mit Anforderungen an den Datenstandort oder die Einhaltung von Vorschriften sollten prüfen, ob Global Cross-Region-Inference zu ihrem Compliance-Framework passt, da Anfragen auch in anderen unterstützten AWS Geschäftsregionen bearbeitet werden können. Um die globale regionsübergreifende Inferenz explizit zu deaktivieren, implementieren Sie die folgende SCP-Richtlinie:

```
{
    "Effect": "Deny",
    "Action": "bedrock:*",
    "Resource": "*",
    "Condition": {
        "StringEquals": {
            "aws:RequestedRegion": "unspecified"
        },
        "ArnLike": {
            "bedrock:InferenceProfileArn": "arn:aws:bedrock:*:*:inference-profile/global.*"
        }
    }
}
```

Dieser SCP lehnt ausdrücklich die globale regionsübergreifende Inferenz ab, da die `"ArnLike"` Bedingungen `"aws:RequestedRegion"` is `"unspecified"` und the auf Inferenzprofile mit dem Präfix im `global` ARN abzielen.

### AWS Implementierung von Control Tower
<a name="control-tower-scp"></a>

Von manueller Bearbeitung, die vom AWS Control Tower SCPs verwaltet wird, wird dringend abgeraten, da dies zu Abweichungen führen kann. Verwenden Sie stattdessen die von Control Tower bereitgestellten Mechanismen, um diese Ausnahmen zu verwalten. Zu den Kernprinzipien gehören entweder die Ausweitung der bestehenden Regionsverweigerungskontrollen oder die Aktivierung von Regionen und die anschließende Anwendung einer benutzerdefinierten, bedingten Sperrrichtlinie.

Eine ausführliche step-by-step Anleitung zur Implementierung regionsübergreifender Inferenz mit Control Tower finden Sie im Blogbeitrag [Enable Amazon Bedrock Cross-region Inference](https://aws.amazon.com/blogs/machine-learning/enable-amazon-bedrock-cross-region-inference-in-multi-account-environments/) in Multi-Account-Umgebungen. Dies umfasst die Erweiterung der bestehenden Region Deny SCPs, die Aktivierung verweigerter Regionen mit benutzerdefinierten SCPs Einstellungen und die Verwendung von Customizations for AWS Control Tower (cFCT) zur Bereitstellung benutzerdefinierter AS-Infrastrukturen SCPs als Code.

## Das Anforderungslimit für globale regionsübergreifende Inferenzen wird erhöht
<a name="global-cris-quotas"></a>

Wenn Sie globale CRIS-Inferenzprofile verwenden, können Sie globales CRIS aus über 20 unterstützten Quellen verwenden. AWS-Regionen Da es sich um ein globales Limit handelt, müssen Anfragen zum Anzeigen, Verwalten oder Erhöhen von Kontingenten für globale regionsübergreifende Inferenzprofile über die Service Quotas Quota-Konsole oder die AWS Befehlszeilenschnittstelle (AWS CLI) in der angeforderten Quelle gestellt werden. AWS-Region

Gehen Sie wie folgt vor, um eine Erhöhung des Limits zu beantragen:

1. Melden Sie sich in Ihrem AWS Konto bei Service Quotas Quotas-Konsole an.

1. Wählen Sie im Navigationsbereich **AWS -Services**.

1. Suchen Sie in der Liste der Dienste nach **Amazon Bedrock** und wählen Sie es aus.

1. Verwenden Sie in der Liste der Kontingente für Amazon Bedrock den Suchfilter, um die spezifischen globalen CRIS-Kontingente zu finden. Beispiel:
   + Globales regionsübergreifendes Modell Inferenz-Token pro Minute für Anthropic Claude Sonnet 4.5 V1

1. Wählen Sie das Kontingent aus, das Sie erhöhen möchten.

1. Wählen Sie **Erhöhung auf Kontoebene beantragen** aus.

1. Geben Sie den gewünschten neuen Kontingentwert ein.

1. Wählen Sie **Anfrage**, um Ihre Anfrage einzureichen.

Denken Sie bei der Berechnung der erforderlichen Kontingenterhöhung daran, die Burndown-Rate zu berücksichtigen. Diese ist definiert als die Rate, mit der Eingabe- und Ausgabetoken in die Token-Kontingentnutzung für das Drosselungssystem umgewandelt werden. Die folgenden Modelle haben eine **5-fache Burn-Down-Rate für Ausgabetoken (1 Ausgabetoken verbraucht 5 Token** aus Ihren Kontingenten):
+ Der Anthropiker Claude, Opus 4
+ Anthropisches Claude-Sonett 4.5
+ Anthropisches Claude-Sonett 4
+ Anthropisches Claude 3.7 Sonett

Bei allen anderen Modellen beträgt die Burndown-Rate **1:1** (1 Ausgabetoken verbraucht 1 Token aus Ihrem Kontingent). Bei Eingabe-Token beträgt das Verhältnis von Token zu Kontingent 1:1. Die Berechnung für die Gesamtzahl der Token pro Anfrage lautet wie folgt:

`Input token count + Cache write input tokens + (Output token count x Burndown rate)`

## Verwenden Sie globale regionsübergreifende Inferenz
<a name="global-cris-usage"></a>

Um die globale regionsübergreifende Inferenz mit Claude Sonnet 4.5 von Anthropic zu verwenden, müssen Entwickler die folgenden wichtigen Schritte ausführen:
+ **Verwenden Sie die globale Inferenzprofil-ID** — Geben Sie bei API-Aufrufen an Amazon Bedrock die globale Claude Sonnet 4.5-Inferenzprofil-ID (`global.anthropic.claude-sonnet-4-5-20250929-v1:0`) von Anthropic anstelle einer -spezifischen Modell-ID an. AWS-Region
+ **IAM-Berechtigungen konfigurieren — Erteilen Sie die entsprechenden IAM-Berechtigungen für** den Zugriff auf das Inferenzprofil und auf ein potenzielles Ziel. FMs AWS-Regionen

Globale regionsübergreifende Inferenz wird unterstützt für:
+ Modellinferenz auf Abruf
+ Batch-Inferenz
+ Kundendienstmitarbeiters (Kundendienstmitarbeiter)
+ Bewertung von Modellen
+ Prompt Management
+ Schnelle Abläufe

**Anmerkung**  
Das globale Inferenzprofil wird für On-Demand-Modellinferenz, Batch-Inferenz, Agenten, Modellbewertung, Prompt-Management und Prompt-Abläufe unterstützt.

## Implementieren Sie globale regionsübergreifende Inferenz
<a name="global-cris-implementation"></a>

Die Implementierung globaler regionsübergreifender Inferenz mit Claude Sonnet 4.5 von Anthropic ist unkompliziert und erfordert nur wenige Änderungen an Ihrem vorhandenen Anwendungscode. Das Folgende ist ein Beispiel dafür, wie Sie Ihren Code in Python aktualisieren können:

```
import boto3
import json
bedrock = boto3.client('bedrock-runtime', region_name='us-east-1')
model_id = "global.anthropic.claude-sonnet-4-5-20250929-v1:0"  
response = bedrock.converse(
    messages=[{"role": "user", "content": [{"text": "Explain cloud computing in 2 sentences."}]}],
    modelId=model_id,
)

print("Response:", response['output']['message']['content'][0]['text'])
print("Token usage:", response['usage'])
print("Total tokens:", response['usage']['totalTokens'])
```