Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Erhöhen des Durchsatzes mit regionenübergreifender Inferenz
Bei regionenübergreifender Inferenz können Sie entweder ein mit einer bestimmten Region (z. B. USA oder EU) verknüpftes regionenübergreifendes Inferenzprofil oder ein globales Inferenzprofil auswählen. Wenn Sie ein Inferenzprofil auswählen, das an eine bestimmte Region gebunden ist, wählt Amazon Bedrock automatisch den optimalen Werbespot AWS-Region innerhalb dieser Region aus, um Ihre Inferenzanfrage zu bearbeiten. Bei globalen Inferenzprofilen wählt Amazon Bedrock automatisch die optimale kommerzielle AWS-Region für die Verarbeitung der Anforderung aus, wodurch die verfügbaren Ressourcen optimiert werden und der Modelldurchsatz erhöht wird.
Beide Arten von regionsübergreifender Inferenz basieren auf Inferenzprofilen, die ein Basismodell (FM) definieren und festlegen, AWS-Regionen an welches Anfragen weitergeleitet werden können. Wenn Sie eine Modellinferenz im On-Demand-Modus ausführen, können Ihre Anforderungen durch Service Quotas oder während Zeiten mit starker Auslastung eingeschränkt werden. Durch regionsübergreifende Inferenz können Sie ungeplante Datenfluten problemlos bewältigen, indem Sie Rechenleistung auf verschiedene Arten nutzen. AWS-Regionen
Sie können den Durchsatz für ein Modell auch erhöhen, indem Sie einen bereitgestellten Durchsatz erwerben. Inferenzprofile unterstützen den bereitgestellten Durchsatz derzeit nicht.
Weitere Informationen zu den Regionen und Modellen, mit denen Sie Inferenzprofile zum Ausführen von regionsübergreifenden Inferenzen verwenden können, finden Sie unter Unterstützte Regionen und Modelle für Inferenzprofile.
Themen
Wählen Sie zwischen geografischer und globaler regionsübergreifender Inferenz
Amazon Bedrock bietet zwei Arten von regionsübergreifenden Inferenzprofilen, die jeweils für unterschiedliche Anwendungsfälle und Compliance-Anforderungen konzipiert sind:
| Feature | Geografische regionsübergreifende Inferenz | Globale regionsübergreifende Inferenz | Empfehlung |
|---|---|---|---|
| Datenresidenz | Innerhalb geografischer Grenzen (USA, EU, APAC usw.) | Jede unterstützte AWS Handelsregion weltweit | Wählen Sie „Geografisch“ für Compliance-Anforderungen |
| Durchsatz | Höher als eine einzelne Region | Höchster verfügbarer | Wählen Sie Global für maximale Leistung |
| Cost (Kosten) | Standardpreise | Ungefähr 10% Ersparnis | Wählen Sie Global für die Kostenoptimierung |
| SCP-Anforderungen | Alle Zielregionen im Profil zulassen | Erlauben "aws:RequestedRegion": "unspecified" |
Konfigurieren Sie auf der Grundlage Ihrer Unternehmensrichtlinien |
| Am besten geeignet für | Organizations mit Vorschriften zur Aufbewahrung von Daten | Organizations, die Kosten und Leistung priorisieren | Beurteilen Sie Ihre Compliance- und Leistungsanforderungen |
Wählen Sie Geographic Cross-Regional Inference, wenn Sie Anforderungen an die Datenresidenz haben und sicherstellen müssen, dass die Datenverarbeitung innerhalb bestimmter geografischer Grenzen erfolgt. Wählen Sie Global Cross-Regional Inference, wenn Sie maximalen Durchsatz und Kosteneinsparungen ohne geografische Einschränkungen erzielen möchten.
Allgemeine Überlegungen
Beachten Sie die folgenden Informationen zur regionsübergreifenden Inferenz:
-
Für die Nutzung von regionenübergreifender Inferenz fallen keine zusätzlichen Routing-Kosten an. Der Preis wird anhand der Region berechnet, von der aus Sie ein Inferenzprofil aufrufen. Weitere Informationen zur Preisgestaltung finden Sie unter Amazon Bedrock – Preise
. -
Durch regionsübergreifende Inferenz können Anfragen weitergeleitet werdenAWS-Regionen, die in Ihrem nicht manuell aktiviert wurden. AWS-Konto Eine manuelle Aktivierung von Regionen ist nicht erforderlich, damit die regionsübergreifende Inferenz funktioniert.
-
Alle Daten, die während regionsübergreifender Operationen übertragen werden, verbleiben im AWS Netzwerk und werden nicht über das öffentliche Internet übertragen. Daten werden bei der Übertragung zwischen verschlüsselt. AWS-Regionen
-
Alle regionsübergreifenden Inferenzanfragen werden CloudTrail in Ihrer Quellregion protokolliert. Suchen Sie nach dem
additionalEventData.inferenceRegionFeld, in dem angegeben ist, wo Anfragen bearbeitet wurden. -
AWSDienste, die von Amazon Bedrock bereitgestellt werden, können auch CRIS verwenden. Weitere Informationen finden Sie in der servicespezifischen Dokumentation.