Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Augmentez le débit grâce à l’inférence entre régions
Avec l’inférence entre régions, vous pouvez choisir soit un profil d’inférence interrégional lié à une zone géographique spécifique (comme les États-Unis ou l’UE), soit un profil d’inférence global. Lorsque vous choisissez un profil d'inférence lié à une zone géographique spécifique, Amazon Bedrock sélectionne automatiquement le commercial optimal au Région AWS sein de cette zone géographique pour traiter votre demande d'inférence. Grâce aux profils d’inférence globaux, Amazon Bedrock sélectionne automatiquement la Région AWS commerciale optimale pour traiter la demande, ce qui optimise les ressources disponibles et augmente le débit du modèle.
Les deux types d'inférence interrégionale fonctionnent grâce à des profils d'inférence, qui définissent un modèle de base (FM) et le modèle Régions AWS vers lequel les demandes peuvent être acheminées. Lorsque vous exécutez l’inférence de modèles en mode à la demande, vos demandes peuvent être limitées par des quotas de service ou pendant les périodes de pointe d’utilisation. L'inférence entre régions vous permet de gérer de manière fluide les pics de trafic imprévus en utilisant le calcul entre différentes régions. Régions AWS
Vous pouvez également augmenter le débit d’un modèle en achetant du débit provisionné. Les profils d’inférence ne prennent actuellement pas en charge le débit provisionné.
Pour voir les régions et les modèles avec lesquels vous pouvez utiliser des profils d’inférence pour exécuter une inférence entre régions, consultez Régions et modèles pris en charge pour les profils d'inférence.
Rubriques
Choisir entre une inférence géographique et une inférence interrégionale globale
Amazon Bedrock propose deux types de profils d'inférence interrégionaux, chacun étant conçu pour différents cas d'utilisation et exigences de conformité :
| Fonctionnalité | Inférence géographique interrégionale | Inférence interrégionale globale | Recommendation |
|---|---|---|---|
| Résidence des données | À l'intérieur des limites géographiques (États-Unis, UE, APAC, etc.) | Toute région AWS commerciale prise en charge dans le monde | Choisissez Geographic pour les exigences de conformité |
| Débit | Supérieur à celui d'une seule région | Le plus haut disponible | Choisissez Global pour des performances optimales |
| Cost | Tarification standard | Environ 10 % d'économies | Choisissez Global pour optimiser les coûts |
| Exigences relatives au SCP | Autoriser toutes les régions de destination dans le profil | Autoriser "aws:RequestedRegion": "unspecified" |
Configurez en fonction des politiques de votre organisation |
| Le mieux adapté pour | Organisations soumises à des réglementations relatives à la résidence des données | Organisations priorisant les coûts et les performances | Évaluez vos besoins en matière de conformité et de performance |
Choisissez l'inférence géographique interrégionale lorsque vous avez des exigences en matière de résidence des données et que vous devez vous assurer que le traitement des données reste dans des limites géographiques spécifiques. Optez pour l'inférence interrégionale globale lorsque vous souhaitez un débit maximal et des économies de coûts sans restrictions géographiques.
Considérations d’ordre général
Notez les informations suivantes concernant l’inférence interrégionale :
-
L’inférence interrégionale n’entraîne aucun coût d’acheminement supplémentaire. Le prix est calculé en fonction de la région à partir de laquelle vous appelez un profil d’inférence. Pour plus d’informations sur la tarification, consultez Tarification d’Amazon Bedrock
. -
L'inférence entre régions peut acheminer les demandes vers celles Régions AWS qui ne sont pas activées manuellement dans votre. Compte AWS L'activation manuelle des régions n'est pas requise pour que l'inférence interrégionale fonctionne.
-
Toutes les données transmises pendant les opérations interrégionales restent sur le AWS réseau et ne transitent pas par l'Internet public. Les données sont cryptées pendant leur transit entre les deuxRégions AWS.
-
Toutes les demandes d'inférence interrégionales sont enregistrées CloudTrail dans votre région source. Recherchez le
additionalEventData.inferenceRegionchamp pour identifier l'endroit où les demandes ont été traitées. -
AWSLes services fournis par Amazon Bedrock peuvent également utiliser CRIS. Pour plus de détails, consultez la documentation spécifique aux services.