Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Accès aux données des tables
Il existe plusieurs manières d'accéder aux tables dans les compartiments de tables Amazon S3. Vous pouvez intégrer des tables à des services d' AWS analyse à l'aide d'Amazon SageMaker Lakehouse ou accéder aux tables directement à l'aide du point de Iceberg REST terminaison Amazon S3 Tables ou du catalogue de tables Amazon S3 pour. Apache Iceberg La méthode d'accès que vous utiliserez dépendra de la configuration de votre catalogue, de votre modèle de gouvernance et de vos besoins en matière de contrôle d'accès. Vous trouverez ci-dessous un aperçu de ces méthodes d'accès.
- Intégration avec Amazon SageMaker Lakehouse
Il s'agit de la méthode d'accès recommandée pour travailler avec des tables dans des compartiments de tables S3. L'intégration permet une gestion unifiée des tables, une gouvernance centralisée et un contrôle d'accès précis entre plusieurs services AWS d'analyse.
- Accès direct
Utilisez cette méthode si vous devez travailler avec des implémentations de catalogues AWS Partner Network (APN), des implémentations de catalogues personnalisés ou si vous devez uniquement effectuer des opérations de lecture/écriture de base sur des tables au sein d'un même compartiment de tables.
Note
Pour accéder aux tables, l'identité IAM que vous utilisez doit accéder aux ressources de vos tables et aux actions de S3 Tables. Pour de plus amples informations, veuillez consulter Gestion des accès pour S3 Tables.
Accès aux tables via l'intégration Amazon SageMaker Lakehouse
Vous pouvez intégrer des compartiments de tables S3 à Amazon SageMaker Lakehouse pour accéder aux tables à partir de services AWS d'analyse, tels qu'Amazon Athena, Amazon Redshift et. QuickSight Amazon SageMaker Lakehouse unifie vos données entre les lacs de données Amazon S3 et les entrepôts de données Amazon Redshift, afin que vous puissiez créer des applications d'analyse, d'apprentissage automatique (ML) et d'IA générative sur une seule copie des données. L'intégration remplit les ressources AWS Glue Data Catalog de votre table et fédère l'accès à ces ressources avec. AWS Lake Formation Pour plus d'informations sur l'intégration, consultezUtilisation d'Amazon S3 Tables avec des services AWS d'analyse.
L'intégration permet un contrôle d'accès précis AWS Lake Formation afin de renforcer la sécurité. Lake Formation utilise une combinaison de son propre modèle d'autorisations et du modèle d'autorisations IAM pour contrôler l'accès aux ressources des tables et aux données sous-jacentes. Cela signifie qu'une demande d'accès à votre table doit passer les contrôles d'autorisation effectués à la fois par IAM et par Lake Formation. Pour plus d'informations, consultez la présentation des autorisations de Lake Formation dans le Guide du AWS Lake Formation développeur.
Les services AWS d'analyse suivants peuvent accéder aux tables via cette intégration :
Accès aux tables à l'aide du AWS GlueIceberg REST point de terminaison
Une fois que vos compartiments de tables S3 sont intégrés à Amazon SageMaker Lakehouse, vous pouvez également utiliser le AWS GlueIceberg REST point de terminaison pour vous connecter aux tables S3 à partir de moteurs de requêtes tiers compatibles. Iceberg Pour de plus amples informations, veuillez consulter Accès aux tables Amazon S3 à l'aide du AWS Glue Iceberg REST point de terminaison.
Nous vous recommandons d'utiliser le AWS GlueIceberg REST point de terminaison lorsque vous souhaitez accéder à des tables à partir de Spark clients compatibles ou à partir d'autres clients Iceberg compatibles. PyIceberg
Les clients suivants peuvent accéder aux tables directement via le AWS GlueIceberg REST point de terminaison :
N'importe quel Iceberg client, y compris SparkPyIceberg, et plus encore.
Accès direct aux tables
Vous pouvez accéder aux tables directement à partir de moteurs de requêtes open source grâce à des méthodes qui relient les opérations de gestion des tables S3 à vos applications Apache Iceberg d'analyse. Il existe deux méthodes d'accès direct : le point de Iceberg REST terminaison Amazon S3 Tables ou le catalogue de tables Amazon S3 pourApache Iceberg. Le REST point final est recommandé.
Nous recommandons un accès direct si vous accédez aux tables dans le cadre d'implémentations de catalogues autogérées ou si vous devez uniquement effectuer des opérations de lecture/écriture de base sur les tables d'un seul compartiment de tables. Pour les autres scénarios d'accès, nous recommandons l'intégration Amazon SageMaker Lakehouse.
L'accès direct aux tables est géré par le biais de politiques basées sur l'identité IAM ou de politiques basées sur les ressources associées aux tables et aux compartiments de tables. Vous n'avez pas besoin de gérer les autorisations de Lake Formation pour les tables lorsque vous y accédez directement.
Accès aux tables via le point de Iceberg REST terminaison Amazon S3 Tables
Vous pouvez utiliser le point de Iceberg REST terminaison Amazon S3 Tables pour accéder à vos tables directement depuis n'importe quel client Iceberg REST compatible via des HTTP points de terminaison. Pour plus d'informations, consultezAccès aux tables à l'aide des tables Amazon S3 Iceberg REST point de terminaison.
Les services AWS d'analyse et moteurs de requêtes suivants peuvent accéder aux tables directement via le point de Iceberg REST terminaison Amazon S3 Tables :
Moteurs de requêtes pris en charge
N'importe quel Iceberg client, y compris SparkPyIceberg, et plus encore.
Accès aux tables directement via le catalogue de tables Amazon S3 pour Apache Iceberg
Vous pouvez également accéder aux tables directement à partir des moteurs de requêtes, Apache Spark par exemple en utilisant le catalogue client S3 Tables. Pour plus d'informations, voirAccès aux tables Amazon S3 avec le catalogue de tables Amazon S3 pour Apache Iceberg. S3 recommande toutefois d'utiliser le point de Iceberg REST terminaison Amazon S3 Tables pour un accès direct, car il prend en charge un plus grand nombre d'applications, sans nécessiter de langage ou de code spécifique au moteur.
Les moteurs de requête suivants peuvent accéder aux tables directement à l'aide du catalogue client :