Accès aux données des tables - Amazon Simple Storage Service

Accès aux données des tables

Il existe plusieurs manières d’accéder aux tables dans les compartiments de table Amazon S3. Vous pouvez intégrer des tables à des services d’analytique AWS à l’aide d’Amazon SageMaker Lakehouse, ou accéder aux tables directement à l’aide du point de terminaison Iceberg REST d’Amazon S3 Tables ou du catalogue d’Amazon S3 Tables pour Apache Iceberg. La méthode d’accès que vous utilisez dépend de la configuration du catalogue, du modèle de gouvernance et de vos besoins en matière de contrôle d’accès. Voici un aperçu de ces méthodes d’accès.

Intégration Amazon SageMaker Lakehouse

Il s’agit de la méthode d’accès recommandée pour utiliser des tables dans des compartiments de table S3. L’intégration permet une gestion unifiée des tables, une gouvernance centralisée et un contrôle d’accès précis entre plusieurs services d’analytique AWS. Après l’intégration, vous pouvez interroger des tables dans des services tels qu’Athena et Amazon Redshift.

Accès direct

Utilisez cette méthode si vous devez utiliser des implémentations de catalogues AWS Partner Network (APN), des implémentations de catalogues personnalisés ou si vous devez uniquement effectuer des opérations de lecture/écriture de base sur des tables au sein d’un même compartiment de table.

Note

Pour accéder aux tables, l’identité IAM que vous utilisez doit accéder aux ressources de vos tables et aux actions de S3 Tables. Pour plus d’informations, consultez Gestion des accès pour S3 Tables.

Accès à des tables via l’intégration Amazon SageMaker Lakehouse

Vous pouvez intégrer des compartiments de table S3 à Amazon SageMaker Lakehouse pour accéder à des tables depuis des services d’analytique AWS tels qu’Amazon Athena, Amazon Redshift et Quick Suite. Amazon SageMaker Lakehouse unifie les données des lacs de données Amazon S3 et des entrepôts de données Amazon Redshift, vous aidant ainsi à créer des applications d’analytique, de machine learning (ML) et d’IA générative sur une copie unique des données. L’intégration remplit le AWS Glue Data Catalog avec les ressources de votre table et fédère l’accès à ces ressources avec AWS Lake Formation. Pour plus d’informations sur l’intégration, consultez Intégration d’Amazon S3 Tables aux services d’analytique AWS.

L’intégration permet un contrôle d’accès précis via AWS Lake Formation afin d’offrir une sécurité supplémentaire. Lake Formation utilise une combinaison de son propre modèle d’autorisations et du modèle d’autorisations IAM pour contrôler l’accès aux ressources des tables et aux données sous-jacentes. Cela signifie qu’une demande d’accès à votre table doit passer les contrôles d’autorisation effectués à la fois par IAM et par Lake Formation. Pour plus d’informations, consultez Présentation des autorisations Lake Formation dans le Guide du développeur AWS Lake Formation.

Les services d’analytique AWS suivants peuvent accéder aux tables via cette intégration :

Accès aux tables à l’aide du point de terminaison AWS Glue Iceberg REST

Une fois que vos compartiments de table S3 sont intégrés à Amazon SageMaker Lakehouse, vous pouvez également utiliser le point de terminaison AWS Glue Iceberg REST pour vous connecter aux tables S3 à partir de moteurs de requêtes tiers compatibles avec Iceberg. Pour plus d’informations, consultez Accès à Amazon S3 Tables à l’aide du point de terminaison AWS Glue Iceberg REST.

Nous vous recommandons d’utiliser le point de terminaison AWS Glue Iceberg REST lorsque vous souhaitez accéder à des tables à partir de Spark, PyIceberg ou d’autres clients compatibles avec Iceberg.

Les clients suivants peuvent accéder aux tables directement via le point de terminaison AWS Glue Iceberg REST :

  • N’importe quel client Iceberg, y compris Spark, PyIceberg, etc.

Accès direct aux tables

Vous pouvez accéder aux tables directement à partir de moteurs de requêtes open source grâce à des méthodes qui relient les opérations de gestion de S3 Tables à vos applications d’analytique Apache Iceberg. Il existe deux méthodes d’accès direct : le point de terminaison Iceberg REST d’Amazon S3 Tables ou le catalogue d’Amazon S3 Tables pour Apache Iceberg. Le point de terminaison REST est recommandé.

Nous recommandons un accès direct si vous accédez aux tables dans le cadre d’implémentations de catalogues autogérées ou si vous devez uniquement effectuer des opérations de lecture/écriture de base sur les tables d’un seul compartiment de table. Pour les autres scénarios d’accès, nous recommandons l’intégration Amazon SageMaker Lakehouse.

L’accès direct aux tables est géré par le biais de politiques basées sur l’identité IAM ou de politiques basées sur les ressources associées aux tables et aux compartiments de table. Vous n’avez pas besoin de gérer les autorisations Lake Formation pour les tables lorsque vous y accédez directement.

Accès aux tables via le point de terminaison Iceberg REST d’Amazon S3 Tables

Vous pouvez utiliser le point de terminaison Iceberg REST d’Amazon S3 Tables pour accéder à vos tables directement depuis n’importe quel client compatible Iceberg REST via des points de terminaison HTTP. Pour plus d’informations, consultez Accès aux tables à l’aide du point de terminaison Iceberg REST d’Amazon S3 Tables.

Les services d’analytique AWS et moteurs de requête suivants peuvent accéder aux tables directement via le point de terminaison Iceberg REST d’Amazon S3 Tables :

Moteurs de requête pris en charge

Accès direct aux tables via le catalogue d’Amazon S3 Tables pour Apache Iceberg

Vous pouvez également accéder directement aux tables à partir des moteurs de requête comme Apache Spark en utilisant le catalogue client de S3 Tables. Pour plus d’informations, consultez Accès direct aux tables Amazon S3 via le catalogue d’Amazon S3 Tables pour Apache Iceberg. S3 recommande toutefois d’utiliser le point de terminaison Iceberg REST d’Amazon S3 Tables pour un accès direct, car il prend en charge un plus grand nombre d’applications, sans nécessiter de langage ou de code spécifique au moteur.

Les moteurs de requête suivants peuvent accéder aux tables directement à l’aide du catalogue client :