Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Accès aux données des tables
Il existe plusieurs manières d'accéder aux tables dans les compartiments de tables Amazon S3. Vous pouvez intégrer des tables à des services AWS d'analyse en utilisant AWS Glue Data Catalog ou accéder à des tables directement à l'aide du point de Iceberg REST terminaison Amazon S3 Tables ou du catalogue de tables Amazon S3 pourApache Iceberg. La méthode d’accès que vous utilisez dépend de la configuration du catalogue, du modèle de gouvernance et de vos besoins en matière de contrôle d’accès. Voici un aperçu de ces méthodes d’accès.
- AWS Glue Data Catalog intégration
Il s’agit de la méthode d’accès recommandée pour utiliser des tables dans des compartiments de table S3. Cette intégration vous donne une vue unifiée de votre parc de données sur plusieurs services AWS d'analyse via le AWS Glue Data Catalog. Après l'intégration, vous pouvez interroger des tables à l'aide de services tels qu'Athena et Amazon Redshift. L'accès aux tables est géré à l'aide des autorisations IAM. Pour accéder aux tables à l'aide de cette intégration, l'identité IAM que vous utilisez doit accéder aux ressources et actions de vos tables S3, aux AWS Glue Data Catalog objets et au moteur de requêtes que vous utilisez. Pour de plus amples informations, veuillez consulter Gestion des accès pour S3 Tables.
- Accès direct
Utilisez cette méthode si vous devez travailler avec des implémentations de catalogues AWS Partner Network (APN), des implémentations de catalogues personnalisés ou si vous devez uniquement effectuer des read/write opérations de base sur des tables au sein d'un même compartiment de tables. L'accès aux tables est géré à l'aide des autorisations IAM. Pour accéder aux tables, l'identité IAM que vous utilisez doit accéder aux ressources de vos tables et aux actions de S3 Tables. Pour de plus amples informations, veuillez consulter Gestion des accès pour S3 Tables.
Accès aux tables via l' AWS Glue Data Catalog intégration
Vous pouvez intégrer des compartiments de tables S3 AWS Glue Data Catalog pour accéder aux tables à partir de services AWS d'analyse tels qu'Amazon Athena, Amazon Redshift et Quick. L'intégration les renseigne AWS Glue Data Catalog avec les ressources de votre table et fédère l'accès à ces ressources. Pour plus d’informations sur l’intégration, consultez Intégration des tables Amazon S3 aux services AWS d'analyse.
Les services AWS d'analyse suivants peuvent accéder aux tables via cette intégration :
Accès aux tables à l’aide du point de terminaison AWS Glue Iceberg REST
Une fois vos compartiments de tables S3 intégrés AWS Glue Data Catalog, vous pouvez également utiliser le AWS GlueIceberg REST point de terminaison pour vous connecter aux tables S3 à partir de moteurs de requêtes tiers compatiblesIceberg. Pour de plus amples informations, veuillez consulter Accès à Amazon S3 Tables à l’aide du point de terminaison AWS Glue Iceberg REST.
Nous vous recommandons d’utiliser le point de terminaison AWS Glue Iceberg REST lorsque vous souhaitez accéder à des tables à partir de Spark, PyIceberg ou d’autres clients compatibles avec Iceberg.
Les clients suivants peuvent accéder aux tables directement via le point de terminaison AWS Glue Iceberg REST :
N’importe quel client Iceberg, y compris Spark, PyIceberg, etc.
Accès direct aux tables
Vous pouvez accéder aux tables directement à partir de moteurs de requêtes open source grâce à des méthodes qui relient les opérations de gestion de S3 Tables à vos applications d’analytique Apache Iceberg. Il existe deux méthodes d’accès direct : le point de terminaison Iceberg REST d’Amazon S3 Tables ou le catalogue d’Amazon S3 Tables pour Apache Iceberg. Le point de terminaison REST est recommandé.
Nous recommandons un accès direct si vous accédez aux tables dans le cadre d'implémentations de catalogues autogérées ou si vous devez uniquement effectuer des read/write opérations de base sur les tables d'un seul compartiment de tables. Pour les autres scénarios d'accès, nous recommandons l' AWS Glue Data Catalog intégration.
L’accès direct aux tables est géré par le biais de politiques basées sur l’identité IAM ou de politiques basées sur les ressources associées aux tables et aux compartiments de table.
Accès aux tables via le point de terminaison Iceberg REST d’Amazon S3 Tables
Vous pouvez utiliser le point de terminaison Iceberg REST d’Amazon S3 Tables pour accéder à vos tables directement depuis n’importe quel client compatible Iceberg REST via des points de terminaison HTTP. Pour plus d’informations, consultez Accès aux tables à l’aide du point de terminaison Iceberg REST d’Amazon S3 Tables.
Les services AWS d'analyse et moteurs de requêtes suivants peuvent accéder aux tables directement via le point de Iceberg REST terminaison Amazon S3 Tables :
Moteurs de requête pris en charge
N’importe quel client Iceberg, y compris Spark, PyIceberg, etc.
Accès direct aux tables via le catalogue d’Amazon S3 Tables pour Apache Iceberg
Vous pouvez également accéder directement aux tables à partir des moteurs de requête comme Apache Spark en utilisant le catalogue client de S3 Tables. Pour plus d’informations, consultez Accès direct aux tables Amazon S3 via le catalogue d’Amazon S3 Tables pour Apache Iceberg. S3 recommande toutefois d’utiliser le point de terminaison Iceberg REST d’Amazon S3 Tables pour un accès direct, car il prend en charge un plus grand nombre d’applications, sans nécessiter de langage ou de code spécifique au moteur.
Les moteurs de requête suivants peuvent accéder aux tables directement à l’aide du catalogue client :