Accesso ai dati delle tabelle - Amazon Simple Storage Service

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Accesso ai dati delle tabelle

Esistono diversi modi per accedere alle tabelle nei bucket di tabelle Amazon S3, puoi integrare tabelle con servizi di AWS analisi utilizzando Amazon SageMaker Lakehouse o accedere direttamente alle tabelle utilizzando l'endpoint Amazon S3 Tables o Amazon S3 Tables Catalog forIceberg REST. Apache Iceberg Il metodo di accesso utilizzato dipenderà dalla configurazione del catalogo, dal modello di governance e dalle esigenze di controllo degli accessi. Di seguito è riportata una panoramica di questi metodi di accesso.

Integrazione con Amazon SageMaker Lakehouse

Questo è il metodo di accesso consigliato per lavorare con le tabelle nei table bucket S3. L'integrazione offre una gestione unificata delle tabelle, una governance centralizzata e un controllo granulare degli accessi su più servizi di analisi. AWS

Accesso diretto

Utilizza questo metodo se devi lavorare con implementazioni di cataloghi AWS Partner Network (APN), implementazioni di cataloghi personalizzati o se devi solo eseguire operazioni di lettura/scrittura di base su tabelle all'interno di un singolo bucket di tabelle.

Nota

Per accedere alle tabelle, l'identità IAM che utilizzi deve accedere alle risorse delle tabelle e alle azioni di S3 Tables. Per ulteriori informazioni, consulta Gestione degli accessi per Tabelle S3.

Accesso alle tabelle tramite l'integrazione con Amazon SageMaker Lakehouse

Puoi integrare i table bucket S3 con Amazon SageMaker Lakehouse per accedere alle tabelle da servizi di AWS analisi, come Amazon Athena, Amazon Redshift e. QuickSight Amazon SageMaker Lakehouse unifica i dati tra i data lake Amazon S3 e i data warehouse Amazon Redshift, in modo da poter creare applicazioni di analisi, machine learning (ML) e intelligenza artificiale generativa su un'unica copia di dati. L'integrazione inserisce le tue risorse tabellari e federa l'accesso a queste risorse AWS Glue Data Catalog con. AWS Lake Formation Per ulteriori informazioni sull'integrazione, consulta. Utilizzo di Amazon S3 Tables con AWS servizi di analisi

L'integrazione consente un controllo granulare degli accessi AWS Lake Formation per fornire ulteriore sicurezza. Lake Formation utilizza una combinazione del proprio modello di autorizzazioni e del modello di autorizzazioni IAM per controllare l'accesso alle risorse delle tabelle e ai dati sottostanti. Ciò significa che una richiesta di accesso alla tua tabella deve superare i controlli di autorizzazione sia di IAM che di Lake Formation. Per ulteriori informazioni, consulta la panoramica delle autorizzazioni di Lake Formation nella Guida per gli AWS Lake Formation sviluppatori.

I seguenti servizi AWS di analisi possono accedere alle tabelle tramite questa integrazione:

Accesso alle tabelle tramite l' AWS GlueIceberg RESTendpoint

Una volta integrati i bucket di tabelle S3 con Amazon SageMaker Lakehouse, puoi anche utilizzare l' AWS GlueIceberg RESTendpoint per connetterti alle tabelle S3 da motori di query di terze parti che lo supportano. Iceberg Per ulteriori informazioni, consulta Accesso alle tabelle Amazon S3 tramite AWS Glue Iceberg REST endpoint.

Ti consigliamo di utilizzare l' AWS GlueIceberg RESTendpoint quando desideri accedere alle tabelle da Spark o altri client compatibili. PyIceberg Iceberg

I seguenti client possono accedere alle tabelle direttamente tramite l' AWS GlueIceberg RESTendpoint:

  • Qualsiasi Iceberg cliente, incluso SparkPyIceberg, e altro ancora.

Accesso diretto alle tabelle

Puoi accedere alle tabelle direttamente dai motori di query open source attraverso metodi che collegano le operazioni di gestione di S3 Tables alle tue applicazioni di Apache Iceberg analisi. Esistono due metodi di accesso diretto: l'Iceberg RESTendpoint Amazon S3 Tables o l'Amazon S3 Tables Catalog for. Apache Iceberg L'RESTendpoint è consigliato.

Consigliamo l'accesso diretto se si accede alle tabelle in implementazioni di cataloghi autogestite o se è necessario eseguire solo operazioni di lettura/scrittura di base sulle tabelle in un unico bucket di tabelle. Per altri scenari di accesso, consigliamo l'integrazione con Amazon SageMaker Lakehouse.

L'accesso diretto alle tabelle viene gestito tramite politiche basate sull'identità IAM o politiche basate sulle risorse collegate a tabelle e bucket di tabelle. Non è necessario gestire le autorizzazioni di Lake Formation per le tabelle quando vi accedi direttamente.

Accesso alle tabelle tramite l'endpoint Amazon S3 Tables Iceberg REST

Puoi utilizzare l'Iceberg RESTendpoint Amazon S3 Tables per accedere alle tabelle direttamente da qualsiasi client Iceberg REST compatibile tramite HTTP endpoint. Per ulteriori informazioni, consulta. Accesso alle tabelle utilizzando le tabelle Amazon S3 Iceberg REST endpoint

I seguenti servizi di AWS analisi e motori di query possono accedere direttamente alle tabelle utilizzando l'endpoint Amazon S3 TablesIceberg REST:

Motori di query supportati

Accesso diretto alle tabelle tramite Amazon S3 Tables Catalog per Apache Iceberg

Puoi anche accedere alle tabelle direttamente dai motori di query, ad esempio Apache Spark utilizzando il catalogo dei client di S3 Tables, per ulteriori informazioni, consulta. Accesso alle tabelle Amazon S3 con Amazon S3 Tables Catalog per Apache Iceberg Tuttavia, S3 consiglia di utilizzare l'endpoint Amazon S3 Iceberg REST Tables per l'accesso diretto perché supporta più applicazioni, senza richiedere un linguaggio o un codice specifico del motore.

I seguenti motori di query possono accedere direttamente alle tabelle utilizzando il catalogo client: