Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Zugreifen auf Tabellendaten
Es gibt mehrere Möglichkeiten, auf Tabellen in Amazon S3 S3-Tabellen-Buckets zuzugreifen. Sie können Tabellen mithilfe von Amazon SageMaker Lakehouse in AWS Analysedienste integrieren oder direkt über den Amazon Iceberg REST S3-Tabellen-Endpunkt oder den Amazon S3 S3-Tabellenkatalog für auf Tabellen zugreifen. Apache Iceberg Welche Zugriffsmethode Sie verwenden, hängt von Ihrer Katalogeinrichtung, Ihrem Verwaltungsmodell und Ihren Anforderungen an die Zugriffskontrolle ab. Im Folgenden finden Sie eine Übersicht über diese Zugriffsmethoden.
- Amazon SageMaker Lakehouse-Integration
Dies ist die empfohlene Zugriffsmethode für die Arbeit mit Tabellen in S3-Tabellen-Buckets. Die Integration bietet Ihnen ein einheitliches Tabellenmanagement, eine zentrale Steuerung und eine differenzierte Zugriffskontrolle für mehrere AWS Analysedienste.
- Direkter Zugriff
Verwenden Sie diese Methode, wenn Sie mit AWS Partner Network (APN-) Katalogimplementierungen oder benutzerdefinierten Katalogimplementierungen arbeiten müssen oder wenn Sie nur grundlegende Lese-/Schreiboperationen für Tabellen innerhalb eines einzelnen Tabellen-Buckets ausführen müssen.
Anmerkung
Für den Zugriff auf Tabellen benötigt die von Ihnen verwendete IAM-Identität Zugriff auf Ihre Tabellenressourcen und S3-Tabellenaktionen. Weitere Informationen finden Sie unter Zugriffsverwaltung für S3 Tables.
Zugreifen auf Tabellen über die Amazon SageMaker Lakehouse-Integration
Sie können S3-Tabellen-Buckets in Amazon SageMaker Lakehouse integrieren, um auf Tabellen von AWS Analysediensten wie Amazon Athena, Amazon Redshift und zuzugreifen. QuickSight Amazon SageMaker Lakehouse vereinheitlicht Ihre Daten über Amazon S3 S3-Data Lakes und Amazon Redshift Redshift-Data Warehouses hinweg, sodass Sie Analysen, maschinelles Lernen (ML) und generative KI-Anwendungen auf einer einzigen Datenkopie erstellen können. Die Integration füllt die AWS Glue Data Catalog mit Ihren Tabellenressourcen und bündelt den Zugriff auf diese Ressourcen mit. AWS Lake Formation Weitere Informationen zur Integration finden Sie unter. Verwenden von Amazon S3 S3-Tabellen mit AWS Analysediensten
Die Integration ermöglicht eine detaillierte Zugriffskontrolle AWS Lake Formation und bietet so zusätzliche Sicherheit. Lake Formation verwendet eine Kombination aus seinem eigenen Berechtigungsmodell und dem IAM-Berechtigungsmodell, um den Zugriff auf Tabellenressourcen und zugrunde liegende Daten zu steuern. Das bedeutet, dass eine Anfrage für den Zugriff auf Ihre Tabelle die Berechtigungsprüfungen sowohl von IAM als auch von Lake Formation bestehen muss. Weitere Informationen finden Sie im AWS Lake Formation Developer Guide unter Übersicht über die Berechtigungen von Lake Formation.
Die folgenden AWS Analysedienste können über diese Integration auf Tabellen zugreifen:
Zugreifen auf Tabellen mithilfe des AWS GlueIceberg REST Endpunkts
Sobald Ihre S3-Tabellen-Buckets in Amazon SageMaker Lakehouse integriert sind, können Sie den AWS GlueIceberg REST Endpunkt auch verwenden, um eine Verbindung zu S3-Tabellen von Abfrage-Engines von Drittanbietern herzustellen, die dies unterstützen. Iceberg Weitere Informationen finden Sie unter Zugreifen auf Amazon S3 S3-Tabellen mit dem AWS Glue Iceberg REST Endpunkt.
Wir empfehlen, den AWS GlueIceberg REST Endpunkt zu verwenden, wenn Sie auf Tabellen von SparkPyIceberg, oder anderen Iceberg kompatiblen Clients zugreifen möchten.
Die folgenden Clients können direkt über den AWS GlueIceberg REST Endpunkt auf Tabellen zugreifen:
Jeder Iceberg Client, einschließlich SparkPyIceberg, und mehr.
Direkter Zugriff auf Tabellen
Sie können direkt von Open-Source-Abfrage-Engines aus auf Tabellen zugreifen, und zwar mithilfe von Methoden, die die Verwaltung von S3-Tabellen mit Ihren Apache Iceberg Analyseanwendungen verbinden. Es gibt zwei Direktzugriffsmethoden: den Amazon Iceberg REST S3-Tabellen-Endpunkt oder den Amazon S3-Tabellenkatalog fürApache Iceberg. Der REST Endpunkt wird empfohlen.
Wir empfehlen den Direktzugriff, wenn Sie in selbstverwalteten Katalogimplementierungen auf Tabellen zugreifen oder nur grundlegende Lese-/Schreibvorgänge für Tabellen in einem einzelnen Tabellen-Bucket ausführen müssen. Für andere Zugriffsszenarien empfehlen wir die Amazon SageMaker Lakehouse-Integration.
Der direkte Zugriff auf Tabellen wird entweder über identitätsbasierte IAM-Richtlinien oder über ressourcenbasierte Richtlinien verwaltet, die an Tabellen und Tabellen-Buckets angehängt sind. Sie müssen Lake Formation Formation-Berechtigungen für Tabellen nicht verwalten, wenn Sie direkt auf sie zugreifen.
Zugreifen auf Tabellen über den Amazon S3 Iceberg REST Tables-Endpunkt
Sie können den Amazon S3 Iceberg REST Tables-Endpunkt verwenden, um direkt von allen Iceberg REST kompatiblen Clients über HTTP Endpunkte auf Ihre Tabellen zuzugreifen. Weitere Informationen finden Sie unterZugreifen auf Tabellen mithilfe der Amazon S3 S3-Tabellen Iceberg REST Endpunkt.
Die folgenden AWS Analysedienste und Abfrage-Engines können über den Amazon S3 Iceberg REST Tables-Endpunkt direkt auf Tabellen zugreifen:
Unterstützte Abfrage-Engines
Jeder Iceberg Client, einschließlich SparkPyIceberg, und mehr.
Direkter Zugriff auf Tabellen über den Amazon S3 S3-Tabellenkatalog für Apache Iceberg
Sie können auch direkt von Abfrage-Engines aus auf Tabellen zugreifen, z. B. Apache Spark mithilfe des S3 Tables-Client-Katalogs. Weitere Informationen finden Sie unterZugreifen auf Amazon S3 S3-Tabellen mit dem Amazon S3 S3-Tabellenkatalog für Apache Iceberg. S3 empfiehlt jedoch, den Amazon S3 Iceberg REST Tables-Endpunkt für den direkten Zugriff zu verwenden, da dieser mehr Anwendungen unterstützt, ohne dass sprach- oder maschinenspezifischer Code erforderlich ist.
Die folgenden Abfrage-Engines können über den Client-Katalog direkt auf Tabellen zugreifen: