Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Mengakses data tabel
Ada beberapa cara untuk mengakses tabel di bucket tabel Amazon S3, Anda dapat mengintegrasikan tabel dengan layanan AWS analitik menggunakan Amazon SageMaker Lakehouse, atau mengakses tabel secara langsung menggunakan titik akhir Tabel Amazon S3 atau Katalog Tabel Amazon S3 Iceberg REST untuk. Apache Iceberg Metode akses yang Anda gunakan akan bergantung pada pengaturan katalog, model tata kelola, dan kebutuhan kontrol akses Anda. Berikut ini adalah ikhtisar metode akses ini.
- Integrasi Amazon SageMaker Lakehouse
Ini adalah metode akses yang disarankan untuk bekerja dengan tabel di ember tabel S3. Integrasi ini memberi Anda manajemen tabel terpadu, tata kelola terpusat, dan kontrol akses berbutir halus di berbagai layanan analitik. AWS
- Akses langsung
Gunakan metode ini jika Anda perlu bekerja dengan implementasi katalog AWS Partner Network (APN), implementasi katalog kustom, atau jika Anda hanya perlu melakukan operasi baca/tulis dasar pada tabel dalam satu keranjang tabel.
catatan
Untuk mengakses tabel, identitas IAM yang Anda gunakan memerlukan akses ke sumber daya tabel dan tindakan Tabel S3. Untuk informasi selengkapnya, lihat Manajemen akses untuk Tabel S3.
Mengakses tabel melalui integrasi Amazon SageMaker Lakehouse
Anda dapat mengintegrasikan bucket tabel S3 dengan Amazon SageMaker Lakehouse untuk mengakses tabel dari layanan AWS analitik, seperti Amazon Athena, Amazon Redshift, dan. QuickSight Amazon SageMaker Lakehouse menyatukan data Anda di seluruh danau data Amazon S3 dan gudang data Amazon Redshift, sehingga Anda dapat membangun analitik, pembelajaran mesin, dan aplikasi AI generatif pada satu salinan data. Integrasi mengisi AWS Glue Data Catalog dengan sumber daya tabel Anda, dan menggabungkan akses ke sumber daya ini dengan. AWS Lake Formation Untuk informasi lebih lanjut tentang integrasi, lihatMenggunakan Tabel Amazon S3 dengan layanan analitik AWS.
Integrasi ini memungkinkan kontrol akses berbutir halus AWS Lake Formation untuk memberikan keamanan tambahan. Lake Formation menggunakan kombinasi model izinnya sendiri dan model izin IAM untuk mengontrol akses ke sumber daya tabel dan data yang mendasarinya. Ini berarti bahwa permintaan untuk mengakses tabel Anda harus melewati pemeriksaan izin oleh IAM dan Lake Formation. Untuk informasi selengkapnya, lihat ikhtisar izin Lake Formation di Panduan AWS Lake Formation Pengembang.
Layanan AWS analitik berikut dapat mengakses tabel melalui integrasi ini:
Mengakses tabel menggunakan titik akhir AWS GlueIceberg REST
Setelah bucket tabel S3 Anda terintegrasi dengan Amazon SageMaker Lakehouse, Anda juga dapat menggunakan AWS GlueIceberg REST titik akhir untuk terhubung ke tabel S3 dari mesin kueri pihak ketiga yang mendukung. Iceberg Untuk informasi selengkapnya, lihat Mengakses tabel Amazon S3 menggunakan AWS Glue Iceberg REST titik akhir.
Sebaiknya gunakan AWS GlueIceberg REST titik akhir saat Anda ingin mengakses tabel dariSpark,PyIceberg, atau klien lain Iceberg yang kompatibel.
Klien berikut dapat mengakses tabel secara langsung melalui AWS GlueIceberg REST titik akhir:
Setiap Iceberg klien, termasukSpark,PyIceberg, dan banyak lagi.
Mengakses tabel secara langsung
Anda dapat mengakses tabel langsung dari mesin kueri sumber terbuka melalui metode yang menjembatani operasi manajemen Tabel S3 ke aplikasi Apache Iceberg analitik Anda. Ada dua metode akses langsung: Iceberg REST titik akhir Tabel Amazon S3 atau Katalog Tabel Amazon S3 untuk. Apache Iceberg RESTTitik akhir direkomendasikan.
Kami merekomendasikan akses langsung jika Anda mengakses tabel dalam implementasi katalog yang dikelola sendiri, atau hanya perlu melakukan operasi baca/tulis dasar pada tabel dalam satu keranjang tabel. Untuk skenario akses lainnya, kami merekomendasikan integrasi Amazon SageMaker Lakehouse.
Akses langsung ke tabel dikelola melalui kebijakan berbasis identitas IAM atau kebijakan berbasis sumber daya yang dilampirkan pada tabel dan bucket tabel. Anda tidak perlu mengelola izin Lake Formation untuk tabel saat Anda mengaksesnya secara langsung.
Mengakses tabel melalui titik akhir Tabel Amazon S3 Iceberg REST
Anda dapat menggunakan Iceberg REST endpoint Amazon S3 Tables untuk mengakses tabel Anda langsung dari klien yang Iceberg REST kompatibel melalui HTTP titik akhir, untuk informasi selengkapnya, lihat. Mengakses tabel menggunakan Tabel Amazon S3 Iceberg REST titik akhir
Layanan AWS analitik dan mesin kueri berikut dapat mengakses tabel secara langsung menggunakan titik akhir Tabel Iceberg REST Amazon S3:
Mesin kueri yang didukung
Setiap Iceberg klien, termasukSpark,PyIceberg, dan banyak lagi.
Mengakses tabel langsung melalui Katalog Tabel Amazon S3 untuk Apache Iceberg
Anda juga dapat mengakses tabel langsung dari mesin kueri seperti Apache Spark dengan menggunakan katalog klien Tabel S3, untuk informasi selengkapnya, lihatMengakses tabel Amazon S3 dengan Katalog Tabel Amazon S3 untuk Apache Iceberg. Namun, S3 merekomendasikan penggunaan endpoint Amazon S3 Iceberg REST Tables untuk akses langsung karena mendukung lebih banyak aplikasi, tanpa memerlukan bahasa atau kode khusus mesin.
Mesin query berikut dapat mengakses tabel secara langsung menggunakan katalog klien: