

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Langsung menanyakan data Amazon S3 di Layanan OpenSearch
<a name="direct-query-s3-overview"></a>

Bagian ini akan memandu Anda melalui proses pembuatan dan konfigurasi integrasi sumber data di Amazon OpenSearch Service, memungkinkan Anda untuk secara efisien menanyakan dan menganalisis data Anda yang disimpan di Amazon S3.

Di halaman berikut, Anda akan mempelajari cara menyiapkan sumber data kueri langsung Amazon S3, menavigasi prasyarat yang diperlukan, dan mengikuti step-by-step prosedur menggunakan API Layanan dan API Layanan. Konsol Manajemen AWS OpenSearch Ini juga mencakup langkah-langkah penting berikutnya, termasuk AWS Glue Data Catalog peran pemetaan dan mengonfigurasi kontrol akses di OpenSearch Dasbor.

**Topics**
+ [Membuat integrasi sumber data Amazon S3 di Layanan OpenSearch](direct-query-s3-creating.md)
+ [Mengkonfigurasi dan menanyakan sumber data S3 di Dasbor OpenSearch](direct-query-s3-configure.md)
+ [Harga](#direct-query-s3-pricing)
+ [Batasan](#direct-query-s3-limitations)
+ [Rekomendasi](#direct-query-s3-recommendations)
+ [Kuota](#direct-query-s3-quotas)
+ [Didukung Wilayah AWS](#direct-query-s3-regions)

## Harga
<a name="direct-query-s3-pricing"></a>

Amazon OpenSearch Service menawarkan harga OpenSearch Compute Unit (OCU) untuk kueri langsung Amazon S3. Saat Anda menjalankan kueri langsung, Anda dikenakan biaya OCUs per jam, terdaftar sebagai jenis penggunaan DirectQuery OCU pada tagihan Anda. Anda juga akan dikenakan biaya terpisah dari Amazon S3 untuk penyimpanan data.

Kueri langsung terdiri dari dua jenis—kueri tampilan interaktif dan terindeks.
+ *Kueri interaktif* digunakan untuk mengisi pemilih data dan melakukan analitik pada data Anda di Amazon S3. Saat Anda menjalankan kueri baru dari Discover, OpenSearch Layanan memulai sesi baru yang berlangsung minimal tiga menit. OpenSearch Layanan membuat sesi ini tetap aktif untuk memastikan bahwa kueri berikutnya berjalan dengan cepat.
+ *Kueri tampilan terindeks* menggunakan komputasi untuk mempertahankan tampilan yang diindeks di Layanan. OpenSearch Kueri ini biasanya memakan waktu lebih lama karena mereka menelan sejumlah data yang bervariasi ke dalam indeks bernama. Untuk sumber data Amazon S3, data yang diindeks disimpan dalam domain berdasarkan jenis instans yang dibeli.

Untuk informasi selengkapnya, lihat bagian Kueri Langsung dan Tanpa Server dalam Harga [ OpenSearch Layanan Amazon](https://aws.amazon.com/opensearch-service/pricing/).

## Batasan
<a name="direct-query-s3-limitations"></a>

Batasan berikut berlaku untuk kueri langsung di Amazon S3:
+ Kueri langsung untuk S3 hanya tersedia di domain OpenSearch Layanan yang menjalankan OpenSearch versi 2.13 atau yang lebih baru, dan memerlukan akses ke. AWS Glue Data Catalog AWS Glue Data Catalog Tabel yang ada harus dibuat ulang menggunakan SQL di OpenSearch Query Workbench.
+ Kueri langsung untuk S3 mengharuskan Anda menentukan bucket pos pemeriksaan di Amazon S3. Bucket ini mempertahankan status tampilan yang diindeks, termasuk waktu penyegaran terakhir dan data yang paling baru dicerna.
+  OpenSearch Domain Anda dan AWS Glue Data Catalog harus sama Akun AWS. Bucket S3 Anda dapat berada di akun yang berbeda (memerlukan kondisi untuk ditambahkan ke kebijakan IAM Anda), tetapi harus Wilayah AWS sama dengan domain Anda.
+ OpenSearch Kueri langsung layanan dengan S3 hanya mendukung tabel Spark yang dihasilkan dari Query Workbench. Tabel yang dihasilkan di dalam AWS Glue Data Catalog atau Athena tidak didukung oleh streaming Spark, yang diperlukan untuk mempertahankan tampilan yang diindeks.
+ OpenSearch tipe instance memiliki batasan muatan jaringan baik 10 MiB atau 100 MiB, tergantung pada jenis instance tertentu yang Anda pilih. 
+ Beberapa jenis data tidak didukung. Tipe data yang didukung terbatas pada Parket, CSV, dan JSON. 
+ Jika struktur data Anda berubah seiring waktu, Anda perlu memperbarui tampilan atau out-of-the-box integrasi yang diindeks untuk memperhitungkan perubahan struktur data. 
+ AWS CloudFormation template belum didukung.
+ OpenSearch Pernyataan SQL dan OpenSearch PPL memiliki keterbatasan yang berbeda saat bekerja dengan OpenSearch indeks dibandingkan dengan menggunakan kueri langsung. Kueri langsung mendukung perintah lanjutan seperti JOINs, subkueri, dan pencarian, sementara dukungan untuk perintah ini pada OpenSearch indeks terbatas atau tidak ada sama sekali. Untuk informasi selengkapnya, lihat [Perintah SQL dan PPL yang didukung](direct-query-supported-commands.md).

## Rekomendasi
<a name="direct-query-s3-recommendations"></a>

Kami merekomendasikan hal berikut saat menggunakan kueri langsung di Amazon S3:
+ Menyerap data ke Amazon S3 menggunakan format partisi tahun, bulan, hari, jam untuk mempercepat kueri.
+ Saat Anda membuat indeks skipping, gunakan filter Bloom untuk bidang dengan kardinalitas tinggi dan min/max indeks untuk bidang dengan rentang nilai yang besar. Untuk bidang kardinalitas tinggi, pertimbangkan untuk menggunakan pendekatan berbasis nilai untuk meningkatkan efisiensi kueri.
+ Gunakan Manajemen Status Indeks untuk mempertahankan penyimpanan untuk tampilan terwujud dan indeks penutup.
+ Gunakan `COALESCE SQL` fungsi untuk menangani kolom yang hilang dan memastikan hasil dikembalikan.
+ Gunakan batasan pada kueri Anda untuk memastikan Anda tidak menarik terlalu banyak data kembali.

## Kuota
<a name="direct-query-s3-quotas"></a>

*Setiap kali Anda memulai kueri ke sumber data Amazon S3 OpenSearch , Layanan membuka sesi dan membuatnya tetap hidup setidaknya selama tiga menit.* Ini mengurangi latensi kueri dengan menghapus waktu mulai sesi di kueri berikutnya.


| Deskripsi | Maksimum | Dapat mengesampingkan | 
| --- | --- | --- | 
| Koneksi per domain | 10 | Ya | 
| Sumber data per domain | 20 | Ya | 
| Indeks per domain | 5 | Ya | 
| Sesi bersamaan per sumber data | 10 | Ya | 
| Maksimum OCU per kueri | 60 | Ya | 
| Waktu eksekusi kueri maksimum (menit) | 30 | Ya | 
| Maksimum OCUs per akselerasi | 20 | Ya | 
| Penyimpanan fana maksimum | 20 | Ya | 

## Didukung Wilayah AWS
<a name="direct-query-s3-regions"></a>

 Wilayah AWS Berikut ini didukung untuk kueri langsung di Amazon S3:
+ Asia Pasifik (Hong Kong)
+ Asia Pasifik (Mumbai)
+ Asia Pasifik (Seoul) 
+ Asia Pasifik (Singapura)
+ Asia Pasifik (Sydney)
+ Asia Pasifik (Tokyo)
+ Kanada (Pusat)
+ Eropa (Frankfurt)
+  Eropa (Irlandia)
+ Eropa (Stockholm)
+ Timur AS (N. Virginia)
+ AS Timur (Ohio)
+ AS Barat (Oregon)