Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Perintah SELECT
penting
Amazon S3 Select sudah tidak tersedia untuk pelanggan baru. Pelanggan Amazon S3 Select yang sudah ada dapat terus menggunakan fitur ini seperti biasa. Pelajari selengkapnya
Amazon S3 Select hanya mendukung perintah SQL SELECT. Klausul standar ANSI berikut didukung untuk SELECT:
-
Daftar
SELECT -
Klausul
FROM -
Klausul
WHERE -
Klausul
LIMIT
catatan
Kueri Amazon S3 Select saat ini tidak mendukung subkueri atau penggabungan.
Daftar SELECT
Daftar SELECT mencantumkan kolom, fungsi, dan ekspresi yang ingin Anda tampilkan dari kueri. Daftar ini mewakili output kueri.
SELECT * SELECTprojection1AScolumn_alias_1,projection2AScolumn_alias_2
Bentuk pertama SELECT dengan * (tanda bintang) mengembalikan setiap baris yang melewati klausul WHERE, apa adanya. Bentuk kedua SELECT membuat baris dengan ekspresi skalar output dan projection1 yang ditentukan pengguna untuk setiap kolom.projection2
Klausul FROM
Amazon S3 Select mendukung bentuk klausul FROM berikut:
FROMtable_nameFROMtable_name aliasFROMtable_nameASalias
Dalam setiap bentuk klausul FROM, table_name adalah S3Object yang sedang dikuerikan. Pengguna yang berasal dari basis data relasional tradisional dapat menganggap hal ini sebagai skema basis data yang berisi beberapa tampilan di atas tabel.
Mengikuti SQL standar, klausul FROM membuat baris yang difilter dalam klausul WHERE dan diproyeksikan dalam daftar SELECT.
Untuk objek JSON yang disimpan di Amazon S3 Select, Anda juga dapat menggunakan bentuk klausul FROM berikut:
FROM S3Object[*].pathFROM S3Object[*].path aliasFROM S3Object[*].pathASalias
Menggunakan bentuk klausul FROM, Anda dapat memilih dari array atau objek di dalam objek JSON. Anda dapat menentukan path menggunakan salah satu bentuk berikut:
-
Berdasarkan nama (dalam objek):
.atauname['name'] -
Berdasarkan indeks (dalam array):
[index] -
Berdasarkan karakter wildcard (dalam objek):
.* -
Berdasarkan karakter wildcard (dalam array):
[*]
catatan
-
Bentuk klausul
FROMini hanya berfungsi dengan objek JSON. -
Karakter wildcard selalu mengeluarkan setidaknya satu catatan. Apabila tidak ada catatan yang cocok, Amazon S3 Select mengeluarkan nilai
MISSING. Selama serialisasi output (setelah kueri selesai berjalan), Amazon S3 Select menggantikan nilaiMISSINGdengan catatan kosong. -
Fungsi agregat (
AVG,COUNT,MAX,MIN, danSUM) melewati nilaiMISSING. -
Apabila Anda tidak menyediakan alias saat menggunakan karakter wildcard, Anda dapat merujuk baris menggunakan elemen terakhir di jalur tersebut. Misalnya, Anda dapat memilih semua harga dari daftar pembukuan menggunakan kueri
SELECT price FROM S3Object[*].books[*].price. Apabila jalur diakhiri karakter wildcard alih-alih nama, maka Anda dapat menggunakan nilai_1tersebut untuk merujuk ke baris. Misalnya, alih-alihSELECT price FROM S3Object[*].books[*].price, Anda dapat menggunakan kueriSELECT _1.price FROM S3Object[*].books[*]. -
Amazon S3 Select selalu memperlakukan dokumen JSON sebagai array nilai tingkat root. Dengan demikian, sekalipun objek JSON yang Anda kueri hanya memiliki satu elemen root, klausul
FROMharus dimulai denganS3Object[*]. Namun, karena alasan kompatibilitas, Amazon S3 Select memungkinkan Anda menghilangkan karakter wildcard jika Anda tidak menyertakan jalur. Dengan demikian, klausul lengkapFROM S3Objectsetara denganFROM S3Object[*] as S3Object. Apabila Anda menyertakan jalur, Anda juga harus menggunakan karakter wildcard. Jadi,FROM S3ObjectdanFROM S3Object[*].keduanya adalah klausul yang valid, tetapi tidak denganpathFROM S3Object..path
Contoh:
Contoh 1
Contoh ini menampilkan hasil menggunakan set data dan kueri berikut:
{ "Rules": [ {"id": "1"}, {"expr": "y > x"}, {"id": "2", "expr": "z = DEBUG"} ]} { "created": "June 27", "modified": "July 6" }
SELECT id FROM S3Object[*].Rules[*].id
{"id":"1"} {} {"id":"2"} {}
Amazon S3 Select menghasilkan setiap hasil karena alasan berikut:
-
{"id":"id-1"}–S3Object[0].Rules[0].idmenghasilkan kecocokan. -
{}–S3Object[0].Rules[1].idtidak cocok dengan catatan, jadi Amazon S3 Select mengeluarkanMISSING, yang kemudian diubah menjadi catatan kosong selama serialisasi output dan dikembalikan. -
{"id":"id-2"}–S3Object[0].Rules[2].idmenghasilkan kecocokan. -
{}–S3Object[1]tidak cocok denganRules, jadi Amazon S3 Select mengeluarkanMISSING, yang kemudian diubah menjadi catatan kosong selama serialisasi output dan dikembalikan.
Apabila Anda tidak ingin Amazon S3 Select mengembalikan catatan kosong saat tidak menemukan kecocokan, Anda dapat menguji nilai MISSING. Kueri berikut mengembalikan hasil yang sama seperti kueri sebelumnya, tetapi nilai yang kosong dihilangkan:
SELECT id FROM S3Object[*].Rules[*].id WHERE id IS NOT MISSING
{"id":"1"} {"id":"2"}
Contoh 2
Contoh ini menampilkan hasil menggunakan set data dan kueri berikut:
{ "created": "936864000", "dir_name": "important_docs", "files": [ { "name": "." }, { "name": ".." }, { "name": ".aws" }, { "name": "downloads" } ], "owner": "Amazon S3" } { "created": "936864000", "dir_name": "other_docs", "files": [ { "name": "." }, { "name": ".." }, { "name": "my stuff" }, { "name": "backup" } ], "owner": "User" }
SELECT d.dir_name, d.files FROM S3Object[*] d
{"dir_name":"important_docs","files":[{"name":"."},{"name":".."},{"name":".aws"},{"name":"downloads"}]} {"dir_name":"other_docs","files":[{"name":"."},{"name":".."},{"name":"my stuff"},{"name":"backup"}]}
SELECT _1.dir_name, _1.owner FROM S3Object[*]
{"dir_name":"important_docs","owner":"Amazon S3"} {"dir_name":"other_docs","owner":"User"}
Klausul WHERE
Klausul WHERE mengikuti sintaks ini:
WHEREcondition
Klausul WHERE memfilter baris berdasarkan . Ketentuan adalah ekspresi yang memiliki hasil Boolean. Hanya baris yang syaratnya dievaluasi sebagai conditionTRUE yang dikembalikan di hasilnya.
Klausul LIMIT
Klausul LIMIT mengikuti sintaks ini:
LIMITnumber
Klausul LIMIT membatasi jumlah catatan yang Anda ingin kuerinya dikembalikan berdasarkan .number
Akses atribut
Klausul SELECT dan WHERE dapat merujuk ke data catatan menggunakan salah satu metode dalam bagian berikut, tergantung pada jika file yang dicari dalam format CSV atau JSON.
CSV
-
Nomor Kolom–Anda dapat merujuk ke kolom Nth pada baris dengan nama kolom
_, denganNadalah posisi kolom. Hitungan posisi dimulai pada 1. Misalnya, kolom pertama diberi namaN_1dan kolom kedua diberi nama_2.Anda dapat merujuk ke kolom sebagai
_atauN. Misalnya,alias._N_2danmyAlias._2adalah cara yang valid untuk merujuk ke kolom dalam daftarSELECTdan klausulWHERE. -
Header Kolom–Untuk objek dalam format CSV yang memiliki baris header, header tersedia untuk daftar
SELECTdan klausulWHERE. Secara khusus, seperti dalam SQL tradisional, dalam ekspresi klausulSELECTdanWHERE, Anda dapat melihat kolom denganataualias.column_name.column_name
JSON
-
Dokumen–Anda dapat mengakses bidang dokumen JSON sebagai
. Anda juga dapat mengakses bidang bersarang, misalnya,alias.name.alias.name1.name2.name3 -
Daftar–Anda dapat mengakses elemen dalam daftar JSON menggunakan indeks berbasis nol dengan operator
[]. Misalnya, Anda dapat mengakses elemen kedua dari daftar sebagai. Anda dapat menggabungkan elemen daftar yang diakses dengan bidang, misalnya,alias[1].alias.name1.name2[1].name3 -
Contoh: Pertimbangkan objek JSON ini sebagai sampel set data:
{"name": "Susan Smith", "org": "engineering", "projects": [ {"project_name":"project1", "completed":false}, {"project_name":"project2", "completed":true} ] }Contoh 1
Kueri berikut mengembalikan hasil ini:
Select s.name from S3Object s{"name":"Susan Smith"}Contoh 2
Kueri berikut mengembalikan hasil ini:
Select s.projects[0].project_name from S3Object s{"project_name":"project1"}
Sensitivitas huruf besar/kecil pada nama header dan atribut
Dengan Amazon S3 Select, Anda dapat menggunakan tanda petik dua untuk menunjukkan header kolom (untuk objek CSV) dan atribut (untuk objek JSON) yang peka terhadap huruf besar/kecil. Tanpa tanda petik dua, header dan atribut objek tidak sensitif terhadap huruf besar/kecil. Kesalahan akan muncul dalam kasus ambiguitas.
Contoh berikut adalah 1) objek Amazon S3 dalam format CSV dengan header bidang yang ditentukan, dan dengan FileHeaderInfo diatur ke "Use" untuk permintaan kueri; atau 2) objek Amazon S3 dalam format JSON dengan atribut yang ditentukan.
Contoh 1: Objek yang dikuerikan memiliki header atau atribut NAME.
-
Ekspresi berikut berhasil mengembalikan nilai dari objek. Karena tidak ada tanda petik, kueri tidak peka huruf besar/kecil.
SELECT s.name from S3Object s -
Ekspresi berikut menghasilkan kesalahan 400
MissingHeaderName. Karena terdapat tanda petik, kueri peka huruf besar/kecil.SELECT s."name" from S3Object s
Contoh 2: Objek Amazon S3 yang dikuerikan memiliki satu header atau atribut dengan NAME header atau atribut lainnya dengan name.
-
Ekspresi berikut menghasilkan kesalahan 400
AmbiguousFieldName. Karena tidak ada tanda petik, kueri tidak sensitif terhadap huruf besar/kecil, tetapi terdapat dua kecocokan, jadi kesalahan dilemparkan.SELECT s.name from S3Object s -
Ekspresi berikut berhasil mengembalikan nilai dari objek. Karena terdapat tanda petik, kueri peka huruf besar/kecil, sehingga tidak ada ambiguitas.
SELECT s."NAME" from S3Object s
Menggunakan kata kunci terpesan sebagai istilah yang ditetapkan pengguna
Amazon S3 Select memiliki serangkaian kata kunci terpesan yang diperlukan untuk menjalankan ekspresi SQL yang digunakan untuk mengkueri konten objek. Kata kunci terpesan meliputi nama fungsi, jenis data, operator, dan sebagainya. Dalam beberapa kasus, istilah yang ditentukan pengguna, seperti header kolom (untuk file CSV) atau atribut (untuk objek JSON), dapat bertentangan dengan kata kunci terpesan. Pada saat hal ini terjadi, Anda harus menggunakan tanda petik dua untuk menunjukkan bahwa Anda sengaja menggunakan istilah khusus pengguna yang bertentangan dengan kata kunci terpesan. Apabila tidak, kesalahan penguraian 400 akan terjadi.
Untuk mengetahui daftar lengkap kata kunci terpesan, lihat Kata kunci terpesan.
Contoh berikut adalah 1) objek Amazon S3 dalam format CSV dengan header bidang yang ditentukan, dengan FileHeaderInfo diatur ke "Use" untuk permintaan kueri, atau 2) objek Amazon S3 dalam format JSON dengan atribut yang ditentukan.
Contoh: Objek yang dikuerikan memiliki header atau atribut bernama CAST, yang merupakan kata kunci terpesan.
-
Ekspresi berikut berhasil mengembalikan nilai dari objek. Karena tanda petik digunakan dalam kueri, S3 Select menggunakan header atau atribut yang ditentukan pengguna.
SELECT s."CAST" from S3Object s -
Ekspresi berikut menghasilkan kesalahan penguraian 400. Karena tidak ada tanda petik yang digunakan dalam kueri,
CASTbertentangan dengan kata kunci terpesan.SELECT s.CAST from S3Object s
Ekspresi skalar
Dalam klausul WHERE dan daftar SELECT, Anda dapat memiliki ekspresi skalar SQL, yaitu ekspresi yang mengembalikan nilai skalar. Bentuknya adalah sebagai berikut:
-
literalSQL literal.
-
column_referenceReferensi ke kolom berupa
ataucolumn_name.alias.column_name -
unary_opexpressionDalam hal ini,
adalah operator numerik SQL.unary_op -
expressionbinary_opexpressionDalam hal ini,
adalah operator biner SQL.binary_op -
func_nameDalam hal ini,
adalah nama fungsi skalar yang diminta.func_name -
expression[ NOT ] BETWEENexpressionANDexpression -
expressionLIKE[expressionESCAPE]expression