

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Buat tabel untuk pekerjaan ETL
<a name="schema-classifier"></a>

Anda dapat menggunakan Athena untuk membuat tabel yang AWS Glue dapat digunakan untuk pekerjaan ETL. AWS Glue pekerjaan melakukan operasi ETL. AWS Glue Pekerjaan menjalankan skrip yang mengekstrak data dari sumber, mengubah data, dan memuatnya menjadi target. Untuk informasi selengkapnya, lihat [Menulis Pekerjaan di AWS Glue](https://docs.aws.amazon.com/glue/latest/dg/author-job-glue.html) di *Panduan AWS Glue Pengembang*.

## Membuat tabel Athena untuk AWS Glue pekerjaan ETL
<a name="schema-etl-tables"></a>

Tabel yang Anda buat di Athena harus memiliki properti tabel ditambahkan ke mereka yang disebut `classification`, yang mengidentifikasi format data. Ini memungkinkan AWS Glue untuk menggunakan tabel untuk tugas ETL. Nilai klasifikasi dapat berupa`avro`,`csv`,`json`,`orc`,`parquet`, atau`xml`. Contoh pernyataan `CREATE TABLE` di Athena berikut:

```
CREATE EXTERNAL TABLE sampleTable (
  column1 INT,
  column2 INT
  ) STORED AS PARQUET
  TBLPROPERTIES (
  'classification'='parquet')
```

Jika properti `classification` tabel tidak ditambahkan saat tabel dibuat, Anda dapat menambahkannya menggunakan AWS Glue konsol.

**Untuk menambahkan properti tabel klasifikasi menggunakan AWS Glue konsol**

1. Masuk ke Konsol Manajemen AWS dan buka AWS Glue konsol di [https://console.aws.amazon.com/glue/](https://console.aws.amazon.com/glue/).

1. Di panel navigasi konsol, pilih **Tabel**.

1. Pilih tautan untuk tabel yang ingin Anda edit, lalu pilih **Tindakan**, **Edit tabel**.

1. Gulir ke bawah ke bagian **Properti tabel**.

1. Pilih **Tambahkan**.

1. Untuk **Kunci**, masukkan **classification**.

1. Untuk **Nilai**, masukkan tipe data (misalnya,**json**).

1. Pilih **Simpan**.

   Di bagian **Rincian tabel**, tipe data yang Anda masukkan muncul di bidang **Klasifikasi** untuk tabel.

Untuk informasi selengkapnya, lihat [Bekerja dengan tabel](https://docs.aws.amazon.com/glue/latest/dg/console-tables.html) di *Panduan AWS Glue Pengembang*.

## Gunakan pekerjaan ETL untuk mengoptimalkan kinerja kueri
<a name="schema-etl-performance"></a>

AWS Glue jobs dapat membantu Anda mengubah data ke format yang mengoptimalkan kinerja kueri di Athena. Format data memiliki dampak besar pada performa kueri dan biaya permintaan di Athena.

AWS Glue mendukung penulisan ke format data Parket dan ORC. Anda dapat menggunakan fitur ini untuk mengubah data Anda untuk digunakan di Athena. Untuk informasi selengkapnya tentang penggunaan Parket dan ORC, dan cara lain untuk meningkatkan kinerja di Athena, lihat [10 kiat penyetelan kinerja terbaik untuk](https://aws.amazon.com/blogs/big-data/top-10-performance-tuning-tips-for-amazon-athena/) Amazon Athena.

**catatan**  
Untuk mengurangi kemungkinan Athena tidak dapat membaca `SMALLINT` dan tipe `TINYINT` data yang dihasilkan oleh pekerjaan AWS Glue ETL, konversikan `SMALLINT` dan `TINYINT` ke `INT` saat Anda membuat pekerjaan ETL yang mengubah data menjadi ORC.

## Otomatiskan AWS Glue pekerjaan untuk ETL
<a name="schema-etl-automate"></a>

Anda dapat mengonfigurasi pekerjaan AWS Glue ETL agar berjalan secara otomatis berdasarkan pemicu. Fitur ini ideal ketika data dari luar AWS didorong ke bucket Amazon S3 dalam format yang kurang optimal untuk kueri di Athena. Untuk informasi selengkapnya, lihat [Memicu AWS Glue lowongan](https://docs.aws.amazon.com/glue/latest/dg/trigger-job.html) di *Panduan AWS Glue Pengembang*.