

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Crawler dan classifiers API
<a name="aws-glue-api-crawler"></a>

Crawler dan classifiers API menjelaskan tipe data AWS Glue crawler dan classifier, dan menyertakan API untuk membuat, menghapus, memperbarui, dan mencantumkan crawler atau pengklasifikasi.

**Topics**
+ [API pengklasifikasi](aws-glue-api-crawler-classifiers.md)
+ [API Crawler](aws-glue-api-crawler-crawling.md)
+ [API statistik kolom](aws-glue-api-crawler-column-statistics.md)
+ [API penjadwal perayap](aws-glue-api-crawler-scheduler.md)

# API pengklasifikasi
<a name="aws-glue-api-crawler-classifiers"></a>

API Pengklasifikasi menjelaskan tipe data AWS Glue pengklasifikasi, dan menyertakan API untuk membuat, menghapus, memperbarui, dan mencantumkan pengklasifikasi.

## Jenis Data
<a name="aws-glue-api-crawler-classifiers-objects"></a>
+ [Struktur pengklasifikasi](#aws-glue-api-crawler-classifiers-Classifier)
+ [GrokClassifier struktur](#aws-glue-api-crawler-classifiers-GrokClassifier)
+ [XMLClassifier struktur](#aws-glue-api-crawler-classifiers-XMLClassifier)
+ [JsonClassifier struktur](#aws-glue-api-crawler-classifiers-JsonClassifier)
+ [CsvClassifier struktur](#aws-glue-api-crawler-classifiers-CsvClassifier)
+ [CreateGrokClassifierRequest struktur](#aws-glue-api-crawler-classifiers-CreateGrokClassifierRequest)
+ [UpdateGrokClassifierRequest struktur](#aws-glue-api-crawler-classifiers-UpdateGrokClassifierRequest)
+ [Buat struktur XMLClassifier Permintaan](#aws-glue-api-crawler-classifiers-CreateXMLClassifierRequest)
+ [Perbarui struktur XMLClassifier Permintaan](#aws-glue-api-crawler-classifiers-UpdateXMLClassifierRequest)
+ [CreateJsonClassifierRequest struktur](#aws-glue-api-crawler-classifiers-CreateJsonClassifierRequest)
+ [UpdateJsonClassifierRequest struktur](#aws-glue-api-crawler-classifiers-UpdateJsonClassifierRequest)
+ [CreateCsvClassifierRequest struktur](#aws-glue-api-crawler-classifiers-CreateCsvClassifierRequest)
+ [UpdateCsvClassifierRequest struktur](#aws-glue-api-crawler-classifiers-UpdateCsvClassifierRequest)

## Struktur pengklasifikasi
<a name="aws-glue-api-crawler-classifiers-Classifier"></a>

Pengklasifikasi dipicu selama tugas melakukan perayapan. Sebuah pengklasifikasi memeriksa apakah file yang diberikan dalam format yang dapat ditanganinya. Jika ya, maka pengklasifikasi menciptakan sebuah skema dalam bentuk objek `StructType` yang cocok dengan format data tersebut.

Anda dapat menggunakan pengklasifikasi standar yang AWS Glue menyediakan, atau Anda dapat menulis pengklasifikasi Anda sendiri untuk mengkategorikan sumber data Anda dengan sebaik-baiknya dan menentukan skema yang sesuai untuk digunakan untuknya. Sebuah pengklasifikasi dapat berupa pengklasifikasi `grok`, pengklasifikasi `XML`, pengklasifikasi `JSON`, atau pengklasifikasi `CSV` kustom, sebagaimana ditentukan dalam salah satu bidang di objek `Classifier`.

**Bidang**
+ `GrokClassifier` — Sebuah objek [GrokClassifier](#aws-glue-api-crawler-classifiers-GrokClassifier).

  Sebuah pengklasifikasi yang menggunakan `grok`.
+ `XMLClassifier` — Sebuah objek [XMLClassifier](#aws-glue-api-crawler-classifiers-XMLClassifier).

  Sebuah pengklasifikasi untuk konten XML.
+ `JsonClassifier` — Sebuah objek [JsonClassifier](#aws-glue-api-crawler-classifiers-JsonClassifier).

  Sebuah pengklasifikasi untuk konten JSON.
+ `CsvClassifier` — Sebuah objek [CsvClassifier](#aws-glue-api-crawler-classifiers-CsvClassifier).

  Pengklasifikasi untuk nilai yang dipisahkan koma (CSV).

## GrokClassifier struktur
<a name="aws-glue-api-crawler-classifiers-GrokClassifier"></a>

Pengklasifikasi yang menggunakan pola `grok`.

**Bidang**
+ `Name` — *Wajib:* String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nama pengklasifikasi.
+ `Classification` – *Wajib:* String UTF-8.

  Pengenal format data yang cocok dengan pengklasifikasi, seperti Twitter, JSON, log Omniture, dan sebagainya.
+ `CreationTime` — Stempel waktu.

  Waktu pada daat pengklasifikasi ini didaftarkan.
+ `LastUpdated` — Stempel waktu.

  Waktu pada saat pengklasifikasi ini terakhir diperbarui.
+ `Version` — Nomor (panjang).

  Versi dari pengklasifikasi ini.
+ `GrokPattern` — *Wajib:* String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 2048 byte, yang cocok dengan [A Logstash Grok string pattern](aws-glue-api-common.md#aws-glue-api-grok-pattern).

  Pola grok diterapkan ke penyimpanan data oleh pengklasifikasi ini. Untuk informasi selengkapnya, lihat pola bawaan dalam [Menulis Pengklasifikasi Kustom](https://docs.aws.amazon.com/glue/latest/dg/custom-classifier.html).
+ `CustomPatterns` — String UTF-8, sepanjang tidak lebih dari 16000, yang cocok dengan [URI address multi-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-uri).

  Pola grok kustom opsional ditentukan oleh pengklasifikasi ini. Untuk informasi selengkapnya, lihat pola kustom dalam [Menulis Pengklasifikasi Kustom](https://docs.aws.amazon.com/glue/latest/dg/custom-classifier.html).

## XMLClassifier struktur
<a name="aws-glue-api-crawler-classifiers-XMLClassifier"></a>

Sebuah pengklasifikasi untuk konten `XML`.

**Bidang**
+ `Name` — *Wajib:* String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nama pengklasifikasi.
+ `Classification` – *Wajib:* String UTF-8.

  Sebuah pengenal format data yang cocok dengan pengklasifikasi.
+ `CreationTime` — Stempel waktu.

  Waktu pada daat pengklasifikasi ini didaftarkan.
+ `LastUpdated` — Stempel waktu.

  Waktu pada saat pengklasifikasi ini terakhir diperbarui.
+ `Version` — Nomor (panjang).

  Versi dari pengklasifikasi ini.
+ `RowTag` – String UTF-8.

  Tag XML yang menunjuk elemen yang berisi setiap catatan dalam dokumen XML yang diurai. Ini tidak dapat mengidentifikasi elemen penutup diri (ditutup oleh `/>`). Elemen baris kosong yang hanya berisi atribut dapat diurai selama itu berakhir dengan tag penutup (misalnya, `<row item_a="A" item_b="B"></row>` baik-baik saja, tapi `<row item_a="A" item_b="B" />` tidak).

## JsonClassifier struktur
<a name="aws-glue-api-crawler-classifiers-JsonClassifier"></a>

Sebuah pengklasifikasi untuk konten `JSON`.

**Bidang**
+ `Name` — *Wajib:* String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nama pengklasifikasi.
+ `CreationTime` — Stempel waktu.

  Waktu pada daat pengklasifikasi ini didaftarkan.
+ `LastUpdated` — Stempel waktu.

  Waktu pada saat pengklasifikasi ini terakhir diperbarui.
+ `Version` — Nomor (panjang).

  Versi dari pengklasifikasi ini.
+ `JsonPath` – *Wajib:* String UTF-8.

  `JsonPath`String yang mendefinisikan data JSON untuk pengklasifikasi untuk mengklasifikasikan. AWS Glue mendukung subset dari JsonPath, seperti yang dijelaskan dalam [Menulis JsonPath Pengklasifikasi Kustom](https://docs.aws.amazon.com/glue/latest/dg/custom-classifier.html#custom-classifier-json).

## CsvClassifier struktur
<a name="aws-glue-api-crawler-classifiers-CsvClassifier"></a>

Pengklasifikasi untuk konten `CSV` kustom.

**Bidang**
+ `Name` — *Wajib:* String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nama pengklasifikasi.
+ `CreationTime` — Stempel waktu.

  Waktu pada daat pengklasifikasi ini didaftarkan.
+ `LastUpdated` — Stempel waktu.

  Waktu pada saat pengklasifikasi ini terakhir diperbarui.
+ `Version` — Nomor (panjang).

  Versi dari pengklasifikasi ini.
+ `Delimiter` — String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 1 byte, yang cocok dengan [Custom string pattern #26](aws-glue-api-common.md#regex_26).

  Sebuah simbol kustom untuk menunjukkan apa yang memisahkan masing-masing entri kolom pada baris.
+ `QuoteSymbol` — String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 1 byte, yang cocok dengan [Custom string pattern #26](aws-glue-api-common.md#regex_26).

  Sebuah simbol kustom untuk menunjukkan apa yang menggabungkan konten ke dalam satu nilai kolom tunggal. Ia harus berbeda dari pembatas kolom.
+ `ContainsHeader` – String UTF-8 (nilai yang valid: `UNKNOWN` \$1 `PRESENT` \$1 `ABSENT`).

  Menunjukkan apakah file CSV berisi sebuah header.
+ `Header` – Susunan string UTF-8.

  Sebuah daftar string yang mewakili nama kolom.
+ `DisableValueTrimming` – Boolean.

  Menentukan tidak akan memotong nilai sebelum mengidentifikasi jenis nilai kolom. Nilai default-nya adalah `true`.
+ `AllowSingleColumn` – Boolean.

  Memungkinkan pemrosesan file yang hanya berisi satu kolom.
+ `CustomDatatypeConfigured` – Boolean.

  Mengaktifkan tipe data khusus untuk dikonfigurasi.
+ `CustomDatatypes` – Susunan string UTF-8.

  Daftar tipe data khusus termasuk “BINARY”, “BOOLEAN”, “DATE”, “DECIMAL”, “DOUBLE”, “FLOAT”, “INT”, “LONG”, “SHORT”, “STRING”, “TIMESTAMP”.
+ `Serde` – String UTF-8 (nilai yang valid: `OpenCSVSerDe` \$1 `LazySimpleSerDe` \$1 `None`).

  Menetapkan SerDe untuk memproses CSV di classifier, yang akan diterapkan dalam Katalog Data. Nilai yang valid adalah `OpenCSVSerDe`, `LazySimpleSerDe`, dan `None`. Anda dapat menentukan `None` nilai saat Anda ingin crawler melakukan deteksi.

## CreateGrokClassifierRequest struktur
<a name="aws-glue-api-crawler-classifiers-CreateGrokClassifierRequest"></a>

Menentukan pengklasifikasi `grok` untuk `CreateClassifier` yang akan dibuat.

**Bidang**
+ `Classification` – *Wajib:* String UTF-8.

  Pengidentifikasi format data yang cocok dengan pengklasifikasi, seperti Twitter, JSON, log Omniture, CloudWatch Amazon Logs, dan sebagainya.
+ `Name` — *Wajib:* String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nama pengklasifikasi baru.
+ `GrokPattern` — *Wajib:* String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 2048 byte, yang cocok dengan [A Logstash Grok string pattern](aws-glue-api-common.md#aws-glue-api-grok-pattern).

  Pola grok yang digunakan oleh pengklasifikasi ini.
+ `CustomPatterns` — String UTF-8, sepanjang tidak lebih dari 16000, yang cocok dengan [URI address multi-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-uri).

  Pola grok kustom opsional yang digunakan oleh pengklasifikasi ini.

## UpdateGrokClassifierRequest struktur
<a name="aws-glue-api-crawler-classifiers-UpdateGrokClassifierRequest"></a>

Menentukan pengklasifikasi grok untuk memperbarui ketika diberikan ke `UpdateClassifier`.

**Bidang**
+ `Name` — *Wajib:* String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nama `GrokClassifier`.
+ `Classification` – String UTF-8.

  Pengidentifikasi format data yang cocok dengan pengklasifikasi, seperti Twitter, JSON, log Omniture, CloudWatch Amazon Logs, dan sebagainya.
+ `GrokPattern` — String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 2048 byte, yang cocok dengan [A Logstash Grok string pattern](aws-glue-api-common.md#aws-glue-api-grok-pattern).

  Pola grok yang digunakan oleh pengklasifikasi ini.
+ `CustomPatterns` — String UTF-8, sepanjang tidak lebih dari 16000, yang cocok dengan [URI address multi-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-uri).

  Pola grok kustom opsional yang digunakan oleh pengklasifikasi ini.

## Buat struktur XMLClassifier Permintaan
<a name="aws-glue-api-crawler-classifiers-CreateXMLClassifierRequest"></a>

Menentukan pengklasifikasi XML untuk `CreateClassifier` yang akan dibuat.

**Bidang**
+ `Classification` – *Wajib:* String UTF-8.

  Sebuah pengenal format data yang cocok dengan pengklasifikasi.
+ `Name` — *Wajib:* String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nama pengklasifikasi.
+ `RowTag` – String UTF-8.

  Tag XML yang menunjuk elemen yang berisi setiap catatan dalam dokumen XML yang diurai. Ini tidak dapat mengidentifikasi elemen penutup diri (ditutup oleh `/>`). Elemen baris kosong yang hanya berisi atribut dapat diurai selama itu berakhir dengan tag penutup (misalnya, `<row item_a="A" item_b="B"></row>` baik-baik saja, tapi `<row item_a="A" item_b="B" />` tidak).

## Perbarui struktur XMLClassifier Permintaan
<a name="aws-glue-api-crawler-classifiers-UpdateXMLClassifierRequest"></a>

Menentukan pengklasifikasi XML yang akan diperbarui.

**Bidang**
+ `Name` — *Wajib:* String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nama pengklasifikasi.
+ `Classification` – String UTF-8.

  Sebuah pengenal format data yang cocok dengan pengklasifikasi.
+ `RowTag` – String UTF-8.

  Tag XML yang menunjuk elemen yang berisi setiap catatan dalam dokumen XML yang diurai. Ini tidak dapat mengidentifikasi elemen penutup mandiri (ditutup oleh `/>`). Elemen baris kosong yang hanya berisi atribut dapat diurai selama diakhiri berakhir dengan tag penutup (misalnya, `<row item_a="A" item_b="B"></row>` tidak apa-apa, tapi `<row item_a="A" item_b="B" />` tidak boleh).

## CreateJsonClassifierRequest struktur
<a name="aws-glue-api-crawler-classifiers-CreateJsonClassifierRequest"></a>

Menentukan pengklasifikasi JSON untuk `CreateClassifier` yang akan dibuat.

**Bidang**
+ `Name` — *Wajib:* String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nama pengklasifikasi.
+ `JsonPath` – *Wajib:* String UTF-8.

  `JsonPath`String yang mendefinisikan data JSON untuk pengklasifikasi untuk mengklasifikasikan. AWS Glue mendukung subset dari JsonPath, seperti yang dijelaskan dalam [Menulis JsonPath Pengklasifikasi Kustom](https://docs.aws.amazon.com/glue/latest/dg/custom-classifier.html#custom-classifier-json).

## UpdateJsonClassifierRequest struktur
<a name="aws-glue-api-crawler-classifiers-UpdateJsonClassifierRequest"></a>

Menentukan pengklasifikasi JSON yang akan diperbarui.

**Bidang**
+ `Name` — *Wajib:* String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nama pengklasifikasi.
+ `JsonPath` – String UTF-8.

  `JsonPath`String yang mendefinisikan data JSON untuk pengklasifikasi untuk mengklasifikasikan. AWS Glue mendukung subset dari JsonPath, seperti yang dijelaskan dalam [Menulis JsonPath Pengklasifikasi Kustom](https://docs.aws.amazon.com/glue/latest/dg/custom-classifier.html#custom-classifier-json).

## CreateCsvClassifierRequest struktur
<a name="aws-glue-api-crawler-classifiers-CreateCsvClassifierRequest"></a>

Menentukan pengklasifikasi CSV kustom untuk `CreateClassifier` yang akan dibuat.

**Bidang**
+ `Name` — *Wajib:* String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nama pengklasifikasi.
+ `Delimiter` — String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 1 byte, yang cocok dengan [Custom string pattern #26](aws-glue-api-common.md#regex_26).

  Sebuah simbol kustom untuk menunjukkan apa yang memisahkan masing-masing entri kolom pada baris.
+ `QuoteSymbol` — String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 1 byte, yang cocok dengan [Custom string pattern #26](aws-glue-api-common.md#regex_26).

  Sebuah simbol kustom untuk menunjukkan apa yang menggabungkan konten ke dalam satu nilai kolom tunggal. Harus berbeda dari pembatas kolom.
+ `ContainsHeader` – String UTF-8 (nilai yang valid: `UNKNOWN` \$1 `PRESENT` \$1 `ABSENT`).

  Menunjukkan apakah file CSV berisi sebuah header.
+ `Header` – Susunan string UTF-8.

  Sebuah daftar string yang mewakili nama kolom.
+ `DisableValueTrimming` – Boolean.

  Menentukan tidak akan memotong nilai sebelum mengidentifikasi jenis nilai kolom. Nilai default-nya adalah BETUL.
+ `AllowSingleColumn` – Boolean.

  Memungkinkan pemrosesan file yang hanya berisi satu kolom.
+ `CustomDatatypeConfigured` – Boolean.

  Mengaktifkan konfigurasi tipe data kustom.
+ `CustomDatatypes` – Susunan string UTF-8.

  Membuat daftar tipe data kustom yang didukung.
+ `Serde` – String UTF-8 (nilai yang valid: `OpenCSVSerDe` \$1 `LazySimpleSerDe` \$1 `None`).

  Menetapkan SerDe untuk memproses CSV di classifier, yang akan diterapkan dalam Katalog Data. Nilai yang valid adalah `OpenCSVSerDe`, `LazySimpleSerDe`, dan `None`. Anda dapat menentukan `None` nilai saat Anda ingin crawler melakukan deteksi.

## UpdateCsvClassifierRequest struktur
<a name="aws-glue-api-crawler-classifiers-UpdateCsvClassifierRequest"></a>

Menentukan pengklasifikasi CSV kustom yang akan diperbarui.

**Bidang**
+ `Name` — *Wajib:* String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nama pengklasifikasi.
+ `Delimiter` — String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 1 byte, yang cocok dengan [Custom string pattern #26](aws-glue-api-common.md#regex_26).

  Sebuah simbol kustom untuk menunjukkan apa yang memisahkan masing-masing entri kolom pada baris.
+ `QuoteSymbol` — String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 1 byte, yang cocok dengan [Custom string pattern #26](aws-glue-api-common.md#regex_26).

  Sebuah simbol kustom untuk menunjukkan apa yang menggabungkan konten ke dalam satu nilai kolom tunggal. Ia harus berbeda dari pembatas kolom.
+ `ContainsHeader` – String UTF-8 (nilai yang valid: `UNKNOWN` \$1 `PRESENT` \$1 `ABSENT`).

  Menunjukkan apakah file CSV berisi sebuah header.
+ `Header` – Susunan string UTF-8.

  Sebuah daftar string yang mewakili nama kolom.
+ `DisableValueTrimming` – Boolean.

  Menentukan tidak akan memotong nilai sebelum mengidentifikasi jenis nilai kolom. Nilai default-nya adalah BETUL.
+ `AllowSingleColumn` – Boolean.

  Memungkinkan pemrosesan file yang hanya berisi satu kolom.
+ `CustomDatatypeConfigured` – Boolean.

  Menentukan konfigurasi tipe data kustom.
+ `CustomDatatypes` – Susunan string UTF-8.

  Menentukan daftar tipe data kustom didukung.
+ `Serde` – String UTF-8 (nilai yang valid: `OpenCSVSerDe` \$1 `LazySimpleSerDe` \$1 `None`).

  Menetapkan SerDe untuk memproses CSV di classifier, yang akan diterapkan dalam Katalog Data. Nilai yang valid adalah `OpenCSVSerDe`, `LazySimpleSerDe`, dan `None`. Anda dapat menentukan `None` nilai saat Anda ingin crawler melakukan deteksi.

## Operasi
<a name="aws-glue-api-crawler-classifiers-actions"></a>
+ [CreateClassifier tindakan (Python: create\$1classifier)](#aws-glue-api-crawler-classifiers-CreateClassifier)
+ [DeleteClassifier tindakan (Python: delete\$1classifier)](#aws-glue-api-crawler-classifiers-DeleteClassifier)
+ [GetClassifier tindakan (Python: get\$1classifier)](#aws-glue-api-crawler-classifiers-GetClassifier)
+ [GetClassifiers tindakan (Python: get\$1classifiers)](#aws-glue-api-crawler-classifiers-GetClassifiers)
+ [UpdateClassifier tindakan (Python: update\$1classifier)](#aws-glue-api-crawler-classifiers-UpdateClassifier)

## CreateClassifier tindakan (Python: create\$1classifier)
<a name="aws-glue-api-crawler-classifiers-CreateClassifier"></a>

Menciptakan pengklasifikasi di akun pengguna. Bisa berupa sebuah `GrokClassifier`, sebuah `XMLClassifier`, sebuah `JsonClassifier`, atau `CsvClassifier`, tergantung pada bidang permintaan yang ada.

**Permintaan**
+ `GrokClassifier` — Sebuah objek [CreateGrokClassifierRequest](#aws-glue-api-crawler-classifiers-CreateGrokClassifierRequest).

  Sebuah objek `GrokClassifier` yang menentukan pengklasifikasi yang akan dibuat.
+ `XMLClassifier` — Sebuah objek [Buat XMLClassifier Permintaan](#aws-glue-api-crawler-classifiers-CreateXMLClassifierRequest).

  Sebuah objek `XMLClassifier` yang menentukan pengklasifikasi yang akan dibuat.
+ `JsonClassifier` — Sebuah objek [CreateJsonClassifierRequest](#aws-glue-api-crawler-classifiers-CreateJsonClassifierRequest).

  Sebuah objek `JsonClassifier` yang menentukan pengklasifikasi yang akan dibuat.
+ `CsvClassifier` — Sebuah objek [CreateCsvClassifierRequest](#aws-glue-api-crawler-classifiers-CreateCsvClassifierRequest).

  Sebuah objek `CsvClassifier` yang menentukan pengklasifikasi yang akan dibuat.

**Respons**
+ *Tidak ada parameter Respons.*

**Kesalahan**
+ `AlreadyExistsException`
+ `InvalidInputException`
+ `OperationTimeoutException`

## DeleteClassifier tindakan (Python: delete\$1classifier)
<a name="aws-glue-api-crawler-classifiers-DeleteClassifier"></a>

Menghapus sebuah pengklasifikasi dari Katalog Data.

**Permintaan**
+ `Name` — *Wajib:* String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nama pengklasifikasi yang akan dihapus.

**Respons**
+ *Tidak ada parameter Respons.*

**Kesalahan**
+ `EntityNotFoundException`
+ `OperationTimeoutException`

## GetClassifier tindakan (Python: get\$1classifier)
<a name="aws-glue-api-crawler-classifiers-GetClassifier"></a>

Mengambil sebuah pengklasifikasi berdasarkan nama.

**Permintaan**
+ `Name` — *Wajib:* String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nama pengklasifikasi yang akan diambil.

**Respons**
+ `Classifier` — Sebuah objek [Pengklasifikasi](#aws-glue-api-crawler-classifiers-Classifier).

  Pengklasifikasi yang diminta.

**Kesalahan**
+ `EntityNotFoundException`
+ `OperationTimeoutException`

## GetClassifiers tindakan (Python: get\$1classifiers)
<a name="aws-glue-api-crawler-classifiers-GetClassifiers"></a>

Mencantumkan semua objek pengklasifikasi dalam Katalog Data.

**Permintaan**
+ `MaxResults` — Nomor (bilangan bulat), tidak kurang dari 1 atau lebih dari 1000.

  Ukuran daftar untuk yang akan dikembalikan (opsional).
+ `NextToken` – String UTF-8.

  Sebuah token kelanjutan opsional.

**Respons**
+ `Classifiers` – Susunan objek [Pengklasifikasi](#aws-glue-api-crawler-classifiers-Classifier).

  Daftar objek pengklasifikasi yang diminta.
+ `NextToken` – String UTF-8.

  Sebuah token kelanjutan.

**Kesalahan**
+ `OperationTimeoutException`

## UpdateClassifier tindakan (Python: update\$1classifier)
<a name="aws-glue-api-crawler-classifiers-UpdateClassifier"></a>

Memodifikasi pengklasifikasi yang ada (sebuah `GrokClassifier`, sebuah `XMLClassifier`, sebuah `JsonClassifier`, atau `CsvClassifier`, tergantung pada bidang mana yang ada).

**Permintaan**
+ `GrokClassifier` — Sebuah objek [UpdateGrokClassifierRequest](#aws-glue-api-crawler-classifiers-UpdateGrokClassifierRequest).

  Sebuah objek `GrokClassifier` dengan bidang yang diperbarui.
+ `XMLClassifier` — Sebuah objek [XMLClassifierPermintaan Perbarui](#aws-glue-api-crawler-classifiers-UpdateXMLClassifierRequest).

  Sebuah objek `XMLClassifier` dengan bidang yang diperbarui.
+ `JsonClassifier` — Sebuah objek [UpdateJsonClassifierRequest](#aws-glue-api-crawler-classifiers-UpdateJsonClassifierRequest).

  Sebuah objek `JsonClassifier` dengan bidang yang diperbarui.
+ `CsvClassifier` — Sebuah objek [UpdateCsvClassifierRequest](#aws-glue-api-crawler-classifiers-UpdateCsvClassifierRequest).

  Sebuah objek `CsvClassifier` dengan bidang yang diperbarui.

**Respons**
+ *Tidak ada parameter Respons.*

**Kesalahan**
+ `InvalidInputException`
+ `VersionMismatchException`
+ `EntityNotFoundException`
+ `OperationTimeoutException`

# API Crawler
<a name="aws-glue-api-crawler-crawling"></a>

Crawler API menjelaskan tipe data AWS Glue crawler, bersama dengan API untuk membuat, menghapus, memperbarui, dan mencantumkan crawler.

## Jenis Data
<a name="aws-glue-api-crawler-crawling-objects"></a>
+ [Struktur perayap](#aws-glue-api-crawler-crawling-Crawler)
+ [Struktur jadwal](#aws-glue-api-crawler-crawling-Schedule)
+ [CrawlerTargets struktur](#aws-glue-api-crawler-crawling-CrawlerTargets)
+ [Struktur S3Target](#aws-glue-api-crawler-crawling-S3Target)
+ [Struktur S3 DeltaCatalogTarget](#aws-glue-api-crawler-crawling-S3DeltaCatalogTarget)
+ [Struktur S3 DeltaDirectTarget](#aws-glue-api-crawler-crawling-S3DeltaDirectTarget)
+ [JdbcTarget struktur](#aws-glue-api-crawler-crawling-JdbcTarget)
+ [Struktur Mongo DBTarget](#aws-glue-api-crawler-crawling-MongoDBTarget)
+ [Struktur dinamo DBTarget](#aws-glue-api-crawler-crawling-DynamoDBTarget)
+ [DeltaTarget struktur](#aws-glue-api-crawler-crawling-DeltaTarget)
+ [IcebergTarget struktur](#aws-glue-api-crawler-crawling-IcebergTarget)
+ [HudiTarget struktur](#aws-glue-api-crawler-crawling-HudiTarget)
+ [CatalogTarget struktur](#aws-glue-api-crawler-crawling-CatalogTarget)
+ [CrawlerMetrics struktur](#aws-glue-api-crawler-crawling-CrawlerMetrics)
+ [CrawlerHistory struktur](#aws-glue-api-crawler-crawling-CrawlerHistory)
+ [CrawlsFilter struktur](#aws-glue-api-crawler-crawling-CrawlsFilter)
+ [SchemaChangePolicy struktur](#aws-glue-api-crawler-crawling-SchemaChangePolicy)
+ [LastCrawlInfo struktur](#aws-glue-api-crawler-crawling-LastCrawlInfo)
+ [RecrawlPolicy struktur](#aws-glue-api-crawler-crawling-RecrawlPolicy)
+ [LineageConfiguration struktur](#aws-glue-api-crawler-crawling-LineageConfiguration)
+ [LakeFormationConfiguration struktur](#aws-glue-api-crawler-crawling-LakeFormationConfiguration)

## Struktur perayap
<a name="aws-glue-api-crawler-crawling-Crawler"></a>

Menentukan sebuah program crawler yang meneliti sumber data dan menggunakan pengklasifikasi untuk mencoba menentukan skemanya. Jika berhasil, crawler mencatat metadata yang terkait sumber data di AWS Glue Data Catalog.

**Bidang**
+ `Name` — String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nama crawler.
+ `Role` – String UTF-8.

  Amazon Resource Name (ARN) dari sebuah IAM role yang digunakan untuk mengakses sumber daya pelanggan, seperti data Amazon Simple Storage Service (Amazon S3).
+ `Targets` — Sebuah objek [CrawlerTargets](#aws-glue-api-crawler-crawling-CrawlerTargets).

  Sebuah sekumpulan target yang akan dilakukan perayapan padanya.
+ `DatabaseName` – String UTF-8.

  Nama basis data tempat output crawler disimpan.
+ `Description` — String deskripsi, dengan panjang tidak lebih dari 2048 byte, yang cocok dengan [URI address multi-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-uri).

  Deskripsi crawler.
+ `Classifiers` – Susunan string UTF-8.

  Daftar string UTF-8 yang menentukan pengklasifikasi kustom yang dikaitkan dengan crawler.
+ `RecrawlPolicy` — Sebuah objek [RecrawlPolicy](#aws-glue-api-crawler-crawling-RecrawlPolicy).

  Sebuah kebijakan yang menentukan apakah akan melakukan perayapan pada seluruh set data lagi, atau hanya pada folder yang ditambahkan sejak crawler terakhir kali dijalankan.
+ `SchemaChangePolicy` — Sebuah objek [SchemaChangePolicy](#aws-glue-api-crawler-crawling-SchemaChangePolicy).

  Kebijakan yang menentukan perilaku pembaruan dan penghapusan untuk crawler.
+ `LineageConfiguration` — Sebuah objek [LineageConfiguration](#aws-glue-api-crawler-crawling-LineageConfiguration).

  Sebuah konfigurasi yang menentukan apakah garis keturunan data diaktifkan untuk crawler.
+ `State` – String UTF-8 (nilai yang valid: `READY` \$1 `RUNNING` \$1 `STOPPING`).

  Menunjukkan apakah crawler sedang berjalan, atau apakah eksekusi-nya ditunda.
+ `TablePrefix` — String UTF-8, dengan panjang tidak lebih dari 128 byte.

  Prefiks ditambahkan ke nama tabel yang dibuat.
+ `Schedule` — Sebuah objek [Jadwal](aws-glue-api-crawler-scheduler.md#aws-glue-api-crawler-scheduler-Schedule).

  Untuk crawler terjadwal, jadwal pada saat crawler berjalan.
+ `CrawlElapsedTime` — Nomor (panjang).

  Jika crawler berjalan, berisi total waktu yang berlalu sejak perayapan terakhir dimulai.
+ `CreationTime` — Stempel waktu.

  Waktu saat crawler diciptakan.
+ `LastUpdated` — Stempel waktu.

  Waktu saat crawler terakhir diperbarui.
+ `LastCrawl` — Sebuah objek [LastCrawlInfo](#aws-glue-api-crawler-crawling-LastCrawlInfo).

  Status perayapan terakhir, dan kemungkinan kesalahan informasi jika terjadi kesalahan.
+ `Version` — Nomor (panjang).

  Versi crawler.
+ `Configuration` – String UTF-8.

  Informasi konfigurasi crawler. String JSON berversi ini memungkinkan pengguna untuk menentukan aspek perilaku perayap. Untuk informasi selengkapnya, lihat [Menyetel opsi konfigurasi crawler](https://docs.aws.amazon.com/glue/latest/dg/crawler-configuration.html).
+ `CrawlerSecurityConfiguration` — String UTF-8, dengan panjang tidak lebih dari 128 byte.

  Nama struktur `SecurityConfiguration` yang akan digunakan oleh crawler ini.
+ `LakeFormationConfiguration` — Sebuah objek [LakeFormationConfiguration](#aws-glue-api-crawler-crawling-LakeFormationConfiguration).

  Menentukan apakah crawler harus menggunakan AWS Lake Formation kredensyal untuk crawler, bukan kredensyal peran IAM.

## Struktur jadwal
<a name="aws-glue-api-crawler-crawling-Schedule"></a>

Sebuah objek penjadwalan menggunakan pernyataan `cron` untuk menjadwalkan sebuah peristiwa.

**Bidang**
+ `ScheduleExpression` – String UTF-8.

  Sebuah ekspresi `cron` yang digunakan untuk menentukan jadwal (lihat [Jadwal Berbasis Waktu untuk Tugas dan Crawler](https://docs.aws.amazon.com/glue/latest/dg/monitor-data-warehouse-schedule.html). Sebagai contoh, untuk menjalankan sesuatu setiap hari pada 12:15 UTC, Anda harus menentukan `cron(15 12 * * ? *)`.
+ `State` – String UTF-8 (nilai yang valid: `SCHEDULED` \$1 `NOT_SCHEDULED` \$1 `TRANSITIONING`).

  Status jadwal.

## CrawlerTargets struktur
<a name="aws-glue-api-crawler-crawling-CrawlerTargets"></a>

Menentukan data yang disimpan ke perayapan.

**Bidang**
+ `S3Targets` – Susunan objek [S3Target](#aws-glue-api-crawler-crawling-S3Target).

  Menentukan target Amazon Simple Storage Service (Amazon S3).
+ `JdbcTargets` – Susunan objek [JdbcTarget](#aws-glue-api-crawler-crawling-JdbcTarget).

  Menentukan target JDBC.
+ `MongoDBTargets` – Susunan objek [Mongo DBTarget](#aws-glue-api-crawler-crawling-MongoDBTarget).

  Menentukan target Amazon DocumentDB atau MongoDB.
+ `DynamoDBTargets` – Susunan objek [Dinamo DBTarget](#aws-glue-api-crawler-crawling-DynamoDBTarget).

  Menentukan target Amazon DynamoDB.
+ `CatalogTargets` – Susunan objek [CatalogTarget](#aws-glue-api-crawler-crawling-CatalogTarget).

  Menentukan AWS Glue Data Catalog target.
+ `DeltaTargets` – Susunan objek [DeltaTarget](#aws-glue-api-crawler-crawling-DeltaTarget).

  Menentukan target penyimpanan data Delta.
+ `IcebergTargets` – Susunan objek [IcebergTarget](#aws-glue-api-crawler-crawling-IcebergTarget).

  Menentukan target penyimpanan data Apache Iceberg.
+ `HudiTargets` – Susunan objek [HudiTarget](#aws-glue-api-crawler-crawling-HudiTarget).

  Menentukan target penyimpanan data Apache Hudi.

## Struktur S3Target
<a name="aws-glue-api-crawler-crawling-S3Target"></a>

Menentukan penyimpanan data dalam Amazon Simple Storage Service (Amazon S3).

**Bidang**
+ `Path` – String UTF-8.

  Path menuju target Amazon S3.
+ `Exclusions` – Susunan string UTF-8.

  Daftar pola glob yang digunakan untuk mengecualikan dari perayapan. Untuk informasi selengkapnya, lihat: [Tabel Katalog dengan Crawler](https://docs.aws.amazon.com/glue/latest/dg/add-crawler.html).
+ `ConnectionName`— String UTF-8, panjangnya tidak kurang dari 1 atau lebih dari 2048 byte.

  Nama koneksi yang memungkinkan tugas atau crawler untuk mengakses data di Amazon S3 dalam lingkungan Amazon Virtual Private Cloud (Amazon VPC).
+ `SampleSize` — Nomor (bilangan bulat).

  Menetapkan jumlah file di setiap folder daun yang akan di-crawl saat melakukan perayapan pada file sampel dalam set data. Jika tidak diatur, maka semua file di-crawl. Nilai yang valid adalah bilangan bulat antara 1 dan 249.
+ `EventQueueArn` – String UTF-8.

  Amazon SQS ARN yang valid. Misalnya, `arn:aws:sqs:region:account:sqs`.
+ `DlqEventQueueArn` – String UTF-8.

  SQS ARN surat mati Amazon yang valid. Misalnya, `arn:aws:sqs:region:account:deadLetterQueue`.

## Struktur S3 DeltaCatalogTarget
<a name="aws-glue-api-crawler-crawling-S3DeltaCatalogTarget"></a>

Menentukan target yang menulis ke sumber data Delta Lake di Katalog AWS Glue Data.

**Bidang**
+ `Name` — *Wajib:* String UTF-8, yang cocok dengan [Custom string pattern #63](aws-glue-api-common.md#regex_63).

  Nama target data.
+ `Inputs`— *Diperlukan:* Sebuah array string UTF-8, tidak kurang dari 1 atau lebih dari 1 string.

  Node yang merupakan input ke target data.
+ `PartitionKeys` – Susunan string UTF-8.

  Menentukan partisi asli menggunakan urutan kunci.
+ `Table` — *Wajib:* String UTF-8, yang cocok dengan [Custom string pattern #61](aws-glue-api-common.md#regex_61).

  Nama tabel dalam database untuk menulis ke.
+ `Database` — *Wajib:* String UTF-8, yang cocok dengan [Custom string pattern #61](aws-glue-api-common.md#regex_61).

  Nama database untuk menulis.
+ `AdditionalOptions` – Susunan peta pasangan nilai kunci.

  Setiap kunci adalah string UTF-8, cocok dengan. [Custom string pattern #61](aws-glue-api-common.md#regex_61)

  Setiap nilai adalah string UTF-8, cocok dengan. [Custom string pattern #61](aws-glue-api-common.md#regex_61)

  Menentukan pilihan koneksi tambahan untuk konektor.
+ `SchemaChangePolicy` — Sebuah objek [CatalogSchemaChangePolicy](aws-glue-api-visual-job-api.md#aws-glue-api-visual-job-api-CatalogSchemaChangePolicy).

  Kebijakan yang menentukan perilaku update untuk crawler.
+ `AutoDataQuality` — Sebuah objek [AutoDataQuality](aws-glue-api-visual-job-api.md#aws-glue-api-visual-job-api-AutoDataQuality).

  Menentukan apakah akan secara otomatis mengaktifkan evaluasi kualitas data untuk target katalog S3 Delta. Ketika diatur ke`true`, pemeriksaan kualitas data dilakukan secara otomatis selama operasi penulisan.
+ `OutputSchemas` – Susunan objek [GlueSchema](aws-glue-api-visual-job-api.md#aws-glue-api-visual-job-api-GlueSchema).

  Menentukan skema data untuk target katalog S3 Delta.

## Struktur S3 DeltaDirectTarget
<a name="aws-glue-api-crawler-crawling-S3DeltaDirectTarget"></a>

Menentukan target yang menulis ke sumber data Delta Lake di. Amazon S3

**Bidang**
+ `Name` — *Wajib:* String UTF-8, yang cocok dengan [Custom string pattern #63](aws-glue-api-common.md#regex_63).

  Nama target data.
+ `Inputs`— *Diperlukan:* Sebuah array string UTF-8, tidak kurang dari 1 atau lebih dari 1 string.

  Node yang merupakan input ke target data.
+ `PartitionKeys` – Susunan string UTF-8.

  Menentukan partisi asli menggunakan urutan kunci.
+ `Path` — *Wajib:* String UTF-8, yang cocok dengan [Custom string pattern #61](aws-glue-api-common.md#regex_61).

  Jalur Amazon S3 dari sumber data Delta Lake Anda untuk menulis.
+ `Compression` – *Wajib:* String UTF-8 (nilai yang valid: `uncompressed="UNCOMPRESSED"` \$1 `snappy="SNAPPY"`).

  Menentukan bagaimana data dikompresi. Hal ini umumnya tidak diperlukan jika data memiliki sebuah ekstensi file standar. Nilai yang mungkin adalah `"gzip"` dan`"bzip"`).
+ `NumberTargetPartitions` – String UTF-8.

  Menentukan jumlah partisi target untuk mendistribusikan file dataset Delta Lake di Amazon S3.
+ `Format`- *Diperlukan:* UTF-8 string (nilai valid: `json="JSON"` \$1 `csv="CSV"` \$1 `avro="AVRO"` \$1 `orc="ORC"` \$1 \$1 `parquet="PARQUET"` \$1 `hudi="HUDI"` \$1 `delta="DELTA"` `iceberg="ICEBERG"` `hyper="HYPER"` \$1`xml="XML"`).

  Menentukan format output data untuk target.
+ `AdditionalOptions` – Susunan peta pasangan nilai kunci.

  Setiap kunci adalah string UTF-8, cocok dengan. [Custom string pattern #61](aws-glue-api-common.md#regex_61)

  Setiap nilai adalah string UTF-8, cocok dengan. [Custom string pattern #61](aws-glue-api-common.md#regex_61)

  Menentukan pilihan koneksi tambahan untuk konektor.
+ `SchemaChangePolicy` — Sebuah objek [DirectSchemaChangePolicy](aws-glue-api-visual-job-api.md#aws-glue-api-visual-job-api-DirectSchemaChangePolicy).

  Kebijakan yang menentukan perilaku update untuk crawler.
+ `AutoDataQuality` — Sebuah objek [AutoDataQuality](aws-glue-api-visual-job-api.md#aws-glue-api-visual-job-api-AutoDataQuality).

  Menentukan apakah akan secara otomatis mengaktifkan evaluasi kualitas data untuk target langsung S3 Delta. Ketika diatur ke`true`, pemeriksaan kualitas data dilakukan secara otomatis selama operasi penulisan.

## JdbcTarget struktur
<a name="aws-glue-api-crawler-crawling-JdbcTarget"></a>

Menentukan penyimpanan data JDBC untuk perayapan.

**Bidang**
+ `ConnectionName`— String UTF-8, panjangnya tidak kurang dari 1 atau lebih dari 2048 byte.

  Nama koneksi yang akan digunakan untuk menyambungkan ke target JDBC.
+ `Path` – String UTF-8.

  Path target JDBC.
+ `Exclusions` – Susunan string UTF-8.

  Daftar pola glob yang digunakan untuk mengecualikan dari perayapan. Untuk informasi selengkapnya, lihat: [Tabel Katalog dengan Crawler](https://docs.aws.amazon.com/glue/latest/dg/add-crawler.html).
+ `EnableAdditionalMetadata` – Susunan string UTF-8.

  Tentukan nilai `RAWTYPES` atau `COMMENTS` untuk mengaktifkan metadata tambahan dalam respons tabel. `RAWTYPES`menyediakan tipe data tingkat asli. `COMMENTS`memberikan komentar yang terkait dengan kolom atau tabel dalam database.

  Jika Anda tidak memerlukan metadata tambahan, biarkan bidang kosong.

## Struktur Mongo DBTarget
<a name="aws-glue-api-crawler-crawling-MongoDBTarget"></a>

Menentukan penyimpanan data Amazon DocumentDB atau MongoDB yang akan di-crawl.

**Bidang**
+ `ConnectionName`— String UTF-8, panjangnya tidak kurang dari 1 atau lebih dari 2048 byte.

  Nama koneksi yang akan digunakan untuk menghubungkan ke target Amazon DocumentDB atau MongoDB.
+ `Path` – String UTF-8.

  Path target Amazon DocumentDB atau MongoDB target (basis data/koleksi).
+ `ScanAll` – Boolean.

  Menunjukkan apakah akan memindai semua catatan, atau mengambil sampel baris dari tabel. Memindai semua catatan dapat memakan waktu lama ketika tabel tersebut bukan merupakan tabel throughput tinggi.

  Sebuah nilai `true` berarti memindai semua catatan, sementara nilai `false` berarti mengambil sampel catatan. Jika tidak ada nilai yang ditentukan, nilai defaultnya menjadi `true`.

## Struktur dinamo DBTarget
<a name="aws-glue-api-crawler-crawling-DynamoDBTarget"></a>

Menentukan tabel Amazon DynamoDB untuk bergerak.

**Bidang**
+ `Path` – String UTF-8.

  Nama dari tabel DynamoDB untuk bergerak.
+ `scanAll` – Boolean.

  Menunjukkan apakah akan memindai semua catatan, atau mengambil sampel baris dari tabel. Memindai semua catatan dapat memakan waktu lama ketika tabel tersebut bukan merupakan tabel throughput tinggi.

  Sebuah nilai `true` berarti memindai semua catatan, sementara nilai `false` berarti mengambil sampel catatan. Jika tidak ada nilai yang ditentukan, nilai defaultnya menjadi `true`.
+ `scanRate` — Nomor (ganda).

  Persentase unit kapasitas baca yang dikonfigurasi untuk digunakan oleh AWS Glue crawler. Unit kapasitas baca adalah istilah yang didefinisikan oleh DynamoDB, dan merupakan nilai numerik yang bertindak sebagai tingkat pembatar untuk jumlah baca yang dapat dilakukan pada tabel tersebut per detik.

  Nilai-nilai yang valid adalah nol atau nilai antara 0,1 sampai 1,5. Nilai nol digunakan ketika pengguna tidak memberikan nilai, dan default-nya menjadi 0,5 Unit Kapasitas Baca yang dikonfigurasi (untuk tabel yang disediakan), atau maksimal 0,25 Unit Kapasitas Baca yang dikonfigurasi (untuk tabel yang menggunakan mode sesuai permintaan).

## DeltaTarget struktur
<a name="aws-glue-api-crawler-crawling-DeltaTarget"></a>

Menentukan penyimpanan data Delta untuk merayapi satu atau lebih tabel Delta.

**Bidang**
+ `DeltaTables` – Susunan string UTF-8.

  Daftar jalur Amazon S3 ke tabel Delta.
+ `ConnectionName`— String UTF-8, panjangnya tidak kurang dari 1 atau lebih dari 2048 byte.

  Nama koneksi yang akan digunakan untuk terhubung ke target tabel Delta.
+ `WriteManifest` – Boolean.

  Menentukan apakah akan menulis file manifes ke jalur tabel Delta.
+ `CreateNativeDeltaTable` – Boolean.

  Menentukan apakah crawler akan membuat tabel asli, untuk memungkinkan integrasi dengan mesin kueri yang mendukung kueri log transaksi Delta secara langsung.

## IcebergTarget struktur
<a name="aws-glue-api-crawler-crawling-IcebergTarget"></a>

Menentukan sumber data Apache Iceberg di mana tabel Iceberg disimpan dalam. Amazon S3

**Bidang**
+ `Paths` – Susunan string UTF-8.

  Satu atau beberapa Amazon S3 jalur yang berisi folder metadata Iceberg sebagai. `s3://bucket/prefix`
+ `ConnectionName`— String UTF-8, panjangnya tidak kurang dari 1 atau lebih dari 2048 byte.

  Nama koneksi yang digunakan untuk terhubung ke target Gunung Es.
+ `Exclusions` – Susunan string UTF-8.

  Daftar pola glob yang digunakan untuk mengecualikan dari perayapan. Untuk informasi selengkapnya, lihat: [Tabel Katalog dengan Crawler](https://docs.aws.amazon.com/glue/latest/dg/add-crawler.html).
+ `MaximumTraversalDepth` — Nomor (bilangan bulat).

  Kedalaman maksimum Amazon S3 jalur yang dapat dilalui crawler untuk menemukan folder metadata Iceberg di jalur Anda. Amazon S3 Digunakan untuk membatasi waktu berjalan crawler.

## HudiTarget struktur
<a name="aws-glue-api-crawler-crawling-HudiTarget"></a>

Menentukan sumber data Apache Hudi.

**Bidang**
+ `Paths` – Susunan string UTF-8.

  Sebuah array string Amazon S3 lokasi untuk Hudi, masing-masing menunjukkan folder root dengan mana file metadata untuk tabel Hudi berada. Folder Hudi mungkin terletak di folder anak dari folder root.

  Crawler akan memindai semua folder di bawah jalur untuk folder Hudi.
+ `ConnectionName`— String UTF-8, panjangnya tidak kurang dari 1 atau lebih dari 2048 byte.

  Nama koneksi yang digunakan untuk terhubung ke target Hudi. Jika file Hudi Anda disimpan dalam bucket yang memerlukan otorisasi VPC, Anda dapat mengatur properti koneksi mereka di sini.
+ `Exclusions` – Susunan string UTF-8.

  Daftar pola glob yang digunakan untuk mengecualikan dari perayapan. Untuk informasi selengkapnya, lihat: [Tabel Katalog dengan Crawler](https://docs.aws.amazon.com/glue/latest/dg/add-crawler.html).
+ `MaximumTraversalDepth` — Nomor (bilangan bulat).

  Kedalaman maksimum Amazon S3 jalur yang dapat dilalui crawler untuk menemukan folder metadata Hudi di jalur Anda. Amazon S3 Digunakan untuk membatasi waktu berjalan crawler.

## CatalogTarget struktur
<a name="aws-glue-api-crawler-crawling-CatalogTarget"></a>

Menentukan AWS Glue Data Catalog target.

**Bidang**
+ `DatabaseName` — *Wajib:* String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nama basis data yang akan disinkronkan.
+ `Tables` — *Wajib:* Susunan string UTF-8, setidaknya 1 string.

  Daftar tabel yang akan disinkronkan.
+ `ConnectionName`— String UTF-8, panjangnya tidak kurang dari 1 atau lebih dari 2048 byte.

  Nama sambungan untuk tabel Katalog Data yang didukung Amazon S3 menjadi target crawl saat menggunakan jenis `Catalog` koneksi yang dipasangkan dengan tipe Sambungan. `NETWORK`
+ `EventQueueArn` – String UTF-8.

  Amazon SQS ARN yang valid. Misalnya, `arn:aws:sqs:region:account:sqs`.
+ `DlqEventQueueArn` – String UTF-8.

  SQS ARN surat mati Amazon yang valid. Misalnya, `arn:aws:sqs:region:account:deadLetterQueue`.

## CrawlerMetrics struktur
<a name="aws-glue-api-crawler-crawling-CrawlerMetrics"></a>

Metrik untuk sebuah crawler yang ditentukan.

**Bidang**
+ `CrawlerName` — String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nama crawler.
+ `TimeLeftSeconds` — Nomor (ganda), tidak lebih dari Tidak Ada.

  Perkiraan waktu tersisa untuk menyelesaikan perayapan yang berjalan.
+ `StillEstimating` – Boolean.

  BETUL jika crawler masih memperkirakan berapa lama waktu yang dibutuhkan untuk menyelesaikan eksekusi ini.
+ `LastRuntimeSeconds` — Nomor (ganda), tidak lebih dari Tidak Ada.

  Durasi eksekusi terbaru oleh crawler, dalam hitungan detik.
+ `MedianRuntimeSeconds` — Nomor (ganda), tidak lebih dari Tidak Ada.

  Durasi median dari eksekusi crawler ini, dalam hitungan detik.
+ `TablesCreated` — Nomor (bilangan bulat), tidak lebih dari Tidak Ada.

  Jumlah tabel yang dibuat oleh crawler ini.
+ `TablesUpdated` — Nomor (bilangan bulat), tidak lebih dari Tidak Ada.

  Jumlah tabel yang diperbarui oleh crawler ini.
+ `TablesDeleted` — Nomor (bilangan bulat), tidak lebih dari Tidak Ada.

  Jumlah tabel yang dihapus oleh crawler ini.

## CrawlerHistory struktur
<a name="aws-glue-api-crawler-crawling-CrawlerHistory"></a>

Berisi informasi untuk menjalankan crawler.

**Bidang**
+ `CrawlId` – String UTF-8.

  Pengenal UUID untuk setiap crawl.
+ `State` – String UTF-8 (nilai yang valid: `RUNNING` \$1 `COMPLETED` \$1 `FAILED` \$1 `STOPPED`).

  Keadaan merangkak.
+ `StartTime` — Stempel waktu.

  Tanggal dan waktu saat perayapan dimulai.
+ `EndTime` — Stempel waktu.

  Tanggal dan waktu di mana perayapan berakhir.
+ `Summary` — String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Ringkasan run untuk crawl tertentu di JSON. Berisi tabel katalog dan partisi yang ditambahkan, diperbarui, atau dihapus.
+ `ErrorMessage` — String deskripsi, dengan panjang tidak lebih dari 2048 byte, yang cocok dengan [URI address multi-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-uri).

  Jika terjadi kesalahan, pesan kesalahan terkait dengan crawl.
+ `LogGroup` — String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 512 byte, yang cocok dengan [Log group string pattern](aws-glue-api-common.md#aws-glue-api-regex-logGroup-id).

  Grup log yang dikaitkan dengan perayapan.
+ `LogStream` — String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 512 byte, yang cocok dengan [Log-stream string pattern](aws-glue-api-common.md#aws-glue-api-regex-logStream-id).

  Pengaliran log yang dikaitkan dengan perayapan.
+ `MessagePrefix` — String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Awalan untuk CloudWatch pesan tentang crawl ini.
+ `DPUHour` — Nomor (ganda), tidak lebih dari Tidak Ada.

  Jumlah unit pemrosesan data (DPU) yang digunakan dalam jam untuk crawl.

## CrawlsFilter struktur
<a name="aws-glue-api-crawler-crawling-CrawlsFilter"></a>

Daftar bidang, pembanding, dan nilai yang dapat Anda gunakan untuk memfilter crawler berjalan untuk crawler tertentu.

**Bidang**
+ `FieldName` – String UTF-8 (nilai yang valid: `CRAWL_ID` \$1 `STATE` \$1 `START_TIME` \$1 `END_TIME` \$1 `DPU_HOUR`).

  Kunci yang digunakan untuk memfilter crawler berjalan untuk crawler tertentu. Nilai yang valid untuk masing-masing nama bidang adalah:
  + `CRAWL_ID`: String yang mewakili identifier UUID untuk crawl.
  + `STATE`: Sebuah string yang mewakili status crawl.
  + `START_TIME`dan`END_TIME`: Stempel waktu zaman dalam milidetik.
  + `DPU_HOUR`: Jumlah jam unit pemrosesan data (DPU) yang digunakan untuk crawl.
+ `FilterOperator` – String UTF-8 (nilai valid: `GT` \$1 `GE` \$1 `LT` \$1 `LE` \$1 `EQ` \$1 `NE`).

  Komparator didefinisikan yang beroperasi pada nilai. Operator yang tersedia adalah:
  + `GT`: Lebih besar dari.
  + `GE`: Lebih besar dari atau sama dengan.
  + `LT`: Kurang dari.
  + `LE`: Kurang dari atau sama dengan.
  + `EQ`: Sama dengan.
  + `NE`: Tidak sama dengan.
+ `FieldValue` – String UTF-8.

  Nilai yang diberikan untuk perbandingan pada bidang crawl. 

## SchemaChangePolicy struktur
<a name="aws-glue-api-crawler-crawling-SchemaChangePolicy"></a>

Kebijakan yang menentukan perilaku pembaruan dan penghapusan untuk perayap.

**Bidang**
+ `UpdateBehavior` – String UTF-8 (nilai yang valid: `LOG` \$1 `UPDATE_IN_DATABASE`).

  Perilaku pembaruan ketika crawler menemukan skema yang berubah.
+ `DeleteBehavior` – String UTF-8 (nilai yang valid: `LOG` \$1 `DELETE_FROM_DATABASE` \$1 `DEPRECATE_IN_DATABASE`).

  Perilaku penghapusan saat crawler menemukan objek yang dihapus.

## LastCrawlInfo struktur
<a name="aws-glue-api-crawler-crawling-LastCrawlInfo"></a>

Informasi status dan kesalahan tentang perayapan terbaru.

**Bidang**
+ `Status` – String UTF-8 (nilai yang valid: `SUCCEEDED` \$1 `CANCELLED` \$1 `FAILED`).

  Status perayapan terakhir.
+ `ErrorMessage` — String deskripsi, dengan panjang tidak lebih dari 2048 byte, yang cocok dengan [URI address multi-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-uri).

  Jika terjadi kesalahan, informasi kesalahan tentang perayapan terakhir.
+ `LogGroup` — String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 512 byte, yang cocok dengan [Log group string pattern](aws-glue-api-common.md#aws-glue-api-regex-logGroup-id).

  Grup log untuk perayapan terakhir.
+ `LogStream` — String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 512 byte, yang cocok dengan [Log-stream string pattern](aws-glue-api-common.md#aws-glue-api-regex-logStream-id).

  Pengaliran log untuk perayapan terakhir.
+ `MessagePrefix` — String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Prefiks untuk pesan tentang perayapan ini.
+ `StartTime` — Stempel waktu.

  Waktu saat perayapan dimulai.

## RecrawlPolicy struktur
<a name="aws-glue-api-crawler-crawling-RecrawlPolicy"></a>

Saat melakukan perayapan pada sumber data Amazon S3 setelah perayapan pertama selesai, tentukan apakah akan melakukan perayapan pada seluruh set data lagi atau hanya pada folder yang ditambahkan sejak crawler terakhir kali dijalankan. Untuk informasi selengkapnya, lihat [Perayapan Tambahan AWS Glue](https://docs.aws.amazon.com/glue/latest/dg/incremental-crawls.html) dalam panduan developer.

**Bidang**
+ `RecrawlBehavior` – String UTF-8 (nilai yang valid: `CRAWL_EVERYTHING` \$1 `CRAWL_NEW_FOLDERS_ONLY` \$1 `CRAWL_EVENT_MODE`).

  Menentukan apakah akan melakukan perayapan pada seluruh set data lagi, atau hanya pada folder yang ditambahkan sejak crawler terakhir kali dijalankan.

  Sebuah nilai `CRAWL_EVERYTHING` menentukan untuk melakukan perayapan pada seluruh set data lagi.

  Sebuah nilai `CRAWL_NEW_FOLDERS_ONLY` menentukan untuk hanya melakukan perayapan pada folder yang ditambahkan sejak menjalankan crawler terakhir kali dijalankan.

  Nilai `CRAWL_EVENT_MODE` menentukan crawling hanya perubahan yang diidentifikasi oleh peristiwa Amazon S3.

## LineageConfiguration struktur
<a name="aws-glue-api-crawler-crawling-LineageConfiguration"></a>

Menentukan pengaturan konfigurasi garis keturunan data untuk crawler tersebut.

**Bidang**
+ `CrawlerLineageSettings` – String UTF-8 (nilai yang valid: `ENABLE` \$1 `DISABLE`).

  Menentukan apakah garis keturunan data diaktifkan untuk crawler. Nilai yang valid adalah:
  + AKTIFKAN: mengaktifkan garis keturunan data untuk crawler
  + NONAKTIFKAN: menonaktifkan garis keturunan data untuk crawler

## LakeFormationConfiguration struktur
<a name="aws-glue-api-crawler-crawling-LakeFormationConfiguration"></a>

Menentukan pengaturan AWS Lake Formation konfigurasi untuk crawler.

**Bidang**
+ `UseLakeFormationCredentials` – Boolean.

  Menentukan apakah akan menggunakan AWS Lake Formation kredensyal untuk crawler, bukan kredensyal peran IAM.
+ `AccountId`— String UTF-8, panjangnya tidak lebih dari 12 byte.

  Diperlukan untuk crawl lintas akun. Untuk crawl akun yang sama dengan data target, ini dapat dibiarkan sebagai null.

## Operasi
<a name="aws-glue-api-crawler-crawling-actions"></a>
+ [CreateCrawler tindakan (Python: create\$1crawler)](#aws-glue-api-crawler-crawling-CreateCrawler)
+ [DeleteCrawler tindakan (Python: delete\$1crawler)](#aws-glue-api-crawler-crawling-DeleteCrawler)
+ [GetCrawler tindakan (Python: get\$1crawler)](#aws-glue-api-crawler-crawling-GetCrawler)
+ [GetCrawlers tindakan (Python: get\$1crawlers)](#aws-glue-api-crawler-crawling-GetCrawlers)
+ [GetCrawlerMetrics tindakan (Python: get\$1crawler\$1metrics)](#aws-glue-api-crawler-crawling-GetCrawlerMetrics)
+ [UpdateCrawler tindakan (Python: update\$1crawler)](#aws-glue-api-crawler-crawling-UpdateCrawler)
+ [StartCrawler tindakan (Python: start\$1crawler)](#aws-glue-api-crawler-crawling-StartCrawler)
+ [StopCrawler tindakan (Python: stop\$1crawler)](#aws-glue-api-crawler-crawling-StopCrawler)
+ [BatchGetCrawlers tindakan (Python: batch\$1get\$1crawlers)](#aws-glue-api-crawler-crawling-BatchGetCrawlers)
+ [ListCrawlers tindakan (Python: list\$1crawlers)](#aws-glue-api-crawler-crawling-ListCrawlers)
+ [ListCrawls tindakan (Python: list\$1crawls)](#aws-glue-api-crawler-crawling-ListCrawls)

## CreateCrawler tindakan (Python: create\$1crawler)
<a name="aws-glue-api-crawler-crawling-CreateCrawler"></a>

Menciptakan sebuah crawler baru dengan target tertentu, peran, konfigurasi, dan jadwal opsional. Setidaknya satu target perayapan harus ditentukan, dalam bidang `s3Targets`, bidang `jdbcTargets`, atau bidang `DynamoDBTargets`.

**Permintaan**
+ `Name` — *Wajib:* String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nama crawler baru.
+ `Role` – *Wajib:* String UTF-8.

  IAM role atau Amazon Resource Name (ARN) dari IAM role yang digunakan oleh crawler baru tersebut untuk mengakses sumber daya pelanggan.
+ `DatabaseName` – String UTF-8.

   AWS Glue Database tempat hasil ditulis, seperti:`arn:aws:daylight:us-east-1::database/sometable/*`.
+ `Description` — String deskripsi, dengan panjang tidak lebih dari 2048 byte, yang cocok dengan [URI address multi-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-uri).

  Deskripsi crawler baru.
+ `Targets` — *Wajib:* Sebuah objek [CrawlerTargets](#aws-glue-api-crawler-crawling-CrawlerTargets).

  Sebuah daftar sekumpulan target yang akan dilakukan perayapan padanya.
+ `Schedule` – String UTF-8.

  Sebuah ekspresi `cron` yang digunakan untuk menentukan jadwal (lihat [Jadwal Berbasis Waktu untuk Tugas dan Crawler](https://docs.aws.amazon.com/glue/latest/dg/monitor-data-warehouse-schedule.html). Sebagai contoh, untuk menjalankan sesuatu setiap hari pada 12:15 UTC, Anda harus menentukan `cron(15 12 * * ? *)`.
+ `Classifiers` – Susunan string UTF-8.

  Daftar pengklasifikasi kustom yang didaftarkan oleh pengguna. Secara default, semua pengklasifikasi bawaan disertakan dalam sebuah perayapan, tetapi pengklasifikasi kustom ini selalu menimpa pengklasifikasi default untuk klasifikasi tertentu.
+ `TablePrefix` — String UTF-8, dengan panjang tidak lebih dari 128 byte.

  Prefiks tabel yang digunakan untuk tabel katalog yang dibuat.
+ `SchemaChangePolicy` — Sebuah objek [SchemaChangePolicy](#aws-glue-api-crawler-crawling-SchemaChangePolicy).

  Kebijakan untuk perilaku pembaruan dan penghapusan crawler.
+ `RecrawlPolicy` — Sebuah objek [RecrawlPolicy](#aws-glue-api-crawler-crawling-RecrawlPolicy).

  Sebuah kebijakan yang menentukan apakah akan melakukan perayapan pada seluruh set data lagi, atau hanya pada folder yang ditambahkan sejak crawler terakhir kali dijalankan.
+ `LineageConfiguration` — Sebuah objek [LineageConfiguration](#aws-glue-api-crawler-crawling-LineageConfiguration).

  Menentukan pengaturan konfigurasi garis keturunan data untuk crawler tersebut.
+ `LakeFormationConfiguration` — Sebuah objek [LakeFormationConfiguration](#aws-glue-api-crawler-crawling-LakeFormationConfiguration).

  Menentukan pengaturan AWS Lake Formation konfigurasi untuk crawler.
+ `Configuration` – String UTF-8.

  Informasi konfigurasi crawler. String JSON berversi ini memungkinkan pengguna untuk menentukan aspek perilaku perayap. Untuk informasi selengkapnya, lihat [Menyetel opsi konfigurasi crawler](https://docs.aws.amazon.com/glue/latest/dg/crawler-configuration.html).
+ `CrawlerSecurityConfiguration` — String UTF-8, dengan panjang tidak lebih dari 128 byte.

  Nama struktur `SecurityConfiguration` yang akan digunakan oleh crawler ini.
+ `Tags` — Sebuah rangkaian peta pasangan nilai kunci, tidak lebih dari 50 pasang.

  Masing-masing kunci adalah sebuah string UTF-8, dengan panjang tidak kurang dari 1 atau lebih dari 128 byte.

  Masing-masing kunci adalah sebuah string UTF-8, dengan panjang tidak lebih dari 256 byte.

  Tag untuk digunakan dengan permintaan crawler ini. Anda dapat menggunakan tag untuk membatasi akses ke crawler. Untuk informasi selengkapnya tentang [AWS tag AWS Glue, lihat Tag AWS Glue di](https://docs.aws.amazon.com/glue/latest/dg/monitor-tags.html) panduan pengembang.

**Respons**
+ *Tidak ada parameter Respons.*

**Kesalahan**
+ `InvalidInputException`
+ `AlreadyExistsException`
+ `OperationTimeoutException`
+ `ResourceNumberLimitExceededException`

## DeleteCrawler tindakan (Python: delete\$1crawler)
<a name="aws-glue-api-crawler-crawling-DeleteCrawler"></a>

Menghapus crawler tertentu dari AWS Glue Data Catalog, kecuali status crawler. `RUNNING`

**Permintaan**
+ `Name` — *Wajib:* String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nama crawler yang akan dihapus.

**Respons**
+ *Tidak ada parameter Respons.*

**Kesalahan**
+ `EntityNotFoundException`
+ `CrawlerRunningException`
+ `SchedulerTransitioningException`
+ `OperationTimeoutException`

## GetCrawler tindakan (Python: get\$1crawler)
<a name="aws-glue-api-crawler-crawling-GetCrawler"></a>

Mengambil metadata untuk crawler yang ditentukan.

**Permintaan**
+ `Name` — *Wajib:* String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nama crawler yang untuknya metadata diambil.

**Respons**
+ `Crawler` — Sebuah objek [Crawler](#aws-glue-api-crawler-crawling-Crawler).

  Metadata untuk crawler yang ditentukan.

**Kesalahan**
+ `EntityNotFoundException`
+ `OperationTimeoutException`

## GetCrawlers tindakan (Python: get\$1crawlers)
<a name="aws-glue-api-crawler-crawling-GetCrawlers"></a>

Mengambil metadata untuk semua crawler yang didefinisikan dalam akun pelanggan.

**Permintaan**
+ `MaxResults` — Nomor (bilangan bulat), tidak kurang dari 1 atau lebih dari 1000.

  Jumlah crawler yang akan dikembalikan pada setiap panggilan.
+ `NextToken` – String UTF-8.

  Sebuah token kelanjutan, jika ini adalah permintaan kelanjutan.

**Respons**
+ `Crawlers` – Susunan objek [Crawler](#aws-glue-api-crawler-crawling-Crawler).

  Daftar metadata crawler.
+ `NextToken` – String UTF-8.

  Sebuah token kelanjutan, jika daftar yang dikembalikan belum mencapai akhir yang didefinisikan dalam akun pelanggan ini.

**Kesalahan**
+ `OperationTimeoutException`

## GetCrawlerMetrics tindakan (Python: get\$1crawler\$1metrics)
<a name="aws-glue-api-crawler-crawling-GetCrawlerMetrics"></a>

Mengambil metrik tentang crawler yang ditentukan.

**Permintaan**
+ `CrawlerNameList` — Susunan string UTF-8, tidak lebih dari 100 string.

  Daftar nama crawler yang akan diambil metriknya.
+ `MaxResults` — Nomor (bilangan bulat), tidak kurang dari 1 atau lebih dari 1000.

  Ukuran maksimum daftar yang akan dikembalikan.
+ `NextToken` – String UTF-8.

  Sebuah token kelanjutan, jika ini adalah panggilan kelanjutan.

**Respons**
+ `CrawlerMetricsList` – Susunan objek [CrawlerMetrics](#aws-glue-api-crawler-crawling-CrawlerMetrics).

  Daftar metrik untuk crawler yang ditentukan.
+ `NextToken` – String UTF-8.

  Sebuah token kelanjutan, jika daftar yang dikembalikan tidak berisi metrik terakhir yang tersedia.

**Kesalahan**
+ `OperationTimeoutException`

## UpdateCrawler tindakan (Python: update\$1crawler)
<a name="aws-glue-api-crawler-crawling-UpdateCrawler"></a>

Memperbarui sebuah crawler. Jika sebuah crawler sedang berjalan, Anda harus menghentikannya menggunakan `StopCrawler` sebelum memperbaruinya.

**Permintaan**
+ `Name` — *Wajib:* String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nama crawler baru.
+ `Role` – String UTF-8.

  IAM role atau Amazon Resource Name (ARN) dari IAM role yang digunakan oleh crawler baru tersebut untuk mengakses sumber daya pelanggan.
+ `DatabaseName` – String UTF-8.

   AWS Glue Database tempat hasil disimpan, seperti:`arn:aws:daylight:us-east-1::database/sometable/*`.
+ `Description` — String UTF-8, sepanjang tidak lebih dari 2048, yang cocok dengan [URI address multi-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-uri).

  Deskripsi crawler baru.
+ `Targets` — Sebuah objek [CrawlerTargets](#aws-glue-api-crawler-crawling-CrawlerTargets).

  Daftar target yang akan di-crawl.
+ `Schedule` – String UTF-8.

  Sebuah ekspresi `cron` yang digunakan untuk menentukan jadwal (lihat [Jadwal Berbasis Waktu untuk Tugas dan Crawler](https://docs.aws.amazon.com/glue/latest/dg/monitor-data-warehouse-schedule.html). Sebagai contoh, untuk menjalankan sesuatu setiap hari pada 12:15 UTC, Anda harus menentukan `cron(15 12 * * ? *)`.
+ `Classifiers` – Susunan string UTF-8.

  Daftar pengklasifikasi kustom yang didaftarkan oleh pengguna. Secara default, semua pengklasifikasi bawaan disertakan dalam sebuah perayapan, tetapi pengklasifikasi kustom ini selalu menimpa pengklasifikasi default untuk klasifikasi tertentu.
+ `TablePrefix` — String UTF-8, dengan panjang tidak lebih dari 128 byte.

  Prefiks tabel yang digunakan untuk tabel katalog yang dibuat.
+ `SchemaChangePolicy` — Sebuah objek [SchemaChangePolicy](#aws-glue-api-crawler-crawling-SchemaChangePolicy).

  Kebijakan untuk perilaku pembaruan dan penghapusan crawler.
+ `RecrawlPolicy` — Sebuah objek [RecrawlPolicy](#aws-glue-api-crawler-crawling-RecrawlPolicy).

  Sebuah kebijakan yang menentukan apakah akan melakukan perayapan pada seluruh set data lagi, atau hanya pada folder yang ditambahkan sejak crawler terakhir kali dijalankan.
+ `LineageConfiguration` — Sebuah objek [LineageConfiguration](#aws-glue-api-crawler-crawling-LineageConfiguration).

  Menentukan pengaturan konfigurasi garis keturunan data untuk crawler tersebut.
+ `LakeFormationConfiguration` — Sebuah objek [LakeFormationConfiguration](#aws-glue-api-crawler-crawling-LakeFormationConfiguration).

  Menentukan pengaturan AWS Lake Formation konfigurasi untuk crawler.
+ `Configuration` – String UTF-8.

  Informasi konfigurasi crawler. String JSON berversi ini memungkinkan pengguna untuk menentukan aspek perilaku perayap. Untuk informasi selengkapnya, lihat [Menyetel opsi konfigurasi crawler](https://docs.aws.amazon.com/glue/latest/dg/crawler-configuration.html).
+ `CrawlerSecurityConfiguration` — String UTF-8, dengan panjang tidak lebih dari 128 byte.

  Nama struktur `SecurityConfiguration` yang akan digunakan oleh crawler ini.

**Respons**
+ *Tidak ada parameter Respons.*

**Kesalahan**
+ `InvalidInputException`
+ `VersionMismatchException`
+ `EntityNotFoundException`
+ `CrawlerRunningException`
+ `OperationTimeoutException`

## StartCrawler tindakan (Python: start\$1crawler)
<a name="aws-glue-api-crawler-crawling-StartCrawler"></a>

Memmulai sebuah perayapan menggunakan crawler yang ditentukan, terlepas dari apa yang dijadwalkan. Jika crawler sudah berjalan, mengembalikan file. [CrawlerRunningException](https://docs.aws.amazon.com/glue/latest/dg/aws-glue-api-exceptions.html#aws-glue-api-exceptions-CrawlerRunningException)

**Permintaan**
+ `Name` — *Wajib:* String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nama crawler yang akan dimulai.

**Respons**
+ *Tidak ada parameter Respons.*

**Kesalahan**
+ `EntityNotFoundException`
+ `CrawlerRunningException`
+ `OperationTimeoutException`

## StopCrawler tindakan (Python: stop\$1crawler)
<a name="aws-glue-api-crawler-crawling-StopCrawler"></a>

Jika crawler yang ditentukan sedang berjalan, berhenti melakukan perayapan.

**Permintaan**
+ `Name` — *Wajib:* String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nama crawler yang akan dihentikan.

**Respons**
+ *Tidak ada parameter Respons.*

**Kesalahan**
+ `EntityNotFoundException`
+ `CrawlerNotRunningException`
+ `CrawlerStoppingException`
+ `OperationTimeoutException`

## BatchGetCrawlers tindakan (Python: batch\$1get\$1crawlers)
<a name="aws-glue-api-crawler-crawling-BatchGetCrawlers"></a>

Mengembalikan daftar metadata sumber daya untuk daftar yang nama crawler yang ditentukan. Setelah memanggil operasi `ListCrawlers`, Anda dapat memanggil operasi ini untuk mengakses data yang Anda telah diberikan izinnya. Operasi ini mendukung semua izin IAM, termasuk syarat izin yang menggunakan tag.

**Permintaan**
+ `CrawlerNames` — *Wajib:* Susunan string UTF-8, tidak lebih dari 100 string.

  Daftar nama crawler, mungkin nama yang dikembalikan oleh operasi `ListCrawlers`.

**Respons**
+ `Crawlers` – Susunan objek [Crawler](#aws-glue-api-crawler-crawling-Crawler).

  Daftar definisi crawler.
+ `CrawlersNotFound` — Susunan string UTF-8, tidak lebih dari 100 string.

  Daftar nama crawler yang tidak ditemukan.

**Kesalahan**
+ `InvalidInputException`
+ `OperationTimeoutException`

## ListCrawlers tindakan (Python: list\$1crawlers)
<a name="aws-glue-api-crawler-crawling-ListCrawlers"></a>

Mengambil nama semua sumber daya crawler di AWS akun ini, atau sumber daya dengan tag yang ditentukan. Operasi ini memungkinkan Anda melihat sumber daya yang tersedia di akun Anda, dan nama-namanya.

Operasi ini mengambil kolom `Tags` opsional, yang dapat Anda gunakan sebagai filter pada respon sehingga tag sumber daya dapat diambil sebagai sebuah grup. Jika Anda memilih untuk menggunakan pem-filter-an tag, maka hanya sumber daya dengan tag saja yang diambil.

**Permintaan**
+ `MaxResults` — Nomor (bilangan bulat), tidak kurang dari 1 atau lebih dari 1000.

  Ukuran maksimum daftar yang akan dikembalikan.
+ `NextToken` – String UTF-8.

  Sebuah token kelanjutan, jika ini adalah permintaan kelanjutan.
+ `Tags` — Sebuah rangkaian peta pasangan nilai kunci, tidak lebih dari 50 pasang.

  Masing-masing kunci adalah sebuah string UTF-8, dengan panjang tidak kurang dari 1 atau lebih dari 128 byte.

  Masing-masing kunci adalah sebuah string UTF-8, dengan panjang tidak lebih dari 256 byte.

  Menentukan untuk mengembalikan hanya sumber daya ditandai saja.

**Respons**
+ `CrawlerNames` — Susunan string UTF-8, tidak lebih dari 100 string.

  Nama dari semua crawler dalam akun, atau crawler dengan tag yang ditentukan.
+ `NextToken` – String UTF-8.

  Sebuah token kelanjutan, jika daftar yang dikembalikan tidak berisi metrik terakhir yang tersedia.

**Kesalahan**
+ `OperationTimeoutException`

## ListCrawls tindakan (Python: list\$1crawls)
<a name="aws-glue-api-crawler-crawling-ListCrawls"></a>

Mengembalikan semua crawl dari crawler tertentu. Hanya mengembalikan crawl yang telah terjadi sejak tanggal peluncuran fitur riwayat perayap, dan hanya mempertahankan perayapan hingga 12 bulan. Perayapan yang lebih tua tidak akan dikembalikan.

Anda dapat menggunakan API ini untuk:
+ Ambil semua crawl dari crawler tertentu.
+ Ambil semua crawl crawler tertentu dalam hitungan terbatas.
+ Ambil semua crawl crawler tertentu dalam rentang waktu tertentu.
+ Ambil semua crawl crawler tertentu dengan status tertentu, ID crawl, atau nilai jam DPU.

**Permintaan**
+ `CrawlerName` — *Wajib:* String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nama crawler yang menjalankan Anda ingin mengambil.
+ `MaxResults` — Nomor (bilangan bulat), tidak kurang dari 1 atau lebih dari 1000.

  Jumlah hasil maksimum yang akan dikembalikan. Defaultnya adalah 20, dan maksimum adalah 100.
+ `Filters` – Susunan objek [CrawlsFilter](#aws-glue-api-crawler-crawling-CrawlsFilter).

  Memfilter crawl berdasarkan kriteria yang Anda tentukan dalam daftar `CrawlsFilter` objek.
+ `NextToken` – String UTF-8.

  Sebuah token kelanjutan, jika ini adalah panggilan kelanjutan.

**Respons**
+ `Crawls` – Susunan objek [CrawlerHistory](#aws-glue-api-crawler-crawling-CrawlerHistory).

  Daftar `CrawlerHistory` objek yang mewakili proses crawl yang memenuhi kriteria Anda.
+ `NextToken` – String UTF-8.

  Sebuah token kelanjutan untuk pemberian nomor halaman untuk daftar token yang ditampilkan, dikembalikan jika segmen saat ini dari daftar tersebut bukan yang terakhir.

**Kesalahan**
+ `EntityNotFoundException`
+ `OperationTimeoutException`
+ `InvalidInputException`

# API statistik kolom
<a name="aws-glue-api-crawler-column-statistics"></a>

API statistik kolom menjelaskan AWS Glue APIs untuk mengembalikan statistik pada kolom dalam tabel.

## Jenis Data
<a name="aws-glue-api-crawler-column-statistics-objects"></a>
+ [ColumnStatisticsTaskRun struktur](#aws-glue-api-crawler-column-statistics-ColumnStatisticsTaskRun)
+ [ColumnStatisticsTaskSettings struktur](#aws-glue-api-crawler-column-statistics-ColumnStatisticsTaskSettings)
+ [ExecutionAttempt struktur](#aws-glue-api-crawler-column-statistics-ExecutionAttempt)

## ColumnStatisticsTaskRun struktur
<a name="aws-glue-api-crawler-column-statistics-ColumnStatisticsTaskRun"></a>

Objek yang menunjukkan rincian statistik kolom dijalankan.

**Bidang**
+ `CustomerId`— String UTF-8, panjangnya tidak lebih dari 12 byte.

  ID AWS akun.
+ `ColumnStatisticsTaskRunId` — String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Pengidentifikasi untuk tugas statistik kolom tertentu dijalankan.
+ `DatabaseName` – String UTF-8.

  Database tempat tabel berada.
+ `TableName` – String UTF-8.

  Nama tabel untuk statistik kolom yang dihasilkan.
+ `ColumnNameList` – Susunan string UTF-8.

  Daftar nama kolom. Jika tidak ada yang disediakan, semua nama kolom untuk tabel akan digunakan secara default.
+ `CatalogID` — String id katalog, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  ID dari Katalog Data tempat tabel berada. Jika tidak ada yang disediakan, ID AWS akun digunakan secara default.
+ `Role` – String UTF-8.

  Peran IAM yang diasumsikan oleh layanan untuk menghasilkan statistik.
+ `SampleSize`— Jumlah (ganda), tidak lebih dari 100.

  Persentase baris yang digunakan untuk menghasilkan statistik. Jika tidak ada yang disediakan, seluruh tabel akan digunakan untuk menghasilkan statistik.
+ `SecurityConfiguration` — String UTF-8, dengan panjang tidak lebih dari 128 byte.

  Nama konfigurasi keamanan yang digunakan untuk mengenkripsi CloudWatch log untuk menjalankan tugas statistik kolom.
+ `NumberOfWorkers` — Nomor (bilangan bulat), minimal 1.

  Jumlah pekerja yang digunakan untuk menghasilkan statistik kolom. Pekerjaan ini telah dikonfigurasi sebelumnya untuk skala otomatis hingga 25 instance.
+ `WorkerType` — String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Jenis pekerja yang digunakan untuk menghasilkan statistik. Nilai default-nya `g.1x`.
+ `ComputationType` – String UTF-8 (nilai yang valid: `FULL` \$1 `INCREMENTAL`).

  Jenis perhitungan statistik kolom.
+ `Status` – String UTF-8 (nilai yang valid: `STARTING` \$1 `RUNNING` \$1 `SUCCEEDED` \$1 `FAILED` \$1 `STOPPED`).

  Status tugas dijalankan.
+ `CreationTime` — Stempel waktu.

  Waktu tugas ini dibuat.
+ `LastUpdated` — Stempel waktu.

  Poin terakhir saat tugas ini dimodifikasi.
+ `StartTime` — Stempel waktu.

  Waktu mulai tugas.
+ `EndTime` — Stempel waktu.

  Waktu akhir tugas.
+ `ErrorMessage` — String deskripsi, dengan panjang tidak lebih dari 2048 byte, yang cocok dengan [URI address multi-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-uri).

  Pesan kesalahan untuk pekerjaan itu.
+ `DPUSeconds` — Nomor (ganda), tidak lebih dari Tidak Ada.

  Penggunaan DPU yang dihitung dalam hitungan detik untuk semua pekerja berskala otomatis.

## ColumnStatisticsTaskSettings struktur
<a name="aws-glue-api-crawler-column-statistics-ColumnStatisticsTaskSettings"></a>

Pengaturan untuk tugas statistik kolom.

**Bidang**
+ `DatabaseName` – String UTF-8.

  Nama database tempat tabel berada.
+ `TableName` – String UTF-8.

  Nama tabel untuk menghasilkan statistik kolom.
+ `Schedule` — Sebuah objek [Jadwal](aws-glue-api-crawler-scheduler.md#aws-glue-api-crawler-scheduler-Schedule).

  Jadwal untuk menjalankan statistik kolom, ditentukan dalam sintaks CRON.
+ `ColumnNameList` – Susunan string UTF-8.

  Daftar nama kolom untuk menjalankan statistik.
+ `CatalogID` — String id katalog, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  ID dari Katalog Data tempat basis data berada.
+ `Role` – String UTF-8.

  Peran yang digunakan untuk menjalankan statistik kolom.
+ `SampleSize`— Jumlah (ganda), tidak lebih dari 100.

  Persentase data untuk sampel.
+ `SecurityConfiguration` — String UTF-8, dengan panjang tidak lebih dari 128 byte.

  Nama konfigurasi keamanan yang digunakan untuk mengenkripsi CloudWatch log.
+ `ScheduleType` – String UTF-8 (nilai yang valid: `CRON` \$1 `AUTO`).

  Jenis jadwal untuk tugas statistik kolom. Nilai yang mungkin bisa `CRON` atau`AUTO`.
+ `SettingSource` – String UTF-8 (nilai yang valid: `CATALOG` \$1 `TABLE`).

  Sumber pengaturan tugas statistik kolom. Nilai yang mungkin bisa `CATALOG` atau`TABLE`.
+ `LastExecutionAttempt` — Sebuah objek [ExecutionAttempt](#aws-glue-api-crawler-column-statistics-ExecutionAttempt).

  Yang terakhir `ExecutionAttempt` untuk tugas statistik kolom dijalankan.

## ExecutionAttempt struktur
<a name="aws-glue-api-crawler-column-statistics-ExecutionAttempt"></a>

Upaya run untuk menjalankan tugas statistik kolom.

**Bidang**
+ `Status` – String UTF-8 (nilai yang valid: `FAILED` \$1 `STARTED`).

  Status tugas statistik kolom terakhir dijalankan.
+ `ColumnStatisticsTaskRunId` — String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  ID tugas menjalankan tugas untuk tugas statistik kolom terakhir yang dijalankan.
+ `ExecutionTimestamp` — Stempel waktu.

  Stempel waktu saat tugas statistik kolom terakhir dijalankan.
+ `ErrorMessage` — String deskripsi, dengan panjang tidak lebih dari 2048 byte, yang cocok dengan [URI address multi-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-uri).

  Pesan kesalahan yang terkait dengan tugas statistik kolom terakhir yang dijalankan.

## Operasi
<a name="aws-glue-api-crawler-column-statistics-actions"></a>
+ [StartColumnStatisticsTaskRun tindakan (Python: start\$1column\$1statistics\$1task\$1run)](#aws-glue-api-crawler-column-statistics-StartColumnStatisticsTaskRun)
+ [GetColumnStatisticsTaskRun tindakan (Python: get\$1column\$1statistics\$1task\$1run)](#aws-glue-api-crawler-column-statistics-GetColumnStatisticsTaskRun)
+ [GetColumnStatisticsTaskRuns tindakan (Python: get\$1column\$1statistics\$1task\$1runs)](#aws-glue-api-crawler-column-statistics-GetColumnStatisticsTaskRuns)
+ [ListColumnStatisticsTaskRuns tindakan (Python: list\$1column\$1statistics\$1task\$1runs)](#aws-glue-api-crawler-column-statistics-ListColumnStatisticsTaskRuns)
+ [StopColumnStatisticsTaskRun tindakan (Python: stop\$1column\$1statistics\$1task\$1run)](#aws-glue-api-crawler-column-statistics-StopColumnStatisticsTaskRun)
+ [CreateColumnStatisticsTaskSettings tindakan (Python: create\$1column\$1statistics\$1task\$1settings)](#aws-glue-api-crawler-column-statistics-CreateColumnStatisticsTaskSettings)
+ [UpdateColumnStatisticsTaskSettings tindakan (Python: update\$1column\$1statistics\$1task\$1settings)](#aws-glue-api-crawler-column-statistics-UpdateColumnStatisticsTaskSettings)
+ [GetColumnStatisticsTaskSettings tindakan (Python: get\$1column\$1statistics\$1task\$1settings)](#aws-glue-api-crawler-column-statistics-GetColumnStatisticsTaskSettings)
+ [DeleteColumnStatisticsTaskSettings tindakan (Python: delete\$1column\$1statistics\$1task\$1settings)](#aws-glue-api-crawler-column-statistics-DeleteColumnStatisticsTaskSettings)
+ [StartColumnStatisticsTaskRunSchedule tindakan (Python: start\$1column\$1statistics\$1task\$1run\$1schedule)](#aws-glue-api-crawler-column-statistics-StartColumnStatisticsTaskRunSchedule)
+ [StopColumnStatisticsTaskRunSchedule tindakan (Python: stop\$1column\$1statistics\$1task\$1run\$1schedule)](#aws-glue-api-crawler-column-statistics-StopColumnStatisticsTaskRunSchedule)

## StartColumnStatisticsTaskRun tindakan (Python: start\$1column\$1statistics\$1task\$1run)
<a name="aws-glue-api-crawler-column-statistics-StartColumnStatisticsTaskRun"></a>

Memulai tugas statistik kolom yang dijalankan, untuk tabel dan kolom tertentu.

**Permintaan**
+ `DatabaseName` — *Wajib:* String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nama database tempat tabel berada.
+ `TableName` — *Wajib:* String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nama tabel untuk menghasilkan statistik.
+ `ColumnNameList` – Susunan string UTF-8.

  Daftar nama kolom untuk menghasilkan statistik. Jika tidak ada yang disediakan, semua nama kolom untuk tabel akan digunakan secara default.
+ `Role` — *Wajib:* String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Peran IAM yang diasumsikan oleh layanan untuk menghasilkan statistik.
+ `SampleSize`— Jumlah (ganda), tidak lebih dari 100.

  Persentase baris yang digunakan untuk menghasilkan statistik. Jika tidak ada yang disediakan, seluruh tabel akan digunakan untuk menghasilkan statistik.
+ `CatalogID` — String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  ID Katalog Data tempat tabel berada. Jika tidak ada yang disediakan, ID akun AWS digunakan secara default.
+ `SecurityConfiguration` — String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nama konfigurasi keamanan yang digunakan untuk mengenkripsi CloudWatch log untuk menjalankan tugas statistik kolom.

**Respons**
+ `ColumnStatisticsTaskRunId` — String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Pengidentifikasi untuk tugas statistik kolom dijalankan.

**Kesalahan**
+ `AccessDeniedException`
+ `EntityNotFoundException`
+ `ColumnStatisticsTaskRunningException`
+ `OperationTimeoutException`
+ `ResourceNumberLimitExceededException`
+ `InvalidInputException`

## GetColumnStatisticsTaskRun tindakan (Python: get\$1column\$1statistics\$1task\$1run)
<a name="aws-glue-api-crawler-column-statistics-GetColumnStatisticsTaskRun"></a>

Dapatkan yang terkait metadata/information untuk menjalankan tugas, diberikan ID menjalankan tugas.

**Permintaan**
+ `ColumnStatisticsTaskRunId` — *Wajib:* String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Pengidentifikasi untuk tugas statistik kolom tertentu dijalankan.

**Respons**
+ `ColumnStatisticsTaskRun` — Sebuah objek [ColumnStatisticsTaskRun](#aws-glue-api-crawler-column-statistics-ColumnStatisticsTaskRun).

  Sebuah `ColumnStatisticsTaskRun` objek yang mewakili rincian statistik kolom berjalan.

**Kesalahan**
+ `EntityNotFoundException`
+ `OperationTimeoutException`
+ `InvalidInputException`

## GetColumnStatisticsTaskRuns tindakan (Python: get\$1column\$1statistics\$1task\$1runs)
<a name="aws-glue-api-crawler-column-statistics-GetColumnStatisticsTaskRuns"></a>

Mengambil informasi tentang semua proses yang terkait dengan tabel yang ditentukan.

**Permintaan**
+ `DatabaseName` – *Wajib:* String UTF-8.

  Nama database tempat tabel berada.
+ `TableName` — *Wajib:* String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nama tabel.
+ `MaxResults` — Nomor (bilangan bulat), tidak kurang dari 1 atau lebih dari 1000.

  Ukuran maksimum respons.
+ `NextToken` – String UTF-8.

  Sebuah token kelanjutan, jika ini adalah panggilan kelanjutan.

**Respons**
+ `ColumnStatisticsTaskRuns` – Susunan objek [ColumnStatisticsTaskRun](#aws-glue-api-crawler-column-statistics-ColumnStatisticsTaskRun).

  Daftar tugas statistik kolom berjalan.
+ `NextToken` – String UTF-8.

  Token kelanjutan, jika tidak semua tugas berjalan belum dikembalikan.

**Kesalahan**
+ `OperationTimeoutException`

## ListColumnStatisticsTaskRuns tindakan (Python: list\$1column\$1statistics\$1task\$1runs)
<a name="aws-glue-api-crawler-column-statistics-ListColumnStatisticsTaskRuns"></a>

Daftar semua tugas yang dijalankan untuk akun tertentu.

**Permintaan**
+ `MaxResults` — Nomor (bilangan bulat), tidak kurang dari 1 atau lebih dari 1000.

  Ukuran maksimum respons.
+ `NextToken` – String UTF-8.

  Sebuah token kelanjutan, jika ini adalah panggilan kelanjutan.

**Respons**
+ `ColumnStatisticsTaskRunIds` — Susunan string UTF-8, tidak lebih dari 100 string.

  Daftar tugas statistik kolom yang dijalankan IDs.
+ `NextToken` – String UTF-8.

  Token kelanjutan, jika tidak semua tugas yang dijalankan IDs belum dikembalikan.

**Kesalahan**
+ `OperationTimeoutException`

## StopColumnStatisticsTaskRun tindakan (Python: stop\$1column\$1statistics\$1task\$1run)
<a name="aws-glue-api-crawler-column-statistics-StopColumnStatisticsTaskRun"></a>

Menghentikan tugas yang dijalankan untuk tabel yang ditentukan.

**Permintaan**
+ `DatabaseName` – *Wajib:* String UTF-8.

  Nama database tempat tabel berada.
+ `TableName` — *Wajib:* String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nama tabel.

**Respons**
+ *Tidak ada parameter Respons.*

**Kesalahan**
+ `EntityNotFoundException`
+ `ColumnStatisticsTaskNotRunningException`
+ `ColumnStatisticsTaskStoppingException`
+ `OperationTimeoutException`

## CreateColumnStatisticsTaskSettings tindakan (Python: create\$1column\$1statistics\$1task\$1settings)
<a name="aws-glue-api-crawler-column-statistics-CreateColumnStatisticsTaskSettings"></a>

Membuat pengaturan untuk tugas statistik kolom.

**Permintaan**
+ `DatabaseName` — *Wajib:* String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nama database tempat tabel berada.
+ `TableName` — *Wajib:* String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nama tabel untuk menghasilkan statistik kolom.
+ `Role` — *Wajib:* String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Peran yang digunakan untuk menjalankan statistik kolom.
+ `Schedule` – String UTF-8.

  Jadwal untuk menjalankan statistik kolom, ditentukan dalam sintaks CRON.
+ `ColumnNameList` – Susunan string UTF-8.

  Daftar nama kolom untuk menjalankan statistik.
+ `SampleSize`— Jumlah (ganda), tidak lebih dari 100.

  Persentase data untuk sampel.
+ `CatalogID` — String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  ID dari Katalog Data tempat database berada.
+ `SecurityConfiguration` — String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nama konfigurasi keamanan yang digunakan untuk mengenkripsi CloudWatch log.
+ `Tags` — Sebuah rangkaian peta pasangan nilai kunci, tidak lebih dari 50 pasang.

  Masing-masing kunci adalah sebuah string UTF-8, dengan panjang tidak kurang dari 1 atau lebih dari 128 byte.

  Masing-masing kunci adalah sebuah string UTF-8, dengan panjang tidak lebih dari 256 byte.

  Peta tag.

**Respons**
+ *Tidak ada parameter Respons.*

**Kesalahan**
+ `AlreadyExistsException`
+ `AccessDeniedException`
+ `EntityNotFoundException`
+ `InvalidInputException`
+ `OperationTimeoutException`
+ `ResourceNumberLimitExceededException`
+ `ColumnStatisticsTaskRunningException`

## UpdateColumnStatisticsTaskSettings tindakan (Python: update\$1column\$1statistics\$1task\$1settings)
<a name="aws-glue-api-crawler-column-statistics-UpdateColumnStatisticsTaskSettings"></a>

Memperbarui pengaturan untuk tugas statistik kolom.

**Permintaan**
+ `DatabaseName` — *Wajib:* String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nama database tempat tabel berada.
+ `TableName` — *Wajib:* String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nama tabel untuk menghasilkan statistik kolom.
+ `Role` — String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Peran yang digunakan untuk menjalankan statistik kolom.
+ `Schedule` – String UTF-8.

  Jadwal untuk menjalankan statistik kolom, ditentukan dalam sintaks CRON.
+ `ColumnNameList` – Susunan string UTF-8.

  Daftar nama kolom untuk menjalankan statistik.
+ `SampleSize`— Jumlah (ganda), tidak lebih dari 100.

  Persentase data untuk sampel.
+ `CatalogID` — String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  ID dari Katalog Data tempat database berada.
+ `SecurityConfiguration` — String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nama konfigurasi keamanan yang digunakan untuk mengenkripsi CloudWatch log.

**Respons**
+ *Tidak ada parameter Respons.*

**Kesalahan**
+ `AccessDeniedException`
+ `EntityNotFoundException`
+ `InvalidInputException`
+ `VersionMismatchException`
+ `OperationTimeoutException`

## GetColumnStatisticsTaskSettings tindakan (Python: get\$1column\$1statistics\$1task\$1settings)
<a name="aws-glue-api-crawler-column-statistics-GetColumnStatisticsTaskSettings"></a>

Mendapat pengaturan untuk tugas statistik kolom.

**Permintaan**
+ `DatabaseName` — *Wajib:* String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nama database tempat tabel berada.
+ `TableName` — *Wajib:* String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nama tabel untuk mengambil statistik kolom.

**Respons**
+ `ColumnStatisticsTaskSettings` — Sebuah objek [ColumnStatisticsTaskSettings](#aws-glue-api-crawler-column-statistics-ColumnStatisticsTaskSettings).

  `ColumnStatisticsTaskSettings`Objek yang mewakili pengaturan untuk tugas statistik kolom.

**Kesalahan**
+ `EntityNotFoundException`
+ `InvalidInputException`
+ `OperationTimeoutException`

## DeleteColumnStatisticsTaskSettings tindakan (Python: delete\$1column\$1statistics\$1task\$1settings)
<a name="aws-glue-api-crawler-column-statistics-DeleteColumnStatisticsTaskSettings"></a>

Menghapus pengaturan untuk tugas statistik kolom.

**Permintaan**
+ `DatabaseName` — *Wajib:* String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nama database tempat tabel berada.
+ `TableName` — *Wajib:* String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nama tabel untuk menghapus statistik kolom.

**Respons**
+ *Tidak ada parameter Respons.*

**Kesalahan**
+ `EntityNotFoundException`
+ `InvalidInputException`
+ `OperationTimeoutException`

## StartColumnStatisticsTaskRunSchedule tindakan (Python: start\$1column\$1statistics\$1task\$1run\$1schedule)
<a name="aws-glue-api-crawler-column-statistics-StartColumnStatisticsTaskRunSchedule"></a>

Memulai jadwal menjalankan tugas statistik kolom.

**Permintaan**
+ `DatabaseName` — *Wajib:* String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nama database tempat tabel berada.
+ `TableName` — *Wajib:* String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nama tabel untuk memulai jadwal menjalankan tugas statistik kolom.

**Respons**
+ *Tidak ada parameter Respons.*

**Kesalahan**
+ `AccessDeniedException`
+ `EntityNotFoundException`
+ `InvalidInputException`
+ `OperationTimeoutException`

## StopColumnStatisticsTaskRunSchedule tindakan (Python: stop\$1column\$1statistics\$1task\$1run\$1schedule)
<a name="aws-glue-api-crawler-column-statistics-StopColumnStatisticsTaskRunSchedule"></a>

Menghentikan jadwal menjalankan tugas statistik kolom.

**Permintaan**
+ `DatabaseName` — *Wajib:* String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nama database tempat tabel berada.
+ `TableName` — *Wajib:* String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nama tabel untuk menghentikan jadwal menjalankan tugas statistik kolom.

**Respons**
+ *Tidak ada parameter Respons.*

**Kesalahan**
+ `EntityNotFoundException`
+ `InvalidInputException`
+ `OperationTimeoutException`

## Pengecualian
<a name="aws-glue-api-crawler-column-statistics-exceptions"></a>
+ [ColumnStatisticsTaskRunningException struktur](#aws-glue-api-crawler-column-statistics-ColumnStatisticsTaskRunningException)
+ [ColumnStatisticsTaskNotRunningException struktur](#aws-glue-api-crawler-column-statistics-ColumnStatisticsTaskNotRunningException)
+ [ColumnStatisticsTaskStoppingException struktur](#aws-glue-api-crawler-column-statistics-ColumnStatisticsTaskStoppingException)
+ [ColumnStatisticsTaskAutoConcurrencyLimitException struktur](#aws-glue-api-crawler-column-statistics-ColumnStatisticsTaskAutoConcurrencyLimitException)
+ [InvalidCatalogSettingException struktur](#aws-glue-api-crawler-column-statistics-InvalidCatalogSettingException)

## ColumnStatisticsTaskRunningException struktur
<a name="aws-glue-api-crawler-column-statistics-ColumnStatisticsTaskRunningException"></a>

Pengecualian dilemparkan saat Anda mencoba memulai pekerjaan lain saat menjalankan pekerjaan pembuatan statistik kolom.

**Bidang**
+ `Message` – String UTF-8.

  Sebuah pesan yang menjelaskan masalah.

## ColumnStatisticsTaskNotRunningException struktur
<a name="aws-glue-api-crawler-column-statistics-ColumnStatisticsTaskNotRunningException"></a>

Pengecualian dilemparkan ketika Anda mencoba menghentikan tugas yang dijalankan ketika tidak ada tugas yang berjalan.

**Bidang**
+ `Message` – String UTF-8.

  Sebuah pesan yang menjelaskan masalah.

## ColumnStatisticsTaskStoppingException struktur
<a name="aws-glue-api-crawler-column-statistics-ColumnStatisticsTaskStoppingException"></a>

Pengecualian dilemparkan saat Anda mencoba menghentikan menjalankan tugas.

**Bidang**
+ `Message` – String UTF-8.

  Sebuah pesan yang menjelaskan masalah.

## ColumnStatisticsTaskAutoConcurrencyLimitException struktur
<a name="aws-glue-api-crawler-column-statistics-ColumnStatisticsTaskAutoConcurrencyLimitException"></a>

Pengecualian dilemparkan ketika Anda telah mencapai batas pekerjaan statistik auto bersamaan.

**Bidang**
+ `Message` – String UTF-8.

  Sebuah pesan yang menjelaskan masalah.

## InvalidCatalogSettingException struktur
<a name="aws-glue-api-crawler-column-statistics-InvalidCatalogSettingException"></a>

Pengecualian dilemparkan ketika ada masalah dengan pengaturan katalog.

**Bidang**
+ `Message` – String UTF-8.

  Sebuah pesan yang menjelaskan masalah.

# API penjadwal perayap
<a name="aws-glue-api-crawler-scheduler"></a>

Crawler scheduler API menjelaskan tipe data AWS Glue crawler, bersama dengan API untuk membuat, menghapus, memperbarui, dan mencantumkan crawler.

## Jenis Data
<a name="aws-glue-api-crawler-scheduler-objects"></a>
+ [Struktur jadwal](#aws-glue-api-crawler-scheduler-Schedule)

## Struktur jadwal
<a name="aws-glue-api-crawler-scheduler-Schedule"></a>

Sebuah objek penjadwalan menggunakan pernyataan `cron` untuk menjadwalkan sebuah peristiwa.

**Bidang**
+ `ScheduleExpression` – String UTF-8.

  Sebuah ekspresi `cron` yang digunakan untuk menentukan jadwal (lihat [Jadwal Berbasis Waktu untuk Tugas dan Crawler](https://docs.aws.amazon.com/glue/latest/dg/monitor-data-warehouse-schedule.html). Sebagai contoh, untuk menjalankan sesuatu setiap hari pada 12:15 UTC, Anda harus menentukan `cron(15 12 * * ? *)`.
+ `State` – String UTF-8 (nilai yang valid: `SCHEDULED` \$1 `NOT_SCHEDULED` \$1 `TRANSITIONING`).

  Status jadwal.

## Operasi
<a name="aws-glue-api-crawler-scheduler-actions"></a>
+ [UpdateCrawlerSchedule tindakan (Python: update\$1crawler\$1schedule)](#aws-glue-api-crawler-scheduler-UpdateCrawlerSchedule)
+ [StartCrawlerSchedule tindakan (Python: start\$1crawler\$1schedule)](#aws-glue-api-crawler-scheduler-StartCrawlerSchedule)
+ [StopCrawlerSchedule tindakan (Python: stop\$1crawler\$1schedule)](#aws-glue-api-crawler-scheduler-StopCrawlerSchedule)

## UpdateCrawlerSchedule tindakan (Python: update\$1crawler\$1schedule)
<a name="aws-glue-api-crawler-scheduler-UpdateCrawlerSchedule"></a>

Memperbarui jadwal sebuah crawler dengan menggunakan ekspresi `cron`. 

**Permintaan**
+ `CrawlerName` — *Wajib:* String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nama crawler yang jadwalnya akan diperbarui.
+ `Schedule` – String UTF-8.

  Ekspresi `cron` yang diperbarui yang digunakan untuk menentukan jadwal (lihat [Jadwal Berbasis Waktu untuk Tugas dan Crawler](https://docs.aws.amazon.com/glue/latest/dg/monitor-data-warehouse-schedule.html). Sebagai contoh, untuk menjalankan sesuatu setiap hari pada 12:15 UTC, Anda harus menentukan `cron(15 12 * * ? *)`.

**Respons**
+ *Tidak ada parameter Respons.*

**Kesalahan**
+ `EntityNotFoundException`
+ `InvalidInputException`
+ `VersionMismatchException`
+ `SchedulerTransitioningException`
+ `OperationTimeoutException`

## StartCrawlerSchedule tindakan (Python: start\$1crawler\$1schedule)
<a name="aws-glue-api-crawler-scheduler-StartCrawlerSchedule"></a>

Mengubah status jadwal crawler yang ditentukan untuk `SCHEDULED`, kecuali crawler sudah berjalan atau status jadwal sudah `SCHEDULED`.

**Permintaan**
+ `CrawlerName` — *Wajib:* String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nama crawler yang akan dijadwal.

**Respons**
+ *Tidak ada parameter Respons.*

**Kesalahan**
+ `EntityNotFoundException`
+ `SchedulerRunningException`
+ `SchedulerTransitioningException`
+ `NoScheduleException`
+ `OperationTimeoutException`

## StopCrawlerSchedule tindakan (Python: stop\$1crawler\$1schedule)
<a name="aws-glue-api-crawler-scheduler-StopCrawlerSchedule"></a>

Menetapkan status jadwal dari crawler yang ditentukan untuk `NOT_SCHEDULED`, tapi tidak menghentikan crawler jika sudah berjalan.

**Permintaan**
+ `CrawlerName` — *Wajib:* String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nama crawler yang status jadwalnya akan ditetapkan.

**Respons**
+ *Tidak ada parameter Respons.*

**Kesalahan**
+ `EntityNotFoundException`
+ `SchedulerNotRunningException`
+ `SchedulerTransitioningException`
+ `OperationTimeoutException`