

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Validasi data target Amazon S3
<a name="CHAP_Validating_S3"></a>

AWS DMS mendukung memvalidasi data yang direplikasi di target Amazon S3. Karena AWS DMS menyimpan data yang direplikasi sebagai file datar di Amazon S3, kami menggunakan kueri [Amazon `CREATE TABLE AS SELECT` Athena](https://docs.aws.amazon.com/athena/latest/ug/what-is.html) (CTAS) untuk memvalidasi data. 

Kueri pada data yang disimpan di Amazon S3 sangat intens secara komputasi. Dengan demikian, AWS DMS menjalankan validasi pada data Amazon S3 selama pengambilan data perubahan (CDC) hanya sekali sehari, pada tengah malam (00:00) UTC. Setiap validasi harian yang AWS DMS berjalan disebut *validasi interval*. Selama validasi interval, AWS DMS validasi semua catatan perubahan yang dimigrasikan ke bucket Amazon S3 target selama 24 jam sebelumnya. Untuk informasi selengkapnya tentang batasan validasi interval, lihat[Batasan untuk menggunakan validasi target S3](#CHAP_Validating_S3_limitations).

Validasi target Amazon S3 menggunakan Amazon Athena, jadi biaya tambahan berlaku. Untuk informasi selengkapnya, lihat [Harga Amazon Athena](https://aws.amazon.com/athena/pricing/).

**catatan**  
Validasi target S3 membutuhkan AWS DMS versi 3.5.0 atau yang lebih baru.

**Topics**
+ [Prasyarat](#CHAP_Validating_S3_prerequisites)
+ [Izin](#CHAP_Validating_S3_permissions)
+ [Batasan](#CHAP_Validating_S3_limitations)
+ [Tugas hanya validasi](#CHAP_Validating_S3_only)

## Prasyarat validasi target S3
<a name="CHAP_Validating_S3_prerequisites"></a>

Sebelum menggunakan validasi target S3, periksa pengaturan dan izin berikut:
+ Tetapkan `DataFormat` nilai untuk [S3Settings](https://docs.aws.amazon.com/dms/latest/APIReference/API_S3Settings.html) endpoint Anda ke. `parquet` Untuk informasi selengkapnya, lihat [Pengaturan parket untuk S3](CHAP_Target.S3.md#CHAP_Target.S3.EndpointSettings.Parquet). 
+ Pastikan peran yang ditetapkan ke akun pengguna yang digunakan untuk membuat tugas migrasi memiliki kumpulan izin yang benar. Lihat [Izin](#CHAP_Validating_S3_permissions) berikut.

Untuk tugas yang menggunakan replikasi berkelanjutan (CDC), periksa pengaturan berikut:
+ Aktifkan pencatatan tambahan sehingga Anda memiliki catatan lengkap dalam data CDC. Untuk informasi tentang mengaktifkan logging tambahan, lihat [Secara otomatis menambahkan supplemental logging untuk titik akhir sumber Oracle](CHAP_Troubleshooting.md#CHAP_Troubleshooting.Oracle.AutoSupplLogging) di [Pemecahan masalah dan dukungan diagnostikPemecahan masalah latensi](CHAP_Troubleshooting.md) bagian dalam panduan ini.
+ Tetapkan `TimestampColumnName` parameter untuk titik akhir target. Tidak ada batasan pada nama kolom stempel waktu. Untuk informasi selengkapnya, lihat [S3Settings](https://docs.aws.amazon.com/dms/latest/APIReference/API_S3Settings.html).
+ Siapkan partisi folder berbasis tanggal untuk target. Untuk informasi selengkapnya, lihat [Menggunakan partisi folder berdasarkan tanggal](CHAP_Target.S3.md#CHAP_Target.S3.DatePartitioning).

## Izin untuk menggunakan validasi target S3
<a name="CHAP_Validating_S3_permissions"></a>

Untuk menyiapkan akses untuk menggunakan validasi target S3, pastikan bahwa peran yang ditetapkan ke akun pengguna yang digunakan untuk membuat tugas migrasi memiliki kumpulan izin berikut. Ganti nilai sampel dengan nilai Anda.

------
#### [ JSON ]

****  

```
{
    "Version":"2012-10-17",		 	 	 
    "Statement": [
        {
            "Sid": "VisualEditor0",
            "Effect": "Allow",
            "Action": [
                "athena:StartQueryExecution",
                "athena:GetQueryExecution",
                "athena:CreateWorkGroup"
            ],
            "Resource": "*"
        },
        {
            "Effect": "Allow",
            "Action": [
                "glue:CreateDatabase",
                "glue:DeleteDatabase",
                "glue:GetDatabase",
                "glue:GetTables",
                "glue:CreateTable",
                "glue:DeleteTable",
                "glue:GetTable"
            ],
            "Resource": "*"
        },
        {
            "Effect": "Allow",
            "Action": [
                "s3:GetBucketLocation",
                "s3:GetObject",
                "s3:ListBucketMultipartUploads",
                "s3:AbortMultipartUpload",
                "s3:ListMultipartUploadParts"
            ],
            "Resource": "*"
        }
    ]
}
```

------

## Batasan untuk menggunakan validasi target S3
<a name="CHAP_Validating_S3_limitations"></a>

Lihat batasan tambahan berikut yang berlaku saat menggunakan validasi target S3. Untuk batasan yang berlaku untuk semua validasi, lihat. [Batasan](CHAP_Validating.md#CHAP_Validating.Limitations)
+ `DatePartitionSequence`Nilai Anda membutuhkan komponen Hari. Validasi target S3 tidak mendukung format. `YYYYMM`
+ Ketika validasi interval berjalan selama CDC, Anda mungkin melihat kesalahan validasi palsu dalam tabel. `awsdms_validation_failures_v1` Kesalahan ini terjadi karena AWS DMS memigrasikan perubahan yang tiba selama validasi interval ke folder partisi hari berikutnya. Biasanya, perubahan ini ditulis ke dalam folder partisi hari ini. Kesalahan palsu ini adalah batasan memvalidasi replikasi dari database sumber dinamis ke target statis, seperti Amazon S3. Untuk menyelidiki kesalahan palsu ini, periksa catatan di dekat akhir jendela validasi (00:00 UTC), yaitu saat kesalahan ini biasanya muncul. 

  Untuk meminimalkan jumlah kesalahan palsu, pastikan bahwa `CDCLatencySource` untuk tugas rendah. Untuk informasi tentang pemantauan latensi, lihat[Metrik tugas replikasi](CHAP_Monitoring.md#CHAP_Monitoring.Metrics.Task). 
+ Tugas di `stopped` negara bagian `failed` atau tidak memvalidasi perubahan hari sebelumnya. Untuk meminimalkan kesalahan validasi karena kegagalan yang tidak terduga, buat tugas validasi terpisah saja dengan pemetaan tabel yang sama, serta titik akhir sumber dan target. Untuk informasi selengkapnya tentang tugas validasi saja, lihat[Menggunakan tugas validasi saja dengan validasi target S3](#CHAP_Validating_S3_only).
+ Kolom **Status Validasi** dalam statistik tabel mencerminkan keadaan validasi interval terbaru. Akibatnya, tabel yang memiliki ketidakcocokan mungkin muncul sebagai divalidasi setelah validasi interval hari berikutnya. Periksa bucket Amazon S3 target untuk ketidakcocokan yang terjadi lebih dari sehari yang lalu. `s3_validation_failures folder`
+ Validasi S3 menggunakan fitur tabel bucketed dari Amazon Athena. Hal ini memungkinkan validasi S3 untuk membuat salinan ember dari data tabel target. Ini berarti bahwa salinan data tabel dibagi menjadi subset yang cocok dengan partisi internal validasi DMS. Meja berember Athena memiliki batas 100.000 ember. Setiap tabel yang coba divalidasi oleh validasi S3 yang melebihi batas ini akan gagal validasi. Jumlah bucket yang coba dibuat oleh Validasi S3 sama dengan yang berikut:

  ```
  (#records in the table) / (validation partition size setting)
  ```

  Untuk mengatasi batasan ini, tingkatkan pengaturan ukuran partisi validasi sehingga jumlah bucket yang dibuat oleh Validasi S3 kurang dari 100.000. *Untuk informasi selengkapnya tentang bucketing, lihat [Partisi dan bucketing di Athena di Panduan Pengguna Amazon Athena](https://docs.aws.amazon.com/athena/latest/ug/ctas-partitioning-and-bucketing.html).*
+ Nama tabel tidak boleh mengandung karakter khusus kecuali garis bawah.

  Validasi S3 menggunakan Amazon Athena yang tidak mendukung karakter khusus (selain garis bawah) dalam nama tabel. Untuk informasi selengkapnya, lihat topik [MEMBUAT TABEL](https://docs.aws.amazon.com/athena/latest/ug/create-table.html) di *Panduan Pengguna Amazon Athena*.
+ Ketika fitur validasi AWS DMS data digunakan dengan target Amazon S3 yang dikelola oleh Lake AWS Formation, proses validasi gagal. Hal ini dapat mengakibatkan masalah konsistensi data.

## Menggunakan tugas validasi saja dengan validasi target S3
<a name="CHAP_Validating_S3_only"></a>

*Tugas hanya validasi* menjalankan validasi pada data yang akan dimigrasi tanpa menjalankan migrasi. 

Hanya tugas validasi yang terus berjalan, meskipun tugas migrasi berhenti, yang memastikan bahwa AWS DMS tidak melewatkan jendela validasi interval 00:00 UTC.

Menggunakan tugas hanya validasi dengan titik akhir target Amazon S3 memiliki batasan berikut:
+ Validasi Amazon S3 untuk Tugas Beban Penuh dengan pengaturan Validasi saja diaktifkan didukung, tetapi beroperasi secara berbeda dari tugas Beban Penuh dan hanya Validasi untuk titik akhir lainnya. Untuk S3 sebagai Target, tugas jenis ini memvalidasi hanya terhadap Data Beban Penuh di target S3, dan tidak akan memvalidasi terhadap data apa pun yang dimigrasi sebagai bagian dari migrasi CDC. Hanya gunakan fitur ini untuk memvalidasi data yang dibuat oleh tugas Full-Load saja. Menggunakan mode ini untuk memvalidasi data dalam target yang menjalankan tugas CDC aktif tidak akan menghasilkan validasi yang efektif.
+ Hanya tugas validasi hanya memvalidasi perubahan sejak jendela validasi interval terakhir (00:00 UTC). Hanya tugas validasi yang tidak memvalidasi data muatan penuh atau data CDC dari hari-hari sebelumnya.