Praktik terbaik pemuatan Batch - Amazon Timestream

Amazon Timestream for LiveAnalytics tidak lagi terbuka untuk pelanggan baru mulai 20 Juni 2025. Jika Anda ingin menggunakan Amazon Timestream untuk LiveAnalytics, daftar sebelum tanggal tersebut. Pelanggan yang sudah ada dapat terus menggunakan layanan seperti biasa. Untuk informasi selengkapnya, lihat Amazon Timestream untuk perubahan LiveAnalytics ketersediaan.

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Praktik terbaik pemuatan Batch

Batch load bekerja paling baik (throughput tinggi) saat mengikuti kondisi dan rekomendasi berikut:

  1. File CSV yang dikirimkan untuk konsumsi berukuran kecil, khususnya dengan ukuran file 100 MB—1 GB, untuk meningkatkan paralelisme dan kecepatan konsumsi.

  2. Hindari memasukkan data secara bersamaan ke dalam tabel yang sama (misalnya menggunakan operasi WriteRecords API, atau kueri terjadwal) saat pemuatan batch sedang berlangsung. Ini mungkin menyebabkan throttle, dan tugas pemuatan batch akan gagal.

  3. Jangan menambah, memodifikasi, atau menghapus file dari bucket S3 yang digunakan dalam pemuatan batch saat tugas pemuatan batch sedang berjalan.

  4. Jangan menghapus atau mencabut izin dari tabel atau sumber, atau laporkan bucket S3 yang memiliki tugas pemuatan batch terjadwal atau sedang berlangsung.

  5. Saat menelan data dengan serangkaian nilai dimensi kardinalitas tinggi, ikuti panduan di. Rekomendasi untuk mempartisi catatan multi-ukuran

  6. Pastikan Anda menguji data untuk kebenaran dengan mengirimkan file kecil. Anda akan dikenakan biaya untuk setiap data yang dikirimkan ke pemuatan batch terlepas dari kebenarannya. Untuk informasi selengkapnya tentang harga, lihat harga Amazon Timestream.

  7. Jangan melanjutkan tugas pemuatan batch kecuali ActiveMagneticStorePartitions di bawah 250. Pekerjaan itu mungkin terhambat dan gagal. Mengirimkan beberapa pekerjaan pada saat yang sama untuk database yang sama akan mengurangi jumlahnya.

Berikut ini adalah praktik terbaik konsol:

  1. Gunakan pembuat hanya untuk pemodelan data sederhana yang hanya menggunakan satu nama ukuran untuk catatan multi-ukuran.

  2. Untuk pemodelan data yang lebih kompleks, gunakan JSON. Misalnya, gunakan JSON saat Anda menggunakan beberapa nama ukuran saat menggunakan catatan multi-ukuran.

Untuk Timestream tambahan untuk praktik LiveAnalytics terbaik, lihatPraktik terbaik.