Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Menyiapkan crawler untuk notifikasi peristiwa Amazon S3 untuk target Amazon S3
Ikuti langkah-langkah berikut untuk menyiapkan crawler untuk notifikasi peristiwa Amazon S3 untuk target Amazon S3 menggunakan atau. AWS Management Console AWS CLI
- AWS Management Console
-
-
Masuk ke AWS Management Console dan buka GuardDuty konsol di https://console.aws.amazon.com/guardduty/
. -
Tetapkan properti crawler Anda. Untuk informasi selengkapnya, lihat Menyetel Opsi Konfigurasi Crawler di AWS Glue konsol.
-
Di bagian Konfigurasi sumber data, Anda ditanya Apakah data Anda sudah dipetakan ke AWS Glue tabel?
Secara default Belum dipilih. Biarkan ini sebagai default karena Anda menggunakan sumber data Amazon S3 dan data belum dipetakan AWS Glue tabel.
-
Di bagian Sumber data, pilih Tambahkan sumber data.
-
Dalam modal Tambah sumber data, konfigurasikan sumber data Amazon S3:
-
Sumber data: Secara default, Amazon S3 dipilih.
-
Koneksi jaringan (Opsional): Pilih Tambahkan koneksi baru.
-
Lokasi data Amazon S3: Secara default, Di akun ini dipilih.
-
Jalur Amazon S3: Tentukan jalur Amazon S3 tempat folder dan file dirayapi.
-
Perayap berikutnya berjalan: Pilih Crawl berdasarkan peristiwa untuk menggunakan notifikasi peristiwa Amazon S3 untuk crawler Anda.
-
Sertakan SQS ARN: Tentukan parameter penyimpanan data termasuk SQS ARN yang valid. (Misalnya,
arn:aws:sqs:region:account:sqs
). -
Sertakan SQS ARN huruf mati (Opsional): Tentukan SQS ARN surat mati Amazon yang valid. (Misalnya,
arn:aws:sqs:region:account:deadLetterQueue
). -
Pilih Tambahkan sumber data Amazon S3.
-
-
- AWS CLI
-
Berikut ini adalah contoh AWS CLI panggilan Amazon S3 untuk mengonfigurasi crawler agar menggunakan notifikasi peristiwa guna meng-crawl bucket target Amazon S3.
Create Crawler: aws glue update-crawler \ --name myCrawler \ --recrawl-policy RecrawlBehavior=CRAWL_EVENT_MODE \ --schema-change-policy UpdateBehavior=UPDATE_IN_DATABASE,DeleteBehavior=LOG --targets '{"S3Targets":[{"Path":"s3://amzn-s3-demo-bucket/", "EventQueueArn": "arn:aws:sqs:us-east-1:012345678910:MyQueue"}]}'