Kirim data ke pekerjaan pelabelan streaming - Amazon SageMaker AI

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Kirim data ke pekerjaan pelabelan streaming

Anda dapat secara opsional mengirimkan data input ke pekerjaan pelabelan streaming satu kali saat Anda membuat pekerjaan pelabelan menggunakan file manifes input. Setelah pekerjaan pelabelan dimulai dan statusnyaInProgress, Anda dapat mengirimkan objek data baru ke pekerjaan pelabelan Anda secara real time menggunakan topik input Amazon SNS dan pemberitahuan acara Amazon S3 Anda.

Kirim Objek Data Saat Anda Memulai Job Pelabelan (Satu Kali):

  • Menggunakan File Manifes Input — Anda dapat secara opsional menentukan file manifes masukan Amazon S3 URI ManifestS3Uri saat Anda membuat pekerjaan pelabelan streaming. Ground Truth mengirimkan setiap objek data dalam file manifes ke pekerja untuk diberi label segera setelah pekerjaan pelabelan dimulai. Untuk mempelajari selengkapnya, lihat Buat File Manifest (Opsional).

    Setelah Anda mengirimkan permintaan untuk membuat pekerjaan pelabelan streaming, statusnya akan menjadiInitializing. Setelah pekerjaan pelabelan aktif, status berubah InProgress dan Anda dapat mulai menggunakan opsi waktu nyata untuk mengirimkan objek data tambahan untuk pelabelan.

Kirim Objek Data secara Real Time:

  • Mengirim objek data menggunakan pesan Amazon SNS - Anda dapat mengirim objek data baru Ground Truth ke label dengan mengirimkan pesan Amazon SNS. Anda akan mengirim pesan ini ke topik input Amazon SNS yang Anda buat dan tentukan saat Anda membuat pekerjaan pelabelan streaming Anda. Untuk informasi selengkapnya, lihat Kirim objek data menggunakan Amazon SNS.

  • Kirim objek data dengan menempatkannya di bucket Amazon S3 — Setiap kali Anda menambahkan objek data baru ke bucket Amazon S3, Anda dapat meminta Ground Truth untuk memproses objek tersebut untuk diberi label. Untuk melakukannya, Anda menambahkan notifikasi peristiwa ke bucket sehingga pemberitahuan tersebut memberi tahu topik input Amazon SNS Anda setiap kali objek baru ditambahkan ke (atau dibuat di) bucket tersebut. Untuk informasi selengkapnya, lihat Kirim objek data menggunakan Amazon S3. Opsi ini tidak tersedia untuk pekerjaan pelabelan berbasis teks seperti klasifikasi teks dan pengenalan entitas bernama.

    penting

    Jika Anda menggunakan konfigurasi Amazon S3, jangan gunakan lokasi Amazon S3 yang sama untuk konfigurasi data input dan data keluaran Anda. Anda menentukan awalan S3 untuk data keluaran Anda saat Anda membuat pekerjaan pelabelan.

Kirim objek data menggunakan Amazon SNS

Anda dapat mengirim objek data ke pekerjaan pelabelan streaming menggunakan Amazon Simple Notification Service (Amazon SNS). Amazon SNS adalah layanan web yang mengoordinasikan dan mengelola pengiriman pesan ke dan dari titik akhir (misalnya, alamat email atau fungsi). AWS Lambda Topik Amazon SNS bertindak sebagai saluran komunikasi antara dua atau lebih titik akhir. Anda menggunakan Amazon SNS untuk mengirim, atau menerbitkan, objek data baru ke topik yang ditentukan dalam CreateLabelingJobparameterSnsTopicArn. InputConfig Format pesan ini sama dengan satu baris dari file manifes masukan.

Misalnya, Anda dapat mengirim sepotong teks ke pekerjaan pelabelan klasifikasi teks aktif dengan mempublikasikannya ke topik masukan Anda. Pesan yang Anda terbitkan mungkin terlihat mirip dengan yang berikut ini:

{"source": "Lorem ipsum dolor sit amet"}

Untuk mengirim objek gambar baru ke pekerjaan pelabelan klasifikasi gambar, pesan Anda mungkin terlihat mirip dengan yang berikut:

{"source-ref": "s3://amzn-s3-demo-bucket/example-image.jpg"}
catatan

Anda juga dapat menyertakan kunci deduplikasi IDs dan deduplikasi khusus dalam pesan Amazon SNS Anda. Untuk mempelajari selengkapnya, lihat Penanganan pesan duplikat.

Saat Ground Truth membuat pekerjaan pelabelan streaming Anda, itu berlangganan topik input Amazon SNS Anda.

Kirim objek data menggunakan Amazon S3

Anda dapat mengirim satu atau beberapa objek data baru ke pekerjaan pelabelan streaming dengan menempatkannya di bucket Amazon S3 yang dikonfigurasi dengan pemberitahuan acara Amazon SNS. Anda dapat menyiapkan acara untuk memberi tahu topik input Amazon SNS kapan pun objek baru dibuat di bucket Anda. Anda harus menentukan topik input Amazon SNS yang sama ini di CreateLabelingJobparameter SnsTopicArn di. InputConfig

Kapan pun Anda mengonfigurasi bucket Amazon S3 untuk mengirim notifikasi ke Amazon SNS, Ground Truth akan menerbitkan acara pengujian"s3:TestEvent", untuk memastikan bahwa topik tersebut ada dan bahwa pemilik bucket Amazon S3 yang ditentukan memiliki izin untuk mempublikasikan ke topik yang ditentukan. Disarankan agar Anda mengatur koneksi Amazon S3 Anda dengan Amazon SNS sebelum memulai pekerjaan pelabelan streaming. Jika tidak, peristiwa pengujian ini dapat mendaftar sebagai objek data dan dikirim ke Ground Truth untuk pelabelan.

penting

Jika Anda menggunakan konfigurasi Amazon S3, jangan gunakan lokasi Amazon S3 yang sama untuk konfigurasi data input dan data keluaran Anda. Anda menentukan awalan S3 untuk data keluaran Anda saat Anda membuat pekerjaan pelabelan.

Untuk pekerjaan pelabelan berbasis gambar, Ground Truth mengharuskan semua bucket S3 memiliki kebijakan CORS yang dilampirkan. Untuk mempelajari selengkapnya, lihat Persyaratan CORS untuk Data Gambar Input.

Setelah mengonfigurasi bucket Amazon S3 dan membuat tugas pelabelan, Anda dapat menambahkan objek ke bucket dan Ground Truth mengirimkan objek tersebut ke pekerja atau menempatkannya di antrian Amazon SQS Anda.

Untuk mempelajari selengkapnya, lihat Membuat notifikasi peristiwa bucket berbasis Amazon S3 berdasarkan Amazon SNS yang ditentukan dalam pekerjaan pelabelan.

penting

Opsi ini tidak tersedia untuk pekerjaan pelabelan berbasis teks seperti klasifikasi teks dan pengenalan entitas bernama.