Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Mengotomatiskan pengaturan data untuk pekerjaan pelabelan
Anda dapat menggunakan penyiapan data otomatis untuk membuat file manifes untuk pekerjaan pelabelan di konsol Ground Truth menggunakan gambar, video, bingkai video, file teks (.txt), dan file nilai dipisahkan koma (.csv) yang disimpan di Amazon S3. Saat menggunakan penyiapan data otomatis, Anda menentukan lokasi Amazon S3 tempat data input disimpan dan tipe data input, dan Ground Truth mencari file yang cocok dengan jenis tersebut di lokasi yang Anda tentukan.
catatan
Ground Truth tidak menggunakan AWS KMS kunci untuk mengakses data input atau menulis file manifes masukan di lokasi Amazon S3 yang Anda tentukan. Pengguna atau peran yang membuat pekerjaan pelabelan harus memiliki izin untuk mengakses objek data input Anda di Amazon S3.
Sebelum menggunakan prosedur berikut, pastikan gambar atau file input Anda diformat dengan benar:
-
File gambar - File gambar harus sesuai dengan batas ukuran dan resolusi yang tercantum dalam tabel yang ditemukan diKuota Ukuran File Masukan.
-
File teks — Data teks dapat disimpan dalam satu atau lebih file.txt. Setiap item yang ingin Anda beri label harus dipisahkan dengan jeda baris standar.
-
File CSV - Data teks dapat disimpan dalam satu atau lebih file.csv. Setiap item yang ingin Anda beri label harus berada di baris terpisah.
-
Video - File video dapat berupa salah satu format berikut: .mp4, .ogg, dan.webm. Jika Anda ingin mengekstrak bingkai video dari file video Anda untuk deteksi objek atau pelacakan objek, lihatMenyediakan File Video.
-
Bingkai video — Bingkai video adalah gambar yang diekstraksi dari video. Semua gambar yang diekstraksi dari satu video disebut sebagai urutan bingkai video. Setiap urutan frame video harus memiliki kunci awalan unik di Amazon S3. Lihat Menyediakan Video Frames. Untuk tipe data ini, lihat Mengatur Data Input Bingkai Video Otomatis
penting
Untuk pekerjaan deteksi objek bingkai video dan pelabelan pelacakan objek bingkai video, lihat Mengatur Data Input Bingkai Video Otomatis untuk mempelajari cara menggunakan penyiapan data otomatis.
Gunakan petunjuk ini untuk secara otomatis mengatur koneksi dataset input Anda dengan Ground Truth.
Sambungkan data Anda secara otomatis di Amazon S3 dengan Ground Truth
-
Arahkan ke halaman pekerjaan Buat pelabelan di konsol Amazon SageMaker AI di https://console.aws.amazon.com/sagemaker/
. Tautan ini menempatkan Anda di Wilayah Virginia Utara (us-east-1). AWS Jika data masukan Anda ada di bucket Amazon S3 di Wilayah lain, alihkan ke Wilayah tersebut. Untuk mengubah AWS Wilayah Anda, pada bilah navigasi, pilih nama Wilayah yang saat ini ditampilkan.
-
Pilih Buat pekerjaan pelabelan.
-
Masukkan nama Job.
-
Di bagian Pengaturan data input, pilih Pengaturan data otomatis.
-
Masukkan URI Amazon S3 untuk lokasi S3 untuk kumpulan data masukan.
-
Tentukan lokasi S3 Anda untuk kumpulan data keluaran. Di sinilah data output Anda disimpan.
-
Pilih tipe Data Anda menggunakan daftar dropdown.
-
Gunakan menu tarik-turun di bawah Peran IAM untuk memilih peran eksekusi. Jika Anda memilih Buat peran baru, tentukan bucket Amazon S3 yang ingin Anda berikan izin peran ini untuk diakses. Peran ini harus memiliki izin untuk mengakses bucket S3 yang Anda tentukan di Langkah 5 dan 6.
-
Pilih Pengaturan data lengkap.
Ini membuat manifes masukan di lokasi Amazon S3 untuk kumpulan data masukan yang Anda tentukan di langkah 5. Jika Anda membuat pekerjaan pelabelan menggunakan SageMaker API atau,, atau AWS SDK AWS CLI, gunakan URI Amazon S3 untuk file manifes masukan ini sebagai input ke parameter. ManifestS3Uri
GIF berikut menunjukkan cara menggunakan pengaturan data otomatis untuk data gambar. Contoh ini akan membuat file, dataset-
di bucket YYMMDDTHHMMSS
.manifestexample-groundtruth-images
Amazon S3 yang
menunjukkan year (YYMMDDTHHmmSS
YY
), month (), day (MM
) dan time in hours (DD
), minutes (HH
) dan seconds (mm
ss
), bahwa file manifes masukan telah dibuat.
