Lihat status antrian pekerjaan - AWS Batch

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Lihat status antrian pekerjaan

Setelah Anda membuat antrian pekerjaan dan mengirimkan pekerjaan, penting untuk dapat memantau kemajuannya. Anda dapat menggunakan halaman Detail pekerjaan untuk meninjau, mengelola, dan memantau antrian pekerjaan Anda.

Lihat informasi antrian pekerjaan

Dari AWS Batch konsol, pilih Antrian pekerjaan di panel navigasi dan pilih antrian pekerjaan yang Anda inginkan untuk melihat detailnya. Di halaman ini, Anda dapat meninjau dan mengelola antrean pekerjaan Anda dan melihat informasi tambahan tentang operasi antrian, seperti snapshot antrian pekerjaan, batas status pekerjaan, urutan lingkungan, tag, dan kode JSON antrian pekerjaan.

Detail antrian pekerjaan

Bagian ini memberikan ikhtisar dan opsi pemeliharaan untuk antrian pekerjaan. Penting untuk dicatat bahwa Anda dapat menemukan Nama Sumber Daya Amazon (ARN) di bagian ini.

Untuk menemukan informasi ini melalui AWS Command Line Interface, gunakan DescribeJobQueuesoperasi bersama dengan nama antrian pekerjaan, atau ARN yang sesuai.

Cuplikan antrian Job

Bagian ini menyediakan daftar statis dari 100 RUNNABLE pekerjaan pertama yang berada dalam antrian. Anda dapat menggunakan bidang pencarian untuk mempersempit daftar dengan mencari informasi dari kolom mana pun di bagian hasil. Pekerjaan di area hasil snapshot diurutkan sesuai dengan strategi lari antrian pekerjaan. Untuk antrian pekerjaan first-in-first-out (FIFO), pemesanan pekerjaan didasarkan pada waktu pengiriman. Untuk antrian pekerjaan penjadwalan yang adil, pemesanan pekerjaan didasarkan pada prioritas pekerjaan dan penggunaan berbagi.

Karena hasilnya adalah snapshot dari antrian pekerjaan, daftar hasil tidak diperbarui secara otomatis. Untuk memperbarui daftar, pilih penyegaran di bagian atas bagian. Pilih hyperlink nama pekerjaan untuk menavigasi ke rincian Job dan melihat status pekerjaan dan informasi terkait lainnya.

Untuk menemukan informasi ini melalui AWS CLI, gunakan GetJobQueueSnapshotoperasi bersama dengan nama antrian pekerjaan atau ARN yang sesuai.

aws batch get-job-queue-snapshot --job-queue my-sm-training-fifo-jq

Batas status Job

Gunakan tab ini untuk meninjau informasi konfigurasi tentang jumlah waktu pekerjaan dapat tetap dalam RUNNABLE status sebelum dibatalkan.

Untuk menemukan informasi ini melalui AWS CLI, gunakan DescribeJobQueuesoperasi bersama dengan nama antrian pekerjaan atau ARN yang sesuai.

Tatanan lingkungan

Jika antrian pekerjaan Anda berjalan di beberapa lingkungan, tab ini menyediakan urutan dan ikhtisar mereka.

Untuk menemukan informasi ini melalui AWS CLI, gunakan DescribeJobQueuesoperasi bersama dengan nama antrian pekerjaan atau ARN yang sesuai.

Tanda

Gunakan tab ini untuk meninjau dan mengelola tag yang terkait dengan antrian pekerjaan ini.

JSON

Gunakan tab ini untuk menyalin kode JSON yang terkait dengan antrian pekerjaan ini. Anda kemudian dapat menggunakan kembali JSON untuk AWS CloudFormation template dan AWS CLI skrip.

Lowongan kerja Monitor service

Anda dapat memantau status pekerjaan layanan dalam antrian pekerjaan Anda menggunakan beberapa AWS Batch perintah. Pekerjaan layanan adalah pekerjaan yang berjalan pada AWS layanan seperti SageMaker Pelatihan, di mana AWS Batch menyediakan kemampuan penjadwalan dan antrian sementara layanan target menangani eksekusi pekerjaan.

Daftar pekerjaan layanan berdasarkan status

Gunakan ListServiceJobsoperasi untuk melihat pekerjaan layanan dalam antrian Anda yang difilter berdasarkan status. Pekerjaan layanan dapat memiliki status berikut:

  • SUBMITTED- Job sudah diserahkan tapi belum diproses

  • PENDING- Job tertunda dan menunggu sumber daya

  • RUNNABLE- Job siap dijalankan dan menunggu dalam antrian

  • STARTING- Job sedang dimulai

  • RUNNING- Job sedang berjalan

  • SCHEDULED- Job telah diserahkan ke layanan target tetapi belum berjalan

  • SUCCEEDED- Job berhasil diselesaikan

  • FAILED- Job gagal diselesaikan

Lihat pekerjaan yang sedang berjalan dalam antrian Anda:

aws batch list-service-jobs \ --job-queue my-sm-training-fifo-jq \ --job-status RUNNING

Lihat pekerjaan yang menunggu dalam antrian:

aws batch list-service-jobs \ --job-queue my-sm-training-fifo-jq \ --job-status RUNNABLE

Lihat pekerjaan yang telah dikirimkan SageMaker tetapi belum berjalan:

aws batch list-service-jobs \ --job-queue my-sm-training-fifo-jq \ --job-status SCHEDULED

Lihat semua pekerjaan yang berhasil:

aws batch list-service-jobs \ --job-queue my-sm-training-fifo-jq \ --job-status SUCCEEDED

Melihat pekerjaan yang gagal untuk pemecahan masalah:

aws batch list-service-jobs \ --job-queue my-sm-training-fifo-jq \ --job-status FAILED

Lowongan kerja Filter Service

Anda dapat memfilter pekerjaan layanan berdasarkan nama menggunakan pencocokan pola. Jika nilai filter berakhir dengan tanda bintang (*), itu cocok dengan nama pekerjaan apa pun yang dimulai dengan string sebelum '*'.

Cari lowongan dengan nama yang dimulai dengan “training”:

aws batch list-service-jobs \ --job-queue my-sm-training-fifo-jq \ --filters name=JOB_NAME,values=training*

Temukan pekerjaan dengan nama tertentu:

aws batch list-service-jobs \ --job-queue my-sm-training-fifo-jq \ --filters name=JOB_NAME,values=my-training-job-1,my-training-job-2

Gabungkan filter status dan nama:

aws batch list-service-jobs \ --job-queue my-sm-training-fifo-jq \ --job-status RUNNING \ --filters name=JOB_NAME,values=production*

Tangani set hasil besar

Ketika Anda memiliki banyak pekerjaan layanan, gunakan pagination untuk mengelola hasil secara efektif.

Batasi jumlah hasil yang dikembalikan:

aws batch list-service-jobs \ --job-queue my-sm-training-fifo-jq \ --max-results 10

Gunakan token berikutnya untuk mendapatkan hasil tambahan:

aws batch list-service-jobs \ --job-queue my-sm-training-fifo-jq \ --max-results 10 \ --next-token eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9...

Dapatkan informasi pekerjaan layanan terperinci

Gunakan DescribeServiceJoboperasi untuk mendapatkan informasi komprehensif tentang pekerjaan layanan tertentu, termasuk statusnya saat ini, pengidentifikasi sumber daya layanan, dan informasi upaya terperinci.

Lihat informasi terperinci tentang pekerjaan tertentu:

aws batch describe-service-job \ --job-id a4d6c728-8ee8-4c65-8e2a-9a5e8f4b7c3d

Perintah ini mengembalikan informasi komprehensif tentang pekerjaan, termasuk:

  • Job ARN dan status saat ini

  • Pengidentifikasi sumber daya layanan (seperti Arn pekerjaan SageMaker Pelatihan)

  • Prioritas penjadwalan dan coba lagi konfigurasi

  • Muatan permintaan layanan yang berisi parameter layanan asli

  • Informasi percobaan terperinci dengan waktu mulai dan berhenti

  • Pesan status dari layanan target

Lowongan kerja Monitor SageMaker Training

Saat memantau pekerjaan SageMaker Pelatihan AWS Batch, Anda dapat mengakses informasi AWS Batch pekerjaan dan detail pekerjaan SageMaker Pelatihan yang mendasarinya.

Pengidentifikasi sumber daya layanan dalam detail pekerjaan berisi ARN pekerjaan SageMaker Pelatihan:

{ "latestAttempt": { "serviceResourceId": { "name": "TrainingJobArn", "value": "arn:aws:sagemaker:us-east-1:123456789012:training-job/my-training-job" } } }

Anda dapat menggunakan ARN ini untuk mendapatkan detail tambahan langsung dari: SageMaker

aws sagemaker describe-training-job \ --training-job-name my-training-job

Pantau kemajuan pekerjaan dengan memeriksa AWS Batch status dan status pekerjaan SageMaker Pelatihan. Status AWS Batch pekerjaan menunjukkan siklus hidup pekerjaan secara keseluruhan, sedangkan status pekerjaan SageMaker Pelatihan memberikan detail spesifik layanan tentang proses pelatihan.

Hentikan pekerjaan layanan

Gunakan TerminateServiceJoboperasi untuk menghentikan pekerjaan layanan yang berjalan.

Mengakhiri pekerjaan layanan tertentu:

aws batch terminate-service-job \ --job-id a4d6c728-8ee8-4c65-8e2a-9a5e8f4b7c3d \ --reason "Job terminated by user request"

Ketika Anda mengakhiri pekerjaan layanan, AWS Batch hentikan pekerjaan dan beri tahu layanan target. Untuk pekerjaan SageMaker Pelatihan, ini akan menghentikan pekerjaan pelatihan di SageMaker AI juga.