Pantau pekerjaan layanan dalam AWS Batch antrian - AWS Batch

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Pantau pekerjaan layanan dalam AWS Batch antrian

Anda dapat memantau status pekerjaan dalam antrian pekerjaan SageMaker Pelatihan Anda menggunakanlist-service-jobs, danget-job-queue-snapshot.

Lihat pekerjaan yang sedang berjalan dalam antrian Anda:

aws batch list-service-jobs \ --job-queue my-sm-training-fifo-jq \ --job-status RUNNING

Lihat pekerjaan yang menunggu dalam antrian:

aws batch list-service-jobs \ --job-queue my-sm-training-fifo-jq \ --job-status RUNNABLE

Lihat pekerjaan yang telah dikirimkan SageMaker tetapi belum berjalan:

aws batch list-service-jobs \ --job-queue my-sm-training-fifo-jq \ --job-status SCHEDULED

Dapatkan snapshot pekerjaan di depan antrian Anda:

aws batch get-job-queue-snapshot --job-queue my-sm-training-fifo-jq

Perintah ini menunjukkan urutan pekerjaan layanan yang akan datang dalam antrian Anda.

Dapatkan informasi pekerjaan layanan terperinci

Gunakan DescribeServiceJoboperasi untuk mendapatkan informasi komprehensif tentang pekerjaan layanan tertentu, termasuk statusnya saat ini, pengidentifikasi sumber daya layanan, dan informasi upaya terperinci.

Lihat informasi terperinci tentang pekerjaan tertentu:

aws batch describe-service-job \ --job-id a4d6c728-8ee8-4c65-8e2a-9a5e8f4b7c3d

Perintah ini mengembalikan informasi komprehensif tentang pekerjaan, termasuk:

  • Job ARN dan status saat ini

  • Pengidentifikasi sumber daya layanan (seperti Arn pekerjaan SageMaker Pelatihan)

  • Prioritas penjadwalan dan coba lagi konfigurasi

  • Muatan permintaan layanan yang berisi parameter layanan asli

  • Informasi percobaan terperinci dengan waktu mulai dan berhenti

  • Pesan status dari layanan target

Lowongan kerja Monitor SageMaker Training

Saat memantau pekerjaan SageMaker Pelatihan AWS Batch, Anda dapat mengakses informasi AWS Batch pekerjaan dan detail pekerjaan SageMaker Pelatihan yang mendasarinya.

Pengidentifikasi sumber daya layanan dalam detail pekerjaan berisi ARN pekerjaan SageMaker Pelatihan:

{ "latestAttempt": { "serviceResourceId": { "name": "TrainingJobArn", "value": "arn:aws:sagemaker:us-east-1:123456789012:training-job/my-training-job" } } }

Anda dapat menggunakan ARN ini untuk mendapatkan detail tambahan langsung dari: SageMaker

aws sagemaker describe-training-job \ --training-job-name my-training-job

Pantau kemajuan pekerjaan dengan memeriksa AWS Batch status dan status pekerjaan SageMaker Pelatihan. Status AWS Batch pekerjaan menunjukkan siklus hidup pekerjaan secara keseluruhan, sedangkan status pekerjaan SageMaker Pelatihan memberikan detail spesifik layanan tentang proses pelatihan.