View a markdown version of this page

Kesalahan umum dan pemecahan masalah - AWS Batch

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Kesalahan umum dan pemecahan masalah

Kesalahan AWS Batch sering terjadi pada tingkat aplikasi atau disebabkan oleh konfigurasi instans yang tidak memenuhi persyaratan pekerjaan spesifik Anda. Masalah lain termasuk pekerjaan yang macet dalam RUNNABLE status atau lingkungan komputasi yang macet dalam suatu INVALID keadaan. Untuk informasi selengkapnya tentang pemecahan masalah pekerjaan yang macet dalam RUNNABLE status, lihat. Pekerjaan terjebak dalam RUNNABLE status Untuk informasi tentang pemecahan masalah lingkungan komputasi dalam suatu INVALID status, lihat. INVALIDlingkungan komputasi

  • Periksa kuota vCPU Amazon EC2 Spot — Verifikasi bahwa kuota layanan Anda saat ini memenuhi persyaratan pekerjaan. Misalnya, misalkan kuota layanan Anda saat ini adalah 256 vCPU dan pekerjaan membutuhkan 10.000 vCPU. Kemudian, kuota layanan tidak memenuhi persyaratan pekerjaan. Untuk informasi selengkapnya dan petunjuk pemecahan masalah, lihat kuota layanan Amazon EC2 dan Bagaimana cara meningkatkan kuota layanan Amazon EC2Resources saya? .

  • Pekerjaan gagal sebelum aplikasi berjalan — Beberapa pekerjaan mungkin gagal karena DockerTimeoutError kesalahan atau CannotPullContainerError kesalahan. Untuk informasi pemecahan masalah, lihat Bagaimana cara mengatasi kesalahan "DockerTimeoutError" di? AWS Batch.

  • Alamat IP tidak mencukupi — Jumlah alamat IP di VPC dan subnet Anda dapat membatasi jumlah instance yang dapat Anda buat. Gunakan Classless Inter-Domain Routing (CIDR) untuk memberikan lebih banyak alamat IP daripada yang diperlukan untuk menjalankan beban kerja Anda. Jika perlu, Anda juga dapat membuat VPC khusus dengan ruang alamat yang besar. Misalnya, Anda dapat membuat VPC dengan beberapa CIDR di 10.x.0.0/16 dan subnet di setiap Availability Zone dengan CIDR dari. 10.x.y.0/17 Dalam contoh ini, x adalah antara 1-4 dan y adalah 0 atau 128. Konfigurasi ini menyediakan 36.000 alamat IP di setiap subnet.

  • Pastikan instans terdaftar di Amazon EC2 — Jika Anda melihat instans di konsol Amazon EC2, tetapi tidak ada instans penampung Amazon Elastic Container Service di kluster Amazon ECS Anda, agen Amazon ECS mungkin tidak diinstal pada Amazon Machine Image (AMI). Agen Amazon ECS, Data Amazon EC2 di AMI Anda, atau templat peluncuran mungkin juga tidak dikonfigurasi dengan benar. Untuk mengisolasi akar penyebab, buat instans Amazon EC2 terpisah atau sambungkan ke instance yang ada menggunakan SSH. Untuk informasi selengkapnya, lihat konfigurasi agen penampung Amazon ECS, Lokasi File Log Amazon ECS, dan. Menghitung sumber daya AMIs

  • Tinjau AWS Dasbor — Tinjau AWS Dasbor untuk memverifikasi bahwa status pekerjaan yang diharapkan dan bahwa skala lingkungan komputasi seperti yang diharapkan. Anda juga dapat meninjau log pekerjaan CloudWatch.

  • Verifikasi bahwa instance Anda dibuat — Jika instance dibuat, itu berarti lingkungan komputasi Anda diskalakan seperti yang diharapkan. Jika instance Anda tidak dibuat, cari subnet terkait di lingkungan komputasi Anda untuk diubah. Untuk selengkapnya, lihat Memverifikasi aktivitas penskalaan untuk grup Auto Scaling.

    Kami juga menyarankan Anda memverifikasi bahwa instans Anda dapat memenuhi persyaratan pekerjaan terkait Anda. Misalnya, pekerjaan mungkin memerlukan 1 TiB memori, tetapi lingkungan komputasi menggunakan jenis instance C5 yang terbatas pada memori 192 GB.

  • Verifikasi bahwa instans Anda diminta oleh AWS Batch — Periksa riwayat grup Auto Scaling untuk memverifikasi bahwa instans Anda diminta oleh. AWS Batch Ini adalah indikasi bagaimana Amazon EC2 mencoba memperoleh instance. Jika Anda menerima kesalahan yang menyatakan Spot Amazon EC2 tidak dapat memperoleh instance di Availability Zone tertentu, ini mungkin karena Availability Zone tidak menawarkan keluarga instance tertentu.

  • Verifikasi bahwa instans terdaftar dengan Amazon ECS — Jika Anda melihat instans di konsol Amazon EC2, tetapi tidak ada instans penampung Amazon ECS di kluster Amazon ECS Anda, agen Amazon ECS mungkin tidak diinstal pada Amazon Machine Image (AMI). Selain itu, Agen Amazon ECS, Data Amazon EC2 di AMI Anda, atau templat peluncuran mungkin tidak dikonfigurasi dengan benar. Untuk mengisolasi akar penyebab, buat instans Amazon EC2 terpisah atau sambungkan ke instance yang ada menggunakan SSH. Untuk informasi selengkapnya, lihat file konfigurasi CloudWatch agen: bagian Log, Lokasi File Log Amazon ECS, danMenghitung sumber daya AMIs.

  • Buka tiket dukungan — Jika Anda masih mengalami masalah setelah beberapa pemecahan masalah dan memiliki rencana dukungan, buka tiket dukungan. Di tiket dukungan, pastikan untuk menyertakan informasi tentang masalah, spesifikasi beban kerja, konfigurasi, dan hasil pengujian. Untuk informasi selengkapnya, lihat Bandingkan Dukungan Paket.

  • Tinjau forum AWS Batch dan HPC — Untuk informasi lebih lanjut, lihat forum AWS Batchdan HPC.

  • Tinjau Dasbor Pemantauan AWS Batch Waktu Proses — Dasbor ini menggunakan arsitektur tanpa server untuk menangkap peristiwa dari Amazon ECS,, dan AWS Batch Amazon EC2 untuk memberikan wawasan tentang pekerjaan dan instans. Untuk informasi selengkapnya, lihat Solusi Dasbor Pemantauan AWS Batch Runtime.