Memecahkan Masalah Instans Terkelola Amazon ECS - Amazon Elastic Container Service

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Memecahkan Masalah Instans Terkelola Amazon ECS

Saat meluncurkan tugas dengan Instans Terkelola Amazon ECS, Amazon ECS pertama-tama mencoba menempatkan tugas pada kapasitas yang ada dan meminta kapasitas tambahan untuk tugas yang tidak dapat ditempatkan. Jika penyediaan instance gagal, ID EC2 permintaan Amazon disertakan dalam pesan kegagalan tugas. Anda dapat menggunakan ID permintaan ini untuk mencari detail permintaan yang gagal CloudTrail untuk pemecahan masalah lebih lanjut.

catatan

Jika Anda memilih untuk menerapkan izin hak istimewa paling sedikit dan menentukan izin Anda sendiri untuk profil instans alih-alih menggunakan kebijakan AmazonECSInstanceRolePolicyForManagedInstances terkelola, Anda dapat menambahkan izin berikut untuk membantu mengatasi masalah terkait tugas dengan Instans Terkelola Amazon ECS:

  • ecs:StartTelemetrySession

  • ecs:PutSystemLogEvents

Definisi tugas tidak kompatibel dengan Instans Terkelola Amazon ECS

Penyebab umum

Kesalahan ini terjadi ketika definisi tugas berisi parameter atau konfigurasi yang tidak didukung oleh Instans Terkelola Amazon ECS. Ketidakcocokan umum termasuk mode jaringan yang tidak didukung, peran tugas, atau persyaratan sumber daya.

Resolusi

  1. Verifikasi bahwa definisi tugas Anda menggunakan requiresCompatibilities set toMANAGED_INSTANCES.

  2. Pastikan definisi tugas Anda menggunakan mode awsvpc jaringan.

  3. Periksa apakah nilai CPU dan memori berada dalam rentang yang didukung untuk Instans Terkelola Amazon ECS.

  4. Tinjau pesan kesalahan terperinci untuk detail ketidakcocokan tertentu.

Penyedia kapasitas tidak terkait dengan cluster

Penyebab umum

Kesalahan ini terjadi ketika penyedia kapasitas yang ditentukan dalam strategi penyedia kapasitas Anda tidak terkait dengan klaster atau tidak ada.

Resolusi

  1. Verifikasi bahwa penyedia kapasitas ada di akun dan wilayah Anda.

  2. Kaitkan penyedia kapasitas dengan klaster Anda menggunakan konsol Amazon ECS atau CLI.

  3. Pastikan penyedia kapasitas dalam ACTIVE status sebelum menggunakannya.

Kesalahan izin peran infrastruktur

Penyebab umum

Kesalahan ini terjadi ketika peran infrastruktur Amazon ECS tidak memiliki izin yang diperlukan untuk melakukan EC2 operasi Amazon atas nama Anda, atau ketika peran tersebut tidak dapat diasumsikan karena masalah hubungan kepercayaan.

Resolusi

  1. Verifikasi bahwa peran infrastruktur Anda memiliki hubungan kepercayaan yang tepat dengan Amazon ECS.

  2. Pastikan peran memiliki EC2 izin Amazon yang diperlukan termasukec2:RunInstances,ec2:DescribeInstances, daniam:PassRole.

  3. Periksa pesan kegagalan otorisasi yang dikodekan CloudTrail untuk detail izin tertentu.

  4. Perbarui kebijakan peran untuk menyertakan izin yang hilang yang diidentifikasi dalam pesan kesalahan.

VcpuLimitExceeded kesalahan

Penyebab umum

Kesalahan ini terjadi ketika Anda telah mencapai kuota layanan vCPU untuk keluarga tipe instans di wilayah saat ini. Instans Terkelola Amazon ECS tidak dapat meluncurkan instans tambahan hingga kapasitas tersedia.

Resolusi

  1. Minta peningkatan kuota layanan untuk keluarga tipe instans yang terpengaruh melalui AWS Support Center.

  2. Pertimbangkan untuk menggunakan jenis instans berbeda yang termasuk dalam kategori kuota vCPU yang berbeda.

  3. Hentikan EC2 instans Amazon yang tidak digunakan untuk membebaskan kapasitas vCPU.

  4. Tinjau konfigurasi penyedia kapasitas Anda untuk menggunakan tipe instans dengan persyaratan vCPU yang lebih rendah.

InsufficientCapacity dan kesalahan kapasitas terkait

Penyebab umum

Kesalahan ini terjadi ketika AWS tidak memiliki kapasitas yang cukup untuk memenuhi permintaan instans Anda. Ini dapat mencakup kapasitas instans yang tidak mencukupi, kapasitas alamat, atau kapasitas volume di Availability Zone yang diminta.

Resolusi

  1. Coba luncurkan instance di Availability Zone yang berbeda dengan mengonfigurasi beberapa subnet di penyedia kapasitas Anda.

  2. Pertimbangkan untuk menggunakan berbagai jenis instance yang mungkin memiliki kapasitas lebih banyak.

  3. Tunggu dan coba lagi operasi karena ketersediaan kapasitas sering berubah.

  4. Untuk kebutuhan kapasitas yang terus-menerus, pertimbangkan untuk menggunakan Instans Cadangan atau Savings Plans.

UnauthorizedOperation kesalahan

Penyebab umum

Kesalahan ini terjadi ketika layanan Amazon ECS tidak memiliki izin yang diperlukan untuk melakukan EC2 operasi Amazon atau meneruskan peran IAM. Skenario umum termasuk ec2:RunInstances izin atau iam:PassRole izin yang hilang untuk profil instance.

Resolusi

  1. Verifikasi bahwa peran infrastruktur Amazon ECS Anda memiliki izin yang diperlukan untuk meluncurkan instans Amazon EC2 .

  2. Pastikan peran infrastruktur memiliki iam:PassRole izin untuk profil instans yang digunakan oleh Instans Terkelola Amazon ECS Anda.

  3. Periksa pesan kegagalan otorisasi yang dikodekan CloudTrail untuk detail izin tertentu.

  4. Perbarui kebijakan peran untuk menyertakan izin yang hilang yang diidentifikasi dalam pesan galat.

Waktu tugas habis menunggu kapasitas

Penyebab umum

Kesalahan ini terjadi ketika instance membutuhkan waktu lebih lama dari yang diharapkan untuk diluncurkan dan mendaftar dengan cluster. Hal ini dapat terjadi karena kendala EC2 kapasitas Amazon, kegagalan peluncuran instance, atau masalah konektivitas jaringan.

Resolusi

  1. Periksa kesehatan EC2 layanan Amazon di wilayah Anda untuk masalah yang sedang berlangsung.

  2. Verifikasi bahwa subnet Anda memiliki alamat IP yang cukup tersedia.

  3. Pastikan grup keamanan Anda mengizinkan lalu lintas yang diperlukan untuk komunikasi agen Amazon ECS.

  4. Pertimbangkan untuk menggunakan beberapa Availability Zone untuk meningkatkan ketersediaan kapasitas.

  5. Coba lagi operasi peluncuran tugas karena kendala kapasitas seringkali bersifat sementara.

Kesalahan konfigurasi jaringan

Penyebab umum

Kesalahan ini terjadi ketika ada ketidakcocokan antara persyaratan jaringan tugas Anda dan konfigurasi jaringan penyedia kapasitas, seperti ketidakcocokan VPC atau konfigurasi jaringan yang hilang.

Resolusi

  1. Verifikasi bahwa penyedia kapasitas Anda dikonfigurasi dengan VPC dan subnet yang benar.

  2. Pastikan bahwa grup keamanan dan subnet milik VPC yang sama.

  3. Periksa apakah konfigurasi jaringan definisi tugas Anda kompatibel dengan penyedia kapasitas.

  4. Perbarui konfigurasi penyedia kapasitas Anda dengan pengaturan jaringan yang benar.

Penyedia kapasitas tidak dapat dihapus karena instance macet

Penyebab umum

Kesalahan ini terjadi ketika Instans Terkelola Amazon ECS macet dalam DRAINING status ACTIVE atau tetapi tidak ada tugas yang berjalan pada instans.

Resolusi

Untuk memungkinkan penghapusan penyedia kapasitas untuk melanjutkan, Anda dapat memaksa deregister instance yang macet menggunakan perintah berikut.

aws ecs deregister-container-instance \ --cluster arn:aws:ecs:us-east-1:111122223333:cluster/MyCluster \ --container-instance arn:aws:ecs:us-east-1:111122223333:container-instance/a1b2c3d4-5678-90ab-cdef-11111EXAMPLE \ --force