Masalah deployment Masalah konektivitas Masalah kinerja Alat pemantauan dan debugging

Memecahkan masalah layanan Amazon ECS Express Mode

Bagian ini membantu Anda mengidentifikasi dan menyelesaikan masalah umum saat menerapkan dan mengelola layanan Mode Ekspres.

Masalah deployment

Layanan terjebak dalam status AKTIF atau DRAINING

Gejala: DescribeServiceRevisions menunjukkan sumber daya masih penyediaan atau deprovisioning. DescribeServices menunjukkan penerapan tidak distabilkan

Kemungkinan penyebab dan solusi:

Izin IAM tidak mencukupi - Verifikasi bahwa peran eksekusi tugas dan peran infrastruktur memiliki izin yang diperlukan seperti yang ditunjukkan dalam kebijakan terkelola masing-masing.
```
# Check if the role has the required managed policy
aws iam list-attached-role-policies --role-name ecsTaskExecutionRole
                    
```

Kegagalan tarik gambar - Pastikan gambar kontainer ada dan dapat diakses.



# Test image pull manually
docker pull 123456789012.dkr.ecr.us-west-2.amazonaws.com/my-app:latest

Masalah konektivitas jaringan - Periksa apakah subnet memiliki akses internet atau titik akhir AWS Amazon VPC untuk layanan.
Batas sumber daya - Verifikasi bahwa akun Anda memiliki kapasitas Fargate yang memadai dan belum mencapai kuota layanan.

Langkah-langkah diagnostik:

Gunakan DescribeExpressGatewayService untuk mendapatkan Revisi Layanan Anda saat ini diikuti oleh DescribeServiceRevisions ServiceRevision untuk mendapatkan status pada penyediaan atau deprovisioning
Periksa peristiwa layanan di konsol Amazon ECS untuk pesan kesalahan terperinci.
Periksa port kontainer telah diatur dengan benar
Periksa kuota AWS layanan untuk Amazon ECS dan Fargate.

Kegagalan startup tugas

Gejala: Tugas gagal dimulai atau segera berhenti setelah memulai.

Penyebab umum:

Kesalahan aplikasi - Aplikasi kontainer keluar karena kesalahan konfigurasi atau runtime.
Kegagalan pemeriksaan kesehatan - Aplikasi tidak menanggapi pemeriksaan kesehatan pada port atau jalur yang diharapkan.
Kendala sumber daya - Alokasi CPU atau memori yang tidak memadai untuk aplikasi.
Variabel atau rahasia lingkungan yang hilang - Konfigurasi yang diperlukan tidak tersedia untuk aplikasi.

Langkah-langkah resolusi:

Periksa log aplikasi di CloudWatch Log, dapatkan nama grup log dari DescribeServiceRevisions:



aws logs describe-log-streams --log-group-name /ecs/express-service-my-app
aws logs get-log-events --log-group-name /ecs/express-service-my-app --log-stream-name stream-name

Verifikasi bahwa jalur pemeriksaan kesehatan mengembalikan status HTTP 200.
Uji gambar kontainer secara lokal untuk memastikannya dimulai dengan benar.
Tinjau dan sesuaikan alokasi CPU dan memori jika diperlukan.

Masalah konektivitas

Aplikasi tidak dapat dijangkau melalui penyeimbang beban

Gejala: URL aplikasi mengembalikan batas waktu atau kesalahan koneksi.

Langkah pemecahan masalah:

Validasi sumber daya Anda telah selesai penyediaan

Verifikasi bahwa tugas berjalan dan sehat:



aws ecs describe-services --cluster my-cluster --services my-express-service

Periksa kesehatan kelompok sasaran Application Load Balancer:



aws elbv2 describe-target-health --target-group-arn arn:aws:elasticloadbalancing:region:account:targetgroup/name/id

Pastikan aplikasi mendengarkan pada port yang benar di dalam wadah.

Masalah kinerja

Waktu respons lambat

Gejala: Respons aplikasi lebih lambat dari yang diharapkan.

Pendekatan diagnostik:

Memantau CPU dan pemanfaatan memori:



# Check CloudWatch metrics for the service
aws cloudwatch get-metric-statistics \
    --namespace AWS/ECS \
    --metric-name CPUUtilization \
    --dimensions Name=ServiceName,Value=my-express-service Name=ClusterName,Value=my-cluster \
    --start-time 2024-01-01T00:00:00Z \
    --end-time 2024-01-01T01:00:00Z \
    --period 300 \
    --statistics Average

Tinjau log aplikasi untuk kesalahan atau peringatan kinerja.
Periksa apakah penskalaan otomatis merespons pemuatan dengan tepat.
Menganalisis metrik penyeimbang beban untuk distribusi permintaan.

Strategi pengoptimalan:

Tingkatkan alokasi CPU atau memori jika sumber daya dibatasi.
Sesuaikan ambang batas penskalaan otomatis untuk skala lebih awal.
Optimalkan kode aplikasi dan kueri basis data.

Penskalaan otomatis tidak berfungsi seperti yang diharapkan

Gejala: Layanan tidak ditingkatkan selama beban tinggi atau tidak menurunkan skala selama beban rendah.

Langkah pemecahan masalah:

Periksa kebijakan penskalaan otomatis dan konfigurasinya:



aws application-autoscaling describe-scaling-policies \
    --service-namespace ecs \
    --resource-id service/my-cluster/my-express-service

Tinjau CloudWatch metrik untuk memastikan pemicu penskalaan terpenuhi.
Verifikasi bahwa layanan memiliki izin untuk menskalakan (periksa peran IAM).
Periksa aktivitas penskalaan dan hasilnya.

Alat pemantauan dan debugging

Menggunakan CloudWatch Wawasan Kontainer

Aktifkan Wawasan Kontainer untuk pemantauan komprehensif:



aws ecs put-account-setting --name containerInsights --value enabled

Wawasan Kontainer menyediakan:

CPU, memori, disk, dan metrik jaringan
Dasbor pemantauan kinerja
Korelasi dan analisis log
Deteksi anomali

Awas Javascript dinonaktifkan atau tidak tersedia di browser Anda.

Untuk menggunakan Dokumentasi AWS, Javascript harus diaktifkan. Lihat halaman Bantuan browser Anda untuk petunjuk.

Konvensi Dokumen

Praktik terbaik untuk layanan Amazon ECS Express Mode

Memperbarui Sumber Daya di Luar Mode Ekspres