Selidiki masalah operasional di lingkungan Anda - Amazon CloudWatch

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Selidiki masalah operasional di lingkungan Anda

Buat investigasi

Buat investigasi dari halaman AWS konsol

Anda dapat memulai penyelidikan dari beberapa AWS konsol, termasuk (namun tidak terbatas pada) halaman CloudWatch alarm, halaman CloudWatch metrik, dan halaman pemantauan Lambda.

Untuk memulai penyelidikan dari halaman AWS konsol
  1. Di Tingkat akun pilih grafik metrik atau alarm yang ingin Anda selidiki.

  2. Jika bagian atas halaman memiliki tombol Selidiki, pilih tombol tersebut lalu pilih Mulai penyelidikan baru.

    Jika tidak, pilih ikon menu elipsis vertikal Depicts the appearance of the vertical ellipsis icon on the console untuk metrik, dan pilih Selidiki, Mulai penyelidikan baru.

  3. Di panel Investigasi, masukkan nama untuk investigasi di judul Investigasi baru, dan secara opsional masukkan catatan tentang metrik atau alarm yang dipilih.

  4. Kemudian pilih Mulai investigasi.

    Investigasi dimulai. CloudWatch Investigasi memindai data telemetri Anda untuk menemukan data yang mungkin terkait dengan situasi ini.

  5. Untuk memindahkan data investigasi ke panel yang lebih besar, pilih Buka di halaman penuh.

  6. Untuk petunjuk terperinci tentang langkah-langkah yang dapat Anda ambil saat melanjutkan penyelidikan, lihatLihat dan lanjutkan investigasi terbuka.

Buat investigasi dari obrolan Amazon Q

Anda dapat mengajukan pertanyaan tentang masalah dalam penyebaran Anda dalam obrolan CloudWatch investigasi. Pertanyaannya bisa berupa “Mengapa fungsi Lambda saya lambat hari ini?”

Ketika Anda melakukannya, CloudWatch investigasi mungkin mengajukan pertanyaan tindak lanjut dan menjalankan pemeriksaan kesehatan mengenai masalah tersebut. Setelah pemeriksaan kesehatan, obrolan akan meminta Anda tentang apakah Anda ingin memulai penyelidikan.

Untuk informasi selengkapnya dan contoh pertanyaan lainnya, lihat Mengobrol dengan Amazon Q tentang AWS. .

Untuk petunjuk terperinci tentang langkah-langkah yang dapat Anda ambil saat melanjutkan penyelidikan setelah dimulai, lihatLihat dan lanjutkan investigasi terbuka.

Buat investigasi dari tindakan CloudWatch alarm

Saat Anda membuat CloudWatch alarm, Anda dapat menentukannya untuk memulai penyelidikan secara otomatis saat masuk ke status ALARM. Anda dapat melakukan ini untuk alarm metrik dan alarm komposit. Untuk informasi selengkapnya tentang membuat alarm, lihat Membuat alarm untuk metrik danMembuat sebuah alarm gabungan.

Lihat dan lanjutkan investigasi terbuka

Gunakan langkah-langkah di bagian ini untuk melihat dan melanjutkan dan investigasi yang ada

Untuk melihat dan melanjutkan penyelidikan
  1. Jika Anda belum berada di halaman untuk penyelidikan, lakukan hal berikut:

    1. Buka CloudWatch konsol di https://console.aws.amazon.com/cloudwatch/.

    2. Di panel navigasi kiri, pilih Operasi AI, Investigasi.

    3. Pilih nama investigasi.

  2. Bagian Umpan menampilkan item yang telah ditambahkan ke temuan investigasi, termasuk metrik atau alarm yang awalnya dipilih untuk memulai penyelidikan.

    Panel di sebelah kanan termasuk tab. Pilih tab Saran.

  3. Tab Saran menampilkan pengamatan telemetri lain yang ditemukan CloudWatch investigasi yang mungkin terkait dengan penyelidikan. Ini mungkin juga mencakup hipotesis, yang merupakan kemungkinan alasan atau akar penyebab yang ditemukan CloudWatch investigasi untuk situasi tersebut.

    Baik pengamatan maupun hipotesis ditulis dalam bahasa alami melalui CloudWatch penyelidikan.

    Anda memiliki beberapa pilihan:

    • Untuk setiap saran, Anda dapat memilih Terima atau Buang.

      Saat Anda memilih Terima, saran ditambahkan ke bagian Umpan, dan CloudWatch investigasi menggunakan informasi ini untuk mengarahkan pemindaian dan saran lebih lanjut.

      Jika Anda memilih Buang, saran dipindahkan ke tab Discarded.

    • Untuk setiap saran jenis pengamatan, Anda dapat memilih untuk memperluas grafik di tab Saran, atau membukanya di CloudWatch konsol untuk melihat detail lebih lanjut tentangnya.

    • Beberapa pengamatan mungkin merupakan hasil dari kueri Wawasan CloudWatch Log yang CloudWatch dilakukan investigasi sebagai bagian dari penyelidikan. Ketika pengamatan adalah hasil kueri CloudWatch Log Insights, kueri itu sendiri ditampilkan sebagai bagian dari pengamatan. Anda dapat mengedit kueri dan menjalankannya kembali. Untuk melakukannya, pilih ikon menu elipsis vertikal An example of a CloudWatch overview home page, showing alarms and their current state, and examples of other metrics graph widgets that might appear on the overview home page. berdasarkan hasilnya, lalu pilih Buka di Wawasan Log. Untuk informasi selengkapnya, lihat Menganalisis data CloudWatch log dengan Wawasan Log.

    • Jika Anda mengetahui telemetri dalam AWS layanan yang mungkin berlaku untuk penyelidikan ini, Anda dapat pergi ke konsol layanan itu dan menambahkan telemetri ke penyelidikan. Misalnya, untuk menambahkan metrik Lambda ke investigasi, Anda dapat melakukan hal berikut:

      1. Buka Konsol Lambda.

      2. Di bagian Monitor, temukan metrik.

      3. Buka menu konteks elipsis vertikal An example of a CloudWatch overview home page, showing alarms and their current state, and examples of other metrics graph widgets that might appear on the overview home page. untuk metrik, pilih Selidiki, Tambahkan ke investigasi Kemudian, di panel Selidiki, pilih nama investigasi.

    • Saat Anda melihat hipotesis di tab Saran, Anda dapat memilih Tampilkan penalaran untuk menampilkan data yang digunakan CloudWatch investigasi untuk menghasilkan hipotesis.

    • Anda dapat memilih tab Discarded dan melihat saran yang sebelumnya telah dibuang. Untuk menambahkan salah satunya ke temuan, pilih Kembalikan ke temuan.

    • Untuk menambahkan catatan ke temuan, pilih Catatan baru di panel Umpan. Kemudian masukkan catatan Anda dan pilih Tambah.

  4. Saat Anda menambahkan hipotesis ke area Feed, mungkin akan menampilkan Tampilkan tindakan yang disarankan. Jika demikian, memilih ini menampilkan kemungkinan tindakan yang dapat Anda ambil, dengan asumsi bahwa hipotesis benar tentang masalah tersebut. Tindakan yang mungkin termasuk yang berikut:

    • Saran dokumentasi adalah tautan ke AWS dokumentasi yang dapat membantu Anda memahami masalah yang sedang Anda kerjakan, dan cara mengatasinya. Untuk melihat dokumentasi yang disarankan, pilih tautan Tinjauan

    • Saran buku runbook adalah saran yang memanfaatkan runbook yang telah ditentukan sebelumnya di Otomasi Systems Manager. Setiap runbook mendefinisikan sejumlah langkah untuk melakukan tugas pada sumber daya. AWS

      penting

      Ada biaya untuk mengeksekusi runbook Otomasi. Namun, CloudWatch investigasi memberi Anda pratinjau tindakan yang diambil oleh runbook yang disarankan, memberi Anda kesempatan untuk mengevaluasi dengan lebih baik apakah akan menjalankan runbook. Untuk informasi tentang harga Otomasi, lihat AWS Systems Manager harga untuk Otomasi.

      Untuk informasi tentang melanjutkan tindakan runbook, lihat Meninjau dan mengeksekusi remediasi runbook yang disarankan untuk investigasi CloudWatch sebelum melanjutkan dengan langkah berikut dalam prosedur ini.

  5. Ketika Anda merasa telah menemukan akar penyebab masalah, Anda dapat memilih tab Ikhtisar dan kemudian memilih Hasilkan di bagian ringkasan Investigasi. CloudWatch investigasi kemudian membuat ringkasan bahasa alami dari temuan penting dan hipotesis dari penyelidikan.

    Bahkan setelah Anda membuat ringkasan, Anda dapat melanjutkan penyelidikan. Jika Anda melakukannya, dan menambah atau menghapus temuan dari investigasi, Anda selalu dapat kembali ke tab Ikhtisar dan memilih Hasilkan lagi untuk ringkasan yang diperbarui.

  6. Untuk mengakhiri investigasi, pilih Akhiri investigasi dan kemudian secara opsional tambahkan catatan akhir. Lalu, pilih Simpan.

    Status investigasi berubah menjadi Diarsipkan. Anda dapat memulai ulang investigasi yang diarsipkan dengan membuka halaman investigasi dan memilih Restart investigasi.

    Kami menyarankan agar Anda tidak membiarkan investigasi terbuka tanpa batas waktu, karena transisi status alarm yang terkait dengan penyelidikan akan terus ditambahkan ke penyelidikan selama terbuka.

catatan

Pada beberapa titik, Anda mungkin melihat Selesai analisis. Selesai dengan investigasi. ditampilkan di atas area Feed. Jika Anda kemudian menambahkan lebih banyak telemetri ke temuan, pesan ini berubah dan CloudWatch penyelidikan mulai memindai telemetri Anda lagi, berdasarkan data baru yang Anda tambahkan ke temuan.

Meninjau dan mengeksekusi remediasi runbook yang disarankan untuk investigasi CloudWatch

Saat Anda menambahkan hipotesis ke area Feed dari investigasi aktif, CloudWatch investigasi mungkin menampilkan Tampilkan tindakan yang disarankan. Salah satu tindakan yang disarankan mungkin adalah melihat dokumentasi dengan informasi untuk membantu Anda memperbaiki masalah secara manual.

Saran lain mungkin menggunakan runbook Otomasi untuk mencoba menyelesaikan masalah secara otomatis. Otomasi adalah kemampuan dalam Systems Manager, yang lain Layanan AWS. Runbook otomatisasi menentukan serangkaian langkah, atau tindakan, yang akan dijalankan pada sumber daya yang Anda pilih. Setiap runbook dirancang untuk mengatasi masalah tertentu. Runbook dapat mengatasi berbagai kebutuhan operasional: Membuat, memperbaiki, mengkonfigurasi ulang, menginstal, memecahkan masalah, memulihkan, menduplikasi, dan banyak lagi. Untuk informasi selengkapnya tentang Otomasi, lihatIntegrasi dengan AWS Systems Manager Otomasi.

Sebelum Anda mulai

Sebelum bekerja dengan runbook Otomasi dalam penyelidikan, perhatikan pertimbangan penting berikut:

  • Memilih untuk menjalankan runbook menimbulkan biaya. Untuk informasi, lihat harga AWS Systems Manager.

  • Akar penyebab dan saran runbook didukung oleh penalaran otomatis dan layanan kecerdasan buatan generatif.

    penting

    Anda bertanggung jawab atas tindakan yang dihasilkan dari mengeksekusi langkah-langkah runbook dan pilihan nilai parameter yang dimasukkan selama eksekusi runbook. Anda mungkin perlu mengedit runbook yang disarankan untuk memastikan runbook berfungsi seperti yang diharapkan. Untuk informasi selengkapnya, lihat kebijakan AI yang AWS bertanggung jawab.

  • Bergantung pada runbook, Anda mungkin perlu memasukkan nilai untuk parameter Input runbook sebelum eksekusi dapat dijalankan.

  • Runbook dijalankan menggunakan izin IAM yang ditetapkan ke operator. Jika perlu, masuk dengan izin IAM yang berbeda untuk menjalankan runbook. Selain izin untuk tindakan yang diambil, Anda memerlukan izin Systems Manager tambahan untuk menjalankan langkah-langkah runbook. Untuk informasi selengkapnya, lihat Menyiapkan Otomatisasi di Panduan AWS Systems Manager Pengguna.

Untuk meninjau dan menjalankan tindakan runbook yang disarankan untuk investigasi CloudWatch
  1. Untuk melihat informasi tentang runbook yang disarankan, pilih Tinjau untuk informasi tentang cara menjalankan langkah-langkah runbook.

    Pada halaman detail investigasi, pilih Saran.

  2. Di panel Saran, tinjau daftar hipotesis berdasarkan analisis sistem tentang masalah yang sedang diselidiki.

    Untuk setiap hipotesis, Anda dapat memilih dari opsi berikut:

    • Tampilkan penalaran — Lihat informasi lebih lanjut tentang mengapa sistem menghasilkan hipotesis.

    • Lihat tindakan — Lihat tindakan yang disarankan untuk masalah ini. Tidak semua hipotesis akan mencakup tindakan yang disarankan.

    • Terima — Terima hipotesis dan tambahkan ke bagian Umpan investigasi.

      catatan

      Menerima hipotesis tidak secara otomatis menjalankan solusi runbook terkait. Anda dapat melihat runbook yang disarankan sebelum menerima hipotesis, tetapi Anda harus menerima hipotesis untuk mengeksekusi runbook.

    • Buang — Tolak hipotesis dan jangan terlibat dengannya lebih jauh.

  3. Setelah memilih Lihat tindakan, di panel Tindakan yang disarankan, tinjau daftar tindakan yang disarankan yang dapat Anda lakukan untuk mengatasi masalah tersebut. Tindakan yang disarankan dapat mencakup satu atau lebih hal berikut:

    • AWS artikel pengetahuan — Memberikan informasi tentang langkah-langkah yang dapat Anda ambil untuk mengatasi masalah secara manual, ditambah tautan ke informasi lebih lanjut.

    • AWS dokumentasi - Menyediakan tautan ke topik dokumentasi pengguna yang terkait dengan masalah ini.

    • AWS-owned runbook — Daftar satu atau beberapa runbook Otomasi yang dikelola oleh AWS yang dapat Anda jalankan untuk mencoba penyelesaian masalah.

    • Runbook yang dimiliki oleh Anda — Daftar satu atau beberapa runbook Otomasi kustom yang dibuat oleh Anda atau orang lain di akun atau organisasi Anda, yang dapat Anda jalankan untuk mencoba penyelesaian masalah.

      catatan

      Sistem secara otomatis menghasilkan daftar runbook ini dengan mengevaluasi kata kunci di runbook kustom Anda dan kemudian membandingkannya dengan istilah yang terkait dengan masalah yang sedang diselidiki.

      Lebih banyak kecocokan kata kunci berarti runbook kustom tertentu muncul lebih tinggi di Runbook yang dimiliki oleh daftar Anda.

  4. Setelah meninjau hipotesis, Anda dapat memeriksa tindakan yang disarankan lebih lanjut dan membaca dokumentasi terkait dengan memilih Pelajari lebih lanjut. Anda juga dapat memilih Tinjau detail untuk memeriksa runbook yang disarankan yang dimiliki oleh AWS dan Anda.

  5. Saat memilih Detail ulasan untuk runbook, lakukan hal berikut:

    1. Untuk deskripsi Runbook, tinjau konten, yang memberikan ikhtisar tindakan yang dapat dilakukan runbook untuk memulihkan masalah yang sedang diselidiki. Pilih Lihat langkah-langkah untuk memvisualisasikan alur kerja buku runbook dan menelusuri detail langkah individual.

    2. Untuk parameter Input, tentukan nilai untuk parameter apa pun yang diperlukan oleh runbook. Parameter ini bervariasi dari runbook ke runbook.

    3. Untuk pratinjau Eksekusi, tinjau informasi dengan cermat. Informasi ini menjelaskan apa ruang lingkup dan dampaknya jika Anda memilih untuk menjalankan runbook.

      Konten pratinjau Eksekusi menyediakan informasi berikut:

      • Berapa banyak akun dan Wilayah tempat operasi runbook akan terjadi.

      • Jenis tindakan yang akan diambil, dan berapa banyak dari masing-masing jenis.

        Jenis tindakan meliputi yang berikut:

        • Mutating: Langkah runbook akan membuat perubahan pada target melalui tindakan yang membuat, memodifikasi, atau menghapus sumber daya.

        • Non-Mutating: Langkah runbook akan mengambil data tentang sumber daya tetapi tidak membuat perubahan pada mereka. Kategori ini umumnya mencakupDescribe,, ListGet, dan tindakan API hanya-baca serupa.

        • UndeterminedLangkah yang belum ditentukan memanggil eksekusi yang dilakukan oleh layanan orkestrasi lain seperti AWS Lambda,, atau Run AWS Step Functions Command, kemampuan. AWS Systems Manager Langkah yang belum ditentukan mungkin juga memanggil API pihak ketiga atau menjalankan Python PowerShell atau skrip. Systems Manager Automation tidak dapat mendeteksi hasil dari proses orkestrasi atau eksekusi API pihak ketiga, dan karenanya tidak dapat mengevaluasinya. Hasil dari langkah-langkah tersebut harus ditinjau secara manual untuk menentukan dampaknya.

        Untuk informasi tentang tindakan yang didukung dan jenis dampaknya, lihat Jenis tindakan runbook dampak remediasi di AWS Systems Manager Panduan Pengguna.

    4. Tinjau informasi pratinjau dengan cermat sebelum memutuskan apakah akan melanjutkan.

      Pada titik ini, Anda dapat memilih salah satu tindakan berikut:

      • Berhenti dan jangan jalankan runbook.

      • Ubah parameter input sebelum menjalankan runbook.

      • Jalankan runbook dengan opsi yang telah Anda pilih.

    penting

    Memilih untuk mengeksekusi runbook menimbulkan biaya. Untuk informasi, lihat harga AWS Systems Manager.

  6. Jika Anda ingin menjalankan runbook, pilih Execute.

    Jika Anda sudah menerima hipotesis, eksekusi berjalan.

    Jika Anda belum menerima hipotesis, kotak dialog meminta Anda untuk menerimanya sebelum eksekusi berjalan.

Setelah Anda memilih Execute for a runbook, tindakan tersebut ditambahkan ke panel Feed investigasi. Dari investigasi, Anda dapat memantau data baru dalam metrik dalam temuan untuk melihat apakah tindakan runbook memperbaiki masalah.