Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris. # Kelola beban kerja di Deteksi dan Respons Insiden Bagian penting dari manajemen insiden yang efektif adalah memiliki proses dan prosedur yang tepat untuk melakukan onboard, menguji, dan mempertahankan beban kerja Anda yang dipantau. Bagian ini mencakup langkah-langkah penting, termasuk mengembangkan runbook komprehensif dan rencana respons untuk memandu tim Anda melalui insiden, menguji dan memvalidasi beban kerja baru secara menyeluruh sebelum orientasi, meminta perubahan untuk memperbarui pemantauan beban kerja, dan melepaskan beban kerja dengan benar bila diperlukan. **Topics** + [Kembangkan runbook dan rencana respons](idr-workloads-dev-runbook.md) + [Uji beban kerja onboard](idr-workloads-testing.md) + [Meminta perubahan pada beban kerja](idr-workloads-change-request.md) + [Menekan alarm](idr-workloads-suppress-alarms.md) + [Offboard beban kerja](idr-workloads-offboard.md) # Kembangkan runbook dan rencana respons untuk menanggapi insiden di Deteksi dan Respons Insiden Deteksi dan Respons Insiden menggunakan informasi yang diambil dari kuesioner orientasi Anda untuk mengembangkan buku runbook dan rencana respons untuk pengelolaan insiden yang memengaruhi beban kerja Anda. Runbook mendokumentasikan langkah-langkah yang diambil Manajer Insiden saat menanggapi suatu insiden. Rencana respons dipetakan ke setidaknya satu dari beban kerja Anda. Tim manajemen insiden membuat template ini dari informasi yang Anda berikan selama [penemuan beban kerja](idr-gs-discovery.md). Rencana respons adalah templat dokumen AWS Systems Manager (SSM) yang digunakan untuk memicu insiden. Untuk mempelajari lebih lanjut tentang dokumen SSM, lihat [AWS Systems Manager Dokumen](https://docs.aws.amazon.com/systems-manager/latest/userguide/sysman-ssm-docs.html). Untuk mempelajari lebih lanjut tentang Manajer Insiden, lihat [Apa Itu Manajer Insiden AWS Systems Manager?](https://docs.aws.amazon.com/incident-manager/latest/userguide/index.html) **Output kunci:** + Penyelesaian definisi beban kerja Anda pada Deteksi dan Respons Insiden AWS. + Penyelesaian alarm, runbook, dan definisi rencana respons pada Deteksi dan Respons Insiden AWS. Anda juga dapat mengunduh contoh AWS Incident Detection and Response Runbook: [aws-idr-runbook-example.zip.](samples/aws-idr-runbook-example.zip) Contoh runbook: ``` Runbook template for AWS Incident Detection and Response # Description This document is intended for [CustomerName] [WorkloadName]. [Insert short description of what the workload is intended for]. ## Step: Priority **Priority actions** 1. When a case is created with Incident Detection and Response, lock the case to yourself, verify the Customer Stakeholders in the Case from *Engagement Plans - Initial Engagement*. 2. Send the first correspondence on the support case to the customer as below. If there is no support case or if it is not possible to use the support case then backup communication details are listed in the steps that follow. ``` Hello, This is <> from AWS Incident Detection and Response. An alarm has triggered for your workload <>. I am currently investigating and will update you in a few minutes after I have finished initial investigation. Alarm Identifier - ``` **Compliance and regulatory requirements for the workload** <> **Actions required from Incident Detection and Response in complying** <> ## Step: Information **Review of common information** * This section provides a space for defining common information which may be needed through the life of the incident. * The target user of this information is the Incident Management Engineer and Operations Engineer. * The following steps may reference this information to complete an action (for example, execute the "Initial Engagement" plan). --- **Engagement plans** Describe the engagement plans applicable to this runbook. This section contains only contact details. Engagement plans will be referenced in the step by step **Communication Plans**. * **Initial engagement** AWS Incident Detection and Response Team will add customer stakeholder addresses below to the Support Case. AWS Stakeholders are for additional stakeholders that may need to be made aware of any issues. When updating customer stakeholders details in this plan also update the Backup Mailto links. * ***Customer Stakeholders***: customeremail1; customeremail2; etc * ***AWS Stakeholders***: aws-idr-oncall@amazon.com; tam-team-email; etc. * ***One Time Only Contacts***: [These are email contacts that are included on only the first communication. Remove these contacts after the first communication has gone out. These could be customer paging email addresses such as pager-duty that must not be paged for every correspondence] * ***Backup Mailto Impact Template***: <*Insert Impact Template Mailto Link here*> * Use the backup Mailto when communication over cases is not possible. * ***Backup Mailto No Impact Template***: <*Insert No Impact Mailto Link here*> * Use the backup Mailto when communication over cases is not possible. * **Engagement Escalation** AWS Incident Detection and Response will reach out to the following contacts when the contacts from the **Initial engagement** plan do not respond to incidents. For each Escalation Contact indicate if they must be added to the support case, phoned or both. * ***First Escalation Contact***: [escalationEmailAddress#1] / [PhoneNumber] - Wait XX Minutes before escalating to this contact. * [add Contact to Case / phone] this contact. * ***Second Escalation Contact***: [escalationEmailAddress#2] / [PhoneNumber] - Wait XX Minutes before escalating to this contact. * [add Contact to Case / phone] this contact. * Etc; --- **Communication plans** Describe how Incident Management Engineer communicates with designated stakeholders outside the incident call and communication channels. * **Impact Communication plan** This plan is initiated when Incident Detection and Response have determined from step **Triage** that an alert indicates potential impact to a customer. Incident Detection and Response will request the customer to join the predetermined bridge (Chime Bridge/Customer Provided Bridge / Customer Static Bridge) as indicated in **Engagement plans - Incident call setup**. All backup email templates for use when cases can't be used are in **Engagement plans - Initial engagement**. * 1 – Before sending the impact notification, verify then remove and/or add customer contacts from the Support Case CC based on the contacts listed in the **Initial engagement** Engagement plan. * 2 – Send the engagement notification to the customer based the following Template: (choose one and remove the rest) ***Impact Template - Chime Bridge*** ``` The following alarm has engaged AWS Incident Detection and Response to an Incident bridge: Alarm Identifier - Alarm State Change Reason - Alarm Start Time - Please join the Chime Bridge below so we can start the steps outlined in your Runbook: International dial-in numbers: https://chime.aws/dialinnumbers/ ``` ***Impact Template - Customer Provided Bridge*** ``` The following alarm has engaged AWS Incident Detection and Response: Alarm Identifier - Alarm State Change Reason - Alarm Start Time - Please respond with your internal bridge details so we can join and start the steps outlined in your Runbook. ``` ***Impact Template - Customer Static Bridge*** ``` The following alarm has engaged AWS Incident Detection and Response to an Incident bridge: Alarm Identifier - Alarm State Change Reason - Alarm Start Time - Please join the Bridge below so we can start the steps outlined in your Runbook: Conference Number: Conference URL : ``` * 3 - Set the Case to Pending Customer Action * 4 - Follow **Engagement Escalation** plan as mentioned above. * 5 - If the customer does not respond within 30 minutes, disengage and continue to monitor until the alarm recovers. * **No Impact Communication plan** This plan is initiated when an alarm recovers before Incident Detection and Response have completed initial **Triage**. * 1 - Before sending the no impact notification, verify then remove and/or add customer contacts from the Support Case CC based on the contacts listed in the **Engagement plans - Initial engagement** Engagement plan. * 2 - Send a no engagement notification to the customer based on the below template: ***No Impact Template*** ``` AWS Incident Detection and Response received an alarm that has recovered for your workload. Alarm Identifier - Alarm State Change Reason - Alarm Start Time - Alarm End Time - This may indicate a brief customer impact that is currently not ongoing. If there is an ongoing impact to your workload, please let us know and we will engage to assist. ``` * 3 - Put the case in to Pending Customer Action. * 4 - If the customer does not respond within 30 minutes Resolve the case. * **Updates** If AWS Incident Detection and Response is expected to provide regular updates to customer stakeholders, list those stakeholders here. Updates must be sent via the same support case. Remove this section if not needed. * Update Cadence: Every XX minutes * External Update Stakeholders: customeremailaddress1; customeremailaddress2; etc * Internal Update Stakeholders: awsemailaddress1; awsemailaddress2; etc --- **Application architecture overview** This section provides an overview of the application/workload architecture for Incident Management Engineer and Operations Engineer awareness. * **AWS Accounts and Regions with key services** - list of AWS accounts with regions supporting this application. Assists Engineers in assessing underlying infrastructure supporting the application. * 123456789012 * US-EAST-1 - brief desc as appropriate * EC2 - brief desc as appropriate * DynamoDB - brief desc as appropriate * etc. * US-WEST-1 - brief desc as appropriate * etc. * another-account-etc. * **Resource identification** - describe how engineers determine resource association with application * Resource groups: etc. * Tag key/value: AppId=123456 * **CloudWatch Dashboards** - list dashboards relevant to key metrics and services * 123456789012 * us-east-1 * some-dashboard-name * etc. * some-other-dashboard-name-in-current-acct ## Step: Triage **Evaluate incident and impact** This section provides instructions for triaging of the incident to determine correct impact, description, and overall correct runbook being executed. * **Evaluation of initial incident information** * 1 - Review Incident Alarm, noting time of first detected impact as well as the alarm start time. * 2 - Identify which service(s) in the customer application is seeing impact. * 3 - Review AWS Service Health for services listed under **AWS Accounts and Regions with key services**. * 4 - Review any customer provided dashboards listed under **CloudWatch Dashboards** --- * **Impact** Impact is determined when either the customer's metrics do not recover, appear to be trending worse or if there is indication of AWS Service Impact. * 1 – Start **Communication plans - Impact Communication plan** * 2 - Start **Engagement plans - Engagement Escalation** if no response is received from the **Initial Engagement** contacts. * 3 - Start **Communication plans - Updates** if specified in **Communication plans** * **No Impact** No Impact is determined when the customer's alarm recovers before Triage is complete and there are no indications of AWS service impact or sustained impact on the customer's CloudWatch Dashboards. * 1 - Start **Communication plans - No Impact Communication plan** ## Step: Investigate **Investigation** This section describes performing investigation of known and unknown symptoms. **Known issue** * *List all known issues with the application and their standard actions here* **Unknown issues** * Investigate with the customer and AWS Premium Support. * Escalate internally as required. ## Step: Mitigation **Collaborate** * Communicate any changes or important information from the **Investigate** step to the members of the incident call. **Implement mitigation** * ***List customer failover plans / Disaster Recovery plans / etc here for implementing mitigation. ## Step: Recovery **Monitor customer impact** * Review metrics to confirm recovery. * Ensure recovery is across all Availability Zones / Regions / Services * Get confirmation from the customer that impact is over and the application has recovered. **Identify action items** * Record key decisions and actions taken, including temporary mitigation that might have been implemented. * Ensure outstanding action items have assigned owners. * Close out any Communication plans that were opened during the incident with a final confirmation of recovery notification. ``` # Uji beban kerja onboard di Deteksi dan Respons Insiden **catatan** AWS Identity and Access Management Pengguna atau peran yang Anda gunakan untuk pengujian alarm harus memiliki `cloudwatch:SetAlarmState` izin. Langkah terakhir dalam proses orientasi adalah melakukan gameday untuk beban kerja baru Anda. Setelah alarm selesai, AWS Incident Detection and Response mengonfirmasi tanggal dan waktu yang Anda pilih untuk memulai gameday Anda. Gameday Anda melayani dua tujuan utama: + **Validasi Fungsional:** Mengonfirmasi bahwa Deteksi dan Respons Insiden AWS dapat menerima peristiwa alarm Anda dengan benar. Dan, validasi fungsional mengonfirmasi bahwa peristiwa alarm Anda memicu runbook yang sesuai dan tindakan lain yang diinginkan, seperti pembuatan kasus otomatis jika Anda memilihnya selama menelan alarm. + **Simulasi:** Gameday adalah simulasi ujung ke ujung dari apa yang mungkin terjadi selama insiden nyata. AWS Incident Detection and Response mengikuti langkah-langkah runbook yang ditentukan untuk memberi Anda wawasan tentang bagaimana insiden nyata dapat terjadi. Gameday adalah kesempatan bagi Anda untuk mengajukan pertanyaan atau menyempurnakan instruksi untuk meningkatkan keterlibatan. Selama pengujian alarm, AWS Incident Detection and Response bekerja sama dengan Anda untuk mengatasi masalah apa pun yang diidentifikasi. ## CloudWatch alarm AWS Incident Detection and Response menguji CloudWatch alarm Amazon Anda dengan memantau perubahan status alarm Anda. Untuk melakukan ini, ubah alarm secara manual ke status **Alarm** menggunakan AWS Command Line Interface. Anda juga dapat mengakses AWS CLI dari AWS CloudShell. AWS Incident Detection and Response memberi Anda daftar AWS CLI perintah untuk Anda gunakan selama pengujian. Untuk mencegah tindakan yang tidak diinginkan, misalnya instans Amazon EC2 dimulai ulang, nonaktifkan tindakan CloudWatch alarm apa pun sebelum Anda mengubah status alarm. Anda dapat mengaktifkan kembali tindakan CloudWatch alarm setelah pengujian selesai. Untuk mempelajari selengkapnya tentang menonaktifkan atau mengaktifkan tindakan alarm, lihat [DisableAlarmActions](https://docs.aws.amazon.com/AmazonCloudWatch/latest/APIReference/API_DisableAlarmActions.html)dan [EnableAlarmActions](https://docs.aws.amazon.com/AmazonCloudWatch/latest/APIReference/API_EnableAlarmActions.html)di Referensi *Amazon CloudWatch * API. Contoh AWS CLI perintah untuk mengatur status alarm: ``` aws cloudwatch set-alarm-state --alarm-name "ExampleAlarm" --state-value ALARM --state-reason "Testing AWS Incident Detection and Response" --region us-east-1 ``` Untuk mempelajari lebih lanjut tentang mengubah status CloudWatch alarm secara manual, lihat [SetAlarmState](https://docs.aws.amazon.com/AmazonCloudWatch/latest/APIReference/API_SetAlarmState.html). Untuk mempelajari lebih lanjut tentang izin yang diperlukan untuk operasi CloudWatch API, lihat referensi [ CloudWatch izin Amazon](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/permissions-reference-cw.html). ## Alarm APM pihak ketiga Beban kerja yang menggunakan alat Application Performance Monitoring (APM) pihak ketiga, seperti Datadog, Splunk, New Relic, atau Dynatrace, memerlukan instruksi yang berbeda untuk mensimulasikan alarm. **Pada awal gameday, AWS Incident Detection and Response meminta Anda untuk sementara mengubah ambang batas alarm atau operator perbandingan untuk memaksa alarm ke status ALARM.** Status ini memicu muatan ke AWS Incident Detection and Response. ## Output kunci Output kunci: + Alarm menelan berhasil dan konfigurasi alarm Anda benar. + Alarm berhasil dibuat dan diterima oleh AWS Incident Detection and Response. + Kasus dukungan dibuat untuk keterlibatan Anda dan kontak yang Anda tentukan akan diberi tahu. + Deteksi dan Respons Insiden AWS dapat berinteraksi dengan Anda melalui sarana konferensi yang ditentukan. + Semua alarm dan kasus dukungan yang dihasilkan sebagai bagian dari gameday diselesaikan. + Email Go-Live dikirim untuk mengonfirmasi beban kerja Anda sekarang sedang dipantau oleh AWS Incident Detection and Response. # Meminta perubahan pada beban kerja onboard di Deteksi dan Respons Insiden Untuk meminta perubahan pada beban kerja onboard, selesaikan langkah-langkah berikut untuk membuat kasus dukungan dengan AWS Incident Detection and Response. 1. Pergi ke [AWS Dukungan Pusat](https://console.aws.amazon.com/support/home#/), lalu pilih **Buat kasus**, seperti yang ditunjukkan pada contoh berikut: ![\[AWS Contoh Support Center.\]](http://docs.aws.amazon.com/id_id/IDR/latest/userguide/images/workload-change-request1.png) 1. Pilih **Teknis**. 1. Untuk **Layanan**, pilih **Deteksi dan Respons Insiden**. 1. Untuk **Kategori**, pilih **Permintaan perubahan beban kerja**. 1. Untuk **Keparahan**, pilih **Panduan Umum**. 1. Masukkan **Subjek** untuk perubahan ini. Contoh: Deteksi dan Respons Insiden AWS - *workload\$1name* 1. Masukkan **Deskripsi** untuk perubahan ini. Misalnya, masukkan “Permintaan ini untuk perubahan pada beban kerja yang ada yang terhubung ke AWS Incident Detection and Response”. Pastikan Anda menyertakan informasi berikut dalam permintaan Anda: + **Nama beban kerja: Nama** beban kerja Anda. + **ID Akun:** ID1,, ID2 ID3, dan sebagainya. + **Rincian perubahan:** Masukkan detail untuk perubahan yang Anda minta. 1. Di bagian **Kontak tambahan - opsional**, masukkan email apa pun IDs yang ingin Anda terima korespondensi tentang perubahan ini. Berikut ini adalah contoh **Kontak tambahan - bagian opsional**. ![\[Masukkan kontak di bagian Kontak tambahan yang disorot - opsional.\]](http://docs.aws.amazon.com/id_id/IDR/latest/userguide/images/workload-change-request2.png) **penting** Kegagalan untuk menambahkan email IDs di bagian **Kontak tambahan - opsional** mungkin menunda proses perubahan. 1. Pilih **Kirim**. Setelah mengirimkan permintaan perubahan, Anda dapat menambahkan email tambahan dari organisasi Anda. Untuk menambahkan email, pilih **Balas** dalam **detail Kasus**, seperti yang ditunjukkan pada contoh berikut: ![\[Halaman Detail yang menampilkan tombol Balas disorot.\]](http://docs.aws.amazon.com/id_id/IDR/latest/userguide/images/workload-change-request3.png) Kemudian, tambahkan email IDs di bagian **Kontak tambahan - opsional**. Berikut ini adalah contoh halaman **Balas** yang menunjukkan di mana Anda dapat memasukkan email tambahan. ![\[Halaman Balas tempat Anda dapat menambahkan email tambahan.\]](http://docs.aws.amazon.com/id_id/IDR/latest/userguide/images/workload-change-request4.png) # Menekan alarm agar tidak melibatkan Deteksi dan Respons Insiden Tentukan alarm beban kerja onboard mana yang terhubung dengan AWS Incident Detection and Response monitoring dengan menekannya sementara atau sesuai jadwal. Misalnya, Anda dapat menekan sementara alarm beban kerja selama pemeliharaan yang direncanakan untuk mencegah alarm terlibat Deteksi dan Respons Insiden. Atau, Anda dapat menekan alarm pada jadwal jika Anda memiliki aktivitas reboot harian. Anda dapat menekan alarm di sumber alarm, seperti Amazon CloudWatch, atau Anda dapat mengirimkan permintaan perubahan beban kerja. **Topics** + [Menekan alarm di sumber alarm](suppress-alarms-at-source.md) + [Kirim permintaan perubahan beban kerja untuk menekan alarm](suppress-alarms-at-source-wcr.md) + [Tutorial: Gunakan fungsi matematika metrik untuk menekan alarm](suppress-alarms-tutorial-suppress.md) + [Tutorial: Hapus fungsi matematika metrik untuk menghapus alarm](suppress-alarms-tutorial-unsuppress.md) # Menekan alarm di sumber alarm Tentukan alarm mana yang terlibat dengan Deteksi dan Respons Insiden dan kapan mereka melakukannya dengan menekan alarm di sumber alarm. **Topics** + [Gunakan fungsi matematika metrik untuk menekan alarm CloudWatch](#suppress-alarms-at-source-cw) + [Hapus fungsi matematika metrik untuk menghapus alarm CloudWatch](#suppress-alarms-metric-math-unsuppress) + [Contoh fungsi matematika metrik dan kasus penggunaan terkait](#suppress-alarms-example-functions) + [Menekan alarm dari APM pihak ketiga](#suppress-alarms-third-party-apm) ## Gunakan fungsi matematika metrik untuk menekan alarm CloudWatch Untuk menekan Deteksi Insiden dan pemantauan Respons CloudWatch alarm Amazon, gunakan [fungsi matematika metrik](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/using-metric-math.html) untuk menghentikan CloudWatch alarm memasuki `ALARM` status selama jendela yang ditentukan. **catatan** Menonaktifkan **tindakan Alarm** pada CloudWatch alarm tidak menekan pemantauan alarm Anda dengan Deteksi dan Respons Insiden. Perubahan status alarm dicerna melalui Amazon EventBridge, bukan melalui tindakan CloudWatch alarm. Untuk menggunakan fungsi matematika metrik untuk menekan CloudWatch alarm, selesaikan langkah-langkah berikut: 1. Masuk ke Konsol Manajemen AWS dan buka CloudWatch konsol di [https://console.aws.amazon.com/cloudwatch/](https://console.aws.amazon.com/cloudwatch/). 1. Pilih **Alarm**, lalu cari alarm yang ingin Anda tambahkan fungsi matematika metrik. 1. Pilih **Tindakan**, lalu pilih **Edit** untuk mengubah alarm. 1. Pilih **Edit metrik** untuk mengubah metrik alarm. 1. Pilih **Tambahkan matematika**, **Mulai dengan ekspresi kosong**. 1. Masukkan ekspresi matematika Anda, lalu pilih **Terapkan**. 1. Hapus pilihan metrik yang ada yang dipantau alarm. 1. Pilih ekspresi yang baru saja Anda buat, lalu **pilih Pilih metrik**. 1. Pilih **Lewati ke Pratinjau dan buat**. 1. Tinjau perubahan Anda untuk memastikan bahwa fungsi matematika metrik Anda diterapkan seperti yang diharapkan, lalu pilih **Perbarui alarm**. Untuk contoh langkah demi langkah menekan CloudWatch alarm dengan fungsi matematika metrik, lihat[Tutorial: Gunakan fungsi matematika metrik untuk menekan alarm](suppress-alarms-tutorial-suppress.md). Untuk informasi selengkapnya tentang sintaks dan fungsi yang tersedia, lihat [Sintaks dan fungsi matematika metrik](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/using-metric-math.html#metric-math-syntax) di * CloudWatch Panduan Pengguna Amazon*. ## Hapus fungsi matematika metrik untuk menghapus alarm CloudWatch Hapus CloudWatch alarm dengan menghapus fungsi matematika metrik. Untuk menghapus fungsi matematika metrik dari alarm, selesaikan langkah-langkah berikut: 1. Masuk ke Konsol Manajemen AWS dan buka CloudWatch konsol di [https://console.aws.amazon.com/cloudwatch/](https://console.aws.amazon.com/cloudwatch/). 1. Pilih **Alarm**, lalu cari alarm atau alarm tempat Anda ingin menghapus ekspresi matematika metrik. 1. Di bagian matematika metrik, pilih **Edit**. 1. Untuk menghapus metrik dari alarm, pilih **Edit** pada metrik, lalu pilih tombol **x** di sebelah ekspresi matematika metrik. 1. Pilih metrik asli, lalu pilih **Pilih metrik**. 1. Pilih **Lewati ke Pratinjau dan buat**. 1. Tinjau perubahan Anda untuk memastikan bahwa fungsi matematika metrik Anda diterapkan seperti yang diharapkan, lalu pilih **Perbarui alarm**. ## Contoh fungsi matematika metrik dan kasus penggunaan terkait Tabel berikut berisi contoh fungsi matematika metrik, bersama dengan kasus penggunaan terkait dan penjelasan dari setiap komponen metrik. | Fungsi matematika metrik | Kasus penggunaan | Penjelasan | | --- | --- | --- | | `IF((DAY(m1) == 2 && HOUR(m1) >= 1 && HOUR(m1) < 3), 0, m1)` | Menekan alarm antara 1:00 hingga 3:00 AM UTC setiap hari Selasa dengan mengganti titik data nyata dengan 0 selama jendela ini. | [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/id_id/IDR/latest/userguide/suppress-alarms-at-source.html) | | `IF((HOUR(m1) >= 23 \|\| HOUR(m1) < 4), 0, m1)` | Menekan alarm antara 11:00 PM hingga 4:00 AM UTC, setiap hari dengan mengganti titik data nyata dengan 0 selama jendela ini. | [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/id_id/IDR/latest/userguide/suppress-alarms-at-source.html) | | `IF((HOUR(m1) >= 11 && HOUR(m1) < 13), 0, m1) ` | Menekan alarm antara 11:00 AM hingga 1:00 PM UTC setiap hari dengan mengganti titik data nyata dengan 0 selama jendela ini. | [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/id_id/IDR/latest/userguide/suppress-alarms-at-source.html) | | `IF((DAY(m1) == 2 && HOUR(m1) >= 1 && HOUR(m1) < 3), 99, m1)` | Menekan alarm antara 1:00 hingga 3:00 AM UTC setiap hari Selasa dengan mengganti titik data nyata dengan 99 selama jendela ini. | [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/id_id/IDR/latest/userguide/suppress-alarms-at-source.html) | | `IF((HOUR(m1) >= 23 \|\| HOUR(m1) < 4), 100, m1)` | Menekan alarm antara 11:00 PM hingga 4:00 AM UTC, setiap hari dengan mengganti titik data nyata dengan 100 selama jendela ini. | [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/id_id/IDR/latest/userguide/suppress-alarms-at-source.html) | | `IF((HOUR(m1) >= 11 && HOUR(m1) < 13), 99, m1) ` | Menekan alarm antara 11:00 AM hingga 1:00 PM UTC setiap hari dengan mengganti titik data nyata dengan 99 selama jendela ini. | [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/id_id/IDR/latest/userguide/suppress-alarms-at-source.html) | ## Menekan alarm dari APM pihak ketiga Lihat dokumentasi vendor APM pihak ketiga Anda untuk petunjuk tentang cara menekan alarm. Contoh vendor APM pihak ketiga adalah New Relic, Splunk, Dynatrace, Datadog, dan. SumoLogic # Kirim permintaan perubahan beban kerja untuk menekan alarm Jika Anda tidak dapat menekan alarm di sumber seperti yang dijelaskan di bagian sebelumnya, kirimkan Permintaan Perubahan Beban Kerja untuk menginstruksikan Deteksi dan Respons Insiden untuk secara manual menekan pemantauan sebagian atau semua alarm beban kerja Anda. Untuk petunjuk mendetail tentang cara membuat Permintaan Perubahan Beban Kerja, lihat [Meminta perubahan ke beban kerja onboard di Deteksi dan Respons Insiden](https://docs.aws.amazon.com/IDR/latest/userguide/idr-workloads-change-request.html). Saat menaikkan Permintaan Perubahan Beban Kerja untuk meminta penindasan alarm Anda, pastikan Anda memberikan informasi yang diperlukan berikut + **Nama beban kerja: Nama** beban kerja Anda. + **ID Akun:** ID1,, ID2 ID3, dan sebagainya. + **Ubah detail:** Penindasan Alarm + **Waktu mulai penindasan:** Tanggal, waktu, dan zona waktu. + **Waktu akhir penindasan:** Tanggal, waktu, dan zona waktu. + **Alarm untuk ditekan:** Daftar CloudWatch alarm ARNs atau pengidentifikasi acara APM pihak ketiga untuk ditekan. Setelah membuat Permintaan Perubahan Beban Kerja penekanan alarm, Anda menerima pemberitahuan berikut dari Deteksi dan Respons Insiden: + Pengakuan Permintaan Perubahan Beban Kerja Anda. + Pemberitahuan saat alarm ditekan. + Pemberitahuan saat alarm diaktifkan kembali untuk pemantauan. # Tutorial: Gunakan fungsi matematika metrik untuk menekan alarm Tutorial berikut memandu Anda melalui cara menekan CloudWatch alarm menggunakan matematika metrik. **Contoh skenario** Ada kegiatan yang direncanakan yang berlangsung antara 1:00 hingga 3:00 AM UTC pada hari Selasa mendatang. Anda ingin membuat fungsi matematika CloudWatch metrik yang menggantikan titik data nyata selama waktu ini, dengan 0 (titik data yang berada di bawah ambang batas yang ditetapkan). 1. Nilai kriteria yang menyebabkan alarm Anda terpicu. Screenshot berikut memberikan contoh kriteria alarm: ![\[CloudWatch layar yang menampilkan detail alarm.\]](http://docs.aws.amazon.com/id_id/IDR/latest/userguide/images/metric-math-assess-alarm-criteria.png) Alarm yang ditampilkan pada tangkapan layar sebelumnya memonitor `UnHealthyHostCount` metrik untuk grup target Application Load Balancer. Alarm ini memasuki `ALARM` keadaan ketika `UnHealthyHostCount` metrik lebih besar dari atau sama dengan 3 untuk 5 dari 5 titik data. Alarm memperlakukan data yang hilang sebagai hal yang buruk (melanggar ambang batas yang dikonfigurasi). 1. Buat fungsi matematika metrik. Dalam contoh ini, kegiatan yang direncanakan berlangsung antara pukul 1:00 hingga 3:00 UTC pada hari Selasa mendatang. Jadi, buat fungsi matematika CloudWatch metrik yang menggantikan titik data nyata selama waktu ini, dengan 0 (titik data yang berada di bawah ambang batas yang ditetapkan). Perhatikan bahwa titik data pengganti yang harus Anda konfigurasikan berbeda tergantung pada konfigurasi alarm Anda. Misalnya, jika Anda memiliki alarm yang memantau tingkat keberhasilan HTTP, dengan ambang kurang dari 98, maka ganti titik data nyata Anda selama aktivitas yang direncanakan dengan nilai di atas ambang batas yang dikonfigurasi, 100. Berikut ini adalah contoh fungsi matematika metrik untuk skenario ini. ``` IF((DAY(m1) == 2 && HOUR(m1) >= 1 && HOUR(m1) < 3), 0, m1) ``` Fungsi matematika metrik sebelumnya berisi elemen-elemen berikut: + **HARI (m1) == 2**: Memastikan hari Selasa (Senin = 1, Minggu = 7). + **JAM (m1) >= 1 && JAM (m1) < 3**: Menentukan rentang waktu dari 1 AM sampai 3 AM UTC. + **IF (condition, value\$1if\$1true, value\$1if\$1false)**: Jika kondisi benar, fungsi menggantikan nilai metrik dengan 0. Jika tidak, nilai asli (m1) dikembalikan. Untuk informasi tambahan tentang sintaks dan fungsi yang tersedia, lihat [Sintaks dan fungsi matematika metrik](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/using-metric-math.html#metric-math-syntax) di Panduan Pengguna *Amazon CloudWatch * 1. Masuk ke Konsol Manajemen AWS dan buka CloudWatch konsol di [https://console.aws.amazon.com/cloudwatch/](https://console.aws.amazon.com/cloudwatch/). 1. Pilih **Alarm**, lalu cari alarm yang ingin Anda tambahkan fungsi matematika metrik. 1. Di bagian matematika metrik, pilih **Edit**. 1. Pilih **Tambahkan matematika**, **Mulai dengan ekspresi kosong**. 1. Masukkan ekspresi matematika Anda, lalu pilih **Terapkan**. Metrik yang ada yang dipantau alarm secara otomatis menjadi **m1** dan ekspresi matematika Anda adalah **e1**, seperti yang ditunjukkan pada contoh berikut: ![\[CloudWatch layar yang menampilkan ekspresi matematika metrik.\]](http://docs.aws.amazon.com/id_id/IDR/latest/userguide/images/metric-math-expression.png) 1. (Opsional) Edit label ekspresi matematika metrik untuk membantu orang lain memahami fungsinya dan mengapa itu dibuat, seperti yang ditunjukkan pada contoh berikut: ![\[CloudWatch layar yang menampilkan pengeditan label ekspresi kecocokan metrik.\]](http://docs.aws.amazon.com/id_id/IDR/latest/userguide/images/metric-math-edit-label.png) 1. **Hapus pilihan **m1**, pilih **e1**, lalu pilih Pilih metrik.** Ini menyetel alarm untuk memantau ekspresi matematika alih-alih metrik yang mendasarinya secara langsung. 1. Pilih **Lewati ke Pratinjau dan buat**. 1. Validasi bahwa alarm dikonfigurasi seperti yang diharapkan, lalu pilih **Perbarui alarm untuk menyimpan perubahan**. Dalam contoh sebelumnya, tanpa fungsi matematika metrik yang diterapkan, `UnHealthyHostCount` metrik sebenarnya akan dilaporkan selama aktivitas yang direncanakan. Ini akan mengakibatkan CloudWatch alarm memasuki `ALARM` status dan melibatkan Deteksi dan Respons Insiden, seperti yang ditunjukkan pada contoh berikut: ![\[CloudWatch layar yang menampilkan titik data yang mengarah ke keadaan alarm.\]](http://docs.aws.amazon.com/id_id/IDR/latest/userguide/images/metric-math-example-alarm-state.png) Dengan fungsi matematika metrik di tempat, titik data nyata diganti dengan 0 selama aktivitas, dan alarm tetap dalam `OK` status, menekan keterlibatan Deteksi Insiden dan Respons. ![\[CloudWatch layar yang menampilkan titik data tanpa status alarm.\]](http://docs.aws.amazon.com/id_id/IDR/latest/userguide/images/metric-math-datapoints-no-alarm.png) # Tutorial: Hapus fungsi matematika metrik untuk menghapus alarm Jika Anda menekan CloudWatch alarm untuk aktivitas satu kali, hapus fungsi matematika metrik dari alarm setelah aktivitas selesai untuk melanjutkan pemantauan alarm secara teratur. Untuk menekan alarm pada jadwal reguler, misalnya, jika Anda memiliki rutinitas penambalan mingguan terjadwal yang menghasilkan reboot instance pada hari dan waktu yang sama setiap minggu, maka biarkan fungsi matematika metrik di tempatnya. Tutorial berikut memandu Anda melalui cara menghapus fungsi matematika metrik untuk menghapus alarm CloudWatch 1. Masuk ke Konsol Manajemen AWS dan buka CloudWatch konsol di [https://console.aws.amazon.com/cloudwatch/](https://console.aws.amazon.com/cloudwatch/). 1. Pilih **Alarm**, lalu cari alarm yang ingin Anda tambahkan fungsi matematika metrik. 1. Di bagian matematika metrik, pilih **Edit**. 1. Untuk menghapus penekanan dari alarm, pilih tombol **x** di sebelah ekspresi matematika metrik. ![\[CloudWatch layar yang menampilkan tombol x untuk menghapus fungsi matematika metrik.\]](http://docs.aws.amazon.com/id_id/IDR/latest/userguide/images/metric-math-unsuppress.png) 1. Pilih metrik untuk melanjutkan pemantauan metrik sebenarnya. lalu **pilih Pilih** metrik. ![\[CloudWatch layar yang menampilkan tombol Pilih metrik.\]](http://docs.aws.amazon.com/id_id/IDR/latest/userguide/images/metric-math-unsuppress-2.png) 1. Pilih **Lewati ke Pratinjau dan buat**. 1. Validasi bahwa alarm dikonfigurasi seperti yang diharapkan, lalu pilih **Perbarui alarm untuk menyimpan perubahan**. # Lepas beban kerja dari Deteksi dan Respons Insiden Untuk melepaskan beban kerja dari AWS Incident Detection and Response, buat kasus dukungan baru untuk setiap beban kerja. Saat Anda membuat kasus dukungan, ingatlah hal berikut: + Untuk melepaskan beban kerja yang ada dalam satu AWS akun, buat kasus dukungan baik dari akun beban kerja atau dari akun pembayar Anda. + **Untuk melepaskan beban kerja yang mencakup beberapa AWS akun, buat kasus dukungan dari akun pembayar Anda.** Di badan kasus dukungan, daftarkan semua akun IDs ke offboard. **penting** Jika Anda membuat kasus dukungan untuk melepaskan beban kerja dari akun yang salah, Anda mungkin mengalami penundaan dan permintaan informasi tambahan sebelum beban kerja Anda dapat diturunkan. **Permintaan untuk melepaskan beban kerja** 1. Pergi ke [AWS Dukungan Pusat](https://console.aws.amazon.com/support/home#/), lalu pilih **Buat kasus**. 1. Pilih **Teknis**. 1. Untuk **Layanan**, pilih **Deteksi dan Respons Insiden**. 1. Untuk **Kategori**, pilih **Workload Offboarding**. 1. Untuk **Keparahan**, pilih **Panduan Umum**. 1. Masukkan **Subjek** untuk perubahan ini. Contoh: [Offboard] Deteksi dan Respons Insiden AWS - *workload\$1name* 1. Masukkan **Deskripsi** untuk perubahan ini. Misalnya, masukkan “Permintaan ini untuk offboarding beban kerja yang ada yang terhubung ke AWS Incident Detection and Response”. Pastikan Anda menyertakan informasi berikut dalam permintaan Anda: + **Nama beban kerja: Nama** beban kerja Anda. + **ID Akun:** ID1,, ID2 ID3, dan sebagainya. + **Alasan offboarding:** Berikan alasan untuk melepaskan beban kerja. 1. Di bagian **Kontak tambahan - opsional**, masukkan email apa pun IDs yang ingin Anda terima korespondensi tentang permintaan offboarding ini. 1. Pilih **Kirim**.