Modelo do CloudFormation para definir uma verificação de integridade do Route 53 propriedades dos alarmes do CloudWatch propriedades da verificação de integridade do Route 53

Configurar a verificação de integridade do Route 53 para endpoints globais do EventBridge

Ao usar endpoints globais, você precisa fazer uma verificação de integridade do Route 53 para monitorar o status de suas regiões. O modelo a seguir define um alarme do Amazon CloudWatch e o usa para definir uma verificação de integridade do Route 53.

Tópicos

Modelo do CloudFormation para definir uma verificação de integridade do Route 53
Propriedades do modelo de alarmes do CloudWatch
Propriedades do modelo de verificações de integridade do Route 53

Modelo do CloudFormation para definir uma verificação de integridade do Route 53

Use o modelo a seguir para definir sua verificações de integridade do Route 53.


Description: |-
  Global endpoints health check that will fail when the average Amazon EventBridge 
  latency is above 30 seconds for a duration of 5 minutes. Note, missing data will 
  cause the health check to fail, so if you only send events intermittently, consider 
  changing the heath check to use a longer evaluation period or instead treat missing 
  data as 'missing' instead of 'breaching'.

Metadata:
  AWS::CloudFormation::Interface:
    ParameterGroups: 
      - Label: 
          default: "Global endpoint health check alarm configuration"
        Parameters:
          - HealthCheckName
          - HighLatencyAlarmPeriod
          - MinimumEvaluationPeriod
          - MinimumThreshold
          - TreatMissingDataAs
    ParameterLabels:
      HealthCheckName:
        default: Health check name
      HighLatencyAlarmPeriod:
        default: High latency alarm period
      MinimumEvaluationPeriod:
        default: Minimum evaluation period
      MinimumThreshold:
        default: Minimum threshold
      TreatMissingDataAs:
        default: Treat missing data as

Parameters:
  HealthCheckName:
    Description: Name of the health check
    Type: String
    Default: LatencyFailuresHealthCheck
  HighLatencyAlarmPeriod:
    Description: The period, in seconds, over which the statistic is applied. Valid values are 10, 30, 60, and any multiple of 60.
    MinValue: 10
    Type: Number
    Default: 60
  MinimumEvaluationPeriod:
    Description: The number of periods over which data is compared to the specified threshold. You must have at least one evaluation period.
    MinValue: 1
    Type: Number
    Default: 5
  MinimumThreshold:
    Description: The value to compare with the specified statistic.
    Type: Number
    Default: 30000
  TreatMissingDataAs:
    Description: Sets how this alarm is to handle missing data points.
    Type: String
    AllowedValues:
      - breaching
      - notBreaching
      - ignore
      - missing
    Default: breaching  

Mappings:
  "InsufficientDataMap":
    "missing":
      "HCConfig": "LastKnownStatus"
    "breaching":
      "HCConfig": "Unhealthy"  

Resources:
  HighLatencyAlarm:
      Type: AWS::CloudWatch::Alarm
      Properties:
        AlarmDescription: High Latency in Amazon EventBridge
        MetricName: IngestionToInvocationStartLatency
        Namespace: AWS/Events
        Statistic: Average
        Period: !Ref HighLatencyAlarmPeriod
        EvaluationPeriods: !Ref MinimumEvaluationPeriod
        Threshold: !Ref MinimumThreshold
        ComparisonOperator: GreaterThanThreshold
        TreatMissingData: !Ref TreatMissingDataAs

  LatencyHealthCheck:
      Type: AWS::Route53::HealthCheck
      Properties:
        HealthCheckTags:
          - Key: Name
            Value: !Ref HealthCheckName
        HealthCheckConfig:
          Type: CLOUDWATCH_METRIC
          AlarmIdentifier:
            Name:
              Ref: HighLatencyAlarm
            Region: !Ref AWS::Region
          InsufficientDataHealthStatus: !FindInMap [InsufficientDataMap, !Ref TreatMissingDataAs, HCConfig]

Outputs:
  HealthCheckId:
    Description: The identifier that Amazon Route 53 assigned to the health check when you created it.
    Value: !GetAtt LatencyHealthCheck.HealthCheckId

Os IDs de eventos podem mudar nas chamadas de API. Portanto, correlacionar eventos entre regiões exige que exista um identificador exclusivo e imutável. Os consumidores também devem ser projetados com a idempotência em mente. Dessa forma, se estiver replicando eventos ou reproduzindo-os de arquivos, não haverá efeitos colaterais do processamento dos eventos nas duas regiões.

Propriedades do modelo de alarmes do CloudWatch

nota

Para todos os campos editable, considere seu throughput por segundo. Se só envia eventos de forma intermitente, considere alterar a verificação de integridade para usar um período de avaliação mais longo ou, em vez disso, tratar os dados ausentes como se fossem missing em vez de breaching.

As seguintes propriedades são usadas na seção de alarme do CloudWatch do modelo:

Métrica	Descrição
`AlarmDescription`	A descrição do alarme. Padrão: `High Latency in Amazon EventBridge`
`MetricName`	O nome da métrica associada ao alarme. Isso é necessário para um alarme com base em uma métrica. Para um alarme com base em uma expressão matemática, use `Metrics`, e você não pode especificar `MetricName`. Padrão: IngestionToInvocationStartLatency
`Namespace`	O namespace da métrica associada ao alarme. Isso é necessário para um alarme com base em uma métrica. Para um alarme com base em uma expressão matemática, não é possível especificar `Namespace`, em vez disso, use `Metrics`. Padrão: `AWS/Events`
`Statistic`	A estatística da métrica associada ao alarme, diferente do percentil. Padrão: médio
`Period`	O período, em segundos, durante o qual a estatística é aplicada. Isso é necessário para um alarme com base em uma métrica. Os valores válidos são 10, 30, 60 e qualquer múltiplo de 60. Padrão: `60`
`EvaluationPeriods`	O número de períodos com os quais os dados são comparados ao limite especificado. Se você estiver configurando um alarme que exija que vários pontos de dados consecutivos estejam em violação para acionar o alarme, esse valor especificará esse número. Se você estiver definindo um alarme “M de N”, esse valor será o N e `DatapointsToAlarm` será o M. Padrão: `5`
`Threshold`	O valor para comparar com a estatística especificada. Padrão: `30,000`
`ComparisonOperator`	A operação aritmética a ser usada ao comparar a estatística e o limite especificados. O valor da estatística especificada é usado como o primeiro operando. Padrão: `GreaterThanThreshold`
`TreatMissingData`	Define como esse alerta deve lidar com pontos de dados ausentes. Valores válidos: `breaching`, `notBreaching`, `ignore` e `missing` Padrão: `breaching`

Propriedades do modelo de verificações de integridade do Route 53

nota

As seguintes propriedades são usadas na seção de verificação de integridade do Route 53 do modelo:

Métrica Descrição

Métrica	Descrição
`HealthCheckName`	O nome da verificação de integridade. Padrão: `LatencyFailuresHealthCheck`
`InsufficientDataHealthStatus`	Quando o CloudWatch tem dados insuficientes sobre a métrica para determinar o estado do alarme, o status que você deseja que o Amazon Route 53 atribua à verificação de integridade Valores válidos: `Healthy`: o Route 53 considera a verificação de integridade como íntegra. `Unhealthy`: o Route 53 considera a verificação de integridade como não íntegra. `LastKnownStatus`: o Route 53 usa o status da verificação de integridade obtido na última vez em que o CloudWatch apresentou dados suficientes para determinar o estado do alarme. Para novas verificações de integridade que não têm último status conhecido, o status padrão indicará a integridade como íntegra. Padrão: não íntegro nota Este campo é atualizado com base na entrada do campo `TreatMissingData`. If `TreatingMissingData` for definido como `Missing`, será atualizado para `LastKnownStatus`. Se `TreatingMissingData` for definido como `Breaching`, será atualizado para `Unhealthy`.

HealthCheckName

O nome da verificação de integridade.

Padrão: LatencyFailuresHealthCheck

InsufficientDataHealthStatus

Quando o CloudWatch tem dados insuficientes sobre a métrica para determinar o estado do alarme, o status que você deseja que o Amazon Route 53 atribua à verificação de integridade

Valores válidos:

Healthy: o Route 53 considera a verificação de integridade como íntegra.
Unhealthy: o Route 53 considera a verificação de integridade como não íntegra.
LastKnownStatus: o Route 53 usa o status da verificação de integridade obtido na última vez em que o CloudWatch apresentou dados suficientes para determinar o estado do alarme. Para novas verificações de integridade que não têm último status conhecido, o status padrão indicará a integridade como íntegra.

Padrão: não íntegro

nota

Este campo é atualizado com base na entrada do campo TreatMissingData. If TreatingMissingData for definido como Missing, será atualizado para LastKnownStatus. Se TreatingMissingData for definido como Breaching, será atualizado para Unhealthy.

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Práticas recomendadas

Registro em log dos barramentos de eventos