Configurar a verificação de integridade do Route 53 para endpoints globais do EventBridge - Amazon EventBridge

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Configurar a verificação de integridade do Route 53 para endpoints globais do EventBridge

Ao usar endpoints globais, você precisa fazer uma verificação de integridade do Route 53 para monitorar o status de suas regiões. O modelo a seguir define um alarme do Amazon CloudWatch e o usa para definir uma verificação de integridade do Route 53.

Modelo do CloudFormation para definir uma verificação de integridade do Route 53

Use o modelo a seguir para definir sua verificações de integridade do Route 53.

Description: |- Global endpoints health check that will fail when the average Amazon EventBridge latency is above 30 seconds for a duration of 5 minutes. Note, missing data will cause the health check to fail, so if you only send events intermittently, consider changing the heath check to use a longer evaluation period or instead treat missing data as 'missing' instead of 'breaching'. Metadata: AWS::CloudFormation::Interface: ParameterGroups: - Label: default: "Global endpoint health check alarm configuration" Parameters: - HealthCheckName - HighLatencyAlarmPeriod - MinimumEvaluationPeriod - MinimumThreshold - TreatMissingDataAs ParameterLabels: HealthCheckName: default: Health check name HighLatencyAlarmPeriod: default: High latency alarm period MinimumEvaluationPeriod: default: Minimum evaluation period MinimumThreshold: default: Minimum threshold TreatMissingDataAs: default: Treat missing data as Parameters: HealthCheckName: Description: Name of the health check Type: String Default: LatencyFailuresHealthCheck HighLatencyAlarmPeriod: Description: The period, in seconds, over which the statistic is applied. Valid values are 10, 30, 60, and any multiple of 60. MinValue: 10 Type: Number Default: 60 MinimumEvaluationPeriod: Description: The number of periods over which data is compared to the specified threshold. You must have at least one evaluation period. MinValue: 1 Type: Number Default: 5 MinimumThreshold: Description: The value to compare with the specified statistic. Type: Number Default: 30000 TreatMissingDataAs: Description: Sets how this alarm is to handle missing data points. Type: String AllowedValues: - breaching - notBreaching - ignore - missing Default: breaching Mappings: "InsufficientDataMap": "missing": "HCConfig": "LastKnownStatus" "breaching": "HCConfig": "Unhealthy" Resources: HighLatencyAlarm: Type: AWS::CloudWatch::Alarm Properties: AlarmDescription: High Latency in Amazon EventBridge MetricName: IngestionToInvocationStartLatency Namespace: AWS/Events Statistic: Average Period: !Ref HighLatencyAlarmPeriod EvaluationPeriods: !Ref MinimumEvaluationPeriod Threshold: !Ref MinimumThreshold ComparisonOperator: GreaterThanThreshold TreatMissingData: !Ref TreatMissingDataAs LatencyHealthCheck: Type: AWS::Route53::HealthCheck Properties: HealthCheckTags: - Key: Name Value: !Ref HealthCheckName HealthCheckConfig: Type: CLOUDWATCH_METRIC AlarmIdentifier: Name: Ref: HighLatencyAlarm Region: !Ref AWS::Region InsufficientDataHealthStatus: !FindInMap [InsufficientDataMap, !Ref TreatMissingDataAs, HCConfig] Outputs: HealthCheckId: Description: The identifier that Amazon Route 53 assigned to the health check when you created it. Value: !GetAtt LatencyHealthCheck.HealthCheckId

Os IDs de eventos podem mudar nas chamadas de API. Portanto, correlacionar eventos entre regiões exige que exista um identificador exclusivo e imutável. Os consumidores também devem ser projetados com a idempotência em mente. Dessa forma, se estiver replicando eventos ou reproduzindo-os de arquivos, não haverá efeitos colaterais do processamento dos eventos nas duas regiões.

Propriedades do modelo de alarmes do CloudWatch

nota

Para todos os campos editable, considere seu throughput por segundo. Se só envia eventos de forma intermitente, considere alterar a verificação de integridade para usar um período de avaliação mais longo ou, em vez disso, tratar os dados ausentes como se fossem missing em vez de breaching.

As seguintes propriedades são usadas na seção de alarme do CloudWatch do modelo:

Métrica Descrição

AlarmDescription

A descrição do alarme.

Padrão: High Latency in Amazon EventBridge

MetricName

O nome da métrica associada ao alarme. Isso é necessário para um alarme com base em uma métrica. Para um alarme com base em uma expressão matemática, use Metrics, e você não pode especificar MetricName.

Padrão: IngestionToInvocationStartLatency

Namespace

O namespace da métrica associada ao alarme. Isso é necessário para um alarme com base em uma métrica. Para um alarme com base em uma expressão matemática, não é possível especificar Namespace, em vez disso, use Metrics.

Padrão: AWS/Events

Statistic

A estatística da métrica associada ao alarme, diferente do percentil.

Padrão: médio

Period

O período, em segundos, durante o qual a estatística é aplicada. Isso é necessário para um alarme com base em uma métrica. Os valores válidos são 10, 30, 60 e qualquer múltiplo de 60.

Padrão: 60

EvaluationPeriods

O número de períodos com os quais os dados são comparados ao limite especificado. Se você estiver configurando um alarme que exija que vários pontos de dados consecutivos estejam em violação para acionar o alarme, esse valor especificará esse número. Se você estiver definindo um alarme “M de N”, esse valor será o N e DatapointsToAlarm será o M.

Padrão: 5

Threshold

O valor para comparar com a estatística especificada.

Padrão: 30,000

ComparisonOperator

A operação aritmética a ser usada ao comparar a estatística e o limite especificados. O valor da estatística especificada é usado como o primeiro operando.

Padrão: GreaterThanThreshold

TreatMissingData

Define como esse alerta deve lidar com pontos de dados ausentes.

Valores válidos: breaching, notBreaching, ignore e missing

Padrão: breaching

Propriedades do modelo de verificações de integridade do Route 53

nota

Para todos os campos editable, considere seu throughput por segundo. Se só envia eventos de forma intermitente, considere alterar a verificação de integridade para usar um período de avaliação mais longo ou, em vez disso, tratar os dados ausentes como se fossem missing em vez de breaching.

As seguintes propriedades são usadas na seção de verificação de integridade do Route 53 do modelo:

Métrica Descrição

HealthCheckName

O nome da verificação de integridade.

Padrão: LatencyFailuresHealthCheck

InsufficientDataHealthStatus

Quando o CloudWatch tem dados insuficientes sobre a métrica para determinar o estado do alarme, o status que você deseja que o Amazon Route 53 atribua à verificação de integridade

Valores válidos:

  • Healthy: o Route 53 considera a verificação de integridade como íntegra.

  • Unhealthy: o Route 53 considera a verificação de integridade como não íntegra.

  • LastKnownStatus: o Route 53 usa o status da verificação de integridade obtido na última vez em que o CloudWatch apresentou dados suficientes para determinar o estado do alarme. Para novas verificações de integridade que não têm último status conhecido, o status padrão indicará a integridade como íntegra.

Padrão: não íntegro

nota

Este campo é atualizado com base na entrada do campo TreatMissingData. If TreatingMissingData for definido como Missing, será atualizado para LastKnownStatus. Se TreatingMissingData for definido como Breaching, será atualizado para Unhealthy.