

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Noções básicas da disponibilidade
<a name="understanding-availability"></a>

 A disponibilidade é uma das principais formas de medir quantitativamente a resiliência. Definimos disponibilidade, *A*, como a porcentagem de tempo em que uma workload está disponível para uso. É uma proporção entre o “tempo de atividade” esperado (disponibilidade) e o tempo total medido (o “tempo de atividade” esperado mais o “tempo de inatividade” esperado). 

![Imagem da equação. A = tempo de atividade/(tempo de atividade + tempo de inatividade)](http://docs.aws.amazon.com/pt_br/whitepapers/latest/availability-and-beyond-improving-resilience/images/availability.png)


 Para entender melhor essa fórmula, veremos como medir o tempo de atividade e o tempo de inatividade. Primeiro, queremos saber quanto tempo a workload durará sem falhas. Chamamos isso de *tempo médio entre falhas* (MTBF), o tempo médio entre o início da operação normal de uma workload e sua próxima falha. Então, queremos saber quanto tempo levará para se recuperar após a falha. 

 Chamamos isso de *tempo médio de reparo (ou recuperação)* (MTTR), um período em que a workload não está disponível enquanto o subsistema com defeito é reparado ou retornado ao serviço. Um período de tempo importante no MTTR é o *tempo médio de detecção* (MTTD), a quantidade de tempo entre a ocorrência de uma falha e o início das operações de reparo. O diagrama a seguir demonstra como todas essas métricas estão relacionadas. 

![Diagrama mostrando a relação entre MTTD, MTTR e MTBF](http://docs.aws.amazon.com/pt_br/whitepapers/latest/availability-and-beyond-improving-resilience/images/availability-metrics.png)


 Assim, podemos expressar disponibilidade, *A*, usando MTBF, quando a workload está alta, e MTTR, quando a workload está inativa. 

![Imagem da equação. A = MTBF / ( MTBF + MTTR)](http://docs.aws.amazon.com/pt_br/whitepapers/latest/availability-and-beyond-improving-resilience/images/equation2.png)


 E a probabilidade de a workload estar “inativa” (ou seja, não disponível) é a probabilidade de falha, *F*. 

![Imagem da equação. F = 1 - A](http://docs.aws.amazon.com/pt_br/whitepapers/latest/availability-and-beyond-improving-resilience/images/equation3.png)


[Confiabilidade](https://docs.aws.amazon.com/wellarchitected/latest/reliability-pillar/reliability.html) é a capacidade de uma workload fazer a coisa certa, quando solicitada, dentro do tempo de resposta especificado. É isso que a disponibilidade mede. Ter uma workload falhar com menos frequência (MTBF mais longo) ou ter um tempo de reparo mais curto (MTTR mais curto) melhora sua disponibilidade. 

**Rule1**  
Falhas menos frequentes (MTBF mais longo), tempos de detecção de falhas mais curtos (MTTD mais curto) e tempos de reparo mais curtos (MTTR mais curto) são os três fatores usados para melhorar a disponibilidade em sistemas distribuídos. 

**Topics**
+ [Disponibilidade do sistema distribuído](distributed-system-availability.md)
+ [Disponibilidade com dependências](availability-with-dependencies.md)
+ [Disponibilidade com redundância](availability-with-redundancy.md)
+ [Teorema CAP](cap-theorem.md)
+ [Tolerância a falhas e isolamento de falhas](fault-tolerance-and-fault-isolation.md)