Pilar Excelência operacional - AWS Orientação prescritiva

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Pilar Excelência operacional

A excelência operacional (OE) representa a dedicação à criação de soluções de software de alta qualidade que atendam e superem consistentemente as expectativas dos usuários. O pilar de excelência operacional do AWS Well-Architected Framework engloba estratégias comprovadas para organização eficaz de equipes, design robusto de carga de trabalho, operações eficientes em grande escala e adaptação perfeita às mudanças nos requisitos ao longo do tempo. Ao aderir a esses princípios, as organizações podem garantir que seus sistemas permaneçam resilientes, com desempenho e alinhados às necessidades comerciais em evolução.

Principais áreas de foco para aplicar esse pilar ao seu ambiente de streaming de WorkSpaces aplicativos:

  • Monitoramento e observabilidade

  • Automação e DevOps

  • Procedimentos operacionais e documentação

  • Support e gerenciamento de incidentes

Organize equipes em torno dos resultados comerciais

Crie um modelo operacional alinhado à nuvem com forte compromisso de liderança, em que as metas de negócios e os principais indicadores de desempenho (KPIs) impulsionem a transformação organizacional por meio de pessoas, processos e tecnologia otimizados.

  • Estrutura da equipe. Estabeleça equipes dedicadas que se alinhem aos resultados do streaming de aplicativos. Por exemplo:

    • A equipe de gerenciamento de imagens é responsável pelo empacotamento de aplicativos e pela otimização de imagens.

    • A equipe de operações da frota gerencia a capacidade, o desempenho e o dimensionamento.

    • A equipe de experiência do usuário lida com o suporte e a satisfação do usuário final.

  • KPIs e métricas. Defina e acompanhe métricas alinhadas aos negócios, como:

    • Taxas de disponibilidade de aplicativos

    • Hora de implantar novos aplicativos

    • Custo por hora de streaming de aplicativos

  • Modelo operacional. Crie processos claros para:

    • Integração e atualizações de aplicativos

    • Gerenciamento da capacidade da frota

    • Provisionamento de acesso de usuários

    • Resposta e resolução de incidentes

Implemente a observabilidade para obter insights acionáveis

Implemente monitoramento e observabilidade abrangentes para monitorar a integridade KPIs da carga de trabalho. Esse princípio permite decisões baseadas em dados e melhorias proativas em desempenho, confiabilidade e custo.

Automatize com segurança sempre que possível

Aplique os princípios de infraestrutura como código (IaC) para automatizar todos os aspectos de suas operações de carga de trabalho. Use grades de proteção para ajudar a garantir uma execução segura e consistente e, ao mesmo tempo, reduzir a intervenção manual.

  • Automatize a criação e a configuração de imagens de WorkSpaces aplicativos usando a CLI do Image Assistant. Para obter mais informações, consulte Crie sua imagem do Amazon WorkSpaces Applications programaticamente usando as operações da CLI do Image Assistant na documentação de aplicativos. WorkSpaces

    • Instalação do aplicativo: use a CLI do Image Assistant para automatizar a instalação de aplicativos durante a criação da imagem.

    • Criação de imagem: crie imagens de WorkSpaces aplicativos de forma programática usando os comandos CLI do Image Assistant.

    • Gerenciamento de configuração: automatize a configuração das configurações padrão do aplicativo e dos parâmetros de inicialização.

  • Automatize a personalização das imagens dos WorkSpaces aplicativos. Para obter mais informações, consulte a postagem do AWS blog Criar automaticamente imagens personalizadas de WorkSpaces aplicativos do Windows.

  • Aplique o IaC para implantar a infraestrutura e os componentes do aplicativo para WorkSpaces aplicativos. Para obter mais informações, consulte a postagem do AWS blog Automação da infraestrutura e implantação de aplicativos para Amazon WorkSpaces Applications with Terraform.

  • Implemente processos automatizados para gerenciamento de frotas, incluindo:

    • Dimensionamento da frota com base na demanda. Configure políticas de escalabilidade automática para ajustar automaticamente a capacidade da frota com base nas métricas de utilização. Para obter mais informações, consulte a postagem do AWS blog Use AWS Lambda para ajustar etapas e limites de escalabilidade para aplicativos da Amazon WorkSpaces .

    • Atualizações de imagens básicas. Beneficie-se das atualizações automáticas da imagem base dos WorkSpaces aplicativos fornecida pelo AWS.

    • Otimização da capacidade. Configure limites de escalabilidade automatizados para otimizar o uso de recursos com base nos padrões de demanda.

  • Configure grades de proteção para automatizar os controles de segurança:

    • Limites máximos de tamanho da frota. Estabeleça limites superiores na capacidade da frota para evitar o excesso de provisionamento.

    • Configuração da política de escalabilidade. Implemente políticas de escalabilidade por etapas ou rastreamento de metas com limites apropriados.

    • Cotas de serviço. Use cotas AWS de serviço como limites incorporados para evitar a alocação excessiva de recursos.

    • Proteção ampliada. Configure a proteção escalável para evitar a remoção de instâncias ativas durante eventos de escalabilidade.

  • Execute testes e validação, incluindo testes de criação de imagens, frota e integração.

    • Teste do construtor de imagens:

      • Teste os aplicativos diretamente na interface do criador de imagens.

      • Verifique o lançamento e a funcionalidade do aplicativo.

      • Teste as configurações e configurações do usuário.

      • Valide a compatibilidade do aplicativo.

    • Teste de frota:

      • Teste sessões de streaming de diferentes dispositivos clientes.

      • Verifique os direitos e o acesso do usuário.

      • Valide o desempenho do aplicativo.

      • Teste a experiência do usuário em elementos e operações, como prancheta, transferência de arquivos e impressão.

    • Teste de integração:

      • Teste a autenticação baseada no Active Directory ou no SAML 2.0.

      • Teste as pastas pessoais e o armazenamento persistente.

      • Teste os direitos do aplicativo.

      • Teste o redirecionamento do dispositivo USB (se configurado).

  • Use o gerenciador de WorkSpaces aplicativos para automatizar o empacotamento e a implantação de aplicativos. Para obter mais informações, consulte a postagem do AWS blog Simplifique a integração de aplicativos com o gerenciador de aplicativos da Amazon WorkSpaces Applications.

  • Automatize a implantação de novas versões de aplicativos usando pipelines de integração contínua e entrega contínua (CI/CD). Para obter mais informações, consulte a postagem do AWS blog Screening Eagle: Optimize CI/CD and end user experience in Amazon WorkSpaces Applications.

Faça mudanças frequentes, pequenas e reversíveis

Crie cargas de trabalho escaláveis e pouco acopladas que possibilitem implantações automatizadas frequentes e de pequena escala com risco mínimo e recursos fáceis de reversão.

  • Para atualizações de imagens, use a criação de imagens versionadas e atualizações incrementais.

    • Criação de imagem versionada:

      • Crie novas imagens para cada conjunto de alterações usando um construtor de imagens.

      • Mantenha várias versões de imagem para suportar cenários de reversão.

      • Use estratégias de AWS marcação para rastrear versões e atributos de imagens.

    • Atualizações incrementais:

      • Faça pequenas alterações incrementais nos aplicativos ou nas configurações.

      • Teste minuciosamente as atualizações no criador de imagens antes de criar uma nova imagem.

      • Documente todas as alterações que você fez em cada nova versão da imagem.

  • Para atualizações da frota de controle:

    • Crie novas frotas com imagens atualizadas para testes.

    • Modifique os atributos da frota existente sem interromper as sessões ativas.

  • Estabeleça procedimentos de gerenciamento de mudanças para documentação, protocolos de teste, fluxos de trabalho de aprovação e processos de monitoramento.

    • Documentação:

      • Mantenha registros de alterações detalhados para todas as atualizações de imagem e frota.

      • Documente os procedimentos e os resultados dos testes para cada alteração.

      • Use AWS CloudTrailpara rastrear e auditar alterações na configuração.

    • Protocolos de teste:

      • Estabeleça um processo de teste abrangente para todas as mudanças.

      • Inclua testes de funcionalidade, desempenho e experiência do usuário do aplicativo.

      • Faça testes no criador de imagens antes de criar novas imagens.

      • Realize testes adicionais em frotas que não são de produção antes da implantação completa.

    • Fluxos de trabalho de aprovação:

      • Implemente um processo de aprovação para mudanças nos ambientes de produção.

      • Defina critérios para mudanças que exigem aprovação versus atualizações padrão.

      • Estabeleça funções e responsabilidades para aprovação de mudanças.

    • Monitoramento e validação:

      • Use CloudWatch a Amazon para monitorar o desempenho da frota e do aplicativo após as mudanças.

      • Configure alertas para as principais métricas para identificar rapidamente os problemas após as atualizações.

      • Realize análises pós-implementação para validar o sucesso da mudança e coletar informações.

Refine os procedimentos operacionais com frequência

Melhore continuamente os procedimentos operacionais por meio de revisões regulares, atualizações e engajamento da equipe para manter todas as partes interessadas informadas e alinhadas com as melhores práticas.

  • Gerenciamento de documentação. Mantenha a documentação atual e controlada por versão dos procedimentos de WorkSpaces aplicativos em um local central para garantir a consistência operacional e o compartilhamento de conhecimento entre as equipes.

    • Documentação necessária: mantenha a up-to-date documentação para operações críticas de WorkSpaces aplicativos para criação e gerenciamento de imagens, operações de frota e solução de problemas.

    • Revisões operacionais: monitore e analise os principais aspectos operacionais, incluindo métricas de desempenho e gerenciamento de incidentes.

  • Melhoria contínua. Melhore sistematicamente as operações dos WorkSpaces aplicativos incorporando AWS service (Serviço da AWS) atualizações, métricas operacionais e melhores práticas aprendidas em procedimentos padrão.

    • Atualizações de serviço: monitore as notas de lançamento do WorkSpaces Applications para ver novos recursos, aprimoramentos de serviços, atualizações de segurança e disponibilidade regional.

    • Melhores práticas: revise e incorpore atualizações do AWS Well-Architected Framework WorkSpaces , melhores práticas AWS de aplicativos, arquiteturas de referência e recomendações de segurança. AWS

    • Gerenciamento do conhecimento: mantenha e atualize procedimentos operacionais padrão, runbooks, guias de solução de problemas e documentação de suporte ao usuário.

Antecipe a falha

Realize testes de cenários de falha regularmente para entender os riscos, validar os procedimentos de resposta e melhorar a prontidão da equipe para lidar com incidentes reais.

  • Teste de falha. Simule e teste regularmente falhas, como esgotamento da capacidade da frota, falhas no lançamento de aplicativos e problemas de conectividade de rede.

    • Esgotamento da capacidade da frota:

      • Monitore e teste o comportamento de escalabilidade da frota ao se aproximar dos limites de capacidade.

      • Configure CloudWatch alarmes CapacityUtilization e AvailableCapacity métricas.

      • Implemente procedimentos para lidar com restrições de capacidade durante o pico de uso.

    • Falhas na inicialização do aplicativo:

      • Teste o comportamento de lançamento de aplicativos em instâncias de streaming.

      • Valide o acesso e o desempenho dos aplicativos em diferentes configurações de frota.

    • Problemas de conectividade de rede:

      • Teste o desempenho da sessão de streaming em diferentes condições de rede.

      • Monitore StreamingSessionLatency os problemas de qualidade da conexão.

      • Garanta a configuração adequada das configurações da VPC e dos grupos de segurança.

  • Procedimentos de recuperação. Desenvolva e teste procedimentos para:

    • Failover de frota entre Zonas de disponibilidade da AWS. Além disso, documente procedimentos para escalar a capacidade da frota, gerenciar atualizações da frota e responder aos problemas de saúde da instância.

    • Gerenciamento de dados do usuário:

      • Configure e teste as soluções de persistência e armazenamento de configurações de aplicativos para pastas iniciais no Amazon Simple Storage Service (Amazon S3) para frotas Windows e sistemas de arquivos compartilhados no Amazon Elastic File System (Amazon EFS) para frotas Linux.

      • Valide a sincronização de dados entre as sessões.

    • Continuidade do serviço. Mantenha procedimentos para criar novas instâncias de frota, gerenciar atualizações de imagens e lidar com desconexões de sessões.

  • Gerenciamento de riscos. Identifique e mitigue:

    • Restrições de capacidade, definindo a capacidade mínima apropriada da frota, configurando políticas de escalabilidade automática com base nos padrões de demanda e monitorando as tendências de utilização da frota usando CloudWatch métricas como, e. CapacityUtilization InUseCapacity AvailableCapacity

    • Gargalos de desempenho rastreando as principais métricas, como StreamingSessionLatency e configurando os alarmes apropriados. CloudWatch

Aprenda com todos os eventos e métricas operacionais

Promova uma cultura de melhoria contínua compartilhando lições aprendidas com eventos operacionais e falhas em toda a organização. Enfatize seu impacto nos resultados comerciais.

  • Análise de eventos. Documente e analise as interrupções do serviço, a degradação do desempenho, as reclamações dos usuários e os problemas de capacidade.

  • Revisão de métricas. Analise padrões de uso, tendências de desempenho, métricas de custo e dados de satisfação do usuário regularmente.

  • Compartilhamento de conhecimento. Estabeleça processos para sessões de aprendizado em equipe, documentação de melhores práticas, transferência de conhecimento entre equipes e retrospectivas de incidentes.

Use serviços gerenciados

Minimize a sobrecarga operacional usando serviços AWS gerenciados e criando procedimentos padronizados em torno deles. Integre com os seguintes serviços AWS gerenciados: