View a markdown version of this page

在中实施 IT 运营 AWS Cloud - AWS 规范性指导

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

在中实施 IT 运营 AWS Cloud

AWS 可以帮助减少组织因其基础架构维护责任而产生的运营开销。因此,IT 团队可以将注意力从日常运营任务转移到战略业务计划上,从而提高整体组织效率和创新能力。

下图概述了 AWS Cloud 环境:

  • 客户应用程序可以使用虚拟私有云 (VPC) AWS 服务 在中 AWS Cloud 进行访问。 AWS 全球基础设施支持 AWS Cloud。

  • AWS 提供多种服务来实现您的 IT 运营自动化,将核心功能和 AI 驱动的运营 (AIOps) 功能相结合。有关支持自动化的更多信息,请参阅自动化AWS 服务。 AWS 服务 了解这些服务可以帮助您顺利地从本地基础设施过渡到 AWS 原生解决方案。

  • AWS 管理控制台支持多种操作任务,包括:

    • 成本优化

    • Backup 和灾难恢复

    • 资源配置和扩展

    • 事件管理和故障排除

    • 自动化和部署

    • 监控和日志记录

    • 安全与合规

    • 文档和知识共享

    • 网络管理

典型 AWS Cloud 环境示例。

要有效地从过渡 VMware 到 AWS Cloud,组织应使用以下步骤:

  1. 确定关键 AWS 操作任务。

  2. 评估现有的本地流程是否有可能重复使用。

  3. 酌情逐步采用云原生运营。

  4. 使当前的工作流程与 AWS 最佳实践保持一致。

  5. 培养特定于以下方面的工具和服务的技能 AWS。

  6. 实施分阶段的方法以最大限度地减少干扰。

这种方法有助于实现平稳迁移,同时利用现有的专业知识并逐步采用云原生功能。团队可以在保持运营连续性的同时快速利用 AWS 能力。下表提供了帮助您开始执行 AWS 操作任务的指导。

AWS 运营协调战略

AWS 操作任务

需要评估现有的本地流程是否可能重复使用

监控和日志记录

  • 查看和分析 Amazon CloudWatch 日志、指标和警报,以发现任何问题或异常情况。

  • 监控 EC2 实例、负载均衡器、数据库等 AWS 服务的运行状况和性能。

  • 出于安全和合规目的,分析来自 AWS CloudTrail 服务的日志数据。

  • 监控和可观测性

安全与合规

  • 查看并对 EC2 实例和其他实例应用必要的安全补丁和更新 AWS 服务。

  • 确认安全组、网络访问控制列表 (ACLs) 和 IAM 策略配置正确,并遵循最佳实践。

  • 使用第三方安全工具检查是否存在任何安全漏洞 AWS Security Hub CSPM 或配置错误。

  • 确保遵守行业标准和法规(例如,支付卡行业数据安全标准 (PCI DSS)、1996 年健康保险便携性和责任法案 (HIPAA) 以及系统和组织控制 SOC)。

  • 安全与合规管理

成本优化

  • 使用 AWS Cost Explorer 或第三方 AWS成本管理工具监控和分析成本和使用情况报告。

  • 识别并终止未使用或未充分利用的资源(例如,闲置的 EC2 实例或未连接的 EBS 卷)。

  • 实施节省成本的策略,例如预留实例、竞价型实例或 AWS Auto Scaling。

  • 容量规划和预测

Backup 和灾难恢复

  • 创建和验证关键数据的备份,包括 EBS 卷、Amazon RDS 数据库和 Amazon S3 存储桶。

  • 使用和等服务测试和验证灾难恢复计划 AWS Backup 和程序 AWS 弹性灾难恢复。

  • 可用性及业务连续性管理

资源配置和扩展

  • 根据需要为新项目或工作负载配置新 AWS 资源(例如 EC2 实例、Amazon RDS 数据库或负载均衡器)。

  • 使用诸如此类的服务,根据需求向上或向下扩展现有资源 AWS Auto Scaling。

  • 预配置和配置管理

自动化和部署

  • 利用诸如 AWS CloudFormation 或 HashiCorp Terraform 之类的 IaC 工具来自动配置资源和配置管理。

  • 使用、和等服务为应用程序部署实施持续集成和持续部署 (CI/CD) 管道。 AWS CodePipeline AWS CodeBuild AWS CodeDeploy

  • 预配置和配置管理

事件管理和故障排除

  • 监控并响应任何警报、事件或服务中断。

  • 排除并解决与 AWS 资源、网络或应用程序性能有关的问题。

  • 与开发团队和其他利益相关者合作,调查和解决复杂的问题。

  • 事件和事件管理

文档和知识共享

  • 维护 AWS 基础架构、配置和流程的 up-to-date文档。

  • 为团队成员举办知识共享课程或 AWS 最佳实践培训。

  • IT 运营

  • 应用程序支持

Network

  • 定义您的 IP 地址范围、子网、路由表和网络网关。

  • 启用 AWS 资源与本地网络之间的安全通信。

  • 使用和 Transit Gateway 维护路由表 ACLs、安全组 AWS Direct Connect 和网络连接。

  • 网络管理

培养技能 AWS 服务 和工具

通过 AWS 培训计划、认证、文档和最佳实践指南,团队可以不断增强其云专业知识。Organizations 可以精通最新 AWS 服务 和功能,使他们能够设计、实施和维护有效的云解决方案,从而推动业务成功。

AWS 提供广泛的资源和计划,以帮助个人和组织在以下方面建立自己的技能和能力: AWS Cloud