PERF05-BP02 评估可用的联网功能 - AWS Well-Architected Framework

PERF05-BP02 评估可用的联网功能

评估云中可能提高性能的联网功能。借助测试、指标和分析来衡量这些功能的影响。例如,利用可用的网络级功能来减少延迟、数据包丢失或抖动。

许多服务的创建旨在提高性能,而其他服务通常提供优化网络性能的功能。AWS Global Accelerator 和 Amazon CloudFront 等服务旨在提高性能,而大多数其他服务具有优化网络流量的产品功能。查看服务功能来提高工作负载性能,如 EC2 实例网络功能、增强联网实例类型、Amazon EBS 优化实例、Amazon S3 Transfer Acceleration 以及 CloudFront。

期望结果: 您已经记录了工作负载中的组件清单,并确定了每个组件的哪些网络配置将有助于满足性能需求。评估网络功能之后,您已经对性能指标进行了试验和测量,以确定如何使用可用的功能。

常见反模式:

  • 您将所有工作负载都放在离总部最近的 AWS 区域,而不是放在接近终端用户的 AWS 区域。

  • 未能对您的工作负载性能进行基准测试,并根据该基准不断评估您的工作负载性能。

  • 您不查看服务配置以获得性能改进选项。

建立此最佳实践的好处: 评估所有服务功能和选项可以提高您的工作负载性能,降低基础设施的成本,减少维护工作负载所需的工作量,并提升您的整体安全状况。您可以利用 AWS 的全球骨干网,确保为客户提供出色的联网体验。

未建立这种最佳实践的情况下暴露的风险等级:

实施指导

查看您可以使用哪些与网络相关的配置选项,以及这些配置选项对您的工作负载的影响。了解这些选项如何与架构进行交互,以及这些选项对实际测量的性能和用户感知到的性能的影响,对于性能优化至关重要。

实施步骤:

  1. 创建工作负载组件列表。

    1. 使用 AWS Cloud WAN构建、管理和监控您的组织网络。

    2. 使用 Network Manager查看您的网络。使用现有的配置管理数据库(CMDB)工具或 AWS Config 等工具创建工作负载清单及其配置方式。

  2. 如果这是一个现有的工作负载,请确定并记录性能指标的基准,重点关注瓶颈和需要改进之处。基于业务要求和工作负载特征,与性能相关的网络指标将因工作负载而异。首先,对于您的工作负载,检查带宽、延迟、数据包丢失、抖动和重传等指标可能很重要。

  3. 如果这是一个新的工作负载,请执行 负载测试 以识别性能瓶颈。

  4. 对于识别的性能瓶颈,请查看解决方案的配置选项,以确定性能改进机会。

  5. 如果您不知道网络路径或路由,请使用 Network Access Analyzer 来识别它们。

  6. 查看您的网络协议,以进一步减少延迟。

  7. 如果您在多个位置使用 AWS Site-to-Site VPN 连接到 AWS 区域,请查看 加速的 Site-to-Site VPN 连接, 以获得提高联网性能的机会。

  8. 当工作负载流量分散在多个账户中时,请评估您的网络拓扑结构和服务以减少延迟。

    • 当连接多个账户时,请评估 VPC 对等AWS Transit Gateway 之间的运营和性能权衡。AWS Transit Gateway 支持 AWS Site-to-Site VPN 吞吐量,通过使用多路径扩展到超过单一 IPsec 最大限制 。Amazon VPC 和 AWS Transit Gateway 之间的流量保持在专用 AWS 网络上,而不会暴露在互联网上。AWS Transit Gateway 简化了您互连所有 VPC 的方式,这些 VPC 可以跨越数千个 AWS 账户并进入本地网络。在多个账户之间共享您的 AWS Transit Gateway(通过使用 Resource Access Manager)。要查看您的全球网络流量,请使用 Network Manager 集中了解您的网络指标情况。

  9. 查看您的用户位置,并尽量缩短用户与工作负载之间的距离。

    1. AWS Global Accelerator 是一项网络服务,使用 Amazon Web Services 全球网络基础设施,可将用户流量的性能提高多达 60%。当互联网拥塞时,AWS Global Accelerator 会优化通往您的应用程序的路径,以始终保持较低的数据包丢失、抖动和延迟。它还提供了静态 IP 地址,可简化在可用区或 AWS 区域之间移动端点的过程,而无需更新 DNS 配置或更改面向客户端的应用程序。

    2. Amazon CloudFront 可在全球范围内提高工作负载内容交付性能并减少延迟。CloudFront 拥有超过 410 个分散在全球各地的入网点,可以缓存您的内容并减少终端用户的延迟。

    3. Amazon Route 53 提供 基于延迟的路由地理位置路由地理位置临近度路由基于 IP 的路由 选项,以帮助您提高面向全球受众的工作负载性能。通过检查工作负载流量和用户位置,确定哪个路由选项将优化您的工作负载性能。

  10. 评估其他 Amazon S3 功能以改进存储 IOPS。

    1. Amazon S3 Transfer Acceleration 是一项功能,借助该功能,外部用户在向 Amazon S3 传输数据时可以通过 CloudFront 的网络优化获益。这就提高了将大量数据从没有专用连接的远程位置传输到 AWS Cloud 的能力。

    2. Amazon S3 多区域接入点 将内容复制到多个区域,并通过提供一个接入点简化了工作负载。使用多区域接入点时,您可以使用标识最低延迟桶的服务向 Amazon S3 请求或写入数据。

  11. 查看您的计算资源网络带宽。

    1. EC2 实例、容器和 Lambda 函数使用的弹性网络接口(ENI)按流进行限制。查看您的置放群组以优化 EC2 网络吞吐量。为避免在每个流的基础上出现瓶颈,请将应用程序设计为使用多个流。要监控和查看与计算相关的网络指标,请使用 CloudWatch Metricsethtoolethtool 包含在 ENA 驱动程序中,并公开了其他与网络相关的指标,这些指标可作为 自定义指标 发布到 CloudWatch。

    2. 较新的 EC2 实例可以利用增强联网。N 系列的 EC2 实例(例如 M5nM5dn)利用第四代定制 Nitro 卡为单个实例提供高达 100Gbps 的网络吞吐量。与基础 M5 实例相比,这些实例提供了 4 倍的网络带宽和数据包处理能力,是网络密集型应用程序的理想选择。

    3. Amazon Elastic Network Adapter (ENA)通过为 集群放置组中的实例提供更好的吞吐量来提供进一步优化。

    4. Elastic Fabric Adapter (EFA)是 Amazon EC2 实例的网络接口,使您能够在 AWS 上大规模运行需要高级别节点间通信的工作负载。借助 EFA,使用消息传递接口(MPI)的高性能计算(HPC)应用程序和使用 NVIDIA Collective Communications Library(NCCL)的机器学习(ML)应用程序可以扩展到数千个 CPU 或 GPU。

    5. Amazon EBS 优化 实例使用经过优化的配置堆栈,可以提供额外的专用容量来提高 Amazon EBS I/O。这种优化通过最小化您的 Amazon EBS I/O 与实例的其他流量之间的争用,来为 Amazon EBS 卷提供最佳性能。

实施计划的工作量级别: 

要建立这种最佳实践,您必须了解目前影响网络性能的工作负载组件选项。收集组件、评估网络改进选项、试验、实施和记录这些改进的工作量为 适中

资源

相关文档:

相关视频:

相关示例: