本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
选择 AWS 存储服务
迈出第一步
|
目的 |
帮助确定哪种 AWS 存储服务最适合您的组织。 |
|
上次更新 |
2024 年 6 月 26 日 |
|
承保服务 |
简介
AWS 提供一系列可靠、可扩展和安全的存储服务,用于存储、访问、保护和分析您的数据。这样可以更轻松地将存储方法与需求相匹配,并提供本地基础架构不容易实现的存储选项。选择存储服务时,确保其与您的访问模式保持一致对于实现所需的性能至关重要。
您可以针对您的工作负载从块、文件和对象存储服务以及云数据迁移选项中进行选择。为您的工作负载选择合适的存储服务需要您根据业务需求做出一系列决策。
本决策指南将帮助您提出正确的问题,提供明确的实施路径,并帮助您从现有的本地存储迁移。
明白
数据是成功部署应用程序、分析工作流程和机器学习创新的基石。架构良好的系统使用多种存储服务,并启用不同的功能来提高性能。
但是,在许多情况下,要选择正确的存储服务,首先要考虑它与您已在使用(或熟悉)的内容的匹配程度。使用您熟悉的存储服务将使您更容易入门,并且可以更轻松地迁移数据,甚至可能更快。
例如,Amazon FSx 数据存储系列中的服务有四个与常用文件系统对应的选项:
-
亚马逊 FSx 版 Windows 文件服务器提供完全托管的微软 Windows 文件服务器,由完全原生 Windows 文件系统提供支持。
-
Amazon FSx for Lustre 允许您启动和运行高性能 Lustre 文件系统。
-
Amazon FSx for OpenZFS 是一项完全托管的文件存储服务,允许您将数据 AWS 从本地 ZFS 或其他基于 Linux 的文件服务器移动到本地。
-
Amazon FSx f NetApp or ONTAP 是一项完全托管的服务,它基于广受欢迎的 ONTAP 文件系统提供高度可靠、可扩展、高性能和功能丰富的文件存储。 NetApp
定义
以下存储类型有 AWS 服务选项:
-
块 — 块存储是一种控制数据存储和存储设备的技术。它接受任何数据,例如文件或数据库条目,然后将其分成大小相等的块。然后,块存储系统以针对快速访问和检索而优化的方式将数据块存储在底层物理存储器上。
-
文件系统-文件系统以文件和文件夹的分层结构存储数据。在网络环境中,基于文件的存储通常使用网络连接存储 (NAS) 技术。NAS 允许用户以与本地硬盘驱动器类似的方式访问网络存储数据。文件存储易于使用,允许用户管理文件共享控制。
-
对象-对象存储是一种以称为对象的非结构化格式存储和管理数据的技术。每个对象都使用唯一标识符进行标记,并包含描述基础内容的元数据。
-
缓存 — 缓存是一种高速数据存储层,用于在更靠近访问点的地方临时存储经常访问或最近使用的数据,目的是提高系统性能和减少延迟。它充当速度较慢和较大的主存储(例如磁盘或远程存储)与访问数据所需的计算资源之间的缓冲区。
-
Hybrid/Edge — Hybrid/Edge 存储将本地存储基础设施与云存储服务相结合,允许根据性能、成本和合规性等要求在两个环境之间移动数据。它提供了诸如低延迟访问、成本优化、数据主权、云可扩展性和业务连续性等优势。
迁移选项
除了选择存储服务外,您还需要选择如何将数据迁移到所选服务中。 AWS 根据需要在线还是离线存储,提供了多种迁移数据的选择。
-
在线迁移涉及通过互联网传输数据和应用程序,而这些数据和应用程序仍在本地数据中心运行。这种方法可能比离线迁移更高效,因为它可以最大限度地减少停机时间,使组织能够更快地开始使用云资源。但是,它需要可靠的互联网连接,可能不适用于大量数据或任务关键型应用程序。
-
离线迁移涉及在没有任何互联网连接的情况下移动数据和应用程序。这种方法需要将外部硬盘驱动器或其他存储介质上的数据物理传输到云提供商的数据中心。这种方法通常用于需要传输大量数据、带宽或连接有限或担心安全和隐私的情况。
有两个关键的考虑因素:
-
速度- 当速度很重要时,选择在线迁移。在线以分钟或小时为单位,离线可以用天来衡量。如果数据更新频繁且时间紧迫,请选择在线。如果是一次性移动,请选择离线,而不是时间紧迫。
-
带宽- 在线移动数据会占用所用的可用带宽 day-to-day。如果存在网络限制,则可以选择离线,数据可以在传输过程中处于离线状态,而不会中断业务。 AWS Snow Family 中的服务为离线迁移提供了一个选项。
考虑一下
您可能正在考虑 AWS 存储服务,因为您要将现有应用程序迁移到云端或在云中构建新应用程序。将数据迁移到云端时,重要的是要了解要将其移动到何处、潜在的用例、要移动的数据类型以及可用的网络资源。
以下是选择 AWS 存储服务时需要考虑的一些标准。
选择
既然您已经知道评估存储选项时应采用的标准,就可以选择适合您的业务需求的 AWS 存储服务了。
下表突出显示了哪些存储选项针对哪些情况进行了优化。使用它来帮助确定最适合您的用例的方案。
| 存储类型 | 它针对什么进行了优化? | 存储服务或工具 |
|---|---|---|
| 数据块 | 需要连接到单个 Amazon EC2 实例或容器的低延迟、高性能持久存储的应用程序,例如数据库和通用本地实例存储。 | |
|
文件系统 |
需要跨多个 Amazon EC2 实例或容器或多个本地服务器共享读写权限的应用程序和工作负载,例如团队文件共享、高可用性企业应用程序、分析工作负载和机器学习培训。 |
|
| 对象 | 读取密集型工作负载,例如内容分发、虚拟主机、大数据分析和机器学习工作流程。非常适合需要通过互联网在全球范围内存储、访问和分发数据的场景。 | |
|
缓存 |
完全托管、可扩展和高速缓存, AWS 用于处理存储在不同位置的文件数据,包括本地 NFS 文件系统、云文件系统(亚马逊适用于 FSx OpenZFS, and/or Amazon for ONTAP NetApp )和 Amazon S FSx 3。 |
|
|
混合动力/边缘 |
向本地应用程序提供低延迟数据,并允许本地应用程序访问云支持的存储。 |
下表详细介绍了您的在线和离线选项。
| 迁移选项 | 当速度是重中之重时 | 当带宽很重要时 | 存储服务或工具 |
|---|---|---|---|
| 在线 | Online 已针对数据的频繁更新进行了优化。将其用于时间紧迫或持续的工作负载。 | 如果带宽充足,可以考虑在下班时间安排传输。 | |
|
离线 |
适用于一次性或定期上传,也适用于传输过程中数据可能处于静态状态的情况。 |
当你只需要使用最小的可用带宽时,这种选择是有意义的,而且你更喜欢物理移动的可预测性。 |
使用
既然您已经确定了处理数据所需的最佳协议、性能要求以及本指南中讨论的其他标准,那么您还应该了解哪种存储服务最适合您的需求。
为了探索如何使用每种可用 AWS 存储服务并了解有关这些服务的更多信息,我们提供了探索每种服务的工作原理的途径。以下部分提供了指向深入文档、动手教程和资源的链接,以帮助您入门。