智能分层存储类的性能特征 - FSx 为了光泽

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

智能分层存储类的性能特征

f FSx or Lustre Intelligent-Tiering 存储类为传统上在基于 HDD/SDD 的混合型高性能文件存储文件系统上运行的工作负载提供弹性、成本优化的存储。使用 Intelligent-Tiering 存储类的文件系统利用完全弹性、智能分层的区域存储,该存储会随着工作负载的变化而自动增长和缩小以适应您的工作负载。有关如何对数据进行分层的信息,请参阅智能分层存储类如何对数据进行分层

具有智能分层存储类别 FSx 的 for Lustre 文件系统所支持的吞吐量与其存储无关。智能分层文件系统可扩展到吞吐量的倍数和数百万 TBps 的 IOPS。使用 Intelligent-Tiering 存储类的文件系统还提供可选的预配置 SSD 读取缓存,以实现对经常访问的数据的低延迟访问。默认情况下,Amazon f FSx or Lustre 会为经常访问的元数据预置 SSD 读取缓存。由于大多数工作负载往往是读取密集型的,并且在任何给定时间只能使用整个数据集的一小部分子集,因此智能分层存储和固态硬盘读取缓存的混合模型允许使用智能分层存储类的文件系统为大多数工作负载提供性能与固态硬盘文件系统相当的存储,同时相对于固态硬盘和硬盘存储类别节省存储成本。

在 Intelligent-Tiering 文件系统中读取和写入数据,尤其是最近访问过的数据或访问频率不足以存放在文件服务器的内存缓存中的数据,性能取决于固态硬盘读取缓存的大小。从 Intelligent-Tiering 存储进行数据访问的 time-to-first-byte延迟约为数十毫秒,而且每个请求的成本也很高,而从固态硬盘读取缓存进行访问的延迟为亚毫秒,并且没有每个请求的成本。

在为文件系统配置 SSD 读取缓存的大小时,应考虑工作负载中经常访问的数据集的大小,以及工作负载对读取频率较低的数据的延迟的敏感性。创建文件系统后,您可以在 SSD 读取缓存大小调整模式之间切换,也可以向上或向下扩展缓存。有关如何修改 SSD 读取缓存的更多信息,请参阅管理预配置的 SSD 读取缓存

当 FSx for Lustre 将数据块写入智能分层存储时,就会出现写入请求。当您将数据写入文件系统时,写入请求会被聚合并写入智能分层存储,从而提高吞吐量并降低请求成本。读取可以从文件服务器的内存缓存、SSD 读取缓存或直接从智能分层存储中提供。当从 Intelligent-Tiering 存储中进行读取时,每个检索到的数据块都会发生读取请求。当您按顺序读取数据时,for Lustre 将预取数据 FSx 以提高性能。

使用 Intelligent-Tiering 存储类的文件系统上的内存缓存中的数据作为网络 I/O 直接提供给请求客户端。 当客户端访问不在内存缓存中的数据时,这些数据将作为磁盘 I/O 从 SSD 读取缓存或 Intelligent-Tiering 存储中读取,然后作为网络 I/O 提供给客户端。

智能分层的文件系统性能

下表显示了 Lustre Intelligent-Tiering 文件系统所设计的性能。 FSx

预配置吞吐容量 () MBps 网络吞吐量 (MBps) 网络 IOPS 内存缓存存储空间 (GB) 最大 SSD 缓存磁盘吞吐量 (MBps) 固态硬盘最大缓存磁盘 IOPS

基准

突增

基准

突增

每 4000 12500

数十万

76.8 4000 160000