监控您的 文件网关 - AWS Storage Gatewa

Amazon FSx 文件网关不再向新客户开放。 FSx File Gateway 的现有客户可以继续正常使用该服务。有关与 FSx 文件网关类似的功能,请访问此博客文章

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

监控您的 文件网关

您可以使用 文件网关和中的相关资源。您还可以使用 “ CloudWatch 事件” 在文件操作完成后收到通知。

使用日志组获取 文件网关运行状况日志 CloudWatch

您可以使用 Amaz CloudWatch on Logs 来获取有关 和相关资源运行状况的信息。您可以使用日志来监控网关遇到的错误。此外,您还可以使用 Amazon CloudWatch 订阅筛选器实时自动处理日志信息。有关更多信息,请参阅 Amazon CloudWatch 用户指南中的通过订阅实时处理日志数据

例如,您可以配置一个 CloudWatch 日志组来监控您的网关,并在文件网关无法将 FSx 文件上传到 Amazon FSx 文件系统时收到通知。您可以在激活网关时或在激活网关并运行后配置组。有关如何在激活网关时配置 CloudWatch 日志组的信息,请参阅 配置您的 Amazon FSx 文件网关。有关 CloudWatch 日志组的一般信息,请参阅 Amazon CloudWatch 用户指南中的使用日志组和日志流

有关如何对 可能报告的错误进行故障排除的信息,请参阅故障排除:文件网关问题

在网关激活后配置 CloudWatch 日志组

以下过程说明如何在激活网关后配置 CloudWatch 日志组。

配置 CloudWatch 日志组以与您的 配合使用
  1. 登录 AWS 管理控制台 并在https://console.aws.amazon.com/storagegateway/家中打开 Storage Gateway 控制台。

  2. 在导航窗格中,选择 Gateways,然后选择要为其配置 CloudWatch 日志组的网关。

  3. 对于操作,选择编辑网关信息

  4. 对于选择如何设置日志组,选择以下选项之一:

    • 创建新的日志组以创建新的 CloudWatch日志组。

    • 使用现有日志组使用已存在的 CloudWatch 日志组。

      现有日志组列表中选择一个日志组。

    • 如果您不想使用@@ 日志组监控网关,请停用 CloudWatch 日志记录。

  5. 选择保存更改

  6. 要查看网关的运行状况日志,请执行以下操作:

    1. 在导航窗格中,选择 Gateways,然后选择您为其配置 CloudWatch 日志组的网关。

    2. 选择 “详细信息” 选项卡,然后在 “Healt h Logs” 下,选择 “CloudWatch日志”。日志组详细信息页面将在 CloudWatch 控制台中打开。

使用亚马逊 CloudWatch 指标

您可以使用 AWS 管理控制台 或 CloudWatch API 获取 文件网关的监控数据。控制台根据来自 CloudWatch API 的原始数据显示一系列图表。该 CloudWatch API 也可以通过其中一个AWS SDKsAmazon CloudWatch API 工具来使用。根据您的需求差异,您可能倾向于使用控制台中显示的图表,也可能倾向于检索自 API 的图表。

无论通过何种方法来使用指标,您都必须指定下列信息:

  • 要使用的指标维度。维度 是帮助您对某指标进行唯一标识的名称/值对。Storage Gateway 的维度为 GatewayIdGatewayName。在 CloudWatch 控制台中,您可以使用Gateway Metrics视图来选择网关特定的维度。有关尺寸的更多信息,请参阅 Amazon CloudWatch 用户指南中的尺寸

  • 指标名称,如 ReadBytes

下表总结了可供您使用的 Storage Gateway 指标数据的类型。

Amazon CloudWatch 命名空间 维度 说明
AWS/StorageGateway GatewayId, GatewayName

这些维度筛选描述网关各个方面的指标数据。您可以通过指定和GatewayName维度来识别要使用的 文件网关GatewayId

网关的吞吐量和延迟数据基于网关中的所有文件共享。

数据在 5 分钟期间内自动可用,无需收费。

网关和文件指标的使用方式类似于其他服务指标。您可以在下面所列的 CloudWatch 文档中找到一个有关某些最常见的指标任务的讨论:

了解网关指标

下表描述了涵盖 FSx 文件网关的指标。每个网关均有与其关联的一组指标。某些特定于网关的指标与某些指标同名。 file-system-specific这些指标代表同类度量,但其范围限于网关,而不是用于文件系统。

在使用特定指标前,始终指定是要处理网关还是文件系统。具体而言,在使用网关指标时,必须为要查看其指标数据的网关指定 Gateway Name。有关更多信息,请参阅 使用亚马逊 CloudWatch 指标

注意

某些指标仅在最近的监控期内生成了新数据时才会返回数据点。

下表描述了可用于获取有关 的信息的指标。

指标 说明
AvailabilityNotifications

此指标报告了网关在报告期内生成的与可用性相关的运行状况通知的数量。

单位:计数

CacheDirectorySize

此指标用于跟踪网关缓存中文件夹的大小。文件夹大小根据其第一级中包含的文件和子文件夹的数量来确定,不会递归地统计子文件夹中的内容。

使用此指标和 Average 统计数据来衡量网关缓存中文件夹的平均大小。使用此指标和 Max 统计数据来衡量网关缓存中文件夹的最大大小。

单位:计数

CacheFileSize

此指标用于跟踪网关缓存中文件的大小。

使用此指标和 Average 统计数据来衡量网关缓存中文件的平均大小。使用此指标和 Max 统计数据来衡量网关缓存中文件的最大大小。

单位:字节

CacheFree

此指标报告网关缓存中的可用字节数。

单位:字节

CacheHitPercent

在来自网关的应用程序读取操作中,由缓存提供的操作所占百分比。样本在报告周期结束时采用。

当网关没有收到任何应用程序读取操作时,此指标会报告为 100%。

单位:百分比

CachePercentDirty

网关缓存中尚未持久化的总体百分比。 AWS样本在报告周期结束时采用。

单位:百分比

CachePercentUsed

使用的网关缓存存储的总体百分比。样本在报告周期结束时采用。

单位:百分比

CacheUsed

此指标报告网关缓存中的已用字节数。

单位:字节

CloudBytesDownloaded

在报告期内,网关从中 AWS 下载的总字节数。

将此指标与 Sum 统计数据结合使用可测量吞吐量,将其与 Samples 统计数据结合使用可测量 IOPS。

单位:字节

CloudBytesUploaded

网关在报告期内上传到的 AWS 总字节数。

将此指标与Sum统计数据结合使用以衡量吞吐量,将此指标与Samples统计数据结合使用以衡量每秒 input/output 操作数 (IOPS)。

单位:字节

FilesFailingUpload

此指标跟踪未能上传到 AWS的文件数。这些文件将生成运行状况通知,其中包含有关该问题的更多信息。

将此指标与 Sum 统计数据结合使用,可以显示当前无法上传到 AWS的文件数。

单位:计数

FileShares

此指标报告网关上的文件共享数量。

单位:计数

FileSystem-ERROR

此指标提供了此网关上处于“错误”状态的文件系统关联数量。

如果此指标报告任何文件系统关联处于“错误”状态,则网关很可能存在问题,这可能会导致工作流中断。建议在此指标报告非零值时创建警报。

单位:计数

HealthNotifications

此指标报告了此网关在报告期内生成的运行状况通知的数量。

单位:计数

IndexEvictions

此指标报告从文件元数据的缓存索引中移出其元数据以便为新条目腾出空间的文件数。网关维护此元数据索引,该索引是根据需要从 AWS 云端填充的。

单位:计数

IndexFetches

此指标报告已提取元数据的文件数。网关维护文件元数据的缓存索引,该索引是根据需要从 AWS 云端填充的。

单位:计数

IoWaitPercent

此指标报告 CPU 等待本地磁盘返回响应所花费的时间占总时间的百分比。

单位:百分比

MemTotalBytes

此指标报告网关上的总内存量。

单位:字节

MemUsedBytes

此指标报告网关上的已用内存量。

单位:字节

RootDiskFreeBytes

此指标报告网关的根磁盘上的可用字节数。

如果此指标报告的空闲空间少于 20 GB,则应增加根磁盘的大小。

要增加根磁盘的大小,可以增加 VM 上现有根磁盘的大小。当 VM 重新启动时,网关会识别根磁盘上增加的大小。

单位:字节

SmbV2Sessions

该指标报告网关上处于活动状态的 SMBv2 会话数。此指标会为与网关关联的每个文件系统分别发出一次。使用 SUM 统计数据计算所有文件系统的活动 SMBv2 会话总数。

单位:计数

SmbV3Sessions

该指标报告网关上处于活动状态的 SMBv3 会话数。此指标会为与网关关联的每个文件系统分别发出一次。使用 SUM 统计数据计算所有文件系统的活动 SMBv3 会话总数。

单位:计数

TotalCacheSize

此指标报告缓存的总大小。

单位:字节

UserCpuPercent

此指标报告网关处理所花费的时间百分比。

单位:百分比

了解文件系统指标

您可以在下面找到有关包含文件系统的 Storage Gateway 指标的信息。每个文件系统均有与其关联的一组指标。某些特定于文件系统的指标与某些特定于网关的指标同名。这些指标代表同类度量,但其范围限于文件系统。

始终在使用指标前指定要使用网关还是文件系统指标。尤其是使用文件系统指标时,您必须指定 File system ID,用于标识希望查看其指标的文件系统。有关更多信息,请参阅 使用亚马逊 CloudWatch 指标

注意

某些指标仅在最近的监控期内生成了新数据时才会返回数据点。

下表描述了可用来获取文件共享相关信息的 Storage Gateway 指标。

指标 说明
CacheHitPercent

在来自文件共享的应用程序读取操作中,由缓存提供的操作所占百分比。样本在报告周期结束时采用。

当文件共享没有收到任何应用程序读取操作时,此指标会报告为 100%。

单位:百分比

CachePercentDirty

在网关缓存中尚未持久化到 AWS的数据中,文件共享产生的部分所占比例。样本在报告周期结束时采用。

将此指标与 Sum 统计数据结合使用。

理想情况下,此指标应保持在较低水平。

注意

使用网关的 CachePercentDirty 指标来查看尚未持久化到 AWS的网关缓存的总体比例。

单位:百分比

CachePercentUsed

整个网关使用的数据缓存的百分比。样本在报告周期结束时采用。这个文件共享特定指标报告的值与相应的网关特定指标报告的值相同。

单位:百分比

CloudBytesUploaded

网关在报告期内上传到的 AWS 总字节数。

将此指标与 Sum 统计数据结合使用可测量吞吐量,将其与 Samples 统计数据结合使用可测量 IOPS。

单位:字节

CloudBytesDownloaded

在报告期内,网关从中 AWS 下载的总字节数。

将此指标与Sum统计数据结合使用以衡量吞吐量,将此指标与Samples统计数据结合使用以衡量每秒 input/output 操作数 (IOPS)。

单位:字节

FilesFailingUpload

此指标跟踪未能上传到 AWS的文件数。这些文件将生成运行状况通知,其中包含有关该问题的更多信息。

将此指标与 Sum 统计数据结合使用,可以显示当前无法上传到 AWS的文件数。

单位:计数

ReadBytes

文件共享的报告周期内从本地应用程序读取的总字节数。

将此指标与 Sum 统计数据结合使用可测量吞吐量,将其与 Samples 统计数据结合使用可测量 IOPS。

单位:字节

WriteBytes

报告周期内写入到场内应用程序的总字节数。

将此指标与 Sum 统计数据结合使用可测量吞吐量,将其与 Samples 统计数据结合使用可测量 IOPS。

单位:字节

了解 审核日志

Amazon FSx File Gateway(FSx 文件网关)审核日志为您提供有关用户访问文件系统关联中的文件和文件夹的详细信息。您可以使用审核日志来监控用户活动,并在发现异常活动模式时采取相应措施。这些日志的格式与 Windows Server 安全日志事件类似,从而可以与 Windows 安全事件的现有日志处理工具兼容。

操作

下表描述了 文件网关审核日志文件访问操作。

操作名称

定义

读取数据

读取文件的内容。

写入数据

更改文件的内容。

Create

创建新文件或文件夹。

重命名

重命名现有文件或文件夹。

删除

删除文件或文件夹。

写入属性

更新文件或文件夹的元数据(ACLs、所有者、群组、权限)。

属性

下表描述了 FSx File Gateway 审核日志文件访问属性。

属性

定义

securityDescriptor

显示在对象上设置的自由访问控制列表 (DACL),使用 SDDL 格式。

sourceAddress

文件共享客户端计算机的 IP 地址。

SubjectDomainName

客户端账户所属的 Active Directory (AD) 域。

SubjectUserName

客户端的 Active Directory 用户名。

source

正在审核的 Storage Gateway FileSystemAssociation 的 ID。

mtime

在此时间修改对象的内容,由客户端设置。

version

审核日志格式的版本。

ObjectType

定义对象是文件还是文件夹。

locationDnsName FSx 文件网关系统 DNS 名称。

objectName

对象的完整路径。

ctime

在此时间修改对象的内容或元数据,由客户端设置。

shareName

正在访问的共享的名称。

operation

对象访问操作的名称。

newObjectName

新对象重命名后的完整路径。

gateway

Storage Gateway ID。

status

操作的状态。仅记录成功(一般不记录失败,但会记录由于权限被拒绝而引发的失败)。

fileSizeInBytes

文件大小,以字节为单位,由客户端在文件创建时设置。

每个操作记录的属性

下表描述了每个 FSx 文件访问操作中记录的 File Gateway 审核日志属性。

读取数据

写入数据

创建文件夹

创建文件

重命名文件/文件夹

删除文件/文件夹

写入属性(更改 ACL)

写入属性(chown)

写入属性(chmod)

写入属性(chgrp)

securityDescriptor

X

sourceAddress

X

X

X

X

X

X

X

X

X

X

SubjectDomainName

X

X

X

X

X

X

X

X

X

X

SubjectUserName

X

X

X

X

X

X

X

X

X

X

source

X

X

X

X

X

X

X

X

X

X

mtime

X

X

version

X

X

X

X

X

X

X

X

X

X

objectType

X

X

X

X

X

X

X

X

X

X

locationDnsName

X

X

X

X

X

X

X

X

X

X

objectName

X

X

X

X

X

X

X

X

X

X

ctime

X

X

shareName

X

X

X

X

X

X

X

X

X

X

operation

X

X

X

X

X

X

X

X

X

X

newObjectName

X

gateway

X

X

X

X

X

X

X

X

X

X

status

X

X

X

X

X

X

X

X

X

X

fileSizeInBytes

X