存储报告 - FSx 适用于 Windows 文件服务器的亚马逊

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

存储报告

存储报告提供对文件系统使用情况的详细分析,帮助您了解存储的使用情况,识别可以存档或删除的文件,并监控文件管理策略的遵守情况。您可以生成多种类型的报告,用于分析文件所有权、文件类型、重复文件、大文件、文件筛选和配额使用情况。

报告类型

您可以创建以下报告类型:

  • DuplicateFiles

    根据文件大小和哈希比较来识别内容相同的文件。使用此报告可以查找消耗不必要存储空间的冗余文件。该报告将重复文件组合在一起,并显示通过删除重复文件可以恢复的总空间。

  • FilesByFileGroup

    按文件组成员资格对文件进行分组,并显示每个文件组的存储消耗情况。使用此报告可以了解哪些类型的文件(文档、媒体、可执行文件等)占用的存储空间最多。

  • FilesByOwner

    按所有者对文件进行分组,并显示每个用户或组占用的存储空间。使用此报告可以识别占用存储空间最多的用户,并适当地分配存储成本或配额。

  • FilesByProperty

    按分类属性值对文件进行分组,并显示每个属性值的文件数量和存储消耗。使用此报告可以根据文件分类来分析文件,例如数据敏感度级别、部门或保留期。此报告要求使用对文件进行分类分类规则

  • FileScreenAuditFiles

    列出用户试图保存被活动文件屏幕屏蔽的文件的文件筛选违规行为。使用此报告可以监控文件筛选策略的遵守情况,并识别经常尝试保存未经授权的文件类型的用户。

  • FoldersByProperty

    按管理属性值对文件夹进行分组,并显示每个属性值的存储消耗量。使用此报告可以按文件夹用途分析存储使用情况,例如用户文件、群组共享或应用程序文件。

  • LargeFiles

    列出超过指定大小阈值的文件。使用此报告可以识别占用大量存储空间且可能成为存档、压缩或删除对象的文件。

  • LeastRecentlyAccessed

    列出在指定天数内未被访问的文件。使用此报告可以识别可以存档或移动到成本较低的存储层的非活动文件。

  • MostRecentlyAccessed

    列出在指定天数内访问过的文件。

  • QuotaUsage

    显示已配置配额的文件夹的配使用统计信息。使用此报告来监控配额合规性并识别接近配额限制的文件夹。

报告格式

您可以生成多种格式的报告,以适应不同的用例:

  • DHTML-动态 HTML 格式,具有排序和过滤等交互功能。

  • HTML-适合存档或发送电子邮件的静态 HTML 格式。

  • XML-用于编程处理的结构化数据格式。

  • CSV-用于导入电子表格应用程序的逗号分隔值格式。

  • Text-纯文本格式,便于查看或处理。

您可以为单个报告指定多种格式。

交互式和预定报告

您可以创建两种类型的存储报告:

  1. 交互式报告-创建后立即运行,仅执行一次。使用交互式报告进行临时分析或故障排除。交互式报告没有时间表,创建后无法修改。要运行另一个交互式报告,必须使用不同的名称创建一个新报告。

  2. 计划报告-根据配置的时间表自动运行。使用计划报告进行定期监控和合规性报告。您可以将报告安排为每周或每月在特定时间运行。可以修改计划报告以更改其配置,也可以使用开始-FSx FSRMStorage 报告命令按需运行这些报告,而无需等待预定时间。

正在运行的报告

创建计划报告后,您可以通过多种方式运行该报告:

  • 自动执行-计划报告按其配置的计划时间自动运行。

  • 手动执行-用于按开始-FSx FSRMStorage 报告需运行计划报告,无需等待预定时间。

您可以使用来监控报告执行情况获取-FSx FSRMStorage 报告,以检查状态。

访问存储报告

FSRM 生成存储报告后,报告文件将保存到文件系统的默认位置。要访问这些报告,您需要映射文件系统的管理 D$ 共享。

访问存储报告
  1. 使用以下路径格式映射管理 D$ 共享:

    \\file-system-dns-name\D$

    例如:

    \\amznfsxaa11bb22.corp.example.com\D$
  2. 导航到该 StorageReports 文件夹。此文件夹包含按报告类型和执行日期组织的子文件夹。

注意

访问管理 D$ 共享需要管理员凭据。

存储报告最佳实践

请遵循以下最佳做法,确保存储报告的效率和效力:

性能注意事项

存储报告的生成是资源密集型的,因为 FSRM 必须扫描大量文件。

  • 限制报告范围-使用Namespace参数将报告限制在特定的文件夹,而不是扫描整个文件系统。扫描大型目录结构需要大量资源,可能需要数小时才能完成。

  • 在非高峰时段安排报告-在系统活动较少的时段运行计划报告,以最大限度地减少对性能的影响。避免在备份窗口或其他维护任务期间运行报告。

  • 设置合理的阈值-使用阈值参数将报告输出限制为可操作的数据。例如,设置LargeFileMinimum为标识值得调查的文件的值,而不是每个超过 1MB 的文件。

  • 使用 RunDuration 限制-设置RunDuration参数以防止报告运行时间过长并影响系统性能。如果报告未在时限内完成,则将在下次计划运行期间恢复。

  • 监控报告性能-用于获取-FSx FSRMStorage 报告检查报告需要多长时间才能完成。如果报告持续时间过长,可以考虑缩小报告范围或降低运行频率。

报告设计

  • 使用描述性名称-为报告提供清晰的描述性名称,说明其分析内容和运行时间,例如 “每周大文件-财务共享” 或 “每月重复文件-所有共享”。

  • 合并相关分析-为同一个命名空间生成多个报告类型时,请创建具有多个ReportType值的单个报告,而不是单独的报告。这样效率更高,因为 FSRM 只需要扫描一次目录结构。

  • 按文件模式筛选-使用文件模式参数将报告的重点放在特定的文件类型上。例如,在分析大文件时,您可以为视频文件、数据库文件和存档文件创建单独的报告,以更好地了解存储消耗模式。

  • 利用分类属性-使用FilesByProperty报告根据文件的分类分析文件。这提供了更有意义的见解。

报告管理

  • 定期审查报告-安排时间审查报告结果并对调查结果采取行动。只有当您使用报告来做出存储管理决策时,报告才有价值。

  • 存档旧报告-报告文件会随着时间的推移而累积并占用存储空间。为报告文件制定保留政策,删除或存档不再需要的旧报告。

  • 计划之前的测试报告-创建交互式报告以测试报告配置,并在创建计划版本之前验证报告配置是否产生预期结果。

存储报告管理命令

您可以访问两个系列的 FSx 远程 PowerShell 命令来管理存储报告:

  1. 报告定义命令-创建、检索、修改和删除存储报告配置,这些配置指定要分析的数据、何时运行报告以及要生成的格式。

  2. 报告执行命令-启动、停止、监视和等待存储报告生成。使用这些命令按需运行报告或管理长时间运行的报告作业。

存储报告 FSx 远程 PowerShell 命令列表

注意

本页中的所有示例都假设您已经使用文件系统的 Windows Remote PowerShell 端点定义了该 $FSxWindowsRemotePowerShellEndpoint变量。您可以在文件系统的详细信息页面上的 Amazon FSx 控制台中找到此终端节点,也可以使用 AWS CLI describe-file-systems命令找到此终端节点。

报告定义命令

全新-FSx FSRMStorage 报告

新建FSxFSRMStorage报告:创建存储报告,用于分析指定目录以生成一种或多种报告类型。

参数:

  • Name (string) – 必需。存储报告的名称。

  • Namespace (array) – 必需。要分析的路径或文件夹类型数组。您可以指定多种格式的路径:

    • 文件夹路径

    • 文件夹分类。例如,[FolderUsage_ms= “用户文件"]

  • ReportType (array) – 必需。要生成的报告类型数组。可以指定以下值:

    • DuplicateFiles:根据文件大小和内容识别重复文件

    • FilesByFileGroup: 按文件组成员资格对文件进行分组

    • FilesByOwner: 按所有者对文件进行分组

    • FilesByProperty: 按分类属性对文件进行分组

    • FileScreenAuditFiles: 列出文件筛选违规行为

    • FoldersByProperty: 按管理属性对文件夹进行分组

    • LargeFiles: 列出超过指定大小阈值的文件

    • LeastRecentlyAccessed: 列出最近未被访问过的文件

    • MostRecentlyAccessed: 列出最近访问过的文件

    • QuotaUsage: 显示配额使用情况统计信息

  • ReportFormat (array) – 可选。输出格式的数组。可以指定以下值:

    • DHTML: 动态 HTML 格式

    • HTML: 静态 HTML 格式

    • XML: XML 格式

    • CSV: 逗号分隔值格式

    • Text: 纯文本格式

  • Interactive (boolean) – 可选。如果设置为 true,则生成交互式报告。交互式报表创建后无法修改。

  • ScheduleConfigurations (hashtable)-除非报告是交互式的,否则为必填项。包含具有以下属性的计划配置的哈希表:

    • Time (datetime): 指定何时运行任务的 DateTime 对象(必需)

    • RunDuration (number): 运行任务的小时数(可选)

    • Weekly (array): 工作日数组(可选)

    • Monthly (array): 一个月中的几天数组,-1用于最后一天(可选)

特定于报告的参数:

  • FileScreenAuditDaysSince (number) – 可选。对于 FileScreenAuditFiles 报告,请指定包含审计事件的天数。

  • FileScreenAuditUser (array) – 可选。对于 FileScreenAuditFiles 报告,指定要包含在报告中的用户帐户数组。只有这些用户违反文件筛选的行为才会包括在内。

  • FileGroupIncluded (array) – 可选。对于 FilesByFileGroup 报告,指定要包括哪些文件组。

  • FileOwnerFilePattern (string) – 可选。对于 FilesByOwner 报告,指定用于筛选结果的文件模式。

  • PropertyName (string) – 可选。对于 FilesByProperty 报告,指定要作为分组依据的分类属性。

  • FolderPropertyName (string) – 可选。对于 FoldersByProperty 报告,指定要作为分组依据的文件夹属性。

  • PropertyFilePattern (string) – 可选。对于 FilesByProperty 和 FoldersByProperty,指定用于筛选结果的文件模式。

  • LargeFileMinimum (number) – 可选。对于 LargeFiles 报告,指定最小文件大小(以字节为单位)。

  • LargeFilePattern (string) – 可选。对于 LargeFiles 报告,指定用于筛选结果的文件模式。

  • LeastAccessedMinimum (number) – 可选。对于 LeastRecentlyAccessed 报告,请指定自上次访问以来的最小天数。

  • LeastAccessedFilePattern (string) – 可选。对于 LeastRecentlyAccessed 报告,指定用于筛选结果的文件模式。

  • MostAccessedMaximum (number) – 可选。对于 MostRecentlyAccessed 报告,指定自上次访问以来的最大天数。

  • MostAccessedFilePattern (string) – 可选。对于 MostRecentlyAccessed 报告,指定用于筛选结果的文件模式。

  • QuotaMinimumUsage (number) – 可选。对于 QuotaUsage 报告,请指定要包括的最低配额使用百分比。

示例:

1. 创建每月大文件报告。

$schedule = @{ Time = ("3:00 AM") Monthly = @(1) # Run on first day } Invoke-Command -ComputerName $FSxWindowsRemotePowerShellEndpoint -ConfigurationName FSxRemoteAdmin -ArgumentList $schedule -ScriptBlock { param($schedule) New-FSxFSRMStorageReport -Name "Monthly Large Files" -Namespace "share\data" -ReportType "LargeFiles" -LargeFileMinimum 100MB -ReportFormat "HTML" -ScheduleConfigurations $schedule }

2. 创建包含多种命名空间和格式的每周重复文件报告。

$schedule = @{ Time = ("12:00 AM") Weekly = @('Sunday') RunDuration = 4 } $namespaces = @("share\docs", "[FolderUsage_MS=User Files]") $reportFormats = @("HTML", "CSV") Invoke-Command -ComputerName $FSxWindowsRemotePowerShellEndpoint -ConfigurationName FSxRemoteAdmin -ArgumentList @($schedule, $namespaces, $reportFormats) -ScriptBlock { param($schedule, $namespaces, $reportFormats) New-FSxFSRMStorageReport -Name "Weekly Duplicates" -Namespace $namespaces -ReportType "DuplicateFiles" -ReportFormat $reportFormats -ScheduleConfigurations $schedule }

3. 创建可立即运行的交互式报告。

Invoke-Command -ComputerName $FSxWindowsRemotePowerShellEndpoint -ConfigurationName FSxRemoteAdmin -ScriptBlock { New-FSxFSRMStorageReport -Name "Find large files" -Namespace "share" -Interactive $true -ReportType "QuotaUsage" }

获取-FSx FSRMStorage 报告

获取FSxFSRMStorage报告:从您的文件系统检索一份或多份存储报告。返回有关报告配置和状态的详细信息。

参数:

  • Name (array) – 可选。要检索的报告名称数组。如果您未指定名称,则该命令将返回文件系统上的所有存储报告。

示例:

1. 检索文件系统上的所有存储报告。

Invoke-Command -ComputerName $FSxWindowsRemotePowerShellEndpoint -ConfigurationName FSxRemoteAdmin -ScriptBlock { Get-FSxFSRMStorageReport }

移除-FSx FSRMStorage 举报

删除-FSx FSRMStorage 报告:从您的文件系统中删除一个或多个存储报告。您无法删除当前正在运行的报告。

参数:

  • Name (array) – 必需。要删除的报告名称数组。

  • PassThru (boolean) – 可选。如果设置为 true,则返回已删除的报表对象。

示例:

1. 移除单个存储报告。

Invoke-Command -ComputerName $FSxWindowsRemotePowerShellEndpoint -ConfigurationName FSxRemoteAdmin -ScriptBlock { Remove-FSxFSRMStorageReport -Name "Monthly Report" -PassThru }

Set-FSx FSRMStorage Report

Parameters
  • Name (array) – 必需。要修改的报告名称数组。

  • Namespace (array) – 可选。要分析的路径或文件夹类型数组。您可以指定多种格式的路径:

    • 文件夹路径

    • 文件夹分类。例如,[FolderUsage_ms= “用户文件"]

  • ReportType (array) – 可选。要生成的报告类型数组。可以指定以下值:

    • DuplicateFiles:根据文件大小和内容识别重复文件

    • FilesByFileGroup: 按文件组成员资格对文件进行分组

    • FilesByOwner: 按所有者对文件进行分组

    • FilesByProperty: 按分类属性对文件进行分组

    • FileScreenAuditFiles: 列出文件筛选违规行为

    • FoldersByProperty: 按管理属性对文件夹进行分组

    • LargeFiles: 列出超过指定大小阈值的文件

    • LeastRecentlyAccessed: 列出最近未被访问过的文件

    • MostRecentlyAccessed: 列出最近访问过的文件

    • QuotaUsage: 显示配额使用情况统计信息

  • ReportFormat (array) – 可选。输出格式的数组。可以指定以下值:

    • DHTML: 动态 HTML 格式

    • HTML: 静态 HTML 格式

    • XML: XML 格式

    • CSV: 逗号分隔值格式

    • Text: 纯文本格式

  • ScheduleConfigurations (hashtable)-除非报告是交互式的,否则为必填项。包含具有以下属性的计划配置的哈希表:

    • Time (datetime): 指定何时运行任务的 DateTime 对象(必需)

    • RunDuration (number): 运行任务的小时数(可选)

    • Weekly (array): 工作日数组(可选)

    • Monthly (array): 一个月中的几天数组,-1用于最后一天(可选)

  • PassThru (boolean) – 可选。如果设置为 true,则返回修改后的报表对象。

特定于报告的参数
  • FileScreenAuditDaysSince (number) – 可选。对于 FileScreenAuditFiles 报告,请指定包含审计事件的天数。

  • FileScreenAuditUser (array) – 可选。对于 FileScreenAuditFiles 报告,指定要包含在报告中的用户帐户数组。只有这些用户违反文件筛选的行为才会包括在内。

  • FileGroupIncluded (array) – 可选。对于 FilesByFileGroup 报告,指定要包括哪些文件组。

  • FileOwnerFilePattern (string) – 可选。对于 FilesByOwner 报告,指定用于筛选结果的文件模式。

  • PropertyName (string) – 可选。对于 FilesByProperty 报告,指定要作为分组依据的分类属性。

  • FolderPropertyName (string) – 可选。对于 FoldersByProperty 报告,指定要作为分组依据的文件夹属性。

  • PropertyFilePattern (string) – 可选。对于 FilesByProperty 和 FoldersByProperty,指定用于筛选结果的文件模式。

  • LargeFileMinimum (number) – 可选。对于 LargeFiles 报告,指定最小文件大小(以字节为单位)。

  • LargeFilePattern (string) – 可选。对于 LargeFiles 报告,指定用于筛选结果的文件模式。

  • LeastAccessedMinimum (number) – 可选。对于 LeastRecentlyAccessed 报告,请指定自上次访问以来的最小天数。

  • LeastAccessedFilePattern (string) – 可选。对于 LeastRecentlyAccessed 报告,指定用于筛选结果的文件模式。

  • MostAccessedMaximum (number) – 可选。对于 MostRecentlyAccessed 报告,指定自上次访问以来的最大天数。

  • MostAccessedFilePattern (string) – 可选。对于 MostRecentlyAccessed 报告,指定用于筛选结果的文件模式。

  • QuotaMinimumUsage (number) – 可选。对于 QuotaUsage 报告,请指定要包括的最低配额使用百分比。

示例:

1. 更新现有报告的日程安排和格式。

$schedule = @{ Time = ("3:00 AM") Monthly = @(1) } $reportFormats = @("HTML", "CSV") Invoke-Command -ComputerName $FSxWindowsRemotePowerShellEndpoint -ConfigurationName FSxRemoteAdmin -ArgumentList @($schedule, $reportFormats) -ScriptBlock { param($schedule, $reportFormats) Set-FSxFSRMStorageReport -Name "Monthly Report" -ScheduleConfigurations $schedule -ReportFormat $reportFormats -PassThru }

报告执行命令

开始-FSx FSRMStorage 报告

Parameters
  • Name (array) – 必需。要开始的报告名称数组。

  • Queue (boolean) – 可选。如果设置为 true,则将报告添加到队列中,以便在接下来的 5 分钟内运行。在此期间排队的所有报告都将一起运行。如果设置为 false 或未指定,则报告将立即启动。

  • RunDuration (number) – 可选。指定报告在取消之前应运行多少小时。有效值:-12147483。特殊值:

    • 0: 运行至完成

    • -1: 运行直到取消

    如果未指定,则运行直至完成。

示例

1. 立即开始提交存储报告。

Invoke-Command -ComputerName $FSxWindowsRemotePowerShellEndpoint -ConfigurationName FSxRemoteAdmin -ScriptBlock { Start-FSxFSRMStorageReport -Name "Monthly Report" }

2. 对具有持续时间限制的存储报告进行排队。

Invoke-Command -ComputerName $FSxWindowsRemotePowerShellEndpoint -ConfigurationName FSxRemoteAdmin -ScriptBlock { Start-FSxFSRMStorageReport -Name "Quarterly Report" -Queue: $true -RunDuration 4 }

停止-FSx FSRMStorage 举报

Parameters
  • Name (array) – 必需。要停止的报告名称数组。

示例:

1. 停止单个存储报告。

Invoke-Command -ComputerName $FSxWindowsRemotePowerShellEndpoint -ConfigurationName FSxRemoteAdmin -ScriptBlock { Stop-FSxFSRMStorageReport -Name "Monthly Report" }

等着FSxFSRMStorage举报

Parameters
  • Name (array) – 必需。要等待的报告名称数组。

  • Timeout (number) – 可选。指定报告完成需要等待多长时间(以秒为单位)。如果超时在报告完成之前过期,则命令会返回,但报告生成将继续在后台运行。有效值:-12147483。特殊值:

    • -1: 无限期等待,直到报告完成(默认)

    • 0: 检查当前状态并立即返回,无需等待

示例:

1. 无限期地等待存储报告完成。

Invoke-Command -ComputerName $FSxWindowsRemotePowerShellEndpoint -ConfigurationName FSxRemoteAdmin -ScriptBlock { Wait-FSxFSRMStorageReport -Name "Monthly Report" }