运行时 HealthOmics 运行保留模式 - AWS HealthOmics

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

运行时 HealthOmics 运行保留模式

运行完成后,将运行元数据 HealthOmics 存档到 CloudWatch。默认情况下,除非您更改 CloudWatch 保留策略,否则会无限期 CloudWatch 保留运行数据。运行输出也会存储在 Amazon S3 中,直到您将其删除。

其中一个可调整项HealthOmics 服务配额maximum number of runs (active and inactive)区域内。 HealthOmics 保留运行元数据以供控制台和 API 操作使用(ListRuns 和 GetRun),最多可运行此次数。开始运行时,可以设置运行保留模式参数以指示运行的保留行为。该参数支持 “移除” 和 “保留” 值。

对于保留模式设置为 REMOVE 的新运行,如果在保存了最大运行次数后 HealthOmics 尝试添加该运行,它会自动删除设置了 REMOVE 模式的最早运行的元数据。此移除不会影响存储在 CloudWatch 或 Amazon S3 中的数据。

RETAIN 是运行保留模式的默认值。对于在此模式下运行,系统不会删除运行元数据。如果 HealthOmics 达到最大运行次数(全部设置为 RETAIN),则在删除某些试验之前,您将无法创建其他游程。

如果您计划同时运行超过最大运行次数的批次,请务必将运行保留模式设置为 REMOVE。否则,当 HealthOmics 尝试在最大值之后开始下一次运行时,批处理将失败。

使用 “移除” 保留模式的其他注意事项:

  • 当你第一次开始使用 REMOVE 作为保留模式时,可以考虑删除一个或多个使用 RETAIN 模式的运行,以腾出插槽。当你开始额外的 REMOVE 运行时,自动删除会占据主导地位,因此有足够的插槽可供新的运行使用。

  • 如果要重新运行已存档的运行(或一组运行),请使用 HealthOmics 重新运行 CLI 工具。有关如何使用此工具的更多信息和示例,请参阅工具存储库中的 Omics 重新运行。 HealthOmics GitHub

  • 我们建议您为每次运行配置一个唯一的名称。 HealthOmics 删除运行后,您将无法使用控制台或 API 来查找运行名称或运行 ID。但是,您可以使用 CloudWatch 搜索运行名称,因此请使用唯一名称来获得最佳搜索结果。

  • 您可以使用 CloudWatch start-query命令来获取有关已存档运行的信息。如果运行名称不是唯一的,则查询可能会返回多个清单。开始时间和结束时间参数定义搜索的时间范围。

    aws logs start-query \ --log-group-name "/aws/omics/WorkflowLog" \ --query-string 'filter @logStream like "manifest" and @message like "myRunName"' \ --end-time <END-EPOCH-TIME> --start-time <START-EPOCH-TIME>

    start-query命令返回查询 ID。将查询 ID 传递给get-query-results命令会返回查询结果。

    aws logs get-query-results --query-id QueryId