查询 HealthOmics 分析数据 - AWS HealthOmics

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

查询 HealthOmics 分析数据

重要

AWS HealthOmics 变体存储和注释存储不再向新客户开放。现有客户可以继续正常使用该服务。有关更多信息,请参阅 AWS HealthOmics 变体存储和注释存储库可用性变更

您可以使用亚马逊 Athena 或 Amazon AWS Lake Formation EMR 对您的多属性商店进行查询。在运行任何查询之前,请完成 Lake Formation 和 Amazon Athena 的设置过程(如以下各节所述)。

有关 Amazon EMR 的信息,请参阅教程:亚马逊 EMR 入门

对于 2024 年 9 月 26 日之后创建的多属性商店,按样本 ID 对商店进行 HealthOmics 分区。这种分区意味着 HealthOmics 使用样本 ID 来优化变体信息的存储。使用示例信息作为筛选器的查询将更快地返回结果,因为查询扫描的数据较少。

HealthOmics 使用示例 IDs 作为分区文件名。在采集数据之前,请检查样本 ID 是否包含任何 PHI 数据。如果是,请在采集数据之前更改样本 ID。有关样本中应包含和不包含哪些内容的更多信息 IDs,请参阅 AWS HIPAA 合规性网页上的指南。