在 HealthOmics 变体商店上运行查询 - AWS HealthOmics

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

在 HealthOmics 变体商店上运行查询

重要

AWS HealthOmics 变体存储和注释存储不再向新客户开放。现有客户可以继续正常使用该服务。有关更多信息,请参阅 AWS HealthOmics 变体存储和注释存储库可用性变更

您可以使用 Amazon Athena 对您的多属性商店进行查询。请注意,变体和注释存储中的基因组坐标表示为从零开始、半封闭的半开间隔。

使用 Athena 控制台运行简单查询

以下示例说明如何运行简单查询。

  1. 打开 Athena 查询编辑器:Athena 查询编辑器

  2. 在 “工作组” 下,选择您在安装过程中创建的工作组。

  3. 验证数据源是否为AwsDataCatalog

  4. 对于数据库,选择您在 Lake Formation 设置期间创建的数据库资源链接。

  5. 将以下查询复制到查询编辑器的 Qu ery 1 选项卡下:

    SELECT * from omicsvariants limit 10
  6. 选择运行以运行查询。控制台使用表格的前 10 行填充结果omicsvariants表。

使用 Athena 控制台运行复杂查询

以下示例说明如何运行复杂查询。要运行此查询,请导ClinVar入注释存储库。

运行复杂查询
  1. 打开 Athena 查询编辑器:Athena 查询编辑器

  2. 在 “工作组” 下,选择您在安装过程中创建的工作组。

  3. 验证数据源是否为AwsDataCatalog

  4. 对于数据库,选择您在 Lake Formation 设置期间创建的数据库资源链接。

  5. 选择右+上角的,创建一个名为 Query 2 的新查询选项卡。

  6. 将以下查询复制到 Query 2 选项卡下的查询编辑器中:

    SELECT variants.sampleid, variants.contigname, variants.start, variants."end", variants.referenceallele, variants.alternatealleles, variants.attributes AS variant_attributes, clinvar.attributes AS clinvar_attributes FROM omicsvariants as variants INNER JOIN omicsannotations as clinvar ON variants.contigname=CONCAT('chr',clinvar.contigname) AND variants.start=clinvar.start AND variants."end"=clinvar."end" AND variants.referenceallele=clinvar.referenceallele AND variants.alternatealleles=clinvar.alternatealleles WHERE clinvar.attributes['CLNSIG']='Likely_pathogenic'
  7. 选择 Run 开始运行查询。