在 HealthOmics 變體存放區上執行查詢 - AWS HealthOmics

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

在 HealthOmics 變體存放區上執行查詢

重要

AWS HealthOmics 變體存放區和註釋存放區不再開放給新客戶。現有客戶可以繼續正常使用該服務。如需詳細資訊,請參閱AWS HealthOmics 變體存放區和註釋存放區可用性變更

您可以使用 Amazon Athena 在變體存放區上執行查詢。請注意,變體和註釋存放區中的基因體座標表示為以零為基礎、半封閉的半開間隔。

使用 Athena 主控台執行簡單的查詢

下列範例示範如何執行簡單的查詢。

  1. 開啟 Athena 查詢編輯器:Athena 查詢編輯器

  2. 工作群組下,選取您在設定期間建立的工作群組。

  3. 確認資料來源AwsDataCatalog

  4. 針對資料庫,選取您在 Lake Formation 設定期間建立的資料庫資源連結。

  5. 將下列查詢複製到查詢 1 索引標籤下的查詢編輯器

    SELECT * from omicsvariants limit 10
  6. 選擇執行以執行查詢。主控台會將資料表的前 10 列填入結果omicsvariants資料表。

使用 Athena 主控台執行複雜的查詢

下列範例示範如何執行複雜的查詢。若要執行此查詢,ClinVar請將 匯入註釋存放區。

執行複雜的查詢
  1. 開啟 Athena 查詢編輯器:Athena 查詢編輯器

  2. 工作群組下,選取您在設定期間建立的工作群組。

  3. 確認資料來源AwsDataCatalog

  4. 針對資料庫,選取您在 Lake Formation 設定期間建立的資料庫資源連結。

  5. 選擇右上角+的 ,以建立新的查詢索引標籤,名為查詢 2

  6. 將下列查詢複製到查詢 2 索引標籤下的查詢編輯器

    SELECT variants.sampleid, variants.contigname, variants.start, variants."end", variants.referenceallele, variants.alternatealleles, variants.attributes AS variant_attributes, clinvar.attributes AS clinvar_attributes FROM omicsvariants as variants INNER JOIN omicsannotations as clinvar ON variants.contigname=CONCAT('chr',clinvar.contigname) AND variants.start=clinvar.start AND variants."end"=clinvar."end" AND variants.referenceallele=clinvar.referenceallele AND variants.alternatealleles=clinvar.alternatealleles WHERE clinvar.attributes['CLNSIG']='Likely_pathogenic'
  7. 選擇執行以開始執行查詢。