什麼是 AWS HealthOmics? - AWS HealthOmics

AWS HealthOmics 自 2025 年 11 月 7 日起,變體存放區和註釋存放區將不再開放給新客戶。如果您想要使用變體存放區或註釋存放區,請在該日期之前註冊。現有客戶可以繼續正常使用服務。如需詳細資訊,請參閱AWS HealthOmics 變體存放區和註釋存放區可用性變更

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

什麼是 AWS HealthOmics?

AWS HealthOmics 是一項符合 HIPAA 資格的服務,可透過完全管理生物資訊學工作流程背後的複雜基礎設施,加速臨床診斷測試、藥物探索和農業研究。HealthOmics 支援業界標準的工作流程語言 (WDL、Nextflow、CWL),並順暢地擴展生物資訊基礎設施,以支援每天數萬次測試的資料,全部都具有每個樣本的可預測成本。HealthOmics 處理技術複雜性,例如管理運算資源和維護工作流程引擎,因此您可以完全專注於科學創新。

重要通知

HealthOmics 僅適用於傳輸、儲存、格式化或顯示資料,以及提供基礎設施和組態支援來管理工作流程。HealthOmics 無法取代專業醫療建議、診斷或治療,也無法修復、治療、緩解、預防或診斷任何疾病或健康狀況。您有責任將人工審核作為 的任何使用的一部分 AWS HealthOmics,包括與旨在告知臨床決策的任何第三方產品相關。

HealthOmics 功能

HealthOmics 的主要使用案例:

  • 臨床診斷 – 使用可預測的成本和隨測試量成長的全受管基礎設施來建置和擴展診斷測試工作流程。

  • 藥物探索 – 透過大規模協調生物基礎模型來加速治療性研究,讓數百萬潛在候選者能夠快速迭代。

  • 農業研究 – 透過 AI 驅動的工作流程來改善食品安全和農業生產力,從而增強作物特性,例如乾旱容忍能力和抗蟲能力。

HealthOmics 的主要優點:

  • 可擴展性 – 將工作流程擴展到超過 100,000 個並行 vCPUs,每天支援數萬次測試,無需基礎設施管理和每個樣本的可預測成本。

  • 專注於科學,而不是基礎設施 – 使用熟悉APIs,同時 AWS 自動處理幕後的基礎設施協同運作和資料管理。

  • 維持合規性 – 針對臨床工作流程設計的全面稽核線索、資料來源追蹤和符合 HIPAA 資格的基礎設施,全都out-of-the-box,可支援開發符合法規要求的解決方案。

HealthOmics 包含三個主要元件:

請獨立使用這些元件,或結合這些元件來提供end-to-end解決方案。

HealthOmics 概念

本主題涵蓋 HealthOmics 特有的關鍵概念和術語的定義,以協助您了解 HealthOmics 使用本指南的術語。

工作流程

透過 HealthOmics 工作流程,您可以處理和分析基因體資料。

  • 工作流程 – 端對端程序的整體定義,包括參數和工具的參考。工作流程定義可以表示為 WDL、Nextflow 或 CWL。每個建立的工作流程都有唯一的識別符。

  • 執行 – 工作流程的單一調用。個別執行會使用您定義的輸入資料,並產生輸出。每個建立的執行都有唯一的識別符。

  • 任務 – 執行中的個別程序。HealthOmics Workflows 使用這些定義的運算規格來執行您的任務。每個任務都有唯一的識別符。

  • 執行群組 – 一組執行,您可以設定最大 vCPU、最大持續時間或最大並行執行,以協助限制每次執行所使用的運算資源。您可以在執行群組中指定和設定執行的優先順序。例如,您可以指定在較低優先順序之前執行高優先順序執行,以建立優先順序佇列。使用執行群組是選用的,而且每個執行群組都有唯一的識別符。

儲存

資料儲存體會分為序列存放區、用於基因體序列和相關資訊,以及用於所有參考基因體的參考存放區。下列術語說明 HealthOmics 特有的實作。

  • 序列存放區 – 用於儲存基因體檔案的資料存放區。您可以在 HealthOmics 中擁有一或多個序列存放區。您可以在序列存放區上設定存取許可和 AWS KMS 加密,以控制誰可以存取資料。

  • 讀取集 – 讀取集是基因體讀取的抽象,以 FASTQ、BAM 或 CRAM 格式儲存。讀取集可以匯入序列存放區,並以中繼資料標註。您可以使用屬性型存取控制 (ABAC) 將許可套用至讀取集。

  • 參考 – 基因體參考會與讀取搭配使用,以識別特定讀取或一組讀取在基因體中的對應位置。這些格式為 FASTA,並存放在參考存放區中。

  • 參考存放區 – 用於儲存參考基因體的資料存放區。您可以在每個帳戶和區域中擁有單一參考存放區。

分析

您可以使用 HealthOmics Analytics 轉換和分析基因體資料。建立變體存放區或註釋存放區,以包含查詢的其他資訊。

  • 變體存放區 – 以人口規模存放變體資料的資料存放區。變體存放區支援基因體變體呼叫格式 (gVCF) 和 VCF 輸入。

  • 註釋存放區 – 代表註釋資料庫的資料存放區,例如來自 TSV/CSV、VCF 或一般功能格式 (GFF3) 檔案的資料存放區。註釋存放區會在匯入期間對應至與變體存放區相同的座標系統。

下列 服務適用於 HealthOmics。

  • Amazon Elastic Container Registry – 每個私有工作流程使用 Amazon ECR 映像 (在私有 Amazon ECR 儲存庫中) 來包含執行工作流程所需的所有可執行檔、程式庫和指令碼。

  • Amazon Simple Storage Service – Amazon S3 為儲存和工作流程資料提供檔案儲存。

  • AWS Lake Formation – Lake Formation 管理對 Analytics 資料存放區的資料存取。

  • Amazon Athena – 使用 Athena 對變體存放區執行查詢。

  • Amazon SageMaker AI – 使用 SageMaker AI 使用 Jupyter 筆記本執行 HealthOmics 任務。

  • GitHub connections – 使用連線將您的外部程式碼儲存庫連線至 HealthOmics 工作流程。

如何存取 HealthOmics

您可以使用 管理主控台、CLI、 SDKs或 API 來存取 AWS HealthOmics 功能。

  • AWS 管理主控台 – 提供可用來存取 HealthOmics 的 Web 界面。

  • AWS Command Line Interface (AWS CLI) – 為廣泛的 AWS 服務提供命令,包括 Windows AWS HealthOmics、macOS 和 Linux 支援 和 。如需安裝 的詳細資訊 AWS CLI,請參閱 AWS Command Line Interface

  • AWS SDKs – AWS 提供SDKs開發套件 (軟體開發套件),其中包含適用於各種程式設計語言和平台 (包括 Java、Python、Ruby、.NET、iOS 和 Android) 的程式庫和範本程式碼。SDKs提供以程式設計方式使用 HealthOmics 的便利方式。如需詳細資訊,請參閱 AWS SDK 開發人員中心

  • AWS API – 您可以使用 API 操作,以程式設計方式存取和管理 HealthOmics。如需詳細資訊,請參閱 HealthOmics API 參考

AWS HealthOmics 的區域和端點

如需區域和端點的完整清單,請參閱 AWS 一般參考

除了預設作用中 AWS 的區域之外,還需要啟用選擇加入區域。若要進一步了解如何啟用或停用區域,請參閱《帳戶管理指南》中的指定 AWS 您的帳戶可以使用的區域。 AWS

進一步了解

從這些研討會和教學課程進一步了解 HealthOmics:

熟悉其他 HealthOmics 工具, AWS 提供: