翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
とは AWS HealthOmics
AWS HealthOmics は、バイオインフォマティクスワークフローの背後にある複雑なインフラストラクチャを完全に管理することで、臨床診断テスト、創薬、農業研究を加速する HIPAA 対応サービスです。HealthOmics は、業界標準のワークフロー言語 (WDL、Nextflow、CWL) をサポートし、バイオインフォマティクスインフラストラクチャをシームレスにスケーリングして、1 日あたり数万回のテストからのデータをサポートします。これらはすべて、サンプルあたりの予測可能なコストです。HealthOmics は、コンピューティングリソースの管理やワークフローエンジンの維持などの技術的な複雑さを処理するため、科学的な進歩に専念できます。
トピック
重要な注意点
HealthOmics は、専門的な医療上のアドバイス、診断、または治療に代わるものではなく、疾患や病状の修復、治療、緩和、予防、診断を目的としていません。お客様は、臨床上の意思決定を通知することを目的としたサードパーティー製品に関連するものを含め AWS HealthOmics、 の使用の一環として人間によるレビューを代行する責任があります。
HealthOmics は、データの転送、保存、フォーマット、表示、およびワークフロー管理のためのインフラストラクチャと設定のサポートの提供のみを目的としています。 AWS HealthOmics は、バリアント呼び出しやゲノム分析と解釈を直接実行することを目的としたものではありません。 AWS HealthOmics は、臨床ラボテストやその他のデバイスデータ、結果、結果の解釈や分析を目的としたものではなく、ゲノム分析での使用を目的としたサードパーティー製ツールに代わるものではありません。
HealthOmics の機能
HealthOmics の主なユースケース:
-
臨床診断 – 予測可能なコストと、テスト量に応じて増加するフルマネージドインフラストラクチャを使用して、診断テストワークフローを構築およびスケールします。
-
創薬 – 生物学的基盤モデルを大規模にオーケストレーションすることで、治療研究を加速し、数百万の候補にわたって迅速な反復を可能にします。
-
農業研究 – 食料安全保障と農業生産性を向上させる AI を活用したワークフローを通じて、旱魃耐性や有害生物耐性などの作物の特性を強化します。
HealthOmics の主な利点:
-
スケーラビリティ – 100,000 以上の同時 vCPUsし、インフラストラクチャ管理を行わず、サンプルあたりのコストを予測可能な数万件のテストを毎日サポートします。
-
インフラストラクチャではなく科学に焦点を当てる – 使い慣れたワークフロー言語と APIs を使用し、インフラストラクチャのオーケストレーションとデータ管理をバックグラウンドで AWS 自動的に処理します。
-
コンプライアンスの維持 — 包括的な監査証跡、データ出所追跡、および臨床ワークフロー用に設計された HIPAA 対象インフラストラクチャは、すべてout-of-the-box使用できるため、規制要件を満たすソリューションの開発をサポートします。
HealthOmics は 3 つの主要コンポーネントで構成されています。
-
HealthOmics ワークフロー — 自動プロビジョニングおよびスケーリングされたインフラストラクチャでバイオインフォマティクス計算を実行します。
-
HealthOmics ストレージ — ギガベースあたりの低コストで、ペタバイトのゲノミクスデータを効率的に保存および共有します。
-
HealthOmics 分析 — マルチオミクスおよびマルチモーダル分析用のゲノミクスデータを準備します。
これらのコンポーネントを個別に使用するか、組み合わせてend-to-endソリューションにします。
HealthOmics の概念
このトピックでは、このガイドで使用されている HealthOmics の用語を理解するのに役立つ、HealthOmics に固有の主要な概念と用語の定義について説明します。
ワークフロー
HealthOmics ワークフローを使用すると、ゲノミクスデータを処理および分析できます。
-
ワークフロー – パラメータやツールへの参照を含むエンドツーエンドプロセスの全体的な定義。ワークフロー定義は、WDL、Nextflow、または CWL として表現できます。作成された各ワークフローには一意の識別子があります。
-
実行 — ワークフローの 1 回の呼び出し。個々の実行では、定義された入力データを使用して出力が生成されます。作成された各実行には一意の識別子があります。
-
タスク – 実行内の個々のプロセス。HealthOmics ワークフローは、これらの定義されたコンピューティング仕様を使用してタスクを実行します。各タスクには一意の識別子があります。
-
実行グループ – 最大 vCPU、最大継続時間、または最大同時実行を設定して、実行ごとに使用されるコンピューティングリソースを制限するのに役立つ実行のグループ。実行グループ内で実行の優先順位を指定および設定できます。たとえば、優先度の低い実行の前に優先度の高い実行を実行し、優先度キューを作成するように指定できます。実行グループの使用はオプションであり、各実行グループには一意の識別子があります。
ストレージ
データストレージは、ゲノミクスシーケンスおよび関連情報についてはシーケンスストアに、すべての参照ゲノムについてはリファレンスストアに分割されます。以下の用語では、HealthOmics に固有の実装について説明します。
-
シーケンスストア – ゲノミクスファイルを保存するためのデータストア。HealthOmics 内に 1 つ以上のシーケンスストアを持つことができます。アクセス許可と AWS KMS 暗号化をシーケンスストアに設定して、データにアクセスできるユーザーを制御できます。
-
リードセット – リードセットは、ゲノム読み取りの抽象化であり、FASTQ、BAM、または CRAM 形式で保存されます。リードセットはシーケンスストアにインポートし、メタデータで注釈を付けることができます。属性ベースのアクセスコントロール (ABAC) を使用して、読み取りセットにアクセス許可を適用できます。
-
リファレンス – ゲノムリファレンスは、ゲノム内の特定の読み取り、または読み取りグループがマッピングされている場所を特定するために、読み取りとともに使用されます。これらは FASTA 形式で、リファレンスストアに保存されます。
-
リファレンスストア – リファレンスゲノムを保存するためのデータストア。アカウントとリージョンごとに 1 つのリファレンスストアを持つことができます。
分析
HealthOmics Analytics を使用して、ゲノムデータを変換および分析できます。バリアントストアまたは注釈ストアを作成して、クエリの追加情報を含めます。
-
バリアントストア – 母集団規模でバリアントデータを保存するデータストア。バリアントストアは、ゲノムバリアントコール形式 (gVCF) と VCF 入力の両方をサポートします。
-
注釈ストア – TSV/CSV、VPC、または General Feature Format (GFF3) ファイルからの注釈データベースを表すデータストア。Annotation Stores は、インポート中にバリアントストアと同じ座標系にマッピングされます。
関連サービス
次のサービスは HealthOmics で動作します。
-
Amazon Elastic Container Registry – 各プライベートワークフローは、Amazon ECR イメージ (プライベート Amazon ECR リポジトリ内) を使用して、ワークフローの実行に必要なすべての実行可能ファイル、ライブラリ、スクリプトを含めます。
-
Amazon Simple Storage Service – Amazon S3 は、ストアデータとワークフローデータ用のファイルストレージを提供します。
-
AWS Lake Formation – Lake Formation は、分析データストアへのデータアクセスを管理します。
-
Amazon Athena – Athena を使用してバリアントストアでクエリを実行します。
-
Amazon SageMaker AI – SageMaker AI を使用して、Jupyter ノートブックを使用して HealthOmics タスクを実行します。
-
GitHub connections – 接続を使用して、外部コードリポジトリを HealthOmics ワークフローに接続します。
HealthOmics にアクセスする方法
AWS HealthOmics 機能には、 マネジメントコンソール、 CLI、 SDKs、または API を使用してアクセスできます。
-
AWS マネジメントコンソール – HealthOmics へのアクセスに使用できるウェブインターフェイスを提供します。
-
AWS Command Line Interface (AWS CLI) – Windows、macOS AWS HealthOmics、Linux など、幅広い AWS サービスのコマンドを提供します。のインストールの詳細については AWS CLI、「」を参照してくださいAWS Command Line Interface
。 -
AWS SDKs – さまざまなプログラミング言語とプラットフォーム (Java、Python、Ruby、.NET、iOS、Android など) のライブラリとサンプルコードで構成される SDKs (ソフトウェア開発キット) AWS を提供します。SDKs は、プログラムで HealthOmics を使用するための便利な方法を提供します。詳細については、AWS 「 SDK デベロッパーセンター
」を参照してください。 -
AWS API – API オペレーションを使用して、プログラムでHEALTHOMICSにアクセスして管理できます。詳細については、HealthOmics API リファレンス」を参照してください。
AWS HealthOmics のリージョンとエンドポイント
リージョンとエンドポイントの完全なリストについては、AWS 「 全般のリファレンス」を参照してください。
デフォルトでアクティブになっている AWS リージョンに加えて、アクティブ化する必要があるオプトインリージョンもあります。リージョンをアクティブ化または非アクティブ化する方法の詳細については、「 アカウント管理ガイド」の「アカウントで使用できる AWS リージョンを指定する」を参照してください。 AWS
詳細はこちら
HealthOmics の詳細については、以下のワークショップとチュートリアルを参照してください。
-
HealthOmics ワークショップ – HealthOmics エンドツーエンドワークショップ
-
AWS ゲノミクスリソース – ゲノミクスに関連するパブリック Amazon ECR リポジトリ
-
Python チュートリアル – HealthOmics ストレージ、分析、ワークフローをカバーする GitHub の Jupyter Notebook チュートリアル
AWS 以下を提供する追加の HealthOmics ツールに精通してください。
-
WDL linter – WDL 用の HealthOmics linter
-
Nextflow linter – Nextflow の HealthOmics linter
-
HealthOmics Amazon ECR ヘルパーツール – HealthOmics 用の Amazon ECR ヘルパーツール
-
GitHub の HealthOmics ツール – HealthOmics を操作するためのツール
(転送マネージャー、URI パーサー、Omics 再実行、アナライザーの実行)。