HealthOmics シーケンスストアの作成 - AWS HealthOmics

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

HealthOmics シーケンスストアの作成

HealthOmics シーケンスストアは、 FASTQ (gzip のみ) および の非整列形式のゲノムファイルのストレージをサポートしていますuBAM。また、 BAMおよび のアラインされた形式もサポートしていますCRAM

インポートされたファイルは読み取りセットとして保存されます。読み取りセットにタグを追加し、IAM ポリシーを使用して読み取りセットへのアクセスを制御できます。整列されたリードセットには、ゲノムシーケンスを整列させるために参照ゲノムが必要ですが、整列されていないリードセットではオプションです。

リードセットを保存するには、まずシーケンスストアを作成します。シーケンスストアを作成するときは、オプションの Amazon S3 バケットをフォールバックの場所と S3 アクセスログが保存される場所として指定できます。フォールバックの場所は、直接アップロード中に読み取りセットの作成に失敗したファイルを保存するために使用されます。フォールバックロケーションは、2023 年 5 月 15 日以降に作成されたシーケンスストアで利用できます。シーケンスストアを作成するときに、フォールバックの場所を指定します。

最大 5 つのリードセットタグキーを指定できます。これらのキーのいずれかに一致するタグキーを使用して読み取りセットを作成または更新すると、読み取りセットタグは対応する Amazon S3 オブジェクトに伝達されます。HealthOmics によって作成されたシステムタグは、デフォルトで伝播されます。

コンソールを使用したシーケンスストアの作成

シーケンスストアを作成するには
  1. HealthOmics コンソールを開きます。

  2. 左側のナビゲーションペインで、シーケンスストアを選択します。

  3. シーケンスストアの作成ページで、次の情報を入力します。

    • シーケンスストア名 - このストアの一意の名前。

    • 説明 (オプション) - このシーケンスストアの説明。

  4. S3 のフォールバックの場所には、Amazon S3 の場所を指定します。HealthOmics はフォールバックの場所を使用して、直接アップロード中に読み取りセットの作成に失敗したファイルを保存します。HealthOmics サービスに Amazon S3 フォールバックロケーションへの書き込みアクセスを許可する必要があります。ポリシーの例についてはフォールバックの場所を設定するを参照してください。

    フォールバックロケーションは、2023 年 5 月 16 日より前に作成されたシーケンスストアでは使用できません。

  5. (オプション) S3 伝達のリードセットタグキーの場合、最大 5 つのリードセットキーを入力して、リードセットから基盤となる S3 オブジェクトに伝達できます。読み取りセットから S3 オブジェクトにタグを伝播することで、タグやエンドユーザーに基づいて S3 アクセス許可を付与し、Amazon S3 getObjectTagging API オペレーションを通じて伝播されたタグを表示できます。

    1. テキストボックスに 1 つのキー値を入力します。コンソールは、次のキーを追加する新しいテキストボックスを作成します。

    2. (オプション) 削除 を選択して、すべてのキーを削除します。

  6. データ暗号化で、データ暗号化を が所有および管理するか、カスタマー管理の CMK AWS を使用するかを選択します。

  7. (オプション) S3 データアクセスで、Amazon S3 経由でシーケンスストアにアクセスするための新しいロールとポリシーを作成するかどうかを選択します。

  8. (オプション) S3 アクセスログ記録では、Amazon S3 がアクセスログレコードを収集Enabledするかどうかを選択します。

    S3 のアクセスログの場所には、ログを保存する Amazon S3 の場所を指定します。このフィールドは、S3 アクセスログ記録を有効にした場合にのみ表示されます。

  9. タグ (オプション) - このシーケンスストアには最大 50 個のタグを指定します。これらのタグは、読み取りセットのインポート/タグ更新中に設定される読み取りセットタグとは別のものです。

ストアを作成すると、 の準備が整いますゲノムファイルのインポート

CLI を使用したシーケンスストアの作成

次の例では、 をシーケンスストアに選択した名前sequence store nameに置き換えます。

aws omics create-sequence-store --name sequence store name --fallback-location "s3://amzn-s3-demo-bucket"

JSON で次のレスポンスを受け取ります。これには、新しく作成したシーケンスストアの ID 番号が含まれます。

{ "id": "3936421177", "arn": "arn:aws:omics:us-west-2:111122223333:sequenceStore/3936421177", "name": "sequence_store_example_name", "creationTime": "2022-07-13T20:09:26.038Z" "fallbackLocation" : "s3://amzn-s3-demo-bucket" }

以下に示すように、list-sequence-stores コマンドを使用して、アカウントに関連付けられているすべてのシーケンスストアを表示することもできます。

aws omics list-sequence-stores

次のレスポンスが表示されます。

{ "sequenceStores": [ { "arn": "arn:aws:omics:us-west-2:111122223333:sequenceStore/3936421177", "id": "3936421177", "name": "MySequenceStore", "creationTime": "2022-07-13T20:09:26.038Z", "updatedTime": "2024-09-13T04:11:31.242Z", "fallbackLocation" : "s3://amzn-s3-demo-bucket", "status": "Active" } ] }

get-sequence-store を使用すると、次の例に示すように、ID を使用してシーケンスストアの詳細を確認できます。

aws omics get-sequence-store --id sequence store ID

次のレスポンスが表示されます。

{ "arn": "arn:aws:omics:us-west-2:123456789012:sequenceStore/sequencestoreID", "creationTime": "2024-01-12T04:45:29.857Z", "updatedTime": "2024-09-13T04:11:31.242Z", "description": null, "fallbackLocation": null, "id": "2015356892", "name": "MySequenceStore", "s3Access": { "s3AccessPointArn": "arn:aws:s3:us-west-2:123456789012:accesspoint/592761533288-2015356892", "s3Uri": "s3://592761533288-2015356892-ajdpi90jdas90a79fh9a8ja98jdfa9jf98-s3alias/592761533288/sequenceStore/2015356892/", "accessLogLocation": "s3://IAD-seq-store-log/2015356892/" }, "sseConfig": { "keyArn": "arn:aws:kms:us-west-2:123456789012:key/eb2b30f5-635d-4b6d-b0f9-d3889fe0e648", "type": "KMS" }, "status": "Active", "statusMessage": null, "setTagsToSync": ["withdrawn","protocol"], }

作成後、複数のストアパラメータを更新することもできます。これは、 コンソールまたは API updateSequenceStoreオペレーションを使用して実行できます。

シーケンスストアの更新

シーケンスストアを更新するには、次の手順に従います。

  1. HealthOmics コンソールを開きます。

  2. 左側のナビゲーションペインで、シーケンスストアを選択します。

  3. 更新するシーケンスストアを選択します。

  4. 詳細パネルで、編集を選択します。

  5. 詳細の編集ページで、次のフィールドを更新できます。

    • シーケンスストア名 - このストアの一意の名前。

    • 説明 - このシーケンスストアの説明。

    • S3 のフォールバックの場所、Amazon S3 の場所を指定します。HealthOmics はフォールバックの場所を使用して、直接アップロード中に読み取りセットの作成に失敗したファイルを保存します。

    • S3 伝達のリードセットタグキーは、Amazon S3 に伝達するために最大 5 つのリードセットキーを入力できます。

    • (オプション) S3 アクセスログ記録では、Amazon S3 がアクセスログレコードを収集Enabledするかどうかを選択します。

      S3 のアクセスログの場所には、ログを保存する Amazon S3 の場所を指定します。このフィールドは、S3 アクセスログ記録を有効にした場合にのみ表示されます。

    • タグ (オプション) - このシーケンスストアには最大 50 個のタグを指定します。

シーケンスストアの読み取りセットタグの更新

シーケンスストアの読み取りセットタグやその他のフィールドを更新するには、次の手順に従います。

  1. HealthOmics コンソールを開きます。

  2. 左側のナビゲーションペインで、シーケンスストアを選択します。

  3. 更新するシーケンスストアを選択します。

  4. [詳細] タブを選択します。

  5. [編集] を選択します。

  6. 必要に応じて、新しいリードセットタグを追加するか、既存のタグを削除します。

  7. 必要に応じて、名前、説明、フォールバックの場所、または S3 データアクセスを更新します。

  8. [Save changes] (変更の保存) をクリックします。

ゲノムファイルのインポート

ゲノムファイルをシーケンスストアにインポートするには、次の手順に従います。

ゲノミクスファイルをインポートするには
  1. HealthOmics コンソールを開きます。

  2. 左側のナビゲーションペインで、シーケンスストアを選択します。

  3. シーケンスストアページで、ファイルをインポートするシーケンスストアを選択します。

  4. 個々のシーケンスストアページで、ゲノムファイルのインポートを選択します。

  5. インポートの詳細の指定ページで、次の情報を入力します。

    • IAM ロール - Amazon S3 のゲノムファイルにアクセスできる IAM ロール。

    • 参照ゲノム - このゲノムデータの参照ゲノム。

  6. インポートマニフェストを指定ページで、次の情報マニフェストファイルを指定します。マニフェストファイルは、ゲノミクスデータの重要な情報を記述する JSON または YAML ファイルです。マニフェストファイルの詳細については、「」を参照してくださいHealthOmics シーケンスストアへの読み取りセットのインポート

  7. インポートジョブの作成をクリックします。