Einen HealthOmics Referenzspeicher erstellen - AWS HealthOmics

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Einen HealthOmics Referenzspeicher erstellen

Ein Referenzspeicher in HealthOmics ist ein Datenspeicher für die Speicherung von Referenzgenomen. Sie können in jeder AWS-Konto Region einen einzigen Referenzspeicher haben. Sie können mit der Konsole oder der CLI einen Referenzspeicher erstellen.

Einen Referenzspeicher mithilfe der Konsole erstellen

Um einen Referenzspeicher zu erstellen
  1. Öffnen Sie die HealthOmics -Konsole.

  2. Wählen Sie im linken Navigationsbereich die Option Erste Schritte mit aus HealthOmics.

  3. Wählen Sie in den Speicheroptionen für Genomics-Daten die Option Referenzgenome aus.

  4. Sie können entweder ein zuvor importiertes Referenzgenom auswählen oder ein neues importieren. Wenn Sie kein Referenzgenom importiert haben, wählen Sie oben rechts Referenzgenom importieren aus.

  5. Wählen Sie auf der Auftragsseite Referenzgenom-Import erstellen entweder die Option Schnellerstellung oder Manuelles Erstellen aus, um einen Referenzspeicher zu erstellen, und geben Sie dann die folgenden Informationen ein.

    • Referenzgenomname — Ein eindeutiger Name für diesen Speicher.

    • Beschreibung (optional) — Eine Beschreibung dieses Referenzspeichers.

    • IAM-Rolle — Wählen Sie eine Rolle mit Zugriff auf Ihr Referenzgenom aus.

    • Referenz von Amazon S3 — Wählen Sie Ihre Referenzsequenzdatei in einem Amazon S3 S3-Bucket aus.

    • Tags (optional) — Stellen Sie bis zu 50 Tags für diesen Referenzspeicher bereit.

Erstellen eines Referenzspeichers mit der CLI

Das folgende Beispiel zeigt Ihnen, wie Sie mit dem einen Referenzspeicher erstellen AWS CLI. Sie können ein Referenzgeschäft pro AWS Region einrichten.

Referenzspeicher unterstützen das Speichern von FASTA-Dateien mit den Erweiterungen.fasta,,.fa,.fas,.fsa,.faa,.fna,.ffn,,.frn, .mpfa.seq,.txt. Die bgzip Version dieser Erweiterungen wird ebenfalls unterstützt.

Ersetzen Sie es im folgenden Beispiel reference store name durch den Namen, den Sie für Ihr Referenzgeschäft gewählt haben.

aws omics create-reference-store --name "reference store name"

Sie erhalten eine JSON-Antwort mit der ID und dem Namen des Referenzspeichers, dem ARN und dem Zeitstempel, zu dem Ihr Referenzspeicher erstellt wurde.

{ "id": "3242349265", "arn": "arn:aws:omics:us-west-2:555555555555:referenceStore/3242349265", "name": "MyReferenceStore", "creationTime": "2022-07-01T20:58:42.878Z" }

Sie können die Referenzspeicher-ID in zusätzlichen AWS CLI Befehlen verwenden. Sie können die Liste der mit Ihrem Konto IDs verknüpften Referenzspeicher mithilfe des list-reference-storesBefehls abrufen, wie im folgenden Beispiel gezeigt.

aws omics list-reference-stores

Als Antwort erhalten Sie den Namen Ihres neu erstellten Referenzgeschäfts.

{ "referenceStores": [ { "id": "3242349265", "arn": "arn:aws:omics:us-west-2:555555555555:referenceStore/3242349265", "name": "MyReferenceStore", "creationTime": "2022-07-01T20:58:42.878Z" } ] }

Nachdem Sie einen Referenzspeicher erstellt haben, können Sie Importaufträge erstellen, um genomische Referenzdateien in diesen Speicher zu laden. Dazu müssen Sie eine IAM-Rolle für den Zugriff auf die Daten verwenden oder eine IAM-Rolle erstellen. Es folgt eine Beispielrichtlinie .

JSON
{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Action": [ "s3:GetObject", "s3:GetBucketLocation" ], "Resource": [ "arn:aws:s3:::amzn-s3-demo-bucket1", "arn:aws:s3:::amzn-s3-demo-bucket1/*" ] } ] }

Sie müssen außerdem über eine Vertrauensrichtlinie verfügen, die dem folgenden Beispiel ähnelt.

JSON
{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Principal": { "Service": [ "omics.amazonaws.com" ] }, "Action": "sts:AssumeRole" } ] }

Sie können jetzt ein Referenzgenom importieren. In diesem Beispiel wird das Genome Reference Consortium Human Build 38 (hg38) verwendet, das frei zugänglich ist und im Registry of Open Data unter AWS verfügbar ist. Der Bucket, der diese Daten hostet, befindet sich in US East (Ohio). Um Buckets in anderen AWS Regionen zu verwenden, können Sie die Daten in einen Amazon S3 S3-Bucket kopieren, der in Ihrer Region gehostet wird. Verwenden Sie den folgenden AWS CLI Befehl, um das Genom in Ihren Amazon S3 S3-Bucket zu kopieren.

aws s3 cp s3://broad-references/hg38/v0/Homo_sapiens_assembly38.fasta s3://amzn-s3-demo-bucket

Anschließend können Sie mit Ihrem Importjob beginnen. Ersetzen Sie reference store IDrole ARN, und source file path durch Ihre eigene Eingabe.

aws omics start-reference-import-job --reference-store-id reference store ID --role-arn role ARN --sources source file path

Nachdem die Daten importiert wurden, erhalten Sie die folgende Antwort in JSON.

{ "id": "7252016478", "referenceStoreId": "3242349265", "roleArn": "arn:aws:iam::111122223333:role/OmicsReferenceImport", "status": "CREATED", "creationTime": "2022-07-01T21:15:13.727Z" }

Sie können den Status eines Jobs mit dem folgenden Befehl überwachen. Ersetzen Sie im folgenden Beispiel reference store ID und job ID durch Ihre Referenzspeicher-ID und die Job-ID, über die Sie mehr erfahren möchten.

aws omics get-reference-import-job --reference-store-id reference store ID --id job ID

Als Antwort erhalten Sie eine Antwort mit den Details zu diesem Referenzspeicher und seinem Status.

{ "id": "7252016478", "referenceStoreId": "3242349265", "roleArn": "arn:aws:iam::555555555555:role/OmicsReferenceImport", "status": "RUNNING", "creationTime": "2022-07-01T21:15:13.727Z", "sources": [ { "sourceFile": "s3://amzn-s3-demo-bucket/Homo_sapiens_assembly38.fasta", "status": "IN_PROGRESS", "name": "MyReference" } ] }

Sie können die importierte Referenz auch finden, indem Sie Ihre Referenzen auflisten und sie anhand des Referenznamens filtern. reference store IDErsetzen Sie es durch Ihre Referenzshop-ID und fügen Sie einen optionalen Filter hinzu, um die Liste einzugrenzen.

aws omics list-references --reference-store-id reference store ID --filter name=MyReference

Als Antwort erhalten Sie die folgenden Informationen.

{ "references": [ { "id": "1234567890", "arn": "arn:aws:omics:us-west-2:555555555555:referenceStore/1234567890/reference/1234567890", "referenceStoreId": "12345678", "md5": "7ff134953dcca8c8997453bbb80b6b5e", "status": "ACTIVE", "name": "MyReference", "creationTime": "2022-07-02T00:15:19.787Z", "updateTime": "2022-07-02T00:15:19.787Z" } ] }

Verwenden Sie den get-reference-metadataAPI-Vorgang, um mehr über die Referenzmetadaten zu erfahren. Ersetzen Sie es im folgenden Beispiel reference store ID durch Ihre Referenzspeicher-ID und reference ID durch die Referenz-ID, über die Sie mehr erfahren möchten.

aws omics get-reference-metadata --reference-store-id reference store ID --id reference ID

Als Antwort erhalten Sie die folgenden Informationen.

{ "id": "1234567890", "arn": "arn:aws:omics:us-west-2:555555555555:referenceStore/referencestoreID/reference/referenceID", "referenceStoreId": "1234567890", "md5": "7ff134953dcca8c8997453bbb80b6b5e", "status": "ACTIVE", "name": "MyReference", "creationTime": "2022-07-02T00:15:19.787Z", "updateTime": "2022-07-02T00:15:19.787Z", "files": { "source": { "totalParts": 31, "partSize": 104857600, "contentLength": 3249912778 }, "index": { "totalParts": 1, "partSize": 104857600, "contentLength": 160928 } } }

Sie können Teile der Referenzdatei auch mithilfe von get-reference herunterladen. Im folgenden Beispiel reference store ID ersetzen Sie es durch Ihre Referenzspeicher-ID und reference ID durch die Referenz-ID, von der Sie herunterladen möchten.

aws omics get-reference --reference-store-id reference store ID --id reference ID --part-number 1 outfile.fa