Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Einen HealthOmics Referenzspeicher erstellen
Ein Referenzspeicher in HealthOmics ist ein Datenspeicher für die Speicherung von Referenzgenomen. Sie können in jeder AWS-Konto Region einen einzigen Referenzspeicher haben. Sie können mit der Konsole oder der CLI einen Referenzspeicher erstellen.
Themen
Einen Referenzspeicher mithilfe der Konsole erstellen
Um einen Referenzspeicher zu erstellen
-
Öffnen Sie die HealthOmics -Konsole
. -
Wählen Sie im linken Navigationsbereich die Option Erste Schritte mit aus HealthOmics.
-
Wählen Sie in den Speicheroptionen für Genomics-Daten die Option Referenzgenome aus.
-
Sie können entweder ein zuvor importiertes Referenzgenom auswählen oder ein neues importieren. Wenn Sie kein Referenzgenom importiert haben, wählen Sie oben rechts Referenzgenom importieren aus.
-
Wählen Sie auf der Auftragsseite Referenzgenom-Import erstellen entweder die Option Schnellerstellung oder Manuelles Erstellen aus, um einen Referenzspeicher zu erstellen, und geben Sie dann die folgenden Informationen ein.
-
Referenzgenomname — Ein eindeutiger Name für diesen Speicher.
-
Beschreibung (optional) — Eine Beschreibung dieses Referenzspeichers.
-
IAM-Rolle — Wählen Sie eine Rolle mit Zugriff auf Ihr Referenzgenom aus.
-
Referenz von Amazon S3 — Wählen Sie Ihre Referenzsequenzdatei in einem Amazon S3 S3-Bucket aus.
-
Tags (optional) — Stellen Sie bis zu 50 Tags für diesen Referenzspeicher bereit.
-
Erstellen eines Referenzspeichers mit der CLI
Das folgende Beispiel zeigt Ihnen, wie Sie mit dem einen Referenzspeicher erstellen AWS CLI. Sie können ein Referenzgeschäft pro AWS Region einrichten.
Referenzspeicher unterstützen das Speichern von FASTA-Dateien mit den Erweiterungen.fasta
,,.fa
,.fas
,.fsa
,.faa
,.fna
,.ffn
,,.frn
, .mpfa
.seq
,.txt
. Die bgzip
Version dieser Erweiterungen wird ebenfalls unterstützt.
Ersetzen Sie es im folgenden Beispiel
durch den Namen, den Sie für Ihr Referenzgeschäft gewählt haben.reference store name
aws omics create-reference-store --name
"reference store name"
Sie erhalten eine JSON-Antwort mit der ID und dem Namen des Referenzspeichers, dem ARN und dem Zeitstempel, zu dem Ihr Referenzspeicher erstellt wurde.
{ "id": "3242349265", "arn": "arn:aws:omics:us-west-2:555555555555:referenceStore/3242349265", "name": "MyReferenceStore", "creationTime": "2022-07-01T20:58:42.878Z" }
Sie können die Referenzspeicher-ID in zusätzlichen AWS CLI Befehlen verwenden. Sie können die Liste der mit Ihrem Konto IDs verknüpften Referenzspeicher mithilfe des list-reference-storesBefehls abrufen, wie im folgenden Beispiel gezeigt.
aws omics list-reference-stores
Als Antwort erhalten Sie den Namen Ihres neu erstellten Referenzgeschäfts.
{ "referenceStores": [ { "id": "3242349265", "arn": "arn:aws:omics:us-west-2:555555555555:referenceStore/3242349265", "name": "MyReferenceStore", "creationTime": "2022-07-01T20:58:42.878Z" } ] }
Nachdem Sie einen Referenzspeicher erstellt haben, können Sie Importaufträge erstellen, um genomische Referenzdateien in diesen Speicher zu laden. Dazu müssen Sie eine IAM-Rolle für den Zugriff auf die Daten verwenden oder eine IAM-Rolle erstellen. Es folgt eine Beispielrichtlinie .
Sie müssen außerdem über eine Vertrauensrichtlinie verfügen, die dem folgenden Beispiel ähnelt.
Sie können jetzt ein Referenzgenom importieren. In diesem Beispiel wird das Genome Reference Consortium Human Build 38 (hg38) verwendet, das frei zugänglich ist und im Registry of Open Data unter AWS
aws s3 cp s3://broad-references/hg38/v0/Homo_sapiens_assembly38.fasta s3://amzn-s3-demo-bucket
Anschließend können Sie mit Ihrem Importjob beginnen. Ersetzen Sie reference store
ID
, und role ARN
durch Ihre eigene Eingabe.source file
path
aws omics start-reference-import-job --reference-store-id
--role-arn
reference store ID
--sources
role ARN
source file path
Nachdem die Daten importiert wurden, erhalten Sie die folgende Antwort in JSON.
{ "id": "7252016478", "referenceStoreId": "3242349265", "roleArn": "arn:aws:iam::111122223333:role/OmicsReferenceImport", "status": "CREATED", "creationTime": "2022-07-01T21:15:13.727Z" }
Sie können den Status eines Jobs mit dem folgenden Befehl überwachen. Ersetzen Sie im folgenden Beispiel
und reference store ID
durch Ihre Referenzspeicher-ID und die Job-ID, über die Sie mehr erfahren möchten.job
ID
aws omics get-reference-import-job --reference-store-id
--id
reference store ID
job ID
Als Antwort erhalten Sie eine Antwort mit den Details zu diesem Referenzspeicher und seinem Status.
{ "id": "7252016478", "referenceStoreId": "3242349265", "roleArn": "arn:aws:iam::555555555555:role/OmicsReferenceImport", "status": "RUNNING", "creationTime": "2022-07-01T21:15:13.727Z", "sources": [ { "sourceFile": "s3://amzn-s3-demo-bucket/Homo_sapiens_assembly38.fasta", "status": "IN_PROGRESS", "name": "MyReference" } ] }
Sie können die importierte Referenz auch finden, indem Sie Ihre Referenzen auflisten und sie anhand des Referenznamens filtern.
Ersetzen Sie es durch Ihre Referenzshop-ID und fügen Sie einen optionalen Filter hinzu, um die Liste einzugrenzen.reference store ID
aws omics list-references --reference-store-id
--filter name=
reference store ID
MyReference
Als Antwort erhalten Sie die folgenden Informationen.
{ "references": [ { "id": "1234567890", "arn": "arn:aws:omics:us-west-2:555555555555:referenceStore/1234567890/reference/1234567890", "referenceStoreId": "12345678", "md5": "7ff134953dcca8c8997453bbb80b6b5e", "status": "ACTIVE", "name": "MyReference", "creationTime": "2022-07-02T00:15:19.787Z", "updateTime": "2022-07-02T00:15:19.787Z" } ] }
Verwenden Sie den get-reference-metadataAPI-Vorgang, um mehr über die Referenzmetadaten zu erfahren. Ersetzen Sie es im folgenden Beispiel
durch Ihre Referenzspeicher-ID und reference store ID
durch die Referenz-ID, über die Sie mehr erfahren möchten.reference ID
aws omics get-reference-metadata --reference-store-id
--id
reference store ID
reference ID
Als Antwort erhalten Sie die folgenden Informationen.
{ "id": "1234567890", "arn": "arn:aws:omics:us-west-2:555555555555:referenceStore/referencestoreID/reference/referenceID", "referenceStoreId": "1234567890", "md5": "7ff134953dcca8c8997453bbb80b6b5e", "status": "ACTIVE", "name": "MyReference", "creationTime": "2022-07-02T00:15:19.787Z", "updateTime": "2022-07-02T00:15:19.787Z", "files": { "source": { "totalParts": 31, "partSize": 104857600, "contentLength": 3249912778 }, "index": { "totalParts": 1, "partSize": 104857600, "contentLength": 160928 } } }
Sie können Teile der Referenzdatei auch mithilfe von get-reference herunterladen. Im folgenden Beispiel
ersetzen Sie es durch Ihre Referenzspeicher-ID und reference store ID
durch die Referenz-ID, von der Sie herunterladen möchten.reference ID
aws omics get-reference --reference-store-id
--id
reference store ID
--part-number 1 outfile.fa
reference ID