Einen HealthOmics Sequenzspeicher erstellen - AWS HealthOmics

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Einen HealthOmics Sequenzspeicher erstellen

HealthOmics Sequenzspeicher unterstützen das Speichern von Genomdateien in den unausgerichteten Formaten FASTQ (nur Gzip) und. uBAM Es unterstützt auch die ausgerichteten Formate von und. BAM CRAM

Importierte Dateien werden als Lesesätze gespeichert. Sie können Tags zu Lesesätzen hinzufügen und den Zugriff auf Lesesätze mithilfe von IAM-Richtlinien steuern. Aligned Read-Sets erfordern ein Referenzgenom, um genomische Sequenzen aufeinander abzustimmen. Für nicht ausgerichtete Read-Sets ist dies jedoch optional.

Um Lesesätze zu speichern, erstellen Sie zunächst einen Sequenzspeicher. Wenn Sie einen Sequenzspeicher erstellen, können Sie einen optionalen Amazon S3 S3-Bucket als Ausweichort und den Ort angeben, an dem S3-Zugriffsprotokolle gespeichert werden. Der Fallback-Speicherort wird zum Speichern von Dateien verwendet, für die während eines direkten Uploads kein Lesesatz erstellt werden kann. Ausweichspeicherorte sind für Sequenzspeicher verfügbar, die nach dem 15. Mai 2023 erstellt wurden. Sie geben den Fallback-Speicherort an, wenn Sie den Sequenzspeicher erstellen.

Sie können bis zu fünf Read-Set-Tag-Schlüssel angeben. Wenn Sie einen Lesesatz mit einem Tag-Schlüssel erstellen oder aktualisieren, der einem dieser Schlüssel entspricht, werden die Read-Set-Tags an das entsprechende Amazon S3 S3-Objekt weitergegeben. System-Tags, die von erstellt wurden, HealthOmics werden standardmäßig weitergegeben.

Einen Sequenzspeicher mithilfe der Konsole erstellen

Um einen Sequenzspeicher zu erstellen
  1. Öffnen Sie die HealthOmics -Konsole.

  2. Wählen Sie im linken Navigationsbereich Sequence Stores aus.

  3. Geben Sie auf der Seite Sequenzspeicher erstellen die folgenden Informationen ein

    • Name des Sequenzspeichers — Ein eindeutiger Name für diesen Speicher.

    • Beschreibung (optional) — Eine Beschreibung dieses Sequenzspeichers.

  4. Geben Sie für Fallback-Standort in S3 einen Amazon S3 S3-Standort an. HealthOmics verwendet den Ersatzspeicherort zum Speichern von Dateien, die während eines direkten Uploads keinen Lesesatz erstellen können. Sie müssen dem HealthOmics Service Schreibzugriff auf den Amazon S3 S3-Fallback-Standort gewähren. Eine Beispielrichtlinie finden Sie unter Konfigurieren Sie einen Fallback-Standort.

    Ausweichstandorte sind für Sequenzspeicher, die vor dem 16. Mai 2023 erstellt wurden, nicht verfügbar.

  5. (Optional) Für Read-Set-Tag-Schlüssel für die S3-Weitergabe können Sie bis zu fünf Read-Set-Schlüssel eingeben, um sie von einem Read-Set an die zugrunde liegenden S3-Objekte weiterzugeben. Durch die Weitergabe von Tags aus einem Lesesatz an das S3-Objekt können Sie and/or Endbenutzern S3-Zugriffsberechtigungen auf der Grundlage von Tags gewähren, um die weitergegebenen Tags über den Amazon S3 getObjectTagging S3-API-Vorgang zu sehen.

    1. Geben Sie einen Schlüsselwert in das Textfeld ein. Die Konsole erstellt ein neues Textfeld, um den nächsten Schlüssel hinzuzufügen.

    2. (Optional) Wählen Sie Entfernen, um alle Schlüssel zu entfernen.

  6. Wählen Sie unter Datenverschlüsselung aus, ob die Datenverschlüsselung Eigentum und Verwaltung sein soll AWS oder ob ein vom Kunden verwaltetes CMK verwendet werden soll.

  7. (Optional) Wählen Sie unter S3-Datenzugriff aus, ob Sie eine neue Rolle und Richtlinie für den Zugriff auf den Sequenzspeicher über Amazon S3 erstellen möchten.

  8. (Optional) Wählen Sie für die S3-Zugriffsprotokollierung aus, Enabled ob Amazon S3 Zugriffsprotokolldatensätze sammeln soll.

    Geben Sie für den Speicherort für die Zugriffsprotokollierung in S3 einen Amazon S3 S3-Speicherort an, an dem die Protokolle gespeichert werden sollen. Dieses Feld ist nur sichtbar, wenn Sie die S3-Zugriffsprotokollierung aktiviert haben.

  9. Tags (optional) — Stellen Sie bis zu 50 Tags für diesen Sequenzspeicher bereit. Diese Tags unterscheiden sich von den Read-Set-Tags, die während der import/tag Aktualisierung des Lesesatzes gesetzt werden

Nachdem Sie den Shop erstellt haben, ist er bereit fürGenomdateien importieren.

Erstellen eines Sequenzspeichers mit der CLI

Ersetzen Sie es im folgenden Beispiel sequence store name durch den Namen, den Sie für Ihren Sequenzspeicher gewählt haben.

aws omics create-sequence-store --name sequence store name --fallback-location "s3://amzn-s3-demo-bucket"

Sie erhalten die folgende Antwort in JSON, die die ID-Nummer für Ihren neu erstellten Sequenzspeicher enthält.

{ "id": "3936421177", "arn": "arn:aws:omics:us-west-2:111122223333:sequenceStore/3936421177", "name": "sequence_store_example_name", "creationTime": "2022-07-13T20:09:26.038Z" "fallbackLocation" : "s3://amzn-s3-demo-bucket" }

Sie können auch alle mit Ihrem Konto verknüpften Sequenzspeicher mithilfe des list-sequence-storesBefehls anzeigen, wie im Folgenden gezeigt.

aws omics list-sequence-stores

Sie erhalten die folgende Antwort.

{ "sequenceStores": [ { "arn": "arn:aws:omics:us-west-2:111122223333:sequenceStore/3936421177", "id": "3936421177", "name": "MySequenceStore", "creationTime": "2022-07-13T20:09:26.038Z", "updatedTime": "2024-09-13T04:11:31.242Z", "fallbackLocation" : "s3://amzn-s3-demo-bucket", "status": "Active" } ] }

Sie können get-sequence-storedamit mehr über einen Sequenzspeicher erfahren, indem Sie dessen ID verwenden, wie im folgenden Beispiel gezeigt:

aws omics get-sequence-store --id sequence store ID

Sie erhalten die folgende Antwort:

{ "arn": "arn:aws:omics:us-west-2:123456789012:sequenceStore/sequencestoreID", "creationTime": "2024-01-12T04:45:29.857Z", "updatedTime": "2024-09-13T04:11:31.242Z", "description": null, "fallbackLocation": null, "id": "2015356892", "name": "MySequenceStore", "s3Access": { "s3AccessPointArn": "arn:aws:s3:us-west-2:123456789012:accesspoint/592761533288-2015356892", "s3Uri": "s3://592761533288-2015356892-ajdpi90jdas90a79fh9a8ja98jdfa9jf98-s3alias/592761533288/sequenceStore/2015356892/", "accessLogLocation": "s3://IAD-seq-store-log/2015356892/" }, "sseConfig": { "keyArn": "arn:aws:kms:us-west-2:123456789012:key/eb2b30f5-635d-4b6d-b0f9-d3889fe0e648", "type": "KMS" }, "status": "Active", "statusMessage": null, "setTagsToSync": ["withdrawn","protocol"], }

Nach der Erstellung können auch mehrere Speicherparameter aktualisiert werden. Dies kann über die Konsole oder die updateSequenceStore API-Operation erfolgen.

Aktualisierung eines Sequenzspeichers

Gehen Sie folgendermaßen vor, um einen Sequenzspeicher zu aktualisieren:

  1. Öffnen Sie die HealthOmics -Konsole.

  2. Wählen Sie im linken Navigationsbereich Sequenzspeicher aus.

  3. Wählen Sie den zu aktualisierenden Sequenzspeicher aus.

  4. Wählen Sie im Bereich „Details“ die Option „Bearbeiten“.

  5. Auf der Seite „Details bearbeiten“ können Sie die folgenden Felder aktualisieren:

    • Name des Sequenzspeichers — Ein eindeutiger Name für diesen Shop.

    • Beschreibung — Eine Beschreibung dieses Sequenzspeichers.

    • Fallback-Standort in S3, geben Sie einen Amazon S3 S3-Standort an. HealthOmics verwendet den Ausweichspeicherort zum Speichern von Dateien, für die beim direkten Upload kein Lesesatz erstellt werden kann.

    • Read-Set-Tag-Schlüssel für die S3-Weitergabe Sie können bis zu fünf Read-Set-Schlüssel für die Weitergabe an Amazon S3 eingeben.

    • (Optional) Wählen Sie für die S3-Zugriffsprotokollierung aus, Enabled ob Amazon S3 Zugriffsprotokolldatensätze sammeln soll.

      Geben Sie für den Speicherort für die Zugriffsprotokollierung in S3 einen Amazon S3 S3-Speicherort an, an dem die Protokolle gespeichert werden sollen. Dieses Feld ist nur sichtbar, wenn Sie die S3-Zugriffsprotokollierung aktiviert haben.

    • Tags (optional) — Stellen Sie bis zu 50 Tags für diesen Sequenzspeicher bereit.

Read-Set-Tags für einen Sequenzspeicher werden aktualisiert

Gehen Sie wie folgt vor, um Read-Set-Tags oder andere Felder für einen Sequenzspeicher zu aktualisieren:

  1. Öffnen Sie die HealthOmics -Konsole.

  2. Wählen Sie im linken Navigationsbereich Sequence Stores aus.

  3. Wählen Sie den Sequenzspeicher aus, den Sie aktualisieren möchten.

  4. Wählen Sie die Registerkarte Details.

  5. Wählen Sie Bearbeiten aus.

  6. Fügen Sie nach Bedarf neue Lesesatz-Tags hinzu oder löschen Sie vorhandene Tags.

  7. Aktualisieren Sie nach Bedarf den Namen, die Beschreibung, den Ausweichort oder den S3-Datenzugriff.

  8. Wählen Sie Änderungen speichern aus.

Genomdateien importieren

Gehen Sie wie folgt vor, um genomische Dateien in einen Sequenzspeicher zu importieren:

Um eine Genomikdatei zu importieren
  1. Öffnen Sie die HealthOmics -Konsole.

  2. Wählen Sie im linken Navigationsbereich Sequence Stores aus.

  3. Wählen Sie auf der Seite Sequenzspeicher den Sequenzspeicher aus, in den Sie Ihre Dateien importieren möchten.

  4. Wählen Sie auf der Seite mit den einzelnen Sequenzspeichern die Option Genomische Dateien importieren aus.

  5. Geben Sie auf der Seite Importdetails angeben die folgenden Informationen ein

    • IAM-Rolle — Die IAM-Rolle, die auf die genomischen Dateien in Amazon S3 zugreifen kann.

    • Referenzgenom — Das Referenzgenom für diese Genomdaten.

  6. Geben Sie auf der Seite Importmanifest angeben die folgende Informations-Manifestdatei an. Die Manifestdatei ist eine JSON- oder YAML-Datei, die wichtige Informationen Ihrer Genomdaten beschreibt. Hinweise zur Manifestdatei finden Sie unter. Lesesätze in einen HealthOmics Sequenzspeicher importieren

  7. Klicken Sie auf Importauftrag erstellen.