Creazione di un archivio di riferimento HealthOmics - AWS HealthOmics

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Creazione di un archivio di riferimento HealthOmics

Un archivio di riferimento in HealthOmics è un archivio dati per l'archiviazione dei genomi di riferimento. È possibile disporre di un unico archivio di riferimento in ciascuna Account AWS regione. È possibile creare un archivio di riferimento utilizzando la console o la CLI.

Creazione di un archivio di riferimento utilizzando la console

Per creare un archivio di riferimento
  1. Apri la HealthOmics console.

  2. Nel riquadro di navigazione a sinistra, scegli Inizia con HealthOmics.

  3. Scegli Genomi di riferimento tra le opzioni di archiviazione dei dati di Genomics.

  4. Puoi scegliere un genoma di riferimento importato in precedenza o importarne uno nuovo. Se non hai importato un genoma di riferimento, scegli Importa genoma di riferimento in alto a destra.

  5. Nella pagina Crea processo di importazione del genoma di riferimento, scegli l'opzione Creazione rapida o Creazione manuale per creare un archivio di riferimento, quindi fornisci le seguenti informazioni.

    • Nome del genoma di riferimento: un nome univoco per questo negozio.

    • Descrizione (opzionale): una descrizione di questo archivio di riferimento.

    • Ruolo IAM: seleziona un ruolo con accesso al tuo genoma di riferimento.

    • Riferimento da Amazon S3: seleziona il file di sequenza di riferimento in un bucket Amazon S3.

    • Tag (opzionale): fornisci fino a 50 tag per questo negozio di riferimento.

Creazione di un archivio di riferimento utilizzando la CLI

L'esempio seguente mostra come creare un archivio di riferimento utilizzando. AWS CLIÈ possibile disporre di un archivio di riferimento per AWS regione.

Gli archivi di riferimento supportano l'archiviazione di file FASTA con le estensioni .fasta.fa,.fas,.fsa,.faa,.fna,.ffn,,.frn, .mpfa.seq,.txt. È supportata anche la bgzip versione di queste estensioni.

Nell'esempio seguente, sostituiscilo reference store name con il nome che hai scelto per il tuo negozio di riferimento.

aws omics create-reference-store --name "reference store name"

Riceverai una risposta JSON con l'ID e il nome dell'archivio di riferimento, l'ARN e il timestamp di quando è stato creato il tuo negozio di riferimento.

{ "id": "3242349265", "arn": "arn:aws:omics:us-west-2:555555555555:referenceStore/3242349265", "name": "MyReferenceStore", "creationTime": "2022-07-01T20:58:42.878Z" }

È possibile utilizzare l'ID dell'archivio di riferimento in comandi aggiuntivi. AWS CLI È possibile recuperare l'elenco degli store di riferimento IDs collegati al proprio account utilizzando il list-reference-storescomando, come illustrato nell'esempio seguente.

aws omics list-reference-stores

In risposta, riceverai il nome del tuo negozio di riferimento appena creato.

{ "referenceStores": [ { "id": "3242349265", "arn": "arn:aws:omics:us-west-2:555555555555:referenceStore/3242349265", "name": "MyReferenceStore", "creationTime": "2022-07-01T20:58:42.878Z" } ] }

Dopo aver creato un archivio di riferimento, potete creare processi di importazione per caricare file di riferimento genomici al suo interno. A tale scopo, è necessario utilizzare o creare un ruolo IAM per accedere ai dati. Di seguito è riportata una policy di esempio.

JSON
{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Action": [ "s3:GetObject", "s3:GetBucketLocation" ], "Resource": [ "arn:aws:s3:::amzn-s3-demo-bucket1", "arn:aws:s3:::amzn-s3-demo-bucket1/*" ] } ] }

È inoltre necessario disporre di una politica di fiducia simile all'esempio seguente.

JSON
{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Principal": { "Service": [ "omics.amazonaws.com" ] }, "Action": "sts:AssumeRole" } ] }

Ora puoi importare un genoma di riferimento. Questo esempio utilizza Genome Reference Consortium Human Build 38 (hg38), che è ad accesso aperto e disponibile nel Registry of Open Data su. AWS Il bucket che ospita questi dati ha sede negli Stati Uniti orientali (Ohio). Per utilizzare i bucket in altre AWS regioni, puoi copiare i dati in un bucket Amazon S3 ospitato nella tua regione. Usa il seguente AWS CLI comando per copiare il genoma nel tuo bucket Amazon S3.

aws s3 cp s3://broad-references/hg38/v0/Homo_sapiens_assembly38.fasta s3://amzn-s3-demo-bucket

Puoi quindi iniziare il processo di importazione. Sostituisci reference store ID e source file path con il tuo input. role ARN

aws omics start-reference-import-job --reference-store-id reference store ID --role-arn role ARN --sources source file path

Dopo l'importazione dei dati, riceverai la seguente risposta in JSON.

{ "id": "7252016478", "referenceStoreId": "3242349265", "roleArn": "arn:aws:iam::111122223333:role/OmicsReferenceImport", "status": "CREATED", "creationTime": "2022-07-01T21:15:13.727Z" }

È possibile monitorare lo stato di un lavoro utilizzando il comando seguente. Nell'esempio seguente, sostituisci reference store ID e job ID con il tuo ID del negozio di riferimento e l'ID del lavoro su cui desideri saperne di più.

aws omics get-reference-import-job --reference-store-id reference store ID --id job ID

In risposta, riceverai una risposta con i dettagli relativi all'archivio di riferimento e al relativo stato.

{ "id": "7252016478", "referenceStoreId": "3242349265", "roleArn": "arn:aws:iam::555555555555:role/OmicsReferenceImport", "status": "RUNNING", "creationTime": "2022-07-01T21:15:13.727Z", "sources": [ { "sourceFile": "s3://amzn-s3-demo-bucket/Homo_sapiens_assembly38.fasta", "status": "IN_PROGRESS", "name": "MyReference" } ] }

Puoi anche trovare il riferimento che è stato importato elencando i riferimenti e filtrandoli in base al nome del riferimento. Sostituiscilo reference store ID con il tuo ID del negozio di riferimento e aggiungi un filtro opzionale per restringere l'elenco.

aws omics list-references --reference-store-id reference store ID --filter name=MyReference

In risposta, riceverai le seguenti informazioni.

{ "references": [ { "id": "1234567890", "arn": "arn:aws:omics:us-west-2:555555555555:referenceStore/1234567890/reference/1234567890", "referenceStoreId": "12345678", "md5": "7ff134953dcca8c8997453bbb80b6b5e", "status": "ACTIVE", "name": "MyReference", "creationTime": "2022-07-02T00:15:19.787Z", "updateTime": "2022-07-02T00:15:19.787Z" } ] }

Per saperne di più sui metadati di riferimento, utilizza l'operazione get-reference-metadataAPI. Nell'esempio seguente, sostituiscilo reference store ID con il tuo ID del negozio di riferimento e reference ID con l'ID di riferimento su cui desideri saperne di più.

aws omics get-reference-metadata --reference-store-id reference store ID --id reference ID

Riceverai le seguenti informazioni in risposta.

{ "id": "1234567890", "arn": "arn:aws:omics:us-west-2:555555555555:referenceStore/referencestoreID/reference/referenceID", "referenceStoreId": "1234567890", "md5": "7ff134953dcca8c8997453bbb80b6b5e", "status": "ACTIVE", "name": "MyReference", "creationTime": "2022-07-02T00:15:19.787Z", "updateTime": "2022-07-02T00:15:19.787Z", "files": { "source": { "totalParts": 31, "partSize": 104857600, "contentLength": 3249912778 }, "index": { "totalParts": 1, "partSize": 104857600, "contentLength": 160928 } } }

È inoltre possibile scaricare parti del file di riferimento utilizzando get-reference. Nell'esempio seguente, sostituiscilo reference store ID con il tuo ID del negozio di riferimento e reference ID con l'ID di riferimento da cui desideri effettuare il download.

aws omics get-reference --reference-store-id reference store ID --id reference ID --part-number 1 outfile.fa