Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Creazione di un archivio di riferimento HealthOmics
Un archivio di riferimento in HealthOmics è un archivio dati per l'archiviazione dei genomi di riferimento. È possibile disporre di un unico archivio di riferimento in ciascuna Account AWS regione. È possibile creare un archivio di riferimento utilizzando la console o la CLI.
Argomenti
Creazione di un archivio di riferimento utilizzando la console
Per creare un archivio di riferimento
-
Apri la HealthOmics console
. -
Nel riquadro di navigazione a sinistra, scegli Inizia con HealthOmics.
-
Scegli Genomi di riferimento tra le opzioni di archiviazione dei dati di Genomics.
-
Puoi scegliere un genoma di riferimento importato in precedenza o importarne uno nuovo. Se non hai importato un genoma di riferimento, scegli Importa genoma di riferimento in alto a destra.
-
Nella pagina Crea processo di importazione del genoma di riferimento, scegli l'opzione Creazione rapida o Creazione manuale per creare un archivio di riferimento, quindi fornisci le seguenti informazioni.
-
Nome del genoma di riferimento: un nome univoco per questo negozio.
-
Descrizione (opzionale): una descrizione di questo archivio di riferimento.
-
Ruolo IAM: seleziona un ruolo con accesso al tuo genoma di riferimento.
-
Riferimento da Amazon S3: seleziona il file di sequenza di riferimento in un bucket Amazon S3.
-
Tag (opzionale): fornisci fino a 50 tag per questo negozio di riferimento.
-
Creazione di un archivio di riferimento utilizzando la CLI
L'esempio seguente mostra come creare un archivio di riferimento utilizzando. AWS CLIÈ possibile disporre di un archivio di riferimento per AWS regione.
Gli archivi di riferimento supportano l'archiviazione di file FASTA con le estensioni .fasta
.fa
,.fas
,.fsa
,.faa
,.fna
,.ffn
,,.frn
, .mpfa
.seq
,.txt
. È supportata anche la bgzip
versione di queste estensioni.
Nell'esempio seguente, sostituiscilo
con il nome che hai scelto per il tuo negozio di riferimento.reference store name
aws omics create-reference-store --name
"reference store name"
Riceverai una risposta JSON con l'ID e il nome dell'archivio di riferimento, l'ARN e il timestamp di quando è stato creato il tuo negozio di riferimento.
{ "id": "3242349265", "arn": "arn:aws:omics:us-west-2:555555555555:referenceStore/3242349265", "name": "MyReferenceStore", "creationTime": "2022-07-01T20:58:42.878Z" }
È possibile utilizzare l'ID dell'archivio di riferimento in comandi aggiuntivi. AWS CLI È possibile recuperare l'elenco degli store di riferimento IDs collegati al proprio account utilizzando il list-reference-storescomando, come illustrato nell'esempio seguente.
aws omics list-reference-stores
In risposta, riceverai il nome del tuo negozio di riferimento appena creato.
{ "referenceStores": [ { "id": "3242349265", "arn": "arn:aws:omics:us-west-2:555555555555:referenceStore/3242349265", "name": "MyReferenceStore", "creationTime": "2022-07-01T20:58:42.878Z" } ] }
Dopo aver creato un archivio di riferimento, potete creare processi di importazione per caricare file di riferimento genomici al suo interno. A tale scopo, è necessario utilizzare o creare un ruolo IAM per accedere ai dati. Di seguito è riportata una policy di esempio.
È inoltre necessario disporre di una politica di fiducia simile all'esempio seguente.
Ora puoi importare un genoma di riferimento. Questo esempio utilizza Genome Reference Consortium Human Build 38 (hg38), che è ad accesso aperto e disponibile nel Registry of Open Data su. AWS
aws s3 cp s3://broad-references/hg38/v0/Homo_sapiens_assembly38.fasta s3://amzn-s3-demo-bucket
Puoi quindi iniziare il processo di importazione. Sostituisci
e reference store
ID
con il tuo input. source file
path
role ARN
aws omics start-reference-import-job --reference-store-id
--role-arn
reference store ID
--sources
role ARN
source file path
Dopo l'importazione dei dati, riceverai la seguente risposta in JSON.
{ "id": "7252016478", "referenceStoreId": "3242349265", "roleArn": "arn:aws:iam::111122223333:role/OmicsReferenceImport", "status": "CREATED", "creationTime": "2022-07-01T21:15:13.727Z" }
È possibile monitorare lo stato di un lavoro utilizzando il comando seguente. Nell'esempio seguente, sostituisci
e reference store ID
con il tuo ID del negozio di riferimento e l'ID del lavoro su cui desideri saperne di più.job
ID
aws omics get-reference-import-job --reference-store-id
--id
reference store ID
job ID
In risposta, riceverai una risposta con i dettagli relativi all'archivio di riferimento e al relativo stato.
{ "id": "7252016478", "referenceStoreId": "3242349265", "roleArn": "arn:aws:iam::555555555555:role/OmicsReferenceImport", "status": "RUNNING", "creationTime": "2022-07-01T21:15:13.727Z", "sources": [ { "sourceFile": "s3://amzn-s3-demo-bucket/Homo_sapiens_assembly38.fasta", "status": "IN_PROGRESS", "name": "MyReference" } ] }
Puoi anche trovare il riferimento che è stato importato elencando i riferimenti e filtrandoli in base al nome del riferimento. Sostituiscilo
con il tuo ID del negozio di riferimento e aggiungi un filtro opzionale per restringere l'elenco.reference store ID
aws omics list-references --reference-store-id
--filter name=
reference store ID
MyReference
In risposta, riceverai le seguenti informazioni.
{ "references": [ { "id": "1234567890", "arn": "arn:aws:omics:us-west-2:555555555555:referenceStore/1234567890/reference/1234567890", "referenceStoreId": "12345678", "md5": "7ff134953dcca8c8997453bbb80b6b5e", "status": "ACTIVE", "name": "MyReference", "creationTime": "2022-07-02T00:15:19.787Z", "updateTime": "2022-07-02T00:15:19.787Z" } ] }
Per saperne di più sui metadati di riferimento, utilizza l'operazione get-reference-metadataAPI. Nell'esempio seguente, sostituiscilo
con il tuo ID del negozio di riferimento e reference store ID
con l'ID di riferimento su cui desideri saperne di più.reference ID
aws omics get-reference-metadata --reference-store-id
--id
reference store ID
reference ID
Riceverai le seguenti informazioni in risposta.
{ "id": "1234567890", "arn": "arn:aws:omics:us-west-2:555555555555:referenceStore/referencestoreID/reference/referenceID", "referenceStoreId": "1234567890", "md5": "7ff134953dcca8c8997453bbb80b6b5e", "status": "ACTIVE", "name": "MyReference", "creationTime": "2022-07-02T00:15:19.787Z", "updateTime": "2022-07-02T00:15:19.787Z", "files": { "source": { "totalParts": 31, "partSize": 104857600, "contentLength": 3249912778 }, "index": { "totalParts": 1, "partSize": 104857600, "contentLength": 160928 } } }
È inoltre possibile scaricare parti del file di riferimento utilizzando get-reference. Nell'esempio seguente, sostituiscilo
con il tuo ID del negozio di riferimento e reference store ID
con l'ID di riferimento da cui desideri effettuare il download.reference ID
aws omics get-reference --reference-store-id
--id
reference store ID
--part-number 1 outfile.fa
reference ID