Creazione di un archivio HealthOmics di sequenze - AWS HealthOmics

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Creazione di un archivio HealthOmics di sequenze

HealthOmics gli archivi di sequenze supportano l'archiviazione di file genomici nei formati non allineati di FASTQ (solo gzip) e. uBAM Supporta anche i formati allineati di e. BAM CRAM

I file importati vengono archiviati come set di lettura. Puoi aggiungere tag ai set di lettura e utilizzare le policy IAM per controllare l'accesso ai set di lettura. I set di lettura allineati richiedono un genoma di riferimento per allineare le sequenze genomiche, ma è facoltativo per i set di lettura non allineati.

Per memorizzare i set di lettura, devi prima creare un archivio di sequenze. Quando crei un archivio di sequenze, puoi specificare un bucket Amazon S3 opzionale come posizione di riserva e la posizione in cui vengono archiviati i log di accesso S3. La posizione di fallback viene utilizzata per archiviare tutti i file che non riescono a creare un set di lettura durante un caricamento diretto. Le posizioni di riserva sono disponibili per i sequence store creati dopo il 15 maggio 2023. La posizione di fallback viene specificata quando si crea l'archivio delle sequenze.

È possibile specificare fino a cinque chiavi di tag read set. Quando crei o aggiorni un set di lettura con una chiave di tag che corrisponde a una di queste chiavi, i tag del set di lettura vengono propagati all'oggetto Amazon S3 corrispondente. I tag di sistema creati da HealthOmics vengono propagati per impostazione predefinita.

Creazione di un archivio di sequenze utilizzando la console

Per creare un archivio di sequenze
  1. Apri la HealthOmics console.

  2. Nel riquadro di navigazione a sinistra, scegli Sequence stores.

  3. Nella pagina Crea archivio sequenze, fornisci le seguenti informazioni

    • Sequence Store name: un nome univoco per questo negozio.

    • Descrizione (opzionale): una descrizione di questo archivio di sequenze.

  4. Per una posizione di fallback in S3, specifica una posizione Amazon S3. HealthOmics utilizza la posizione di fallback per archiviare tutti i file che non riescono a creare un set di lettura durante un caricamento diretto. È necessario concedere al HealthOmics servizio l'accesso in scrittura alla posizione di fallback di Amazon S3. Per un esempio di policy, consulta Configura una posizione di fallback.

    Le posizioni di riserva non sono disponibili per i sequence store creati prima del 16 maggio 2023.

  5. (Facoltativo) Per le chiavi dei tag Read set per la propagazione S3, puoi inserire fino a cinque chiavi di lettura per propagarle da un set di lettura agli oggetti S3 sottostanti. Propagando i tag da un set di lettura all'oggetto S3, puoi concedere autorizzazioni di accesso a S3 basate sui tag agli utenti and/or finali per visualizzare i tag propagati tramite l'operazione dell'API Amazon S3. getObjectTagging

    1. Inserisci un valore chiave nella casella di testo. La console crea una nuova casella di testo per aggiungere la chiave successiva.

    2. (Facoltativo) Scegliete Rimuovi per rimuovere tutte le chiavi.

  6. In Crittografia dei dati, seleziona se desideri che la crittografia dei dati sia di proprietà e gestita da AWS o utilizzi una CMK gestita dal cliente.

  7. (Facoltativo) In S3 Data access, seleziona se creare un nuovo ruolo e una nuova policy per accedere al Sequence Store tramite Amazon S3.

  8. (Facoltativo) Per la registrazione degli accessi S3, seleziona Enabled se desideri che Amazon S3 raccolga i record dei log di accesso.

    Per la posizione di registrazione di Access in S3, specifica una posizione Amazon S3 in cui archiviare i log. Questo campo è visibile solo se hai abilitato la registrazione degli accessi S3.

  9. Tag (opzionale): fornisci fino a 50 tag per questo archivio di sequenze. Questi tag sono separati dai tag del set di lettura che vengono impostati durante l' import/tag aggiornamento del set di lettura

Dopo aver creato il negozio, è pronto perImportazione di file genomici.

Creazione di un archivio di sequenze utilizzando la CLI

Nell'esempio seguente, sostituiscilo sequence store name con il nome che hai scelto per il tuo archivio di sequenze.

aws omics create-sequence-store --name sequence store name --fallback-location "s3://amzn-s3-demo-bucket"

Riceverai la seguente risposta in JSON, che include il numero ID del tuo sequence store appena creato.

{ "id": "3936421177", "arn": "arn:aws:omics:us-west-2:111122223333:sequenceStore/3936421177", "name": "sequence_store_example_name", "creationTime": "2022-07-13T20:09:26.038Z" "fallbackLocation" : "s3://amzn-s3-demo-bucket" }

È inoltre possibile visualizzare tutti gli archivi di sequenze associati al proprio account utilizzando il list-sequence-storescomando, come illustrato di seguito.

aws omics list-sequence-stores

Riceverai la seguente risposta.

{ "sequenceStores": [ { "arn": "arn:aws:omics:us-west-2:111122223333:sequenceStore/3936421177", "id": "3936421177", "name": "MySequenceStore", "creationTime": "2022-07-13T20:09:26.038Z", "updatedTime": "2024-09-13T04:11:31.242Z", "fallbackLocation" : "s3://amzn-s3-demo-bucket", "status": "Active" } ] }

È possibile utilizzarla get-sequence-storeper saperne di più su un archivio di sequenze utilizzando il relativo ID, come illustrato nell'esempio seguente:

aws omics get-sequence-store --id sequence store ID

Riceverai la seguente risposta:

{ "arn": "arn:aws:omics:us-west-2:123456789012:sequenceStore/sequencestoreID", "creationTime": "2024-01-12T04:45:29.857Z", "updatedTime": "2024-09-13T04:11:31.242Z", "description": null, "fallbackLocation": null, "id": "2015356892", "name": "MySequenceStore", "s3Access": { "s3AccessPointArn": "arn:aws:s3:us-west-2:123456789012:accesspoint/592761533288-2015356892", "s3Uri": "s3://592761533288-2015356892-ajdpi90jdas90a79fh9a8ja98jdfa9jf98-s3alias/592761533288/sequenceStore/2015356892/", "accessLogLocation": "s3://IAD-seq-store-log/2015356892/" }, "sseConfig": { "keyArn": "arn:aws:kms:us-west-2:123456789012:key/eb2b30f5-635d-4b6d-b0f9-d3889fe0e648", "type": "KMS" }, "status": "Active", "statusMessage": null, "setTagsToSync": ["withdrawn","protocol"], }

Dopo la creazione, è possibile aggiornare anche diversi parametri del negozio. Questa operazione può essere eseguita tramite la console o l'updateSequenceStoreoperazione API.

Aggiornamento di un archivio di sequenze

Per aggiornare un archivio di sequenze, effettuate le seguenti operazioni:

  1. Apri la HealthOmics console.

  2. Nel riquadro di navigazione a sinistra, scegli Sequence stores.

  3. Scegli l'archivio di sequenze da aggiornare.

  4. Nel pannello Dettagli, scegliete Modifica.

  5. Nella pagina Modifica dettagli, puoi aggiornare i seguenti campi:

    • Nome del negozio in sequenza: un nome univoco per questo negozio.

    • Descrizione: una descrizione di questo archivio di sequenze.

    • Posizione di fallback in S3, specifica una posizione Amazon S3. HealthOmics utilizza la posizione di fallback per archiviare tutti i file che non riescono a creare un set di lettura durante un caricamento diretto.

    • Leggi le chiavi dei tag del set di lettura per la propagazione S3, puoi inserire fino a cinque chiavi del set di lettura da propagare su Amazon S3.

    • (Facoltativo) Per la registrazione degli accessi S3, seleziona Enabled se desideri che Amazon S3 raccolga i record dei log di accesso.

      Per la posizione di registrazione di Access in S3, specifica una posizione Amazon S3 in cui archiviare i log. Questo campo è visibile solo se hai abilitato la registrazione degli accessi S3.

    • Tag (opzionale): fornisci fino a 50 tag per questo archivio di sequenze.

Aggiornamento dei tag di lettura per un archivio di sequenze

Per aggiornare i tag del set di lettura o altri campi per un archivio di sequenze, procedi nel seguente modo:

  1. Apri la HealthOmics console.

  2. Nel riquadro di navigazione a sinistra, scegli Sequence stores.

  3. Scegli l'archivio di sequenze che desideri aggiornare.

  4. Seleziona la scheda Details (Dettagli).

  5. Scegli Modifica.

  6. Aggiungi nuovi tag di lettura o elimina i tag esistenti, se necessario.

  7. Aggiorna il nome, la descrizione, la posizione di riserva o l'accesso ai dati S3, come richiesto.

  8. Scegli Save changes (Salva modifiche).

Importazione di file genomici

Per importare file genomici in un archivio di sequenze, procedi nel seguente modo:

Per importare un file genomico
  1. Apri la HealthOmics console.

  2. Nel riquadro di navigazione a sinistra, scegli Sequence stores.

  3. Nella pagina Sequence stores, scegli l'archivio di sequenze in cui vuoi importare i tuoi file.

  4. Nella pagina dell'archivio delle singole sequenze, scegli Importa file genomici.

  5. Nella pagina Specificare i dettagli di importazione, fornite le seguenti informazioni

    • Ruolo IAM: il ruolo IAM che può accedere ai file genomici su Amazon S3.

    • Genoma di riferimento: il genoma di riferimento per questi dati genomici.

  6. Nella pagina Specificare il manifesto di importazione, specificare il seguente file manifesto di informazioni. Il file manifest è un file JSON o YAML che descrive le informazioni essenziali dei dati genomici. Per informazioni sul file manifest, vedere. Importazione di set di lettura in un archivio di HealthOmics sequenze

  7. Fate clic su Crea processo di importazione.