Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Che cos'è AWS HealthOmics?
AWS HealthOmics è un AWS servizio che aiuta utenti come bioinformatici, ricercatori e scienziati a archiviare, interrogare, analizzare e generare informazioni sulla genomica e su altri dati biologici. Semplifica e accelera il processo di archiviazione e analisi delle informazioni genomiche per le organizzazioni di ricerca e cliniche e velocizza le scoperte scientifiche e la generazione di informazioni.
HealthOmics ha tre componenti principali. HealthOmics Lo storage consente di archiviare e condividere petabyte di dati genomici in modo efficiente e a basso costo per gigabase. HealthOmics L'analisi semplifica la preparazione dei dati genomici per analisi multiomiche e multimodali. HealthOmics Workflows fornisce e ridimensiona automaticamente l'infrastruttura sottostante per il calcolo bioinformatico.
Argomenti
Avviso importante
HealthOmics non sostituisce la consulenza, la diagnosi o il trattamento medico professionale e non è destinato a curare, trattare, mitigare, prevenire o diagnosticare alcuna malattia o condizione di salute. L'utente è responsabile dell'istituzione della revisione umana nell'ambito di qualsiasi utilizzo AWS HealthOmics, anche in associazione a, di qualsiasi prodotto di terze parti destinato a informare il processo decisionale clinico.
HealthOmics è destinato esclusivamente al trasferimento, all'archiviazione, alla formattazione o alla visualizzazione di dati e alla fornitura di supporto infrastrutturale e di configurazione per la gestione dei flussi di lavoro. AWS HealthOmics non è destinato a eseguire direttamente la chiamata delle varianti o l'analisi e l'interpretazione genomica. AWS HealthOmics non è destinato a interpretare o analizzare test clinici di laboratorio o altri dati, risultati e scoperte dei dispositivi e non sostituisce strumenti di terze parti destinati all'uso nelle analisi genomiche.
HealthOmics concetti
Questo argomento descrive le definizioni dei concetti e dei termini chiave specifici di HealthOmics, per aiutarti a comprendere la terminologia HealthOmics utilizzata in questa guida.
Argomenti
Storage
L'archiviazione dei dati è suddivisa in archivi di sequenze, per le sequenze genomiche e le informazioni correlate, e un archivio di riferimento, per tutti i genomi di riferimento. I termini seguenti descrivono le implementazioni specifiche di. HealthOmics
-
Sequence store: un archivio dati per l'archiviazione di file genomici. All'interno è possibile avere uno o più archivi di sequenze. HealthOmics Le autorizzazioni di accesso e AWS KMS la crittografia possono essere impostate su un archivio di sequenze per controllare chi ha accesso ai dati.
-
Set di lettura: un set di lettura è un'astrazione delle letture genomiche, archiviate nei formati FASTQ, BAM o CRAM. I set di lettura possono essere importati negli archivi di sequenze e annotati con metadati. È possibile applicare le autorizzazioni ai set di lettura utilizzando il controllo degli accessi basato sugli attributi (ABAC).
-
Riferimento: un riferimento al genoma viene utilizzato con le letture per identificare dove in un genoma viene mappata una lettura specifica o un gruppo di letture. Questi sono in formato FASTA e memorizzati nell'archivio di riferimento.
-
Archivio di riferimento: un archivio dati per l'archiviazione dei genomi di riferimento. Puoi avere un unico archivio di riferimento in ogni account e regione.
Analisi
Puoi trasformare e analizzare i tuoi dati genomici con HealthOmics Analytics. Crea un negozio di varianti o un archivio di annotazioni per includere informazioni aggiuntive per le tue query.
-
Archivio varianti: archivio dati che archivia i dati delle varianti su scala di popolazione. Gli archivi di varianti supportano sia gli input genomici Variant Call Format (gvCF) che gli input VCF.
-
Archivio di annotazioni: un archivio dati che rappresenta un database di annotazioni, ad esempio uno contenuto in un file TSV/CSV, VCF o General Feature Format (). GFF3 Gli archivi di annotazioni vengono mappati sullo stesso sistema di coordinate degli archivi di varianti durante l'importazione.
Flussi di lavoro
Con HealthOmics Workflows, puoi elaborare e analizzare i tuoi dati genomici.
-
Flusso di lavoro: la definizione generale di un processo end-to-end, inclusi parametri e riferimenti agli strumenti. Le definizioni del flusso di lavoro possono essere espresse come WDL, Nextflow o CWL. Ogni flusso di lavoro creato ha un identificatore univoco.
-
Esegui: una singola chiamata di un flusso di lavoro. Una singola esecuzione utilizza i dati di input definiti e produce un output. Ogni esecuzione creata ha un identificatore univoco.
-
Attività: i singoli processi all'interno di una corsa. HealthOmics I flussi di lavoro utilizzano queste specifiche di elaborazione definite per eseguire l'attività. Ogni attività ha un identificatore univoco.
-
Gruppo di esecuzione: un gruppo di esecuzioni per il quale è possibile impostare la vCPU massima, la durata massima o il numero massimo di esecuzioni simultanee per limitare le risorse di calcolo utilizzate per esecuzione. È possibile specificare e configurare le priorità per le esecuzioni all'interno di un gruppo di esecuzione. Ad esempio, è possibile specificare che venga eseguita un'esecuzione ad alta priorità prima di un'esecuzione con priorità inferiore, creando una coda prioritaria. L'utilizzo di un Run Group è facoltativo e ogni Run Group ha un identificatore univoco.
HealthOmics features
HealthOmics offre le seguenti funzionalità.
-
HealthOmics Storage: consente di archiviare e condividere petabyte di dati genomici grezzi in modo efficiente e a basso costo per gigabase.
-
HealthOmics Analisi: semplifica la preparazione dei dati genomici per analisi multiomiche e multimodali.
-
HealthOmics Flussi di lavoro: fornisce e ridimensiona automaticamente l'infrastruttura sottostante per i flussi di lavoro bioinformatici.
È possibile utilizzare ciascun componente in modo indipendente o come parte di una soluzione integrata. end-to-end
HealthOmics ti offre i seguenti vantaggi.
-
Archivia e combina dati genomici in modo sicuro: HealthOmics si integra con altri AWS servizi come Amazon AWS Lake Formation Athena. È possibile archiviare in modo sicuro i dati genomici e quindi interrogarli o combinarli con i dati anamnestici per diagnosi migliori e piani di trattamento personalizzati.
-
Proteggi la privacy dei pazienti: HealthOmics è idoneo all'HIPAA. Si integra inoltre con IAM e Amazon CloudWatch in modo da poter controllare e registrare l'accesso ai dati e tenere traccia del modo in cui i dati vengono utilizzati nelle analisi.
-
Costruito su larga scala: supporta l'analisi dei dati di grandi popolazioni con fatturazione semplificata e nuovi strumenti di collaborazione.
-
Massimizza l'efficienza: utilizza flussi di lavoro automatizzati e strumenti integrati per semplificare l'elaborazione e l'analisi dei dati.
È possibile utilizzarlo HealthOmics per le seguenti applicazioni biomediche:
-
Sequenziamento della popolazione: interroga migliaia di genomi contemporaneamente per capire come la variazione genomica si associa ai fenotipi di una popolazione.
-
Genomica clinica: crea flussi di lavoro genomici riproducibili dall'output del sequenziatore ai dati segnalabili. Puoi anche ottimizzare la produttività ad alto volume e impostare i requisiti di elaborazione per i campioni clinici ad alta priorità per ridurre i tempi di risposta.
-
Sperimentazioni cliniche: integra l'analisi del genoma nelle sperimentazioni cliniche per comprendere meglio l'efficacia dei nuovi farmaci candidati. Semplifica e accelera le sperimentazioni cliniche con risparmi sui costi a lungo termine e sulla provenienza dei dati per soddisfare le normative degli enti governativi.
-
Migliora la ricerca e l'innovazione: semplifica e controlla l'archiviazione, l'accesso e l'analisi dei dati genomici anonimi con il controllo degli accessi integrato basato su righe e colonne.
Servizi correlati
I seguenti servizi funzionano con. HealthOmics
-
Amazon Elastic Container Registry: ogni flusso di lavoro privato utilizza un'immagine Amazon ECR (in un repository Amazon ECR privato) per contenere tutti i file eseguibili, le librerie e gli script necessari per eseguire il flusso di lavoro.
-
Amazon Simple Storage Service: Amazon S3 fornisce lo storage di file per i dati di Store e Workflow.
-
AWS Lake Formation — Lake Formation gestisce l'accesso ai dati ai tuoi archivi di dati Analytics.
-
Amazon Athena: usa Athena per eseguire query sui tuoi negozi Variant.
-
Amazon SageMaker AI: utilizza l' SageMaker intelligenza artificiale per eseguire HealthOmics attività utilizzando i notebook Jupyter.
Regioni ed endpoint per AWS HealthOmics
Per un elenco completo delle regioni e degli endpoint, consulta la Guida AWS generale.
Oltre alle AWS regioni che sono attive per impostazione predefinita, ci sono anche regioni Opt-in che devono essere attivate. Per ulteriori informazioni su come attivare o disattivare una regione, consulta Specificare le AWS regioni che il tuo account può utilizzare nella guida alla gestione dell' AWS account.
Come accedere HealthOmics
Puoi accedere alle AWS HealthOmics funzionalità utilizzando la console di gestione, la CLI SDKs o l'API.
-
AWS Console di gestione: fornisce un'interfaccia Web che è possibile utilizzare per accedere HealthOmics.
-
AWS Command Line Interface (AWS CLI) — Fornisce comandi per un'ampia gamma di AWS servizi AWS HealthOmics, inclusi ed è supportato su Windows, macOS e Linux. Per ulteriori informazioni sull'installazione di AWS CLI, vedere AWS Command Line Interface
. -
AWS SDKs — AWS fornisce SDKs (Software Development Kit) costituiti da librerie e codice di esempio per vari linguaggi e piattaforme di programmazione (inclusi Java, Python, Ruby, .NET, iOS e Android). SDKs Forniscono un modo comodo per l'uso a livello di codice. HealthOmics Per ulteriori informazioni, consulta l'AWS SDK Developer Center.
-
AWS API: puoi utilizzare le operazioni API per accedere e gestire in modo HealthOmics programmatico. Per ulteriori informazioni, consulta la Documentazione di riferimento delle API di HealthOmics .
Ulteriori informazioni
Scopri di più grazie HealthOmics a questi workshop e tutorial:
-
HealthOmics workshop: workshop dall'HealthOmics inizio alla fine
-
AWS risorse genomiche: archivi Amazon ECR
pubblici relativi alla genomica -
Tutorial in Python: tutorial per notebook Jupyter su storage, analisi e flussi di lavoro
GitHub HealthOmics
Acquisisci HealthOmics familiarità con AWS strumenti aggiuntivi che forniscono:
-
Linter WDL — HealthOmics linter
per WDL -
HealthOmics Strumento di supporto Amazon ECR — Strumento di supporto Amazon ECR per HealthOmics
-
HealthOmics tools on GitHub : strumenti con cui lavorare HealthOmics
(Transfer manager, URI parser, Omics rerun, Run analyzer).