Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Che cos'è AWS HealthOmics?
AWS HealthOmics è un servizio idoneo all'HIPAA che accelera i test diagnostici clinici, la scoperta di farmaci e la ricerca agricola gestendo completamente la complessa infrastruttura alla base dei flussi di lavoro bioinformatici. HealthOmics supporta i linguaggi di flusso di lavoro standard del settore (WDL, Nextflow, CWL) e ridimensiona perfettamente l'infrastruttura bioinformatica per supportare i dati di decine di migliaia di test al giorno, il tutto con un costo per campione prevedibile. HealthOmics gestisce le complessità tecniche come la gestione delle risorse di elaborazione e la manutenzione dei motori del flusso di lavoro in modo da poterti concentrare interamente sulle scoperte scientifiche.
Argomenti
Avviso importante
HealthOmics non sostituisce la consulenza, la diagnosi o il trattamento medico professionale e non è destinato a curare, trattare, mitigare, prevenire o diagnosticare alcuna malattia o condizione di salute. L'utente è responsabile dell'istituzione della revisione umana nell'ambito di qualsiasi utilizzo AWS HealthOmics, anche in associazione a, di qualsiasi prodotto di terze parti destinato a informare il processo decisionale clinico.
HealthOmics è destinato esclusivamente al trasferimento, all'archiviazione, alla formattazione o alla visualizzazione di dati e alla fornitura di supporto infrastrutturale e di configurazione per la gestione dei flussi di lavoro. AWS HealthOmics non è destinato a eseguire direttamente la chiamata delle varianti o l'analisi e l'interpretazione genomica. AWS HealthOmics non è destinato a interpretare o analizzare test clinici di laboratorio o altri dati, risultati e scoperte dei dispositivi e non sostituisce strumenti di terze parti destinati all'uso nelle analisi genomiche.
HealthOmics features
Casi d'uso principali per: HealthOmics
-
Diagnostica clinica: crea e ridimensiona i flussi di lavoro dei test diagnostici con costi prevedibili e un'infrastruttura completamente gestita che cresce con il volume dei test.
-
Scoperta di farmaci: accelera la ricerca terapeutica orchestrando modelli di base biologici su larga scala, che consentono una rapida iterazione tra milioni di potenziali candidati.
-
Ricerca agricola: migliora le caratteristiche delle colture come la tolleranza alla siccità e la resistenza ai parassiti attraverso flussi di lavoro basati sull'intelligenza artificiale che migliorano la sicurezza alimentare e la produttività agricola.
HealthOmicsPrincipali vantaggi di:
-
Scalabilità: scalabilità dei flussi di lavoro su oltre 100.000 flussi di lavoro simultanei CPUs per supportare decine di migliaia di test al giorno con una gestione dell'infrastruttura pari a zero e un costo per campione prevedibile.
-
Concentrati sulla scienza, non sull'infrastruttura: utilizza linguaggi di flusso di lavoro familiari e gestisci AWS automaticamente l'orchestrazione dell'infrastruttura e APIs la gestione dei dati dietro le quinte.
-
Mantieni la conformità: audit trail completi, tracciamento della provenienza dei dati e infrastruttura conforme all'HIPAA progettata per i flussi di lavoro clinici supportano lo sviluppo di soluzioni che soddisfano i requisiti out-of-the-box normativi.
HealthOmics è costituito da tre componenti principali:
-
HealthOmics flussi di lavoro: esegui calcoli bioinformatici su un'infrastruttura scalabile e con provisioning automatico.
-
HealthOmics archiviazione: archivia e condividi petabyte di dati genomici in modo efficiente a un basso costo per gigabase.
-
HealthOmics analisi: prepara i dati genomici per analisi multiomiche e multimodali.
Utilizzate questi componenti in modo indipendente o combinateli per ottenere una soluzione. end-to-end
HealthOmics concetti
Questo argomento descrive le definizioni dei concetti e dei termini chiave specifici di HealthOmics, per aiutarti a comprendere la terminologia HealthOmics utilizzata in questa guida.
Argomenti
Flussi di lavoro
Con HealthOmics Workflows, puoi elaborare e analizzare i tuoi dati genomici.
-
Flusso di lavoro: la definizione generale di un processo end-to-end, inclusi parametri e riferimenti agli strumenti. Le definizioni del flusso di lavoro possono essere espresse come WDL, Nextflow o CWL. Ogni flusso di lavoro creato ha un identificatore univoco.
-
Esegui: una singola chiamata di un flusso di lavoro. Una singola esecuzione utilizza i dati di input definiti e produce un output. Ogni esecuzione creata ha un identificatore univoco.
-
Attività: i singoli processi all'interno di una corsa. HealthOmics I flussi di lavoro utilizzano queste specifiche di elaborazione definite per eseguire l'attività. Ogni attività ha un identificatore univoco.
-
Gruppo di esecuzione: un gruppo di esecuzioni per il quale è possibile impostare la vCPU massima, la durata massima o il numero massimo di esecuzioni simultanee per limitare le risorse di calcolo utilizzate per esecuzione. È possibile specificare e configurare le priorità per le esecuzioni all'interno di un gruppo di esecuzione. Ad esempio, è possibile specificare che venga eseguita un'esecuzione ad alta priorità prima di un'esecuzione con priorità inferiore, creando una coda prioritaria. L'utilizzo di un Run Group è facoltativo e ogni Run Group ha un identificatore univoco.
Archiviazione
L'archiviazione dei dati è suddivisa in archivi di sequenze, per le sequenze genomiche e le informazioni correlate, e un archivio di riferimento, per tutti i genomi di riferimento. I termini seguenti descrivono le implementazioni specifiche di. HealthOmics
-
Sequence store: un archivio dati per l'archiviazione di file genomici. All'interno è possibile avere uno o più archivi di sequenze. HealthOmics Le autorizzazioni di accesso e AWS KMS la crittografia possono essere impostate su un archivio di sequenze per controllare chi ha accesso ai dati.
-
Set di lettura: un set di lettura è un'astrazione delle letture genomiche, archiviate nei formati FASTQ, BAM o CRAM. I set di lettura possono essere importati negli archivi di sequenze e annotati con metadati. È possibile applicare le autorizzazioni ai set di lettura utilizzando il controllo degli accessi basato sugli attributi (ABAC).
-
Riferimento: un riferimento al genoma viene utilizzato con le letture per identificare dove in un genoma viene mappata una lettura specifica o un gruppo di letture. Questi sono in formato FASTA e memorizzati nell'archivio di riferimento.
-
Archivio di riferimento: un archivio dati per l'archiviazione dei genomi di riferimento. Puoi avere un unico archivio di riferimento in ogni account e regione.
Analisi
Puoi trasformare e analizzare i tuoi dati genomici con HealthOmics Analytics. Crea un negozio di varianti o un archivio di annotazioni per includere informazioni aggiuntive per le tue query.
-
Archivio varianti: archivio dati che archivia i dati delle varianti su scala di popolazione. Gli archivi di varianti supportano sia gli input genomici Variant Call Format (gvCF) che gli input VCF.
-
Archivio di annotazioni: un archivio dati che rappresenta un database di annotazioni, ad esempio uno contenuto in un file TSV/CSV, VCF o General Feature Format (). GFF3 Gli archivi di annotazioni vengono mappati sullo stesso sistema di coordinate degli archivi di varianti durante l'importazione.
Servizi correlati
I seguenti servizi funzionano con. HealthOmics
-
Amazon Elastic Container Registry: ogni flusso di lavoro privato utilizza un'immagine Amazon ECR (in un repository Amazon ECR privato) per contenere tutti i file eseguibili, le librerie e gli script necessari per eseguire il flusso di lavoro.
-
Amazon Simple Storage Service: Amazon S3 fornisce lo storage di file per i dati di Store e Workflow.
-
AWS Lake Formation — Lake Formation gestisce l'accesso ai dati ai tuoi archivi di dati Analytics.
-
Amazon Athena: usa Athena per eseguire query sui tuoi negozi Variant.
-
Amazon SageMaker AI: utilizza l' SageMaker intelligenza artificiale per eseguire HealthOmics attività utilizzando i notebook Jupyter.
-
GitHub connections— Usa le connessioni per connettere i tuoi repository di codice esterni ai tuoi flussi di lavoro. HealthOmics
Come accedere HealthOmics
Puoi accedere alle AWS HealthOmics funzionalità utilizzando la console di gestione, la CLI SDKs o l'API.
-
AWS Console di gestione: fornisce un'interfaccia Web che è possibile utilizzare per accedere HealthOmics.
-
AWS Command Line Interface (AWS CLI) — Fornisce comandi per un'ampia gamma di AWS servizi AWS HealthOmics, inclusi ed è supportato su Windows, macOS e Linux. Per ulteriori informazioni sull'installazione di AWS CLI, vedere AWS Command Line Interface
. -
AWS SDKs — AWS fornisce SDKs (Software Development Kit) costituiti da librerie e codice di esempio per vari linguaggi e piattaforme di programmazione (inclusi Java, Python, Ruby, .NET, iOS e Android). SDKs Forniscono un modo comodo per l'uso a livello di codice. HealthOmics Per ulteriori informazioni, consulta l'AWS SDK Developer Center.
-
AWS API: puoi utilizzare le operazioni API per accedere e gestire in modo HealthOmics programmatico. Per ulteriori informazioni, consulta la Documentazione di riferimento delle API di HealthOmics .
Regioni ed endpoint per AWS HealthOmics
Per un elenco completo delle regioni e degli endpoint, consulta la Guida AWS generale.
Oltre alle AWS regioni che sono attive per impostazione predefinita, ci sono anche regioni Opt-in che devono essere attivate. Per ulteriori informazioni su come attivare o disattivare una regione, consulta Specificare le AWS regioni che il tuo account può utilizzare nella guida alla gestione dell' AWS account.
Ulteriori informazioni
Scopri di più grazie HealthOmics a questi workshop e tutorial:
-
HealthOmics workshop: workshop dall'HealthOmics inizio alla fine
-
AWS risorse genomiche: archivi Amazon ECR
pubblici relativi alla genomica -
Tutorial in Python: tutorial per notebook Jupyter su storage, analisi e flussi di lavoro
GitHub HealthOmics
Acquisisci HealthOmics familiarità con AWS strumenti aggiuntivi che forniscono:
-
Linter WDL — HealthOmics linter
per WDL -
HealthOmics Strumento di supporto Amazon ECR — Strumento di supporto Amazon ECR per HealthOmics
-
HealthOmics tools on GitHub : strumenti con cui lavorare HealthOmics
(Transfer manager, URI parser, Omics rerun, Run analyzer).