Che cos'è AWS HealthOmics? - AWS HealthOmics

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Che cos'è AWS HealthOmics?

AWS HealthOmics è un servizio idoneo all'HIPAA che accelera i test diagnostici clinici, la scoperta di farmaci e la ricerca agricola gestendo completamente la complessa infrastruttura alla base dei flussi di lavoro bioinformatici. HealthOmics supporta i linguaggi di flusso di lavoro standard del settore (WDL, Nextflow, CWL) e ridimensiona perfettamente l'infrastruttura bioinformatica per supportare i dati di decine di migliaia di test al giorno, il tutto con un costo per campione prevedibile. HealthOmics gestisce le complessità tecniche come la gestione delle risorse di elaborazione e la manutenzione dei motori del flusso di lavoro in modo da poterti concentrare interamente sulle scoperte scientifiche.

Avviso importante

HealthOmics non sostituisce la consulenza, la diagnosi o il trattamento medico professionale e non è destinato a curare, trattare, mitigare, prevenire o diagnosticare alcuna malattia o condizione di salute. L'utente è responsabile dell'istituzione della revisione umana nell'ambito di qualsiasi utilizzo AWS HealthOmics, anche in associazione a, di qualsiasi prodotto di terze parti destinato a informare il processo decisionale clinico.

HealthOmics è destinato esclusivamente al trasferimento, all'archiviazione, alla formattazione o alla visualizzazione di dati e alla fornitura di supporto infrastrutturale e di configurazione per la gestione dei flussi di lavoro. AWS HealthOmics non è destinato a eseguire direttamente la chiamata delle varianti o l'analisi e l'interpretazione genomica. AWS HealthOmics non è destinato a interpretare o analizzare test clinici di laboratorio o altri dati, risultati e scoperte dei dispositivi e non sostituisce strumenti di terze parti destinati all'uso nelle analisi genomiche.

HealthOmics features

Casi d'uso principali per: HealthOmics

  • Diagnostica clinica: crea e ridimensiona i flussi di lavoro dei test diagnostici con costi prevedibili e un'infrastruttura completamente gestita che cresce con il volume dei test.

  • Scoperta di farmaci: accelera la ricerca terapeutica orchestrando modelli di base biologici su larga scala, che consentono una rapida iterazione tra milioni di potenziali candidati.

  • Ricerca agricola: migliora le caratteristiche delle colture come la tolleranza alla siccità e la resistenza ai parassiti attraverso flussi di lavoro basati sull'intelligenza artificiale che migliorano la sicurezza alimentare e la produttività agricola.

HealthOmicsPrincipali vantaggi di:

  • Scalabilità: scalabilità dei flussi di lavoro su oltre 100.000 flussi di lavoro simultanei CPUs per supportare decine di migliaia di test al giorno con una gestione dell'infrastruttura pari a zero e un costo per campione prevedibile.

  • Concentrati sulla scienza, non sull'infrastruttura: utilizza linguaggi di flusso di lavoro familiari e gestisci AWS automaticamente l'orchestrazione dell'infrastruttura e APIs la gestione dei dati dietro le quinte.

  • Mantieni la conformità: audit trail completi, tracciamento della provenienza dei dati e infrastruttura conforme all'HIPAA progettata per i flussi di lavoro clinici supportano lo sviluppo di soluzioni che soddisfano i requisiti out-of-the-box normativi.

HealthOmics è costituito da tre componenti principali:

Utilizzate questi componenti in modo indipendente o combinateli per ottenere una soluzione. end-to-end

HealthOmics concetti

Questo argomento descrive le definizioni dei concetti e dei termini chiave specifici di HealthOmics, per aiutarti a comprendere la terminologia HealthOmics utilizzata in questa guida.

Flussi di lavoro

Con HealthOmics Workflows, puoi elaborare e analizzare i tuoi dati genomici.

  • Flusso di lavoro: la definizione generale di un processo end-to-end, inclusi parametri e riferimenti agli strumenti. Le definizioni del flusso di lavoro possono essere espresse come WDL, Nextflow o CWL. Ogni flusso di lavoro creato ha un identificatore univoco.

  • Esegui: una singola chiamata di un flusso di lavoro. Una singola esecuzione utilizza i dati di input definiti e produce un output. Ogni esecuzione creata ha un identificatore univoco.

  • Attività: i singoli processi all'interno di una corsa. HealthOmics I flussi di lavoro utilizzano queste specifiche di elaborazione definite per eseguire l'attività. Ogni attività ha un identificatore univoco.

  • Gruppo di esecuzione: un gruppo di esecuzioni per il quale è possibile impostare la vCPU massima, la durata massima o il numero massimo di esecuzioni simultanee per limitare le risorse di calcolo utilizzate per esecuzione. È possibile specificare e configurare le priorità per le esecuzioni all'interno di un gruppo di esecuzione. Ad esempio, è possibile specificare che venga eseguita un'esecuzione ad alta priorità prima di un'esecuzione con priorità inferiore, creando una coda prioritaria. L'utilizzo di un Run Group è facoltativo e ogni Run Group ha un identificatore univoco.

Archiviazione

L'archiviazione dei dati è suddivisa in archivi di sequenze, per le sequenze genomiche e le informazioni correlate, e un archivio di riferimento, per tutti i genomi di riferimento. I termini seguenti descrivono le implementazioni specifiche di. HealthOmics

  • Sequence store: un archivio dati per l'archiviazione di file genomici. All'interno è possibile avere uno o più archivi di sequenze. HealthOmics Le autorizzazioni di accesso e AWS KMS la crittografia possono essere impostate su un archivio di sequenze per controllare chi ha accesso ai dati.

  • Set di lettura: un set di lettura è un'astrazione delle letture genomiche, archiviate nei formati FASTQ, BAM o CRAM. I set di lettura possono essere importati negli archivi di sequenze e annotati con metadati. È possibile applicare le autorizzazioni ai set di lettura utilizzando il controllo degli accessi basato sugli attributi (ABAC).

  • Riferimento: un riferimento al genoma viene utilizzato con le letture per identificare dove in un genoma viene mappata una lettura specifica o un gruppo di letture. Questi sono in formato FASTA e memorizzati nell'archivio di riferimento.

  • Archivio di riferimento: un archivio dati per l'archiviazione dei genomi di riferimento. Puoi avere un unico archivio di riferimento in ogni account e regione.

Analisi

Puoi trasformare e analizzare i tuoi dati genomici con HealthOmics Analytics. Crea un negozio di varianti o un archivio di annotazioni per includere informazioni aggiuntive per le tue query.

  • Archivio varianti: archivio dati che archivia i dati delle varianti su scala di popolazione. Gli archivi di varianti supportano sia gli input genomici Variant Call Format (gvCF) che gli input VCF.

  • Archivio di annotazioni: un archivio dati che rappresenta un database di annotazioni, ad esempio uno contenuto in un file TSV/CSV, VCF o General Feature Format (). GFF3 Gli archivi di annotazioni vengono mappati sullo stesso sistema di coordinate degli archivi di varianti durante l'importazione.

I seguenti servizi funzionano con. HealthOmics

  • Amazon Elastic Container Registry: ogni flusso di lavoro privato utilizza un'immagine Amazon ECR (in un repository Amazon ECR privato) per contenere tutti i file eseguibili, le librerie e gli script necessari per eseguire il flusso di lavoro.

  • Amazon Simple Storage Service: Amazon S3 fornisce lo storage di file per i dati di Store e Workflow.

  • AWS Lake Formation — Lake Formation gestisce l'accesso ai dati ai tuoi archivi di dati Analytics.

  • Amazon Athena: usa Athena per eseguire query sui tuoi negozi Variant.

  • Amazon SageMaker AI: utilizza l' SageMaker intelligenza artificiale per eseguire HealthOmics attività utilizzando i notebook Jupyter.

  • GitHub connections— Usa le connessioni per connettere i tuoi repository di codice esterni ai tuoi flussi di lavoro. HealthOmics

Come accedere HealthOmics

Puoi accedere alle AWS HealthOmics funzionalità utilizzando la console di gestione, la CLI SDKs o l'API.

  • AWS Console di gestione: fornisce un'interfaccia Web che è possibile utilizzare per accedere HealthOmics.

  • AWS Command Line Interface (AWS CLI) — Fornisce comandi per un'ampia gamma di AWS servizi AWS HealthOmics, inclusi ed è supportato su Windows, macOS e Linux. Per ulteriori informazioni sull'installazione di AWS CLI, vedere AWS Command Line Interface.

  • AWS SDKs — AWS fornisce SDKs (Software Development Kit) costituiti da librerie e codice di esempio per vari linguaggi e piattaforme di programmazione (inclusi Java, Python, Ruby, .NET, iOS e Android). SDKs Forniscono un modo comodo per l'uso a livello di codice. HealthOmics Per ulteriori informazioni, consulta l'AWS SDK Developer Center.

  • AWS API: puoi utilizzare le operazioni API per accedere e gestire in modo HealthOmics programmatico. Per ulteriori informazioni, consulta la Documentazione di riferimento delle API di HealthOmics .

Regioni ed endpoint per AWS HealthOmics

Per un elenco completo delle regioni e degli endpoint, consulta la Guida AWS generale.

Oltre alle AWS regioni che sono attive per impostazione predefinita, ci sono anche regioni Opt-in che devono essere attivate. Per ulteriori informazioni su come attivare o disattivare una regione, consulta Specificare le AWS regioni che il tuo account può utilizzare nella guida alla gestione dell' AWS account.

Ulteriori informazioni

Scopri di più grazie HealthOmics a questi workshop e tutorial:

Acquisisci HealthOmics familiarità con AWS strumenti aggiuntivi che forniscono: