Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
¿Qué es AWS HealthOmics?
AWS HealthOmics es un servicio que cumple con los requisitos de la HIPAA y que acelera las pruebas de diagnóstico clínico, el descubrimiento de fármacos y la investigación agrícola mediante la gestión integral de la compleja infraestructura que sustenta sus flujos de trabajo bioinformáticos. HealthOmics es compatible con los lenguajes de flujo de trabajo estándares del sector (WDL, Nextflow, CWL) y amplía sin problemas la infraestructura bioinformática para admitir los datos de decenas de miles de pruebas al día, todo ello con un coste por muestra predecible. HealthOmics gestiona las complejidades técnicas, como la gestión de los recursos informáticos y el mantenimiento de los motores de flujo de trabajo, para que pueda centrarse por completo en los avances científicos.
Temas
Aviso importante
HealthOmics no sustituye el asesoramiento, el diagnóstico o el tratamiento de un médico profesional, y no pretende curar, tratar, mitigar, prevenir o diagnosticar ninguna enfermedad o afección de salud. Usted es responsable de instituir una revisión humana como parte de cualquier uso de cualquier producto de terceros destinado a fundamentar la toma de decisiones clínicas AWS HealthOmics, incluso en asociación con él.
HealthOmics está destinado únicamente a transferir, almacenar, formatear o mostrar datos y a proporcionar soporte de infraestructura y configuración para gestionar los flujos de trabajo. AWS HealthOmics no está diseñado para realizar directamente la búsqueda de variantes ni el análisis e interpretación genómicos. AWS HealthOmics no pretende interpretar ni analizar las pruebas de laboratorio clínico ni los datos, resultados y hallazgos de otros dispositivos, ni sustituye a las herramientas de terceros destinadas a utilizarse en los análisis genómicos.
HealthOmics features
Casos de uso principales para HealthOmics:
-
Diagnóstico clínico: cree y escale los flujos de trabajo de las pruebas de diagnóstico con costes predecibles y una infraestructura totalmente gestionada que crezca con el volumen de pruebas.
-
Descubrimiento de fármacos: acelere la investigación terapéutica organizando modelos biológicos básicos a escala, lo que permitirá una rápida iteración entre millones de posibles candidatos.
-
Investigación agrícola: mejore las características de los cultivos, como la tolerancia a la sequía y la resistencia a las plagas, mediante flujos de trabajo impulsados por la IA que mejoran la seguridad alimentaria y la productividad agrícola.
Principales beneficios de: HealthOmics
-
Escalabilidad: escale los flujos de trabajo a más de 100 000 V simultáneos CPUs para realizar decenas de miles de pruebas al día sin necesidad de gestionar la infraestructura y con un coste por muestra predecible.
-
Céntrese en la ciencia, no en la infraestructura: utilice lenguajes de flujo de trabajo conocidos y, APIs al mismo tiempo, gestione AWS automáticamente la infraestructura y la gestión de datos entre bastidores.
-
Mantenga el cumplimiento: los registros de auditoría integrales, el seguimiento de la procedencia de los datos y una infraestructura compatible con la HIPAA diseñada para los flujos de trabajo clínicos respaldan el desarrollo de soluciones que cumplen con los out-of-the-box requisitos reglamentarios.
HealthOmics consta de tres componentes principales:
-
HealthOmics flujos de trabajo: ejecute cálculos bioinformáticos en una infraestructura escalada y aprovisionada automáticamente.
-
HealthOmics almacenamiento: almacene y comparta petabytes de datos genómicos de manera eficiente a un bajo costo por gigabase.
-
HealthOmics análisis: prepare los datos genómicos para los análisis multiómicos y multimodales.
Utilice estos componentes de forma independiente o combínelos para crear una solución. end-to-end
HealthOmics conceptos
Este tema cubre las definiciones de los conceptos y términos clave específicos de HealthOmics, para ayudarlo a comprender la terminología HealthOmics utilizada en esta guía.
Flujos de trabajo
Con HealthOmics Workflows, puede procesar y analizar sus datos genómicos.
-
Flujo de trabajo: la definición general de un proceso integral, incluidos los parámetros y las referencias a las herramientas. Las definiciones de flujo de trabajo se pueden expresar como WDL, Nextflow o CWL. Cada flujo de trabajo creado tiene un identificador único.
-
Ejecutar: una sola invocación de un flujo de trabajo. Una ejecución individual utiliza los datos de entrada definidos y produce una salida. Cada ejecución creada tiene un identificador único.
-
Tarea: los procesos individuales de una ejecución. HealthOmics Los flujos de trabajo utilizan estas especificaciones informáticas definidas para ejecutar la tarea. Cada tarea tiene un identificador único.
-
Grupo de ejecuciones: grupo de ejecuciones para el que puedes establecer el número máximo de vCPU, la duración máxima o el máximo de ejecuciones simultáneas para limitar los recursos informáticos utilizados por ejecución. Puedes especificar y configurar las prioridades de tus ejecuciones dentro de un grupo de ejecuciones. Por ejemplo, puedes especificar que se ejecute una ejecución de alta prioridad antes que una de menor prioridad, creando una cola de prioridad. El uso de un grupo de ejecución es opcional y cada grupo de ejecución tiene un identificador único.
Almacenamiento
El almacenamiento de datos se divide en almacenes de secuencias, para las secuencias genómicas e información relacionada, y un almacén de referencias, para todos los genomas de referencia. Los siguientes términos describen las implementaciones específicas de. HealthOmics
-
Almacén de secuencias: almacén de datos para el almacenamiento de archivos genómicos. Puede tener uno o más almacenes de secuencias en su interior HealthOmics. Los permisos de acceso y el AWS KMS cifrado se pueden configurar en un almacén de secuencias para controlar quién tiene acceso a los datos.
-
Conjunto de lecturas: un conjunto de lecturas es una abstracción de las lecturas genómicas, que se almacenan en los formatos FASTQ, BAM o CRAM. Los conjuntos de lectura pueden importarse a almacenes de secuencias y anotarse con metadatos. Puede aplicar permisos a los conjuntos de lectura mediante el control de acceso basado en atributos (ABAC).
-
Referencia: una referencia genómica se utiliza con las lecturas para identificar en qué parte del genoma se mapea una lectura específica o un grupo de lecturas. Están en formato FASTA y se almacenan en el almacén de referencias.
-
Almacén de referencia: almacén de datos para el almacenamiento de genomas de referencia. Puede tener un único almacén de referencias en cada cuenta y región.
Análisis
Puede transformar y analizar sus datos genómicos con HealthOmics Analytics. Cree un almacén de variantes o un almacén de anotaciones para incluir información adicional para sus consultas.
-
Almacén de variantes: almacén de datos que almacena datos de variantes a escala de población. Los almacenes de variantes admiten tanto el formato de llamada de variantes genómicas (gvCF) como las entradas VCF.
-
Almacén de anotaciones: banco de datos que representa una base de datos de anotaciones, como una de un archivo TSV/CSV, VCF o General Feature Format (). GFF3 Los almacenes de anotaciones se asignan al mismo sistema de coordenadas que los almacenes de variantes durante una importación.
Servicios relacionados
Los siguientes servicios funcionan con. HealthOmics
-
Amazon Elastic Container Registry: cada flujo de trabajo privado utiliza una imagen de Amazon ECR (en un repositorio privado de Amazon ECR) para contener todos los ejecutables, bibliotecas y scripts necesarios para ejecutar el flujo de trabajo.
-
Amazon Simple Storage Service: Amazon S3 proporciona almacenamiento de archivos para los datos de la tienda y del flujo de trabajo.
-
AWS Lake Formation — Lake Formation gestiona el acceso a los datos de sus almacenes de datos de Analytics.
-
Amazon Athena: usa Athena para realizar consultas en tus tiendas de variantes.
-
Amazon SageMaker AI: utilice la SageMaker IA para ejecutar HealthOmics tareas con los cuadernos Jupyter.
-
GitHub connections— Utilice conexiones para conectar sus repositorios de código externos a sus flujos de trabajo. HealthOmics
¿Cómo acceder HealthOmics
Puede acceder a AWS HealthOmics las funciones mediante la consola de administración, la CLI SDKs o la API.
-
AWS Consola de administración: proporciona una interfaz web a la que puede acceder HealthOmics.
-
AWS Command Line Interface (AWS CLI): proporciona comandos para un amplio conjunto de AWS servicios AWS HealthOmics, incluidos y es compatible con Windows, macOS y Linux. Para obtener más información sobre la instalación de AWS CLI, consulte AWS Command Line Interface
. -
AWS SDKs — AWS proporciona SDKs (kits de desarrollo de software) que consisten en bibliotecas y código de muestra para varios lenguajes de programación y plataformas (incluidos Java, Python, Ruby, .NET, iOS y Android). SDKs Proporcionan una forma cómoda de utilizarlos HealthOmics mediante programación. Para obtener más información, consulta el Centro de desarrolladores del AWS SDK
. -
AWS API: puede usar las operaciones de la API para acceder a ellas y administrarlas HealthOmics mediante programación. Para obtener más información, consulte la Referencia de la API de HealthOmics .
Regiones y puntos finales para AWS HealthOmics
Para obtener una lista completa de regiones y puntos finales, consulte la Referencia AWS general.
Además de las AWS regiones que están activas de forma predeterminada, también hay regiones de suscripción que deben activarse. Para obtener más información sobre cómo activar o desactivar una región, consulta Especificar qué AWS regiones puede usar tu cuenta en la guía de administración de AWS cuentas.
Más información
Obtenga más información HealthOmics en estos talleres y tutoriales:
-
HealthOmics taller: taller de principio a HealthOmics fin
-
AWS recursos genómicos — Repositorios públicos de Amazon ECR relacionados
con la genómica -
Tutoriales de Python: tutoriales de Jupyter Notebook
sobre HealthOmics almacenamiento GitHub, análisis y flujos de trabajo
Familiarícese con HealthOmics herramientas adicionales que AWS ofrecen:
-
WDL linter: HealthOmics linter
para WDL -
HealthOmics Herramienta auxiliar de Amazon ECR: herramienta de ayuda de Amazon ECR para HealthOmics
-
HealthOmics herramientas sobre GitHub : herramientas con las que trabajar HealthOmics
(gestor de transferencias, analizador de URI, reejecución de Omics, analizador de ejecución).