O que é AWS HealthOmics? - AWS HealthOmics

AWS HealthOmics lojas variantes e lojas de anotações não estarão mais abertas a novos clientes a partir de 7 de novembro de 2025. Se você quiser usar lojas de variantes ou lojas de anotações, cadastre-se antes dessa data. Os clientes existentes podem continuar usando o serviço normalmente. Para obter mais informações, consulte Alteração de disponibilidade da loja de AWS HealthOmics variantes e da loja de anotações.

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

O que é AWS HealthOmics?

AWS HealthOmics é um serviço qualificado pela HIPAA que acelera os testes de diagnóstico clínico, a descoberta de medicamentos e a pesquisa agrícola ao gerenciar totalmente a infraestrutura complexa por trás de seus fluxos de trabalho de bioinformática. HealthOmics suporta linguagens de fluxo de trabalho padrão do setor (WDL, Nextflow, CWL) e dimensiona perfeitamente a infraestrutura de bioinformática para suportar dados de dezenas de milhares de testes por dia, tudo com custo previsível por amostra. HealthOmics lida com as complexidades técnicas, como gerenciar recursos computacionais e manter mecanismos de fluxo de trabalho, para que você possa se concentrar inteiramente em descobertas científicas.

Aviso importante

HealthOmics destina-se somente à transferência, armazenamento, formatação ou exibição de dados e ao fornecimento de infraestrutura e suporte de configuração para gerenciar fluxos de trabalho. HealthOmics não substitui o aconselhamento, diagnóstico ou tratamento médico profissional e não se destina a curar, tratar, mitigar, prevenir ou diagnosticar qualquer doença ou condição de saúde. Você é responsável por instituir a avaliação humana como parte de qualquer uso de AWS HealthOmics, inclusive em associação com, qualquer produto de terceiros destinado a informar a tomada de decisões clínicas.

HealthOmics features

Casos de uso primários para HealthOmics:

  • Diagnóstico clínico — Crie e escale fluxos de trabalho de testes de diagnóstico com custos previsíveis e infraestrutura totalmente gerenciada que cresce com o volume de testes.

  • Descoberta de medicamentos — Acelere a pesquisa terapêutica orquestrando modelos de base biológica em grande escala, permitindo a rápida iteração entre milhões de candidatos em potencial.

  • Pesquisa agrícola — Melhore as características das culturas, como tolerância à seca e resistência a pragas, por meio de fluxos de trabalho baseados em IA que melhoram a segurança alimentar e a produtividade agrícola.

Principais benefícios de HealthOmics:

  • Escalabilidade — Dimensione fluxos de trabalho em mais de 100.000 v simultâneos CPUs para suportar dezenas de milhares de testes diários sem gerenciamento de infraestrutura e custo previsível por amostra.

  • Concentre-se na ciência, não na infraestrutura — use linguagens de fluxo de trabalho familiares e, APIs ao mesmo tempo, gerencie AWS automaticamente a orquestração da infraestrutura e o gerenciamento de dados nos bastidores.

  • Mantenha a conformidade — trilhas de auditoria abrangentes, rastreamento de proveniência de dados e infraestrutura qualificada pela HIPAA projetada para fluxos de trabalho clínicos — tudo isso out-of-the-box — apoiam o desenvolvimento de soluções que atendam aos requisitos regulatórios.

HealthOmics consiste em três componentes principais:

Use esses componentes de forma independente ou combine-os para obter uma end-to-end solução.

HealthOmics conceitos

Este tópico aborda as definições dos principais conceitos e termos específicos de HealthOmics, para ajudá-lo a entender a terminologia de HealthOmics uso deste guia.

Fluxos de trabalho

Com HealthOmics os fluxos de trabalho, você pode processar e analisar seus dados genômicos.

  • Fluxo de trabalho — A definição geral de um processo de ponta a ponta, incluindo parâmetros e referências a ferramentas. As definições de fluxo de trabalho podem ser expressas como WDL, Nextflow ou CWL. Cada fluxo de trabalho criado tem um identificador exclusivo.

  • Executar — Uma única invocação de um fluxo de trabalho. Uma execução individual usa seus dados de entrada definidos e produz uma saída. Cada execução criada tem um identificador exclusivo.

  • Tarefa — Os processos individuais em uma execução. HealthOmics Os fluxos de trabalho usam essas especificações de computação definidas para executar sua tarefa. Cada tarefa tem um identificador exclusivo.

  • Grupo de execuções — Um grupo de execuções para as quais você pode definir o máximo de vCPU, a duração máxima ou o máximo de execuções simultâneas para ajudar a limitar os recursos computacionais usados por execução. Você pode especificar e configurar prioridades para suas execuções dentro de um grupo de corridas. Por exemplo, você pode especificar que uma execução de alta prioridade será executada antes de uma de menor prioridade, criando uma fila prioritária. É opcional usar um grupo de execução, e cada grupo de execução tem um identificador exclusivo.

Armazenamento

O armazenamento de dados é separado em armazenamentos de sequências, para suas sequências genômicas e informações relacionadas, e um armazenamento de referência, para todos os seus genomas de referência. Os termos a seguir descrevem as implementações que são específicas do. HealthOmics

  • Armazenamento de sequências — Um armazenamento de dados para o armazenamento de arquivos genômicos. Você pode ter um ou mais armazenamentos de sequências dentro HealthOmics. As permissões de acesso e a AWS KMS criptografia podem ser definidas em um armazenamento de sequências para controlar quem tem acesso aos dados.

  • Conjunto de leitura — Um conjunto de leitura é uma abstração das leituras genômicas, que são armazenadas nos formatos FASTQ, BAM ou CRAM. Os conjuntos de leitura podem ser importados para armazenamentos de sequências e anotados com metadados. Você pode aplicar permissões para ler conjuntos usando o controle de acesso baseado em atributos (ABAC).

  • Referência — Uma referência de genoma é usada com leituras para identificar onde em um genoma uma leitura específica, ou grupo de leituras, é mapeada. Eles estão no formato FASTA e são armazenados no repositório de referência.

  • Armazenamento de referência — Um armazenamento de dados para o armazenamento de genomas de referência. Você pode ter uma única loja de referência em cada conta e região.

Analytics

Você pode transformar e analisar seus dados genômicos com HealthOmics o Analytics. Crie um repositório de variantes ou um repositório de anotações para incluir informações adicionais para suas consultas.

  • Armazenamento de variantes — armazenamento de dados que armazena dados variantes em escala populacional. Os armazenamentos de variantes suportam entradas genômicas de Variant Call Format (gVCF) e VCF.

  • Armazenamento de anotações — Um armazenamento de dados que representa um banco de dados de anotações, como um arquivo TSV/CSV, VCF ou General Feature Format (). GFF3 Os repositórios de anotações são mapeados para o mesmo sistema de coordenadas dos armazenamentos de variantes durante uma importação.

Os serviços a seguir funcionam com HealthOmics.

  • Amazon Elastic Container Registry — Cada fluxo de trabalho privado usa uma imagem do Amazon ECR (em um repositório privado do Amazon ECR) para conter todos os executáveis, bibliotecas e scripts necessários para executar o fluxo de trabalho.

  • Amazon Simple Storage Service — O Amazon S3 fornece armazenamento de arquivos para dados de armazenamento e fluxo de trabalho.

  • AWS Lake Formation — Lake Formation gerencia o acesso aos dados aos seus armazenamentos de dados do Analytics.

  • Amazon Athena — Use o Athena para realizar consultas em suas lojas Variant.

  • Amazon SageMaker AI — Use a SageMaker IA para executar HealthOmics tarefas usando notebooks Jupyter.

  • GitHub connections— Use conexões para conectar seus repositórios de código externos aos seus fluxos de trabalho. HealthOmics

Como acessar HealthOmics

Você pode acessar os AWS HealthOmics recursos usando o console de gerenciamento, a CLI SDKs ou a API.

  • AWS Console de gerenciamento — fornece uma interface da web que você pode usar para acessar HealthOmics.

  • AWS Command Line Interface (AWS CLI) — Fornece comandos para um amplo conjunto de AWS serviços, inclusive AWS HealthOmics, e é compatível com Windows, macOS e Linux. Para obter mais informações sobre a instalação do AWS CLI, consulte AWS Command Line Interface.

  • AWS SDKs — AWS fornece SDKs (kits de desenvolvimento de software) que consistem em bibliotecas e código de amostra para várias linguagens e plataformas de programação (incluindo Java, Python, Ruby, .NET, iOS e Android). Eles SDKs fornecem uma maneira conveniente de usar HealthOmics programaticamente. Para obter mais informações, consulte o AWS SDK Developer Center.

  • AWS API — Você pode usar operações de API para acessar e gerenciar HealthOmics programaticamente. Para obter mais informações, consulte a Referência da API do HealthOmics .

Regiões e endpoints para AWS HealthOmics

Para obter uma lista completa de regiões e endpoints, consulte a Referência AWS geral.

Além das AWS regiões que estão ativas por padrão, também há regiões opcionais que precisam ser ativadas. Para saber mais sobre como ativar ou desativar uma região, consulte Especificar quais AWS regiões sua conta pode usar no guia de gerenciamento de AWS contas.

Saiba mais

Saiba mais sobre HealthOmics esses workshops e tutoriais:

Familiarize-se com HealthOmics ferramentas adicionais que AWS fornecem: