O que AWS HealthOmicsé - AWS HealthOmics

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

O que AWS HealthOmicsé

AWS HealthOmics é um AWS serviço que ajuda usuários como bioinformáticos, pesquisadores e cientistas a armazenar, consultar, analisar e gerar insights a partir de dados genômicos e outros dados biológicos. Ele simplifica e acelera o processo de armazenamento e análise de informações genômicas para organizações clínicas e de pesquisa, além de acelerar a descoberta científica e a geração de insights.

HealthOmics tem três componentes principais. HealthOmics O armazenamento ajuda você a armazenar e compartilhar petabytes de dados genômicos de forma eficiente e com baixo custo por gigabase. HealthOmics O Analytics simplifica a forma como você prepara dados genômicos para análises multiômicas e multimodais. HealthOmics Os fluxos de trabalho provisionam e escalam automaticamente a infraestrutura subjacente para sua computação de bioinformática.

Aviso importante

HealthOmics não substitui o aconselhamento, diagnóstico ou tratamento médico profissional e não se destina a curar, tratar, mitigar, prevenir ou diagnosticar qualquer doença ou condição de saúde. Você é responsável por instituir a avaliação humana como parte de qualquer uso de AWS HealthOmics, inclusive em associação com, qualquer produto de terceiros destinado a informar a tomada de decisões clínicas.

HealthOmics destina-se somente à transferência, armazenamento, formatação ou exibição de dados e ao fornecimento de infraestrutura e suporte de configuração para gerenciar fluxos de trabalho. AWS HealthOmics não se destina a realizar diretamente a chamada de variantes ou a análise e interpretação genômicas. AWS HealthOmics não se destina a interpretar ou analisar testes de laboratório clínico ou dados, resultados e descobertas de outros dispositivos, e não substitui ferramentas de terceiros destinadas ao uso em análises genômicas.

HealthOmics conceitos

Este tópico aborda as definições dos principais conceitos e termos específicos de HealthOmics, para ajudá-lo a entender a terminologia de HealthOmics uso deste guia.

Armazenamento

O armazenamento de dados é separado em armazenamentos de sequências, para suas sequências genômicas e informações relacionadas, e um armazenamento de referência, para todos os seus genomas de referência. Os termos a seguir descrevem as implementações que são específicas do. HealthOmics

  • Armazenamento de sequências — Um armazenamento de dados para o armazenamento de arquivos genômicos. Você pode ter um ou mais armazenamentos de sequências dentro dele HealthOmics. As permissões de acesso e a AWS KMS criptografia podem ser definidas em um armazenamento de sequências para controlar quem tem acesso aos dados.

  • Conjunto de leitura — Um conjunto de leitura é uma abstração das leituras genômicas, que são armazenadas nos formatos FASTQ, BAM ou CRAM. Os conjuntos de leitura podem ser importados para armazenamentos de sequências e anotados com metadados. Você pode aplicar permissões para ler conjuntos usando o controle de acesso baseado em atributos (ABAC).

  • Referência — Uma referência de genoma é usada com leituras para identificar onde em um genoma uma leitura específica, ou grupo de leituras, é mapeada. Eles estão no formato FASTA e são armazenados no repositório de referência.

  • Armazenamento de referência — Um armazenamento de dados para o armazenamento de genomas de referência. Você pode ter uma única loja de referência em cada conta e região.

Analytics

Você pode transformar e analisar seus dados genômicos com HealthOmics o Analytics. Crie um repositório de variantes ou um repositório de anotações para incluir informações adicionais para suas consultas.

  • Armazenamento de variantes — armazenamento de dados que armazena dados variantes em escala populacional. Os armazenamentos de variantes suportam entradas genômicas de Variant Call Format (gVCF) e VCF.

  • Armazenamento de anotações — Um armazenamento de dados que representa um banco de dados de anotações, como um arquivo TSV/CSV, VCF ou General Feature Format (). GFF3 Os repositórios de anotações são mapeados para o mesmo sistema de coordenadas dos armazenamentos de variantes durante uma importação.

Fluxos de trabalho

Com HealthOmics os fluxos de trabalho, você pode processar e analisar seus dados genômicos.

  • Fluxo de trabalho — A definição geral de um processo de ponta a ponta, incluindo parâmetros e referências a ferramentas. As definições de fluxo de trabalho podem ser expressas como WDL, Nextflow ou CWL. Cada fluxo de trabalho criado tem um identificador exclusivo.

  • Executar — Uma única invocação de um fluxo de trabalho. Uma execução individual usa seus dados de entrada definidos e produz uma saída. Cada execução criada tem um identificador exclusivo.

  • Tarefa — Os processos individuais em uma execução. HealthOmics Os fluxos de trabalho usam essas especificações de computação definidas para executar sua tarefa. Cada tarefa tem um identificador exclusivo.

  • Grupo de execuções — Um grupo de execuções para as quais você pode definir o máximo de vCPU, a duração máxima ou o máximo de execuções simultâneas para ajudar a limitar os recursos computacionais usados por execução. Você pode especificar e configurar prioridades para suas execuções dentro de um grupo de corridas. Por exemplo, você pode especificar que uma execução de alta prioridade será executada antes de uma de menor prioridade, criando uma fila prioritária. É opcional usar um grupo de execução, e cada grupo de execução tem um identificador exclusivo.

HealthOmics features

HealthOmics oferece os seguintes recursos.

  • HealthOmics Armazenamento — ajuda você a armazenar e compartilhar petabytes de dados genômicos brutos com eficiência e baixo custo por gigabase.

  • HealthOmics Análise — simplifica a forma como você prepara dados genômicos para análises multiômicas e multimodais.

  • HealthOmics Fluxos de trabalho — provisiona e dimensiona automaticamente a infraestrutura subjacente para seus fluxos de trabalho de bioinformática.

Você pode usar cada componente de forma independente ou como parte de uma end-to-end solução integrada.

HealthOmics oferece os seguintes benefícios.

  • Armazene e combine dados genômicos com segurança — HealthOmics integra-se a outros AWS serviços, como o Amazon Athena. AWS Lake Formation Você pode armazenar com segurança seus dados genômicos e, em seguida, consultá-los ou combiná-los com dados do histórico médico para obter melhores diagnósticos e planos de tratamento personalizados.

  • Proteja a privacidade do paciente — HealthOmics é elegível para a HIPAA? Ele também se integra ao IAM e à Amazon CloudWatch para que você possa controlar e registrar o acesso aos dados e acompanhar como os dados são usados nas análises.

  • Criado para escalar — Support análises de dados populacionais de grande porte com faturamento simplificado e novas ferramentas de colaboração.

  • Maximize a eficiência — use fluxos de trabalho automatizados e ferramentas integradas para agilizar o processamento e a análise de dados.

Você pode usar HealthOmics para as seguintes aplicações biomédicas:

  • Sequenciamento populacional — consulte milhares de genomas ao mesmo tempo para entender como a variação genômica é mapeada para fenótipos em uma população.

  • Genômica clínica — Crie fluxos de trabalho genômicos reproduzíveis, desde a saída do sequenciador até dados reportáveis. Você também pode otimizar a taxa de transferência de alto volume e definir os requisitos de computação para amostras clínicas de alta prioridade para reduzir o tempo de resposta.

  • Ensaios clínicos — Integre a análise do genoma aos ensaios clínicos para entender melhor a eficácia de novos candidatos a medicamentos. Simplifique e acelere os ensaios clínicos com economia de custos de longo prazo e proveniência de dados para atender às regulamentações dos órgãos governamentais.

  • Melhore a pesquisa e a inovação — Simplifique e controle o armazenamento, o acesso e a análise de dados genômicos anônimos com controle de acesso integrado baseado em linhas e colunas.

Os serviços a seguir funcionam com HealthOmics.

  • Amazon Elastic Container Registry — Cada fluxo de trabalho privado usa uma imagem do Amazon ECR (em um repositório privado do Amazon ECR) para conter todos os executáveis, bibliotecas e scripts necessários para executar o fluxo de trabalho.

  • Amazon Simple Storage Service — O Amazon S3 fornece armazenamento de arquivos para dados de armazenamento e fluxo de trabalho.

  • AWS Lake Formation — Lake Formation gerencia o acesso aos dados aos seus armazenamentos de dados do Analytics.

  • Amazon Athena — Use o Athena para realizar consultas em suas lojas Variant.

  • Amazon SageMaker AI — Use a SageMaker IA para executar HealthOmics tarefas usando notebooks Jupyter.

Regiões e endpoints para AWS HealthOmics

Para obter uma lista completa de regiões e endpoints, consulte a Referência AWS geral.

Além das AWS regiões que estão ativas por padrão, também há regiões opcionais que precisam ser ativadas. Para saber mais sobre como ativar ou desativar uma região, consulte Especificar quais AWS regiões sua conta pode usar no guia de gerenciamento de AWS contas.

Como acessar HealthOmics

Você pode acessar os AWS HealthOmics recursos usando o console de gerenciamento, a CLI SDKs ou a API.

  • AWS Console de gerenciamento — fornece uma interface da web que você pode usar para acessar HealthOmics.

  • AWS Command Line Interface (AWS CLI) — Fornece comandos para um amplo conjunto de AWS serviços, inclusive AWS HealthOmics, e é compatível com Windows, macOS e Linux. Para obter mais informações sobre a instalação do AWS CLI, consulte AWS Command Line Interface.

  • AWS SDKs — AWS fornece SDKs (kits de desenvolvimento de software) que consistem em bibliotecas e código de amostra para várias linguagens e plataformas de programação (incluindo Java, Python, Ruby, .NET, iOS e Android). Eles SDKs fornecem uma maneira conveniente de usar HealthOmics programaticamente. Para obter mais informações, consulte o AWS SDK Developer Center.

  • AWS API — Você pode usar operações de API para acessar e gerenciar HealthOmics programaticamente. Para obter mais informações, consulte a Referência da API do HealthOmics .

Saiba mais

Saiba mais sobre HealthOmics esses workshops e tutoriais:

Familiarize-se com HealthOmics ferramentas adicionais que AWS fornecem: