HealthOmics parâmetros de execução Iniciando uma execução usando o console Iniciando uma execução usando a API Obtenha informações sobre uma corrida

Comece uma corrida em HealthOmics

Ao iniciar uma execução, você especifica os recursos que são HealthOmics alocados para uso durante a execução.

Especifique o tipo de armazenamento executado e a quantidade de armazenamento (para armazenamento estático). Para garantir o isolamento e a segurança dos dados, HealthOmics provisiona o armazenamento no início de cada execução e o desprovisiona no final da execução. Para obter informações adicionais, consulte Execute tipos de armazenamento em HealthOmics fluxos de trabalho.

Especifique uma localização do Amazon S3 para os arquivos de saída. Se você executa um grande volume de fluxos de trabalho simultaneamente, use uma URIs saída separada do Amazon S3 para cada fluxo de trabalho para evitar a limitação do bucket. Para obter mais informações, consulte Organização de objetos usando prefixos no Guia do usuário do Amazon S3 e Dimensione conexões de armazenamento horizontalmente no whitepaper Otimizando o desempenho do Amazon S3.

Você também pode especificar a prioridade de execução. O impacto da prioridade na execução depende de a execução estar associada a um grupo de execução. Para obter informações adicionais, consulte Prioridade de execução.

Se um fluxo de trabalho tiver uma ou mais versões, você poderá especificar uma versão ao iniciar a execução. Se você não especificar uma versão, HealthOmics iniciará a versão padrão do fluxo de trabalho.

Ao usar a HealthOmics API, você pode fornecer um ID de solicitação exclusivo para cada execução. O ID da solicitação é um token de idempotência HealthOmics usado para identificar solicitações duplicadas e inicia a execução apenas uma vez.

nota

Você especifica uma função de serviço do IAM ao iniciar uma execução. Opcionalmente, o console pode criar a função de serviço para você. Para obter mais informações, consulte Funções de serviço para AWS HealthOmics.

HealthOmics parâmetros de execução

Ao iniciar uma execução, você especifica as entradas de execução no arquivo JSON dos parâmetros de execução ou pode inserir os valores dos parâmetros em linha. Para obter informações sobre como gerenciar o tamanho do arquivo JSON de parâmetros de execução, consulteGerenciando o tamanho dos parâmetros de execução.

HealthOmics suporta os seguintes tipos de JSON para valores de parâmetros.

Tipo JSON	Exemplo de chave e valor	Observações
boolean	“b”: verdadeiro	O valor não está entre aspas e está todo em minúsculas.
integer	“i” :7	O valor não está entre aspas.
número	“f”: 42,3	O valor não está entre aspas.
string	“s”: “caracteres”	O valor está entre aspas. Use o tipo de string para valores de texto URIs e. O destino do URI deve ser o tipo de entrada esperado.
array	“a”: [1,2,3]	O valor não está entre aspas. Cada membro da matriz deve ter o tipo definido pelo parâmetro de entrada.
objeto	“o”: {"left” :"a”, “right” :1}	Na WDL, o objeto é mapeado para WDL Pair, Map ou Struct

Iniciando uma execução usando o console

Para começar uma corrida

Abra o console de HealthOmics .
Se necessário, abra o painel de navegação esquerdo (≡). Selecione Execuções.
Na página Execuções, escolha Iniciar execução.
No painel Detalhes da execução, forneça as seguintes informações
- Fonte do fluxo de trabalho - escolha Fluxo de trabalho próprio ou Fluxo de trabalho compartilhado.
- ID do fluxo de trabalho - O ID do fluxo de trabalho associado a essa execução.
- Versão do fluxo de trabalho (opcional) - selecione uma versão do fluxo de trabalho para usar nessa execução. Se você não selecionar uma versão, a execução usará a versão padrão do fluxo de trabalho.
- Nome da execução - Um nome distinto para essa execução.
- Prioridade de execução (opcional) - A prioridade dessa execução. Números mais altos especificam uma prioridade mais alta, e as tarefas de maior prioridade são executadas primeiro.
- Executar tipo de armazenamento - especifique o tipo de armazenamento aqui para substituir o tipo de armazenamento de execução padrão especificado para o fluxo de trabalho. O armazenamento estático aloca uma quantidade fixa de armazenamento para a execução. O armazenamento dinâmico aumenta e diminui conforme necessário para cada tarefa em execução.
- Capacidade de armazenamento em execução - Para armazenamento em execução estática, especifique a quantidade de armazenamento necessária para a execução. Essa entrada substitui a quantidade padrão de armazenamento de execução especificada para o fluxo de trabalho.
- Selecione o destino de saída do S3 - O local do S3 onde as saídas de execução serão salvas.
- ID da conta do proprietário do bucket de saída (opcional) — se sua conta não for proprietária do bucket de saída, insira o Conta da AWS ID do proprietário do bucket. Essas informações são necessárias para que HealthOmics possamos verificar a propriedade do bucket.
- Modo de retenção de metadados de execução: escolha se deseja reter os metadados de todas as execuções ou fazer com que o sistema remova os metadados de execução mais antigos quando sua conta atingir o número máximo de execuções. Para obter mais informações, consulte Execute o modo de retenção para HealthOmics execuções.
Em Função de serviço, você pode usar uma função de serviço existente ou criar uma nova.
(Opcional) Para tags, você pode atribuir até 50 tags à execução.
Escolha Próximo.
Na página Adicionar valores de parâmetros, forneça os parâmetros de execução. Você pode fazer upload de um arquivo JSON que especifique os parâmetros ou inserir manualmente os valores.
Escolha Próximo.
No painel Grupo de execução, você pode, opcionalmente, especificar um grupo de execução para essa execução. Para obter mais informações, consulte Usando grupos de HealthOmics execução.
No painel Executar cache, você pode, opcionalmente, especificar um cache de execução para essa execução. Para obter mais informações, consulte Configurando uma execução com cache de execução usando o console.
Escolha Review and start run (Examinar e iniciar execução).
Depois de revisar a configuração de execução, escolha Iniciar execução.

Iniciando uma execução usando a API

Use a operação da API start-run para criar e iniciar uma execução.

O exemplo a seguir especifica a ID do fluxo de trabalho e a função de serviço. Este exemplo define o modo de retenção comoREMOVE. Para obter mais informações sobre o modo de retenção, consulteExecute o modo de retenção para HealthOmics execuções.


aws omics start-run 
     --workflow-id workflow id \
     --role-arn arn:aws:iam::1234567892012:role/service-role/OmicsWorkflow-20221004T164236 \
     --name workflow name \
     --retention-mode REMOVE

Em resposta, você obtém a seguinte saída. uuidÉ exclusivo para a execução e, junto com ele, outputUri pode ser usado para rastrear onde os dados de saída são gravados.


{
    "arn": "arn:aws:omics:us-west-2:....:run/1234567", 
    "id": "123456789",
    "uuid":"96c57683-74bf-9d6d-ae7e-f09b097db14a",
    "outputUri":"s3://bucket/folder/8405154/96c57683-74bf-9d6d-ae7e-f09b097db14a"
    "status": "PENDING"
}

Incluir um arquivo de parâmetros

Se o modelo de parâmetro de um fluxo de trabalho declarar quaisquer parâmetros necessários, você poderá fornecer um arquivo JSON local das entradas ao iniciar a execução de um fluxo de trabalho. O arquivo JSON contém o nome exato de cada parâmetro de entrada e um valor para o parâmetro.

Faça referência ao arquivo JSON de entrada no AWS CLI adicionando --parameters file://<input_file.json> à sua start-run solicitação. Para obter mais informações sobre os parâmetros de execução, consulteHealthOmics entradas de execução.

Forneça um ID de solicitação

Você pode fornecer um item exclusivo requestId para cada corrida. O ID da solicitação é um token de idempotência usado HealthOmics para capturar solicitações duplicadas. Ela não iniciará uma execução se o ID da solicitação for uma duplicata de uma execução anterior.

Se você usa infraestrutura (como funções Lambda ou funções de etapas) para orquestrar o início da execução, a melhor prática é fornecer um ID de solicitação exclusivo para cada solicitação. StartRun Isso garante que, se sua infraestrutura inadvertidamente iniciar uma execução já iniciada, HealthOmics não inicie a execução duplicada. Por exemplo, se a infraestrutura estiver tentando se recuperar de um erro inicial, ela poderá executar novamente um script que tente iniciar execuções que sejam solicitações duplicadas.

Escolha uma versão do fluxo de trabalho

Você pode especificar uma versão do fluxo de trabalho para a execução. Se você não especificar uma versão, HealthOmics iniciará a execução com a versão padrão do fluxo de trabalho.


aws omics start-run 
     --workflow-id workflow id \
      ...
     --workflow-version-name '1.2.1'

Substituir o tipo de armazenamento de execução

Você pode substituir o tipo de armazenamento de execução padrão que foi definido no fluxo de trabalho.


aws omics start-run 
       --workflow-id workflow id \
        ...
       --storage-type STATIC
       --storage-capacity 2400

Execute um fluxo de trabalho de GPU

Você também pode especificar uma ID de fluxo de trabalho da GPU, conforme mostrado no exemplo a seguir:


aws omics start-run 
       --workflow-id workflow id \
       --role-arn arn:aws:iam::1234567892012:role/service-role/OmicsWorkflow-20221004T164236 \
       --name GPUTestRunModel \
       --output-uri s3://amzn-s3-demo-bucket1

Obtenha informações sobre uma corrida

Você pode usar o ID na resposta com a API get-run para verificar o status de uma execução, conforme mostrado.


aws omics get-run --id run id

A resposta dessa operação de API informa o status da execução do fluxo de trabalho. Os status possíveis são PENDINGSTARTING,RUNNING, e. COMPLETED Quando uma execução é executadaCOMPLETED, você pode encontrar um arquivo de saída chamado outfile.txt em seu bucket de saída do Amazon S3, em uma pasta com o nome do ID de execução.

A operação da API get-run também retorna outros detalhes, como se o fluxo de trabalho é Ready2Run ouPRIVATE, o mecanismo do fluxo de trabalho e os detalhes do acelerador. O exemplo a seguir mostra a resposta para get-run para uma execução de um fluxo de trabalho privado, descrita na WDL com um acelerador de GPU e sem tags atribuídas à execução.


{
    "arn": "arn:aws:omics:us-west-2:123456789012:run/7830534",
    "id": "7830534",
    "uuid":"96c57683-74bf-9d6d-ae7e-f09b097db14a",
    "outputUri":"s3://bucket/folder/8405154/96c57683-74bf-9d6d-ae7e-f09b097db14a" 
    "status": "COMPLETED",
    "workflowId": "4074992",
    "workflowType": "PRIVATE",
    "workflowVersionName": "3.0.0",
    "roleArn": "arn:aws:iam::123456789012:role/service-role/OmicsWorkflow-20221004T164236",
    "name": "RunGroupMaxGpuTest",
    "runGroupId": "9938959",
    "digest": "sha256:a23a6fc54040d36784206234c02147302ab8658bed89860a86976048f6cad5ac",
    "accelerators": "GPU",
    "outputUri": "s3://amzn-s3-demo-bucket1",
    "startedBy": "arn:aws:sts::123456789012:assumed-role/Admin/<role_name>",
    "creationTime": "2023-04-07T16:44:22.262471+00:00",
    "startTime": "2023-04-07T16:56:12.504000+00:00",
    "stopTime": "2023-04-07T17:22:29.908813+00:00",
    "tags": {}
}

Você pode ver o status de todas as execuções com a operação da API list-runs, conforme mostrado.


 aws omics list-runs

Para ver todas as tarefas concluídas em uma execução específica, use a list-run-tasksAPI.


 aws omics list-run-tasks --id task ID

Para obter os detalhes de qualquer tarefa específica, use a get-run-task API.


 aws omics get-run-task --id <run_id> --task-id task ID

Após a conclusão da execução, os metadados são enviados para o CloudWatch subfluxo. manifest/run/<run ID>/<run UUID>

Veja a seguir um exemplo do manifesto.


{
    "arn": "arn:aws:omics:us-east-1:123456789012:run/1695324",
    "creationTime": "2022-08-24T19:53:55.284Z",
    "resourceDigests": {
      "s3://omics-data/broad-references/hg38/v0/Homo_sapiens_assembly38.dict": "etag:3884c62eb0e53fa92459ed9bff133ae6",
      "s3://omics-data/broad-references/hg38/v0/Homo_sapiens_assembly38.fasta": "etag:e307d81c605fb91b7720a08f00276842-388",
      "s3://omics-data/broad-references/hg38/v0/Homo_sapiens_assembly38.fasta.fai": "etag:f76371b113734a56cde236bc0372de0a",
      "s3://omics-data/intervals/hg38-mjs-whole-chr.500M.intervals": "etag:27fdd1341246896721ec49a46a575334",
      "s3://omics-data/workflow-input-lists/dragen-gvcf-list.txt": "etag:e22f5aeed0b350a66696d8ffae453227"
    },
    "digest": "sha256:a5baaff84dd54085eb03f78766b0a367e93439486bc3f67de42bb38b93304964",
    "engine": "WDL",
    "main": "gatk4-basic-joint-genotyping-v2.wdl",
    "name": "1044-gvcfs",
    "outputUri": "s3://omics-data/workflow-output",
    "parameters": {
      "callset_name": "cohort",
      "input_gvcf_uris": "s3://omics-data/workflow-input-lists/dragen-gvcf-list.txt",
      "interval_list": "s3://omics-data/intervals/hg38-mjs-whole-chr.500M.intervals",
      "ref_dict": "s3://omics-data/broad-references/hg38/v0/Homo_sapiens_assembly38.dict",
      "ref_fasta": "s3://omics-data/broad-references/hg38/v0/Homo_sapiens_assembly38.fasta",
      "ref_fasta_index": "s3://omics-data/broad-references/hg38/v0/Homo_sapiens_assembly38.fasta.fai"
    },
    "roleArn": "arn:aws:iam::123456789012:role/OmicsServiceRole",
    "startedBy": "arn:aws:sts::123456789012:assumed-role/admin/ahenroid-Isengard",
    "startTime": "2022-08-24T20:08:22.582Z",
    "status": "COMPLETED",
    "stopTime": "2022-08-24T20:08:22.582Z",
    "storageCapacity": 9600,
    "uuid": "a3b0ca7e-9597-4ecc-94a4-6ed45481aeab",
    "workflow": "arn:aws:omics:us-east-1:123456789012:workflow/1558364",
    "workflowType": "PRIVATE"
  },
  {
    "arn": "arn:aws:omics:us-east-1:123456789012:task/1245938",
    "cpus": 16,
    "creationTime": "2022-08-24T20:06:32.971290",
    "image": "123456789012.dkr.ecr.us-west-2.amazonaws.com/gatk",
    "imageDigest": "sha256:8051adab0ff725e7e9c2af5997680346f3c3799b2df3785dd51d4abdd3da747b",
    "memory": 32,
    "name": "geno-123",
    "run": "arn:aws:omics:us-east-1:123456789012:run/1695324",
    "startTime": "2022-08-24T20:08:22.278Z",
    "status": "SUCCESS",
    "stopTime": "2022-08-24T20:08:22.278Z",
    "uuid": "44c1a30a-4eee-426d-88ea-1af403858f76"
  },
  ...

Os metadados de execução não são excluídos se não estiverem presentes nos CloudWatch registros.

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Execute operações

Execute novamente uma corrida