HealthOmics ejecutar parámetros Iniciar una ejecución mediante la consola Iniciar una ejecución mediante la API Obtén información sobre una ejecución

Iniciar una carrera en HealthOmics

Al iniciar una ejecución, se especifican los recursos que se HealthOmics asignarán para su uso durante la ejecución.

Especifique el tipo de almacenamiento de la ejecución y la cantidad de almacenamiento (para el almacenamiento estático). Para garantizar el aislamiento y la seguridad de los datos, HealthOmics aprovisiona el almacenamiento al inicio de cada ejecución y lo desaprovisiona al final de la ejecución. Para obtener información adicional, consulta Ejecute tipos de almacenamiento en HealthOmics flujos de trabajo.

Especifique una ubicación de Amazon S3 para los archivos de salida. Si ejecuta un gran volumen de flujos de trabajo de forma simultánea, utilice una salida de Amazon S3 independiente URIs para cada flujo de trabajo a fin de evitar la limitación de los cubos. Para obtener más información, consulte Organizar objetos mediante prefijos en la Guía del usuario de Amazon S3 y Escalar las conexiones de almacenamiento horizontalmente en el documento técnico Optimización del rendimiento de Amazon S3.

También puede especificar la prioridad de ejecución. El impacto de la prioridad en la ejecución depende de si la ejecución está asociada a un grupo de ejecuciones. Para obtener información adicional, consulta Prioridad de ejecución.

Si un flujo de trabajo tiene una o más versiones, puede especificar una versión al iniciar la ejecución. Si no especifica una versión, HealthOmics inicia la versión predeterminada del flujo de trabajo.

Al usar la HealthOmics API, puedes proporcionar un ID de solicitud único para cada ejecución. El ID de solicitud es un token de idempotencia que se HealthOmics utiliza para identificar las solicitudes duplicadas e inicia la ejecución solo una vez.

nota

Al iniciar una ejecución, debe especificar una función de servicio de IAM. Si lo desea, la consola puede crear el rol de servicio automáticamente. Para obtener más información, consulte Funciones de servicio para AWS HealthOmics.

Temas

HealthOmics ejecutar parámetros
Iniciar una ejecución mediante la consola
Iniciar una ejecución mediante la API
Obtén información sobre una ejecución

HealthOmics ejecutar parámetros

Al iniciar una ejecución, se especifican las entradas de la ejecución en el archivo JSON de parámetros de ejecución o se pueden introducir los valores de los parámetros en línea. Para obtener información sobre cómo administrar el tamaño del archivo JSON de parámetros de ejecución, consulteAdministrar el tamaño de los parámetros de ejecución.

HealthOmics admite los siguientes tipos de JSON para los valores de los parámetros.

Tipo JSON	Ejemplo de clave y valor	Notas
booleano	«b»: verdadero	El valor no está entre comillas y está todo en minúsculas.
entero	«i»: 7	El valor no está entre comillas.
número	«f»: 42.3	El valor no está entre comillas.
cadena	«s» :"caracteres»	El valor está entre comillas. Utilice el tipo de cadena para los valores de texto y URIs. El objetivo del URI debe ser el tipo de entrada esperado.
array	«a»: [1,2,3]	El valor no está entre comillas. Cada uno de los miembros de la matriz debe tener el tipo definido por el parámetro de entrada.
objeto	«o»: {"izquierda» :"a», «derecha» :1}	En WDL, el objeto se asigna a un par, mapa o estructura de WDL

Iniciar una ejecución mediante la consola

Para iniciar una ejecución

Abra la consola de HealthOmics .
Si es necesario, abre el panel de navegación izquierdo (≡). Elija Ejecuciones.
En la página Ejecuciones, seleccione Iniciar ejecución.
En el panel de detalles de la ejecución, proporcione la siguiente información
- Origen del flujo de trabajo: elija un flujo de trabajo propio o un flujo de trabajo compartido.
- ID del flujo de trabajo: el ID del flujo de trabajo asociado a esta ejecución.
- Versión del flujo de trabajo (opcional): seleccione una versión del flujo de trabajo para usarla en esta ejecución. Si no selecciona una versión, la ejecución utilizará la versión predeterminada del flujo de trabajo.
- Nombre de la ejecución: nombre distintivo de esta ejecución.
- Prioridad de ejecución (opcional): la prioridad de esta ejecución. Los números más altos especifican una prioridad más alta y las tareas de mayor prioridad se ejecutan primero.
- Tipo de almacenamiento de ejecución: especifique aquí el tipo de almacenamiento para anular el tipo de almacenamiento de ejecución predeterminado especificado para el flujo de trabajo. El almacenamiento estático asigna una cantidad fija de almacenamiento para la ejecución. El almacenamiento dinámico se amplía y reduce según sea necesario para cada tarea de la ejecución.
- Capacidad de almacenamiento en ejecución: en el caso del almacenamiento estático en ejecución, especifique la cantidad de almacenamiento necesaria para la ejecución. Esta entrada anula la cantidad de almacenamiento de ejecución predeterminada especificada para el flujo de trabajo.
- Seleccione el destino de salida de S3: la ubicación de S3 en la que se guardarán las salidas de la ejecución.
- ID de cuenta del propietario del bucket de salida (opcional): si su cuenta no es propietaria del bucket de salida, introduzca el Cuenta de AWS ID del propietario del bucket. Esta información es necesaria para HealthOmics poder verificar la propiedad del depósito.
- Modo de retención de metadatos de ejecución: elija si desea conservar los metadatos de todas las ejecuciones o hacer que el sistema elimine los metadatos de las ejecuciones más antiguas cuando su cuenta alcance el número máximo de ejecuciones. Para obtener más información, consulte Modo de retención de ejecución para HealthOmics carreras.
En Función de servicio, puedes usar una función de servicio existente o crear una nueva.
(Opcional) En el caso de las etiquetas, puedes asignar hasta 50 etiquetas a la ejecución.
Elija Siguiente.
En la página Agregar valores de parámetros, proporcione los parámetros de ejecución. Puede cargar un archivo JSON que especifique los parámetros o introducir los valores manualmente.
Elija Siguiente.
En el panel Grupo de ejecuciones, si lo desea, puede especificar un grupo de ejecuciones para esta ejecución. Para obtener más información, consulte Uso de grupos de HealthOmics ejecución.
En el panel Caché de ejecución, si lo desea, puede especificar una caché de ejecución para esta ejecución. Para obtener más información, consulte Configuración de una ejecución con caché de ejecución mediante la consola.
Elija Review and start run (Revisar e iniciar ejecución).
Tras revisar la configuración de ejecución, seleccione Iniciar ejecución.

Iniciar una ejecución mediante la API

Utilice la operación API start-run para crear e iniciar una ejecución.

En el siguiente ejemplo, se especifican el identificador del flujo de trabajo y la función de servicio. En este ejemplo, se establece el modo de retención enREMOVE. Para obtener más información sobre el modo de retención, consulteModo de retención de ejecución para HealthOmics carreras.


aws omics start-run 
     --workflow-id workflow id \
     --role-arn arn:aws:iam::1234567892012:role/service-role/OmicsWorkflow-20221004T164236 \
     --name workflow name \
     --retention-mode REMOVE

Como respuesta, obtendrá el siguiente resultado. uuidEs exclusivo de la ejecución y, además, se outputUri puede usar para rastrear dónde se escriben los datos de salida.


{
    "arn": "arn:aws:omics:us-west-2:....:run/1234567", 
    "id": "123456789",
    "uuid":"96c57683-74bf-9d6d-ae7e-f09b097db14a",
    "outputUri":"s3://bucket/folder/8405154/96c57683-74bf-9d6d-ae7e-f09b097db14a"
    "status": "PENDING"
}

Incluye un archivo de parámetros

Si la plantilla de parámetros de un flujo de trabajo declara algún parámetro obligatorio, puede proporcionar un archivo JSON local con las entradas al iniciar la ejecución de un flujo de trabajo. El archivo JSON contiene el nombre exacto de cada parámetro de entrada y un valor para el parámetro.

Haz referencia al archivo JSON de entrada que aparece en el AWS CLI agregándolo --parameters file://<input_file.json> a tu start-run solicitud. Para obtener más información sobre los parámetros de ejecución, consulteHealthOmics ejecutar entradas.

Proporcione un identificador de solicitud

Puedes proporcionar una única requestId para cada ejecución. El ID de solicitud es un token de idempotencia que se HealthOmics utiliza para atrapar solicitudes duplicadas. No iniciará una ejecución si el ID de solicitud es un duplicado de una ejecución anterior.

Si utiliza infraestructura (como funciones Lambda o funciones escalonadas) para organizar los inicios de las ejecuciones, lo mejor es proporcionar un identificador de solicitud único para cada solicitud. StartRun Esto garantiza que si su infraestructura inicia de forma inadvertida una ejecución que ya ha iniciado, HealthOmics no iniciará la ejecución duplicada. Por ejemplo, si la infraestructura intenta recuperarse de un error inicial, puede volver a ejecutar un script que intente iniciar ejecuciones que son solicitudes duplicadas.

Elija una versión del flujo de trabajo

Puede especificar una versión del flujo de trabajo para la ejecución. Si no especifica una versión, HealthOmics inicia la ejecución con la versión de flujo de trabajo predeterminada.


aws omics start-run 
     --workflow-id workflow id \
      ...
     --workflow-version-name '1.2.1'

Anule el tipo de almacenamiento de ejecución

Puede anular el tipo de almacenamiento de ejecución predeterminado que se estableció en el flujo de trabajo.


aws omics start-run 
       --workflow-id workflow id \
        ...
       --storage-type STATIC
       --storage-capacity 2400

Ejecute un flujo de trabajo de GPU

También puedes especificar un ID de flujo de trabajo de GPU, como se muestra en el siguiente ejemplo:


aws omics start-run 
       --workflow-id workflow id \
       --role-arn arn:aws:iam::1234567892012:role/service-role/OmicsWorkflow-20221004T164236 \
       --name GPUTestRunModel \
       --output-uri s3://amzn-s3-demo-bucket1

Obtén información sobre una ejecución

Puedes usar el ID de la respuesta con la API get-run para comprobar el estado de una ejecución, como se muestra.


aws omics get-run --id run id

La respuesta de esta operación de API indica el estado de la ejecución del flujo de trabajo. Los estados posibles son PENDING STARTINGRUNNING, yCOMPLETED. Cuando se ejecutaCOMPLETED, puede encontrar un archivo de salida llamado outfile.txt en el bucket de Amazon S3 de salida, en una carpeta que lleva el nombre del ID de la ejecución.

La operación de API get-run también devuelve otros detalles, como si el flujo de trabajo es Ready2Run oPRIVATE, el motor del flujo de trabajo y los detalles del acelerador. En el siguiente ejemplo, se muestra la respuesta de get-run para una ejecución de un flujo de trabajo privado, descrita en la WDL, con un acelerador de GPU y sin etiquetas asignadas a la ejecución.


{
    "arn": "arn:aws:omics:us-west-2:123456789012:run/7830534",
    "id": "7830534",
    "uuid":"96c57683-74bf-9d6d-ae7e-f09b097db14a",
    "outputUri":"s3://bucket/folder/8405154/96c57683-74bf-9d6d-ae7e-f09b097db14a" 
    "status": "COMPLETED",
    "workflowId": "4074992",
    "workflowType": "PRIVATE",
    "workflowVersionName": "3.0.0",
    "roleArn": "arn:aws:iam::123456789012:role/service-role/OmicsWorkflow-20221004T164236",
    "name": "RunGroupMaxGpuTest",
    "runGroupId": "9938959",
    "digest": "sha256:a23a6fc54040d36784206234c02147302ab8658bed89860a86976048f6cad5ac",
    "accelerators": "GPU",
    "outputUri": "s3://amzn-s3-demo-bucket1",
    "startedBy": "arn:aws:sts::123456789012:assumed-role/Admin/<role_name>",
    "creationTime": "2023-04-07T16:44:22.262471+00:00",
    "startTime": "2023-04-07T16:56:12.504000+00:00",
    "stopTime": "2023-04-07T17:22:29.908813+00:00",
    "tags": {}
}

Puedes ver el estado de todas las ejecuciones con la operación de API list-runs, como se muestra.


 aws omics list-runs

Para ver todas las tareas completadas en una ejecución específica, usa la list-run-tasksAPI.


 aws omics list-run-tasks --id task ID

Para obtener los detalles de una tarea específica, usa la get-run-task API.


 aws omics get-run-task --id <run_id> --task-id task ID

Una vez completada la ejecución, los metadatos se envían a CloudWatch Under the Streammanifest/run/<run ID>/<run UUID>.

A continuación, se muestra un ejemplo del manifiesto.


{
    "arn": "arn:aws:omics:us-east-1:123456789012:run/1695324",
    "creationTime": "2022-08-24T19:53:55.284Z",
    "resourceDigests": {
      "s3://omics-data/broad-references/hg38/v0/Homo_sapiens_assembly38.dict": "etag:3884c62eb0e53fa92459ed9bff133ae6",
      "s3://omics-data/broad-references/hg38/v0/Homo_sapiens_assembly38.fasta": "etag:e307d81c605fb91b7720a08f00276842-388",
      "s3://omics-data/broad-references/hg38/v0/Homo_sapiens_assembly38.fasta.fai": "etag:f76371b113734a56cde236bc0372de0a",
      "s3://omics-data/intervals/hg38-mjs-whole-chr.500M.intervals": "etag:27fdd1341246896721ec49a46a575334",
      "s3://omics-data/workflow-input-lists/dragen-gvcf-list.txt": "etag:e22f5aeed0b350a66696d8ffae453227"
    },
    "digest": "sha256:a5baaff84dd54085eb03f78766b0a367e93439486bc3f67de42bb38b93304964",
    "engine": "WDL",
    "main": "gatk4-basic-joint-genotyping-v2.wdl",
    "name": "1044-gvcfs",
    "outputUri": "s3://omics-data/workflow-output",
    "parameters": {
      "callset_name": "cohort",
      "input_gvcf_uris": "s3://omics-data/workflow-input-lists/dragen-gvcf-list.txt",
      "interval_list": "s3://omics-data/intervals/hg38-mjs-whole-chr.500M.intervals",
      "ref_dict": "s3://omics-data/broad-references/hg38/v0/Homo_sapiens_assembly38.dict",
      "ref_fasta": "s3://omics-data/broad-references/hg38/v0/Homo_sapiens_assembly38.fasta",
      "ref_fasta_index": "s3://omics-data/broad-references/hg38/v0/Homo_sapiens_assembly38.fasta.fai"
    },
    "roleArn": "arn:aws:iam::123456789012:role/OmicsServiceRole",
    "startedBy": "arn:aws:sts::123456789012:assumed-role/admin/ahenroid-Isengard",
    "startTime": "2022-08-24T20:08:22.582Z",
    "status": "COMPLETED",
    "stopTime": "2022-08-24T20:08:22.582Z",
    "storageCapacity": 9600,
    "uuid": "a3b0ca7e-9597-4ecc-94a4-6ed45481aeab",
    "workflow": "arn:aws:omics:us-east-1:123456789012:workflow/1558364",
    "workflowType": "PRIVATE"
  },
  {
    "arn": "arn:aws:omics:us-east-1:123456789012:task/1245938",
    "cpus": 16,
    "creationTime": "2022-08-24T20:06:32.971290",
    "image": "123456789012.dkr.ecr.us-west-2.amazonaws.com/gatk",
    "imageDigest": "sha256:8051adab0ff725e7e9c2af5997680346f3c3799b2df3785dd51d4abdd3da747b",
    "memory": 32,
    "name": "geno-123",
    "run": "arn:aws:omics:us-east-1:123456789012:run/1695324",
    "startTime": "2022-08-24T20:08:22.278Z",
    "status": "SUCCESS",
    "stopTime": "2022-08-24T20:08:22.278Z",
    "uuid": "44c1a30a-4eee-426d-88ea-1af403858f76"
  },
  ...

Los metadatos de ejecución no se eliminan si no están presentes en los CloudWatch registros.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Ejecute operaciones

Vuelva a ejecutar una ejecución