Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Iniciar una carrera en HealthOmics
Al iniciar una ejecución, se especifican los recursos que se HealthOmics asignarán para su uso durante la ejecución.
Especifique el tipo de almacenamiento de la ejecución y la cantidad de almacenamiento (para el almacenamiento estático). Para garantizar el aislamiento y la seguridad de los datos, HealthOmics aprovisiona el almacenamiento al inicio de cada ejecución y lo desaprovisiona al final de la ejecución. Para obtener información adicional, consulta Ejecute tipos de almacenamiento en HealthOmics flujos de trabajo.
Especifique una ubicación de Amazon S3 para los archivos de salida. Si ejecuta un gran volumen de flujos de trabajo de forma simultánea, utilice una salida de Amazon S3 independiente URIs para cada flujo de trabajo a fin de evitar la limitación de los cubos. Para obtener más información, consulte Organizar objetos mediante prefijos en la Guía del usuario de Amazon S3 y Escalar las conexiones de almacenamiento horizontalmente en el documento técnico Optimización del rendimiento de Amazon S3.
También puede especificar la prioridad de ejecución. El impacto de la prioridad en la ejecución depende de si la ejecución está asociada a un grupo de ejecuciones. Para obtener información adicional, consulta Prioridad de ejecución.
Si un flujo de trabajo tiene una o más versiones, puede especificar una versión al iniciar la ejecución. Si no especifica una versión, HealthOmics inicia la versión predeterminada del flujo de trabajo.
Al usar la HealthOmics API, puedes proporcionar un ID de solicitud único para cada ejecución. El ID de solicitud es un token de idempotencia que se HealthOmics utiliza para identificar las solicitudes duplicadas e inicia la ejecución solo una vez.
nota
Al iniciar una ejecución, debe especificar una función de servicio de IAM. Si lo desea, la consola puede crear el rol de servicio automáticamente. Para obtener más información, consulte Funciones de servicio para AWS HealthOmics.
Temas
HealthOmics ejecutar parámetros
Al iniciar una ejecución, se especifican las entradas de la ejecución en el archivo JSON de parámetros de ejecución o se pueden introducir los valores de los parámetros en línea. Para obtener información sobre cómo administrar el tamaño del archivo JSON de parámetros de ejecución, consulteAdministrar el tamaño de los parámetros de ejecución.
HealthOmics admite los siguientes tipos de JSON para los valores de los parámetros.
| Tipo JSON | Ejemplo de clave y valor | Notas |
|---|---|---|
| booleano | «b»: verdadero | El valor no está entre comillas y está todo en minúsculas. |
| entero | «i»: 7 | El valor no está entre comillas. |
| número | «f»: 42.3 | El valor no está entre comillas. |
| cadena | «s» :"caracteres» | El valor está entre comillas. Utilice el tipo de cadena para los valores de texto y URIs. El objetivo del URI debe ser el tipo de entrada esperado. |
| array | «a»: [1,2,3] | El valor no está entre comillas. Cada uno de los miembros de la matriz debe tener el tipo definido por el parámetro de entrada. |
| objeto | «o»: {"izquierda» :"a», «derecha» :1} | En WDL, el objeto se asigna a un par, mapa o estructura de WDL |
Iniciar una ejecución mediante la consola
Para iniciar una ejecución
-
Abra la consola de HealthOmics
. -
Si es necesario, abre el panel de navegación izquierdo (≡). Elija Ejecuciones.
-
En la página Ejecuciones, seleccione Iniciar ejecución.
-
En el panel de detalles de la ejecución, proporcione la siguiente información
-
Origen del flujo de trabajo: elija un flujo de trabajo propio o un flujo de trabajo compartido.
-
ID del flujo de trabajo: el ID del flujo de trabajo asociado a esta ejecución.
-
Versión del flujo de trabajo (opcional): seleccione una versión del flujo de trabajo para usarla en esta ejecución. Si no selecciona una versión, la ejecución utilizará la versión predeterminada del flujo de trabajo.
-
Nombre de la ejecución: nombre distintivo de esta ejecución.
-
Prioridad de ejecución (opcional): la prioridad de esta ejecución. Los números más altos especifican una prioridad más alta y las tareas de mayor prioridad se ejecutan primero.
-
Tipo de almacenamiento de ejecución: especifique aquí el tipo de almacenamiento para anular el tipo de almacenamiento de ejecución predeterminado especificado para el flujo de trabajo. El almacenamiento estático asigna una cantidad fija de almacenamiento para la ejecución. El almacenamiento dinámico se amplía y reduce según sea necesario para cada tarea de la ejecución.
-
Capacidad de almacenamiento en ejecución: en el caso del almacenamiento estático en ejecución, especifique la cantidad de almacenamiento necesaria para la ejecución. Esta entrada anula la cantidad de almacenamiento de ejecución predeterminada especificada para el flujo de trabajo.
-
Seleccione el destino de salida de S3: la ubicación de S3 en la que se guardarán las salidas de la ejecución.
-
ID de cuenta del propietario del bucket de salida (opcional): si su cuenta no es propietaria del bucket de salida, introduzca el Cuenta de AWS ID del propietario del bucket. Esta información es necesaria para HealthOmics poder verificar la propiedad del depósito.
-
Modo de retención de metadatos de ejecución: elija si desea conservar los metadatos de todas las ejecuciones o hacer que el sistema elimine los metadatos de las ejecuciones más antiguas cuando su cuenta alcance el número máximo de ejecuciones. Para obtener más información, consulte Modo de retención de ejecución para HealthOmics carreras.
-
-
En Función de servicio, puedes usar una función de servicio existente o crear una nueva.
-
(Opcional) En el caso de las etiquetas, puedes asignar hasta 50 etiquetas a la ejecución.
-
Elija Siguiente.
-
En la página Agregar valores de parámetros, proporcione los parámetros de ejecución. Puede cargar un archivo JSON que especifique los parámetros o introducir los valores manualmente.
-
Elija Siguiente.
-
En el panel Grupo de ejecuciones, si lo desea, puede especificar un grupo de ejecuciones para esta ejecución. Para obtener más información, consulte Uso de grupos de HealthOmics ejecución.
-
En el panel Caché de ejecución, si lo desea, puede especificar una caché de ejecución para esta ejecución. Para obtener más información, consulte Configuración de una ejecución con caché de ejecución mediante la consola.
-
Elija Review and start run (Revisar e iniciar ejecución).
-
Tras revisar la configuración de ejecución, seleccione Iniciar ejecución.
Iniciar una ejecución mediante la API
Utilice la operación API start-run para crear e iniciar una ejecución.
En el siguiente ejemplo, se especifican el identificador del flujo de trabajo y la función de servicio. En este ejemplo, se establece el modo de retención enREMOVE. Para obtener más información sobre el modo de retención, consulteModo de retención de ejecución para HealthOmics carreras.
aws omics start-run --workflow-id\ --role-arn arn:aws:iam::1234567892012:role/service-role/OmicsWorkflow-20221004T164236 \ --nameworkflow id\ --retention-mode REMOVEworkflow name
Como respuesta, obtendrá el siguiente resultado. uuidEs exclusivo de la ejecución y, además, se outputUri puede usar para rastrear dónde se escriben los datos de salida.
{ "arn": "arn:aws:omics:us-west-2:....:run/1234567", "id": "123456789", "uuid":"96c57683-74bf-9d6d-ae7e-f09b097db14a", "outputUri":"s3://bucket/folder/8405154/96c57683-74bf-9d6d-ae7e-f09b097db14a" "status": "PENDING" }
xx
Si la plantilla de parámetros de un flujo de trabajo declara algún parámetro obligatorio, puede proporcionar un archivo JSON local con las entradas al iniciar la ejecución de un flujo de trabajo. El archivo JSON contiene el nombre exacto de cada parámetro de entrada y un valor para el parámetro.
Haz referencia al archivo JSON de entrada que aparece en el AWS CLI agregándolo --parameters file://<input_file.json> a tu start-run solicitud. Para obtener más información sobre los parámetros de ejecución, consulteHealthOmics ejecutar entradas.
xx
Puedes proporcionar una única requestId para cada ejecución. El identificador de solicitud es un identificador de idempotencia que se HealthOmics utiliza para identificar las solicitudes duplicadas e inicia la ejecución solo una vez.
Si utiliza infraestructura (como funciones Lambda o funciones escalonadas) para organizar los inicios de las ejecuciones, lo mejor es proporcionar un identificador de solicitud único en cada solicitud. StartRun Esto garantiza que si la infraestructura realiza un reintento (por ejemplo, cuando se recupera de errores iniciales), HealthOmics no se inicie una ejecución duplicada.
xx
Puede especificar una versión del flujo de trabajo para la ejecución.
aws omics start-run --workflow-id\ ... --workflow-version-name '1.2.1'workflow id
xx
Puede anular el tipo de almacenamiento de ejecución predeterminado, que se especifica en el flujo de trabajo.
aws omics start-run --workflow-id\ ... --storage-type STATIC --storage-capacity 2400workflow id
xx
aws omics start-run --workflow-id\ --role-arn arn:aws:iam::1234567892012:role/service-role/OmicsWorkflow-20221004T164236 \ --name GPUTestRunModel \ --output-uri s3://amzn-s3-demo-bucket1workflow id
Obtenga información sobre una carrera
Puedes usar el ID de la respuesta con la API get-run para comprobar el estado de una ejecución, como se muestra.
aws omics get-run --idrun id
La respuesta de esta operación de API indica el estado de la ejecución del flujo de trabajo. Los estados posibles son PENDING STARTINGRUNNING, yCOMPLETED. Cuando se ejecutaCOMPLETED, puede encontrar un archivo de salida llamado outfile.txt en el bucket de Amazon S3 de salida, en una carpeta que lleva el nombre del ID de la ejecución.
La operación de API get-run también devuelve otros detalles, como si el flujo de trabajo es Ready2Run oPRIVATE, el motor del flujo de trabajo y los detalles del acelerador. En el siguiente ejemplo, se muestra la respuesta de get-run para una ejecución de un flujo de trabajo privado, descrita en la WDL, con un acelerador de GPU y sin etiquetas asignadas a la ejecución.
{ "arn": "arn:aws:omics:us-west-2:123456789012:run/7830534", "id": "7830534", "uuid":"96c57683-74bf-9d6d-ae7e-f09b097db14a", "outputUri":"s3://bucket/folder/8405154/96c57683-74bf-9d6d-ae7e-f09b097db14a" "status": "COMPLETED", "workflowId": "4074992", "workflowType": "PRIVATE", "workflowVersionName": "3.0.0", "roleArn": "arn:aws:iam::123456789012:role/service-role/OmicsWorkflow-20221004T164236", "name": "RunGroupMaxGpuTest", "runGroupId": "9938959", "digest": "sha256:a23a6fc54040d36784206234c02147302ab8658bed89860a86976048f6cad5ac", "accelerators": "GPU", "outputUri": "s3://amzn-s3-demo-bucket1", "startedBy": "arn:aws:sts::123456789012:assumed-role/Admin/<role_name>", "creationTime": "2023-04-07T16:44:22.262471+00:00", "startTime": "2023-04-07T16:56:12.504000+00:00", "stopTime": "2023-04-07T17:22:29.908813+00:00", "tags": {} }
Puedes ver el estado de todas las ejecuciones con la operación de API list-runs, como se muestra.
aws omics list-runs
Para ver todas las tareas completadas en una ejecución específica, usa la list-run-tasksAPI.
aws omics list-run-tasks --idtask ID
Para obtener los detalles de una tarea específica, usa la get-run-task API.
aws omics get-run-task --id <run_id> --task-idtask ID
Una vez completada la ejecución, los metadatos se envían a CloudWatch Under the Streammanifest/run/<run ID>/<run
UUID>.
A continuación, se muestra un ejemplo del manifiesto.
{ "arn": "arn:aws:omics:us-east-1:123456789012:run/1695324", "creationTime": "2022-08-24T19:53:55.284Z", "resourceDigests": { "s3://omics-data/broad-references/hg38/v0/Homo_sapiens_assembly38.dict": "etag:3884c62eb0e53fa92459ed9bff133ae6", "s3://omics-data/broad-references/hg38/v0/Homo_sapiens_assembly38.fasta": "etag:e307d81c605fb91b7720a08f00276842-388", "s3://omics-data/broad-references/hg38/v0/Homo_sapiens_assembly38.fasta.fai": "etag:f76371b113734a56cde236bc0372de0a", "s3://omics-data/intervals/hg38-mjs-whole-chr.500M.intervals": "etag:27fdd1341246896721ec49a46a575334", "s3://omics-data/workflow-input-lists/dragen-gvcf-list.txt": "etag:e22f5aeed0b350a66696d8ffae453227" }, "digest": "sha256:a5baaff84dd54085eb03f78766b0a367e93439486bc3f67de42bb38b93304964", "engine": "WDL", "main": "gatk4-basic-joint-genotyping-v2.wdl", "name": "1044-gvcfs", "outputUri": "s3://omics-data/workflow-output", "parameters": { "callset_name": "cohort", "input_gvcf_uris": "s3://omics-data/workflow-input-lists/dragen-gvcf-list.txt", "interval_list": "s3://omics-data/intervals/hg38-mjs-whole-chr.500M.intervals", "ref_dict": "s3://omics-data/broad-references/hg38/v0/Homo_sapiens_assembly38.dict", "ref_fasta": "s3://omics-data/broad-references/hg38/v0/Homo_sapiens_assembly38.fasta", "ref_fasta_index": "s3://omics-data/broad-references/hg38/v0/Homo_sapiens_assembly38.fasta.fai" }, "roleArn": "arn:aws:iam::123456789012:role/OmicsServiceRole", "startedBy": "arn:aws:sts::123456789012:assumed-role/admin/ahenroid-Isengard", "startTime": "2022-08-24T20:08:22.582Z", "status": "COMPLETED", "stopTime": "2022-08-24T20:08:22.582Z", "storageCapacity": 9600, "uuid": "a3b0ca7e-9597-4ecc-94a4-6ed45481aeab", "workflow": "arn:aws:omics:us-east-1:123456789012:workflow/1558364", "workflowType": "PRIVATE" }, { "arn": "arn:aws:omics:us-east-1:123456789012:task/1245938", "cpus": 16, "creationTime": "2022-08-24T20:06:32.971290", "image": "123456789012.dkr.ecr.us-west-2.amazonaws.com/gatk", "imageDigest": "sha256:8051adab0ff725e7e9c2af5997680346f3c3799b2df3785dd51d4abdd3da747b", "memory": 32, "name": "geno-123", "run": "arn:aws:omics:us-east-1:123456789012:run/1695324", "startTime": "2022-08-24T20:08:22.278Z", "status": "SUCCESS", "stopTime": "2022-08-24T20:08:22.278Z", "uuid": "44c1a30a-4eee-426d-88ea-1af403858f76" }, ...
Los metadatos de ejecución no se eliminan si no están presentes en los CloudWatch registros.