Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Comenzar una carrera en HealthOmics
Al iniciar una ejecución, puede establecer el tipo de almacenamiento de la ejecución y la cantidad de almacenamiento (para el almacenamiento estático). Para obtener información adicional, consulta Ejecute tipos de almacenamiento en HealthOmics flujos de trabajo.
También estableces la prioridad de ejecución. El impacto de la prioridad en la ejecución depende de si la ejecución está asociada a un grupo de ejecuciones. Para obtener información adicional, consulta Prioridad de ejecución.
Si ha creado una o más versiones del flujo de trabajo, puede especificar la versión al iniciar la ejecución. Si no especifica una versión, HealthOmics inicia la versión predeterminada del flujo de trabajo.
Especifique una ubicación de Amazon S3 para los archivos de salida. Si ejecuta un gran volumen de flujos de trabajo de forma simultánea, utilice una salida de Amazon S3 independiente URIs para cada flujo de trabajo a fin de evitar la limitación de los cubos. Para obtener más información, consulte Organizar objetos mediante prefijos en la Guía del usuario de Amazon S3 y Escalar las conexiones de almacenamiento horizontalmente en el documento técnico Optimización del rendimiento de Amazon S3.
nota
Al iniciar una ejecución, debe especificar un rol de servicio de IAM. Si lo desea, la consola puede crear el rol de servicio automáticamente. Para obtener más información, consulte Funciones de servicio para AWS HealthOmics.
Temas
HealthOmics ejecutar parámetros
Al iniciar una ejecución, se especifican las entradas de la ejecución en el archivo JSON de parámetros de ejecución o se pueden introducir los valores de los parámetros en línea. Para obtener información sobre cómo administrar el tamaño del archivo JSON de parámetros de ejecución, consulteAdministrar el tamaño de los parámetros de ejecución.
HealthOmics admite los siguientes tipos de JSON para los valores de los parámetros.
Tipo JSON | Ejemplo de clave y valor | Notas |
---|---|---|
booleano | «b»: verdadero | El valor no está entre comillas y está todo en minúsculas. |
entero | «i»: 7 | El valor no está entre comillas. |
número | «f»: 42.3 | El valor no está entre comillas. |
cadena | «s» :"caracteres» | El valor está entre comillas. Utilice el tipo de cadena para los valores de texto y URIs. El objetivo del URI debe ser el tipo de entrada esperado. |
array | «a»: [1,2,3] | El valor no está entre comillas. Cada uno de los miembros de la matriz debe tener el tipo definido por el parámetro de entrada. |
objeto | «o»: {"izquierda» :"a», «derecha» :1} | En WDL, el objeto se asigna a un par, mapa o estructura de WDL |
Iniciar una ejecución mediante la consola
Para iniciar un flujo de trabajo, ejecute
-
Abra la consola de HealthOmics
. En el panel de navegación izquierdo, elija Ejecuciones.
-
En la página Ejecuciones, seleccione Iniciar ejecución.
-
En el panel de detalles de la ejecución, proporcione la siguiente información
-
Origen del flujo de trabajo: elija un flujo de trabajo propio o un flujo de trabajo compartido.
-
ID del flujo de trabajo: el ID del flujo de trabajo asociado a esta ejecución.
-
Versión del flujo de trabajo (opcional): seleccione una versión del flujo de trabajo para usarla en esta ejecución. Si no selecciona una versión, la ejecución utilizará la versión predeterminada del flujo de trabajo.
-
Nombre de la ejecución: nombre distintivo de esta ejecución.
-
Prioridad de ejecución (opcional): la prioridad de esta ejecución. Los números más altos especifican una prioridad más alta y las tareas de mayor prioridad se ejecutan primero.
-
Tipo de almacenamiento de ejecución: especifique aquí el tipo de almacenamiento para anular el tipo de almacenamiento de ejecución predeterminado especificado para el flujo de trabajo. El almacenamiento estático asigna una cantidad fija de almacenamiento para la ejecución. El almacenamiento dinámico se amplía y reduce según sea necesario para cada tarea de la ejecución.
-
Capacidad de almacenamiento en ejecución: en el caso del almacenamiento estático en ejecución, especifique la cantidad de almacenamiento necesaria para la ejecución. Esta entrada anula la cantidad de almacenamiento de ejecución predeterminada especificada para el flujo de trabajo.
-
Seleccione el destino de salida de S3: la ubicación de S3 en la que se guardarán las salidas de la ejecución.
-
ID de cuenta del propietario del bucket de salida (opcional): si su cuenta no es propietaria del bucket de salida, introduzca el Cuenta de AWS ID del propietario del bucket. Esta información es necesaria para HealthOmics poder verificar la propiedad del depósito.
-
Modo de retención de metadatos de ejecución: elija si desea conservar los metadatos de todas las ejecuciones o hacer que el sistema elimine los metadatos de las ejecuciones más antiguas cuando su cuenta alcance el número máximo de ejecuciones. Para obtener más información, consulte Modo de retención de ejecución para HealthOmics carreras.
-
-
En Función de servicio, puedes usar una función de servicio existente o crear una nueva.
-
(Opcional) En el caso de las etiquetas, puedes asignar hasta 50 etiquetas a la ejecución.
-
Elija Siguiente.
-
En la página Agregar valores de parámetros, proporcione los parámetros de ejecución. Puede cargar un archivo JSON que especifique los parámetros o introducir los valores manualmente.
-
Elija Siguiente.
-
En el panel Grupo de ejecuciones, si lo desea, puede especificar un grupo de ejecuciones para esta ejecución. Para obtener más información, consulte Creación de grupos de HealthOmics carreras.
-
En el panel Caché de ejecución, si lo desea, puede especificar una caché de ejecución para esta ejecución. Para obtener más información, consulte Configurar una ejecución con caché de ejecución mediante la consola.
-
Elija Review and start run (Revisar e iniciar ejecución).
-
Tras revisar la configuración de ejecución, seleccione Iniciar ejecución.
Iniciar una ejecución mediante la API
Utilice la operación API start-run con el rol de IAM y el bucket de Amazon S3 que creó. En este ejemplo, se establece el modo de retención en. REMOVE
Para obtener más información sobre el modo de retención, consulteModo de retención de ejecución para HealthOmics carreras.
aws omics start-run --workflow-id
\ --role-arn arn:aws:iam::1234567892012:role/service-role/OmicsWorkflow-20221004T164236 \ --name
workflow id
\ --retention-mode REMOVE
workflow name
Como respuesta, obtendrá el siguiente resultado. uuid
Es exclusivo de la ejecución y, además, se outputUri
puede usar para rastrear dónde se escriben los datos de salida.
{ "arn": "arn:aws:omics:us-west-2:....:run/1234567", "id": "123456789", "uuid":"96c57683-74bf-9d6d-ae7e-f09b097db14a", "outputUri":"s3://bucket/folder/8405154/96c57683-74bf-9d6d-ae7e-f09b097db14a" "status": "PENDING" }
Si la plantilla de parámetros de un flujo de trabajo declara algún parámetro obligatorio, puede proporcionar un archivo JSON local con las entradas al iniciar la ejecución de un flujo de trabajo. El archivo JSON contiene el nombre exacto de cada parámetro de entrada y un valor para el parámetro.
Haz referencia al archivo JSON de entrada que aparece en el AWS CLI agregándolo --parameters file://<input_file.json>
a tu start-run
solicitud. Para obtener más información sobre los parámetros de ejecución, consulteHealthOmics ejecutar entradas.
Puede especificar una versión del flujo de trabajo para la ejecución.
aws omics start-run --workflow-id
\ ... --workflow-version-name '1.2.1'
workflow id
Puede anular el tipo de almacenamiento de ejecución predeterminado, que se especifica en el flujo de trabajo.
aws omics start-run --workflow-id
\ ... --storage-type STATIC --storage-capacity 2400
workflow id
También puedes usar la API de inicio y ejecución con un ID de flujo de trabajo de GPU, como se muestra.
aws omics start-run --workflow-id
\ --role-arn arn:aws:iam::1234567892012:role/service-role/OmicsWorkflow-20221004T164236 \ --name GPUTestRunModel \ --output-uri s3://amzn-s3-demo-bucket1
workflow id
Obtén información sobre la ejecución de un flujo de trabajo
Puedes usar el ID de la respuesta con la API get-run para comprobar el estado de una ejecución, como se muestra.
aws omics get-run --id
run id
La respuesta de esta operación de API indica el estado de la ejecución del flujo de trabajo. Los estados posibles son PENDING
STARTING
RUNNING
, yCOMPLETED
. Cuando se ejecutaCOMPLETED
, puede encontrar un archivo de salida llamado outfile.txt
en el bucket de Amazon S3 de salida, en una carpeta que lleva el nombre del ID de la ejecución.
La operación de API get-run también devuelve otros detalles, como si el flujo de trabajo es Ready2Run
oPRIVATE
, el motor del flujo de trabajo y los detalles del acelerador. En el siguiente ejemplo, se muestra la respuesta de get-run para una ejecución de un flujo de trabajo privado, descrita en la WDL, con un acelerador de GPU y sin etiquetas asignadas a la ejecución.
{ "arn": "arn:aws:omics:us-west-2:123456789012:run/7830534", "id": "7830534", "uuid":"96c57683-74bf-9d6d-ae7e-f09b097db14a", "outputUri":"s3://bucket/folder/8405154/96c57683-74bf-9d6d-ae7e-f09b097db14a" "status": "COMPLETED", "workflowId": "4074992", "workflowType": "PRIVATE", "workflowVersionName": "3.0.0", "roleArn": "arn:aws:iam::123456789012:role/service-role/OmicsWorkflow-20221004T164236", "name": "RunGroupMaxGpuTest", "runGroupId": "9938959", "digest": "sha256:a23a6fc54040d36784206234c02147302ab8658bed89860a86976048f6cad5ac", "accelerators": "GPU", "outputUri": "s3://amzn-s3-demo-bucket1", "startedBy": "arn:aws:sts::123456789012:assumed-role/Admin/<role_name>", "creationTime": "2023-04-07T16:44:22.262471+00:00", "startTime": "2023-04-07T16:56:12.504000+00:00", "stopTime": "2023-04-07T17:22:29.908813+00:00", "tags": {} }
Puedes ver el estado de todas las ejecuciones con la operación de API list-runs, como se muestra.
aws omics list-runs
Para ver todas las tareas completadas en una ejecución específica, usa la list-run-tasksAPI.
aws omics list-run-tasks --id
task ID
Para obtener los detalles de una tarea específica, usa la get-run-task API.
aws omics get-run-task --id <run_id> --task-id
task ID
Una vez completada la ejecución, los metadatos se envían a CloudWatch Under the Streammanifest/run/<run ID>/<run
UUID>
.
A continuación, se muestra un ejemplo del manifiesto.
{ "arn": "arn:aws:omics:us-east-1:123456789012:run/1695324", "creationTime": "2022-08-24T19:53:55.284Z", "resourceDigests": { "s3://omics-data/broad-references/hg38/v0/Homo_sapiens_assembly38.dict": "etag:3884c62eb0e53fa92459ed9bff133ae6", "s3://omics-data/broad-references/hg38/v0/Homo_sapiens_assembly38.fasta": "etag:e307d81c605fb91b7720a08f00276842-388", "s3://omics-data/broad-references/hg38/v0/Homo_sapiens_assembly38.fasta.fai": "etag:f76371b113734a56cde236bc0372de0a", "s3://omics-data/intervals/hg38-mjs-whole-chr.500M.intervals": "etag:27fdd1341246896721ec49a46a575334", "s3://omics-data/workflow-input-lists/dragen-gvcf-list.txt": "etag:e22f5aeed0b350a66696d8ffae453227" }, "digest": "sha256:a5baaff84dd54085eb03f78766b0a367e93439486bc3f67de42bb38b93304964", "engine": "WDL", "main": "gatk4-basic-joint-genotyping-v2.wdl", "name": "1044-gvcfs", "outputUri": "s3://omics-data/workflow-output", "parameters": { "callset_name": "cohort", "input_gvcf_uris": "s3://omics-data/workflow-input-lists/dragen-gvcf-list.txt", "interval_list": "s3://omics-data/intervals/hg38-mjs-whole-chr.500M.intervals", "ref_dict": "s3://omics-data/broad-references/hg38/v0/Homo_sapiens_assembly38.dict", "ref_fasta": "s3://omics-data/broad-references/hg38/v0/Homo_sapiens_assembly38.fasta", "ref_fasta_index": "s3://omics-data/broad-references/hg38/v0/Homo_sapiens_assembly38.fasta.fai" }, "roleArn": "arn:aws:iam::123456789012:role/OmicsServiceRole", "startedBy": "arn:aws:sts::123456789012:assumed-role/admin/ahenroid-Isengard", "startTime": "2022-08-24T20:08:22.582Z", "status": "COMPLETED", "stopTime": "2022-08-24T20:08:22.582Z", "storageCapacity": 9600, "uuid": "a3b0ca7e-9597-4ecc-94a4-6ed45481aeab", "workflow": "arn:aws:omics:us-east-1:123456789012:workflow/1558364", "workflowType": "PRIVATE" }, { "arn": "arn:aws:omics:us-east-1:123456789012:task/1245938", "cpus": 16, "creationTime": "2022-08-24T20:06:32.971290", "image": "123456789012.dkr.ecr.us-west-2.amazonaws.com/gatk", "imageDigest": "sha256:8051adab0ff725e7e9c2af5997680346f3c3799b2df3785dd51d4abdd3da747b", "memory": 32, "name": "geno-123", "run": "arn:aws:omics:us-east-1:123456789012:run/1695324", "startTime": "2022-08-24T20:08:22.278Z", "status": "SUCCESS", "stopTime": "2022-08-24T20:08:22.278Z", "uuid": "44c1a30a-4eee-426d-88ea-1af403858f76" }, ...
Los metadatos de ejecución no se eliminan si no están presentes en los CloudWatch registros. También puede usar el ID de ejecución para volver a ejecutar las ejecuciones del flujo de trabajo mediante la herramienta CLI. Obtenga más información y descargue la herramienta desde el GitHub repositorio de HealthOmics herramientas
Volver a ejecutar un flujo de trabajo
El siguiente ejemplo muestra cómo utilizar la rerun herramienta para volver a ejecutar una ejecución. Necesitas el identificador de ejecución, que puedes recuperar de los CloudWatch registros.
omics-rerun 9876543 --name
--retention-mode REMOVE
workflow name
Si la ejecución existe en CloudWatch, recibirás una respuesta similar a la siguiente.
Original request: { "workflowId": "9679729", "roleArn": "arn:aws:iam::123456789012:role/DemoRole", "name": "sample_rerun", "parameters": { "image": "123456789012.dkr.ecr.us-west-2.amazonaws.com/default:latest", "file1": "omics://123456789012.storage.us-west-2.amazonaws.com/8647780323/readSet/6389608538" }, "outputUri": "s3://workflow-output-bcf2fcb1" } StartRun request: { "workflowId": "9679729", "roleArn": "arn:aws:iam::123456789012:role/DemoRole", "name": "new test", "parameters": { "image": "123456789012.dkr.ecr.us-west-2.amazonaws.com/default:latest", "file1": "omics://123456789012.storage.us-west-2.amazonaws.com/8647780323/readSet/6389608538" }, "outputUri": "s3://workflow-output-bcf2fcb1" } StartRun response: { "arn": "arn:aws:omics:us-west-2:123456789012:run/9171779", "id": "9171779", "status": "PENDING", "tags": {} }
Si el flujo de trabajo ya no existe, recibirá un mensaje de error.