Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
HealthOmics requisiti di definizione del flusso di lavoro
I file HealthOmics di definizione del flusso di lavoro devono soddisfare i seguenti requisiti:
-
Le attività devono definire input/output parametri, repository di contenitori Amazon ECR e specifiche di runtime come l'allocazione della memoria o della CPU.
-
Verifica che i tuoi ruoli IAM dispongano delle autorizzazioni richieste.
-
Il tuo flusso di lavoro ha accesso ai dati di input provenienti da AWS risorse, come Amazon S3.
-
Il tuo flusso di lavoro ha accesso a servizi di repository esterni quando necessario.
-
-
Dichiara i file di output nella definizione del flusso di lavoro. Per copiare i file di esecuzione intermedi nella posizione di output, dichiarateli come output del flusso di lavoro.
-
Le posizioni di input e output devono trovarsi nella stessa regione del flusso di lavoro.
-
HealthOmics gli input del flusso di lavoro di archiviazione devono essere in
ACTIVE
stato. HealthOmics non importerà input con unoARCHIVED
stato, causando il fallimento del flusso di lavoro. Per informazioni sugli input degli oggetti Amazon S3, consulta. HealthOmics esegui ingressi -
La main posizione del flusso di lavoro è facoltativa se l'archivio ZIP contiene una singola definizione di flusso di lavoro o un file denominato «principale».
-
Percorso di esempio:
workflow-definition/main-file.wdl
-
-
Prima di creare un flusso di lavoro da Amazon S3 o dall'unità locale, crea un archivio zip dei file di definizione del flusso di lavoro e di eventuali dipendenze, come i flussi di lavoro secondari.
-
Ti consigliamo di dichiarare i contenitori Amazon ECR nel flusso di lavoro come parametri di input per la convalida delle autorizzazioni Amazon ECR.
Considerazioni aggiuntive su Nextflow:
-
/bin
Le definizioni del flusso di lavoro Nextflow possono includere una cartella /bin con script eseguibili. Questo percorso ha accesso alle attività in sola lettura ed eseguibile. Le attività che si basano su questi script devono utilizzare un contenitore creato con gli interpreti di script appropriati. La migliore pratica consiste nel chiamare direttamente l'interprete. Per esempio:
process my_bin_task { ... script: """ python3 my_python_script.py """ }
-
includeConfig
Le definizioni dei flussi di lavoro basate su NextFlow possono includere file nextflow.config che aiutano ad astrarre le definizioni dei parametri o i profili delle risorse di processo. Per supportare lo sviluppo e l'esecuzione di pipeline Nextflow su più ambienti, utilizza una configurazione HealthOmics specifica da aggiungere alla configurazione globale utilizzando la direttiva IncludeConfig. Per mantenere la portabilità, configura il flusso di lavoro in modo che includa il file solo durante l'esecuzione utilizzando il codice seguente: HealthOmics
// at the end of the nextflow.config file if ("$AWS_WORKFLOW_RUN") { includeConfig 'conf/omics.config' }
-
Reports
HealthOmics non supporta i report dag, trace ed esecuzione generati dal motore. È possibile generare alternative ai report di traccia ed esecuzione utilizzando una combinazione di GetRun chiamate API. GetRunTask
Considerazioni aggiuntive sulla CWL:
-
Container image uri interpolation
HealthOmics consente alla proprietà DockerPull di essere un'espressione DockerRequirement javascript in linea. Per esempio:
requirements: DockerRequirement: dockerPull: "$(inputs.container_image)"
Ciò consente di specificare l'immagine del contenitore URIs come parametri di input per il flusso di lavoro.
-
Javascript expressions
Le espressioni Javascript devono essere
strict mode
conformi. -
Operation process
HealthOmics non supporta i processi operativi CWL.