Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
HealthOmics exigences de définition du flux de travail
Les fichiers HealthOmics de définition du flux de travail doivent répondre aux exigences suivantes :
-
Les tâches doivent définir input/output les paramètres, les référentiels de conteneurs Amazon ECR et les spécifications d'exécution telles que l'allocation de mémoire ou de CPU.
-
Vérifiez que vos rôles IAM disposent des autorisations requises.
-
Votre flux de travail a accès aux données d'entrée provenant de AWS ressources, telles qu'Amazon S3.
-
Votre flux de travail a accès à des services de référentiel externes en cas de besoin.
-
-
Déclarez les fichiers de sortie dans la définition du flux de travail. Pour copier des fichiers d'exécution intermédiaires vers l'emplacement de sortie, déclarez-les en tant que sorties de flux de travail.
-
Les emplacements d'entrée et de sortie doivent se trouver dans la même région que le flux de travail.
-
HealthOmics les entrées du flux de travail de stockage doivent être en
ACTIVE
état. HealthOmics n'importera pas d'entrées avec unARCHIVED
statut, ce qui entraînera l'échec du flux de travail. Pour plus d'informations sur les entrées d'objets Amazon S3, consultezHealthOmics exécuter les entrées. -
L'mainemplacement du flux de travail est facultatif si votre archive ZIP contient une seule définition de flux de travail ou un fichier nommé « principal ».
-
Exemple de chemin :
workflow-definition/main-file.wdl
-
-
Avant de créer un flux de travail à partir d'Amazon S3 ou de votre disque local, créez une archive zip contenant les fichiers de définition du flux de travail et toutes les dépendances, telles que les sous-flux de travail.
-
Nous vous recommandons de déclarer les conteneurs Amazon ECR dans le flux de travail comme paramètres d'entrée pour la validation des autorisations Amazon ECR.
Autres considérations relatives à Nextflow :
-
/bin
Les définitions de flux de travail Nextflow peuvent inclure un dossier /bin contenant des scripts exécutables. Ce chemin dispose d'un accès en lecture seule et d'un accès exécutable aux tâches. Les tâches qui s'appuient sur ces scripts doivent utiliser un conteneur créé avec les interpréteurs de script appropriés. La meilleure pratique consiste à appeler directement l'interprète. Par exemple :
process my_bin_task { ... script: """ python3 my_python_script.py """ }
-
includeConfig
Les définitions de flux de travail basées sur Nextflow peuvent inclure des fichiers nextflow.config qui permettent d'abstraire les définitions de paramètres ou de traiter les profils de ressources. Pour prendre en charge le développement et l'exécution de pipelines Nextflow sur plusieurs environnements, utilisez une configuration HealthOmics spécifique que vous ajoutez à la configuration globale à l'aide de la directive IncludeConfig. Pour garantir la portabilité, configurez le flux de travail pour inclure le fichier uniquement lors de son exécution en HealthOmics utilisant le code suivant :
// at the end of the nextflow.config file if ("$AWS_WORKFLOW_RUN") { includeConfig 'conf/omics.config' }
-
Reports
HealthOmics ne prend pas en charge les rapports DAG, de trace et d'exécution générés par le moteur. Vous pouvez générer des alternatives aux rapports de suivi et d'exécution à l'aide d'une combinaison GetRun d'appels d' GetRunTask API.
Autres considérations relatives au CWL :
-
Container image uri interpolation
HealthOmics permet à la propriété DockerPull du d' DockerRequirement être une expression javascript en ligne. Par exemple :
requirements: DockerRequirement: dockerPull: "$(inputs.container_image)"
Cela vous permet de spécifier l'image du conteneur URIs comme paramètre d'entrée du flux de travail.
-
Javascript expressions
Les expressions Javascript doivent être
strict mode
conformes. -
Operation process
HealthOmics ne prend pas en charge les processus d'opération CWL.