Creare una versione del flusso di lavoro - AWS HealthOmics

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Creare una versione del flusso di lavoro

Quando crei una nuova versione di un flusso di lavoro, devi specificare i valori di configurazione per la nuova versione. Non eredita alcun valore di configurazione dal flusso di lavoro.

Quando crei la versione, fornisci un nome di versione univoco per questo flusso di lavoro. Non è possibile modificare il nome dopo aver HealthOmics creato la versione.

Il nome della versione deve iniziare con una lettera o un numero e può includere lettere maiuscole e minuscole, numeri, trattini, punti e caratteri di sottolineatura. La lunghezza massima è di 64 caratteri. Ad esempio, è possibile utilizzare uno schema di denominazione semplice, ad esempio version1, version2, version3. È inoltre possibile abbinare le versioni del flusso di lavoro alle proprie convenzioni interne di controllo delle versioni, ad esempio 2.7.0, 2.7.1, 2.7.2.

Facoltativamente, utilizzate il campo di descrizione della versione per aggiungere note su questa versione. Ad esempio: Fix for syntax error in workflow definition.

Nota

Non includere informazioni di identificazione personale (PII) nel nome della versione. I nomi delle versioni vengono visualizzati nella versione del workflow ARN.

HealthOmics assegna un ARN univoco alla versione del flusso di lavoro. L'ARN è unico in base alla combinazione di ID del flusso di lavoro e nome della versione.

avvertimento

Dopo aver eliminato una versione del flusso di lavoro, HealthOmics consente di riutilizzare il nome della versione per una versione diversa del flusso di lavoro. È consigliabile non riutilizzare i nomi delle versioni. Se riutilizzi un nome, il flusso di lavoro e ogni versione hanno un UUID univoco che puoi usare come provenienza.

Crea una versione del flusso di lavoro utilizzando la console

Passaggi per creare una versione del flusso di lavoro
  1. Apri la HealthOmics console.

  2. Se necessario, apri il riquadro di navigazione a sinistra (≡). Scegli Flussi di lavoro privati.

  3. Nella pagina Flussi di lavoro privati, scegli il flusso di lavoro per la nuova versione.

  4. Nella pagina dei dettagli del flusso di lavoro, scegli Crea nuova versione.

  5. Nella pagina Crea versione, fornisci le seguenti informazioni:

    1. Nome della versione: inserisci un nome per la versione del flusso di lavoro che sia univoco in tutto il flusso di lavoro.

    2. Descrizione della versione (opzionale): puoi utilizzare il campo della descrizione per aggiungere note su questa versione.

  6. Nel pannello di definizione del flusso di lavoro, fornite le seguenti informazioni:

    1. Lingua del flusso di lavoro (opzionale): seleziona la lingua delle specifiche per la versione del flusso di lavoro. Altrimenti, HealthOmics determina la lingua dalla definizione del flusso di lavoro.

    2. Per l'origine delle definizioni di Workflow, scegli di importare la cartella delle definizioni da un repository basato su Git, una posizione Amazon S3 o da un'unità locale.

      1. Per l'importazione da un servizio di repository:

        Nota

        HealthOmics supporta repository pubblici e privati perGitHub,,, GitLabBitbucket,GitHub self-managed. GitLab self-managed

        1. Scegli una connessione per connettere AWS le tue risorse al repository esterno. Per creare una connessione, consultaConnect con repository di codice esterni.

          Nota

          I clienti della TLV regione devono creare una connessione nella regione IAD (us-east-1) per creare un flusso di lavoro.

        2. In Full repository ID, inserisci l'ID del repository come nome utente/nome del repository. Verifica di avere accesso ai file in questo repository.

        3. In Riferimento alla fonte (opzionale), inserisci un riferimento alla fonte del repository (branch, tag o ID di commit). HealthOmics utilizza il ramo predefinito se non viene specificato alcun riferimento alla fonte.

        4. In Escludi modelli di file, inserisci i modelli di file per escludere cartelle, file o estensioni specifici. Questo aiuta a gestire le dimensioni dei dati durante l'importazione dei file del repository. Esistono un massimo di 50 pattern e i pattern devono seguire la sintassi del modello glob. Per esempio:

          1. tests/

          2. *.jpeg

          3. large_data.zip

      2. Per Seleziona la cartella di definizione da S3:

        1. Inserisci la posizione Amazon S3 che contiene la cartella di definizione del flusso di lavoro compressa. Il bucket Amazon S3 deve trovarsi nella stessa regione del flusso di lavoro.

        2. Se il tuo account non possiede il bucket Amazon S3, inserisci l'ID dell'account del proprietario del bucket nell'ID dell' AWS account del proprietario del bucket S3. Queste informazioni sono necessarie per verificare la proprietà del HealthOmics bucket.

      3. Per Seleziona la cartella di definizione da una fonte locale:

        1. Immettete la posizione sull'unità locale della cartella di definizione del flusso di lavoro compressa.

    3. Percorso principale del file di definizione del flusso di lavoro (opzionale): immettete il percorso del file dalla cartella o dall'archivio di definizione del flusso di lavoro compresso al file. main Questo parametro non è richiesto se è presente un solo file nella cartella di definizione del flusso di lavoro o se il file principale è denominato «principale».

  7. Nel pannello del file README (opzionale), selezionate l'origine del file README e fornite le seguenti informazioni:

    • Per Importazione da un servizio di repository, nel percorso del file README, immettete il percorso del file README all'interno del repository.

    • Per Seleziona file da S3, nel file README in S3, inserisci l'URI Amazon S3 per il file README.

    • Per Seleziona file da una fonte locale: in README - opzionale, scegli Scegli file per selezionare il file markdown (.md) da caricare.

  8. Nel pannello di configurazione dell'archiviazione di esecuzione predefinita, fornisci il tipo e la capacità di archiviazione di esecuzione predefiniti per le esecuzioni che utilizzano questo flusso di lavoro:

    1. Tipo di archiviazione di esecuzione: scegli se utilizzare l'archiviazione statica o dinamica come impostazione predefinita per l'archiviazione di esecuzione temporanea. L'impostazione predefinita è l'archiviazione statica.

    2. Capacità di archiviazione di esecuzione (opzionale): per il tipo di storage di esecuzione statico, è possibile inserire la quantità predefinita di storage di esecuzione richiesta per questo flusso di lavoro. Il valore predefinito per questo parametro è 1200 GiB. È possibile sovrascrivere questi valori predefiniti quando si avvia un'esecuzione.

  9. Tag (opzionale): puoi associare fino a 50 tag a questa versione del flusso di lavoro.

  10. Scegli Next (Successivo).

  11. Nella pagina Aggiungi parametri del flusso di lavoro (opzionale), seleziona l'origine dei parametri:

    1. Per Analizza dal file di definizione del flusso di lavoro, HealthOmics analizzerà automaticamente i parametri del flusso di lavoro dal file di definizione del flusso di lavoro.

    2. Per Fornire un modello di parametro dal repository Git, usa il percorso del file del modello di parametro dal tuo repository.

    3. Per Seleziona il file JSON dalla fonte locale, carica un JSON file da una fonte locale che specifichi i parametri.

    4. In Inserisci manualmente i parametri del flusso di lavoro, inserisci manualmente i nomi e le descrizioni dei parametri.

  12. Nel pannello di anteprima dei parametri, è possibile rivedere o modificare i parametri per questa versione del flusso di lavoro. Se ripristinate il JSON file, perderete tutte le modifiche locali apportate.

  13. Nella pagina di rimappatura dell'URI del contenitore, nel pannello Regole di mappatura, puoi definire le regole di mappatura URI per il tuo flusso di lavoro.

    Per Sorgente del file di mappatura, selezionate una delle seguenti opzioni:

    • Nessuna: non è richiesta alcuna regola di mappatura.

    • Seleziona il file JSON da S3: specifica la posizione S3 per il file di mappatura.

    • Seleziona il file JSON da una fonte locale: specifica la posizione del file di mappatura sul tuo dispositivo locale.

    • Inserisci manualmente le mappature: inserisci le mappature del registro e le mappature delle immagini nel pannello Mappature.

  14. La console visualizza il pannello Mappature. Se avete scelto un file sorgente di mappatura, la console visualizza i valori del file.

    1. Nelle mappature del registro, è possibile modificare le mappature o aggiungere mappature (massimo 20 mappature del registro).

      Ogni mappatura del registro contiene i seguenti campi:

      • URL del registro upstream: l'URI del registro upstream.

      • Prefisso del repository ECR: il prefisso del repository da utilizzare nell'archivio privato Amazon ECR.

      • (Facoltativo) Prefisso del repository upstream: il prefisso del repository nel registro upstream.

      • (Facoltativo) ID account ECR: ID account dell'account proprietario dell'immagine del contenitore upstream.

    2. Nelle mappature delle immagini, è possibile modificare le mappature delle immagini o aggiungere mappature (massimo 100 mappature di immagini).

      Ogni mappatura di immagini contiene i seguenti campi:

      • Immagine di origine: specifica l'URI dell'immagine di origine nel registro upstream.

      • Immagine di destinazione: specifica l'URI dell'immagine corrispondente nel registro privato di Amazon ECR.

  15. Scegli Next (Successivo).

  16. Controlla la configurazione della versione, quindi scegli Crea versione.

Una volta creata la versione, la console torna alla pagina dei dettagli del flusso di lavoro e visualizza la nuova versione nella tabella Flussi di lavoro e versioni.

Creare una versione del flusso di lavoro utilizzando la CLI

È possibile creare una versione del flusso di lavoro utilizzando l'operazione CreateWorkflowVersion API. Per i parametri opzionali, HealthOmics utilizza le seguenti impostazioni predefinite:

Parametro Predefinita
Motore Determinato dalla definizione del flusso di lavoro
Storage Type (Tipo di storage) STATIC
Capacità di archiviazione (per l'archiviazione statica) 1200 GiB
Principale Determinato in base al contenuto della cartella di definizione del flusso di lavoro. Per informazioni dettagliate, consultare HealthOmics requisiti di definizione del flusso di lavoro.
Acceleratori nessuno
Tag nessuno

L'esempio CLI seguente crea una versione del flusso di lavoro con archiviazione statica come archiviazione di esecuzione predefinita:

aws omics create-workflow-version \ --workflow-id 1234567 \ --version-name "my_version" \ --engine WDL \ --definition-zip fileb://workflow-crambam.zip \ --description "my version description" \ --main file://workflow-params.json \ --parameter-template file://workflow-params.json \ --storage-type='STATIC' \ --storage-capacity 1200 \ --tags example123=string \ --accelerators GPU

Se il file di definizione del flusso di lavoro si trova in una cartella Amazon S3, inserisci la posizione utilizzando il definition-uri parametro anziché. definition-zip Per ulteriori informazioni, CreateWorkflowVersionconsulta AWS HealthOmics API Reference.

Riceverai la seguente risposta alla create-workflow-version richiesta.

{ "workflowId": "1234567", "versionName": "my_version", "arn": "arn:aws:omics:us-west-2:123456789012:workflow/1234567/version/3", "status": "ACTIVE", "tags": { "environment": "production", "owner": "team-alpha" }, "uuid": "0ac9a563-355c-fc7a-1b47-a115167af8a2" }

Crea una versione del flusso di lavoro utilizzando un SDK

Puoi creare un flusso di lavoro utilizzando uno dei SDKs.

L'esempio seguente mostra come creare una versione del flusso di lavoro utilizzando Python SDK.

import boto3 omics = boto3.client('omics') with open('definition.zip', 'rb') as f: definition = f.read() response = omics.create_workflow_version( workflowId='1234567', versionName='my_version', requestId='my_request_1' definitionZip=definition, parameterTemplate={ ... } )

Verifica lo stato di una versione del flusso di lavoro

Dopo aver creato la versione del flusso di lavoro, è possibile verificare lo stato e visualizzare altri dettagli del flusso di lavoro utilizzando get-workflow-version, come illustrato.

aws omics get-workflow-version --workflow-id 9876543 --version-name "my_version"

La risposta fornisce i dettagli del flusso di lavoro, incluso lo stato, come mostrato.

{ "workflowId": "1234567", "versionName": "3.0.0", "arn": "arn:aws:omics:us-west-2:123456789012:workflow/1234567/version/3.0.0", "status": "ACTIVE", "description": ... "uuid": "0ac9a563-355c-fc7a-1b47-a115167af8a2" }

Prima di poter iniziare un'esecuzione con questa versione del flusso di lavoro, lo stato deve passare aACTIVE.