Aufbewahrungsmodus für HealthOmics Läufe ausführen - AWS HealthOmics

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Aufbewahrungsmodus für HealthOmics Läufe ausführen

HealthOmics Archiviert nach Abschluss eines Laufs die Metadaten des Laufs unter CloudWatch. Speichert die Laufdaten standardmäßig auf unbestimmte Zeit, sofern Sie die CloudWatch Aufbewahrungsrichtlinie nicht ändern. CloudWatch Run-Ausgaben werden ebenfalls in Amazon S3 gespeichert, bis Sie sie löschen.

Eine der einstellbaren HealthOmics Servicekontingenten Optionen ist die maximum number of runs (active and inactive) in einer Region. HealthOmics speichert Run-Metadaten für bis zu dieser Anzahl von Durchläufen zur Verwendung durch die Konsole und API-Operationen (ListRuns und GetRun). Wenn Sie einen Lauf starten, können Sie den Parameter für den Ausführungsmodus so einstellen, dass er das Aufbewahrungsverhalten für den Lauf angibt. Der Parameter unterstützt die Werte REMOVE und RETAIN.

Wenn bei einem neuen Lauf, bei dem der Aufbewahrungsmodus auf REMOVE gesetzt ist, HealthOmics versucht wird, den Lauf hinzuzufügen, nachdem er bereits die maximale Anzahl von Durchläufen gespeichert hat, werden automatisch die Metadaten für den ältesten Lauf entfernt, für den der REMOVE-Modus festgelegt wurde. Diese Entfernung hat keine Auswirkungen auf die in CloudWatch oder Amazon S3 gespeicherten Daten.

RETAIN ist der Standardwert für den Run-Aufbewahrungsmodus. Bei Läufen in diesem Modus löscht das System die Ausführungsmetadaten nicht. Wenn die maximale Anzahl von Läufen HealthOmics erreicht ist, die alle auf RETAIN gesetzt sind, können Sie keine weiteren Läufe erstellen, bis Sie einige Läufe gelöscht haben.

Wenn Sie planen, einen Stapel mit mehr als der maximalen Anzahl von Durchläufen gleichzeitig auszuführen, stellen Sie sicher, dass der Aufbewahrungsmodus für die Ausführung auf REMOVE eingestellt ist. Andernfalls schlägt der Batch fehl, wenn HealthOmics versucht wird, den nächsten Lauf nach dem Maximum zu starten.

Zusätzliche Überlegungen zur Verwendung des REMOVE-Aufbewahrungsmodus:

  • Wenn Sie REMOVE zum ersten Mal als Aufbewahrungsmodus verwenden, sollten Sie erwägen, einen oder mehrere Läufe zu löschen, die den RETIN-Modus verwenden, um Steckplätze freizugeben. Wenn Sie weitere REMOVE-Läufe starten, wird das automatische Entfernen übernommen, sodass genügend Steckplätze für neue Läufe verfügbar sind.

  • Wenn Sie einen archivierten Lauf (oder eine Reihe von Läufen) erneut ausführen möchten, verwenden Sie das HealthOmics Rerun-CLI-Tool. Weitere Informationen und Beispiele zur Verwendung dieses Tools finden Sie unter Omics rerun im Tools-Repository. HealthOmics GitHub

  • Wir empfehlen, für jeden Lauf einen eindeutigen Namen zu konfigurieren. Nach dem HealthOmics Entfernen eines Laufs können Sie die Konsole oder API nicht mehr verwenden, um den Namen oder die Lauf-ID des Laufs zu finden. Sie können sie jedoch verwenden, CloudWatch um nach dem Namen der Ausführung zu suchen. Verwenden Sie daher eindeutige Namen, um die besten Suchergebnisse zu erzielen.

  • Sie können den CloudWatch start-query Befehl verwenden, um Informationen zu einem archivierten Lauf abzurufen. Wenn der Runname nicht eindeutig ist, gibt die Abfrage möglicherweise mehrere Manifeste zurück. Die Parameter Startzeit und Endzeit definieren den Zeitraum für die Suche.

    aws logs start-query \ --log-group-name "/aws/omics/WorkflowLog" \ --query-string 'filter @logStream like "manifest" and @message like "myRunName"' \ --end-time <END-EPOCH-TIME> --start-time <START-EPOCH-TIME>

    Der start-query Befehl gibt eine Abfrage-ID zurück. Wenn die Abfrage-ID an den get-query-results Befehl übergeben wird, werden die Abfrageergebnisse zurückgegeben.

    aws logs get-query-results --query-id QueryId