Memulai lari di HealthOmics - AWS HealthOmics

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Memulai lari di HealthOmics

Saat Anda memulai proses, Anda dapat mengatur jenis penyimpanan run dan jumlah penyimpanan (untuk penyimpanan statis). Untuk informasi tambahan, lihat Jalankan jenis penyimpanan dalam HealthOmics alur kerja.

Anda juga menetapkan prioritas lari. Bagaimana prioritas memengaruhi proses tergantung pada apakah run dikaitkan dengan grup run. Untuk informasi tambahan, lihat Jalankan prioritas.

Jika Anda telah membuat satu atau beberapa versi alur kerja, Anda dapat menentukan versi saat memulai proses. Jika Anda tidak menentukan versi, HealthOmics mulai versi alur kerja default.

Tentukan lokasi Amazon S3 untuk file output. Jika Anda menjalankan alur kerja volume tinggi secara bersamaan, gunakan URIs output Amazon S3 terpisah untuk setiap alur kerja untuk menghindari pembatasan bucket. Untuk informasi selengkapnya, lihat Mengatur objek menggunakan awalan di Panduan Pengguna Amazon S3 dan Skalakan Koneksi Penyimpanan Secara Horizontal di whitepaper Mengoptimalkan Kinerja Amazon S3.

catatan

Anda menentukan peran layanan IAM saat memulai proses. Secara opsional, konsol dapat membuat peran layanan untuk Anda. Untuk informasi selengkapnya, lihat Peran layanan untuk AWS HealthOmics.

HealthOmics menjalankan parameter

Saat Anda memulai proses, Anda menentukan input run di file JSON parameter run atau Anda dapat memasukkan nilai parameter sebaris. Untuk informasi tentang mengelola ukuran file JSON parameter run, lihatMengelola ukuran parameter run.

HealthOmics mendukung jenis JSON berikut untuk nilai parameter.

Jenis JSON Contoh kunci dan nilai Catatan
boolean “b” :benar Nilai tidak dalam tanda kutip, dan semua huruf kecil.
integer “Aku” :7 Nilai tidak dalam tanda kutip.
number “f” :42.3 Nilai tidak dalam tanda kutip.
string “s” :"karakter” Nilai dalam tanda kutip. Gunakan tipe string untuk nilai teks dan URIs. Target URI harus jenis input yang diharapkan.
array “a”: [1,2,3] Nilai tidak dalam tanda kutip. Anggota array masing-masing harus memiliki tipe yang ditentukan oleh parameter input.
object “o”: {"left” :"a”, “right” :1} Di WDL, objek peta ke WDL Pair, Map, atau Struct

Memulai lari menggunakan konsol

Untuk memulai alur kerja
  1. Buka konsol HealthOmics .

  2. Di panel navigasi kiri, pilih Runs.

  3. Pada halaman Runs, pilih Mulai jalankan.

  4. Di panel Run details, berikan informasi berikut

    • Sumber alur kerja - Pilih alur kerja yang dimiliki atau alur kerja bersama.

    • ID alur kerja - ID alur kerja yang terkait dengan proses ini.

    • Versi alur kerja (Opsional) - Pilih versi alur kerja yang akan digunakan untuk menjalankan ini. Jika Anda tidak memilih versi, proses akan menggunakan versi default alur kerja.

    • Jalankan nama - Nama khas untuk lari ini.

    • Jalankan prioritas (Opsional) - Prioritas proses ini. Angka yang lebih tinggi menentukan prioritas yang lebih tinggi, dan tugas prioritas tertinggi dijalankan terlebih dahulu.

    • Jalankan tipe penyimpanan - Tentukan jenis penyimpanan di sini untuk mengganti jenis penyimpanan run default yang ditentukan untuk alur kerja. Penyimpanan statis mengalokasikan jumlah penyimpanan yang tetap untuk dijalankan. Skala penyimpanan dinamis naik dan turun sesuai kebutuhan untuk setiap tugas yang dijalankan.

    • Jalankan kapasitas penyimpanan - Untuk penyimpanan run statis, tentukan jumlah penyimpanan yang diperlukan untuk menjalankan. Entri ini mengganti jumlah penyimpanan run default yang ditentukan untuk alur kerja.

    • Pilih tujuan output S3 - Lokasi S3 tempat output run akan disimpan.

    • ID akun pemilik bucket keluaran (Opsional) - Jika akun Anda tidak memiliki bucket keluaran, masukkan Akun AWS ID pemilik bucket. Informasi ini diperlukan agar HealthOmics dapat memverifikasi kepemilikan bucket.

    • Jalankan mode retensi metadata - Pilih apakah akan mempertahankan metadata untuk semua proses atau minta sistem menghapus metadata run tertua saat akun Anda mencapai jumlah maksimum proses. Untuk informasi selengkapnya, lihat Jalankan mode retensi untuk HealthOmics berjalan.

  5. Di bawah Peran layanan, Anda dapat menggunakan peran layanan yang ada atau membuat yang baru.

  6. (Opsional) Untuk Tag, Anda dapat menetapkan hingga 50 tag untuk dijalankan.

  7. Pilih Berikutnya.

  8. Pada halaman Tambah nilai parameter, berikan parameter run. Anda dapat mengunggah file JSON yang menentukan parameter atau memasukkan nilai secara manual.

  9. Pilih Berikutnya.

  10. Di panel Run group, Anda dapat secara opsional menentukan grup run untuk menjalankan ini. Untuk informasi selengkapnya, lihat Membuat grup HealthOmics run.

  11. Di panel Run cache, Anda dapat secara opsional menentukan cache run untuk proses ini. Untuk informasi selengkapnya, lihat Mengkonfigurasi run dengan run cache menggunakan konsol.

  12. Pilih Tinjau dan mulai jalankan.

  13. Setelah Anda meninjau konfigurasi run, pilih Mulai jalankan.

Memulai menjalankan menggunakan API

Gunakan operasi API yang dijalankan mulai dengan peran IAM dan bucket Amazon S3 yang Anda buat. Contoh ini menetapkan mode retensi keREMOVE. Untuk informasi selengkapnya tentang mode retensi, lihatJalankan mode retensi untuk HealthOmics berjalan.

aws omics start-run --workflow-id workflow id \ --role-arn arn:aws:iam::1234567892012:role/service-role/OmicsWorkflow-20221004T164236 \ --name workflow name \ --retention-mode REMOVE

Sebagai tanggapan, Anda mendapatkan output berikut. uuidIni unik untuk dijalankan, dan bersama dengan outputUri dapat digunakan untuk melacak di mana data output ditulis.

{ "arn": "arn:aws:omics:us-west-2:....:run/1234567", "id": "123456789", "uuid":"96c57683-74bf-9d6d-ae7e-f09b097db14a", "outputUri":"s3://bucket/folder/8405154/96c57683-74bf-9d6d-ae7e-f09b097db14a" "status": "PENDING" }

Jika templat parameter untuk alur kerja mendeklarasikan parameter yang diperlukan, Anda dapat memberikan file JSON lokal dari input saat memulai alur kerja. File JSON berisi nama yang tepat dari setiap parameter input dan nilai untuk parameter.

Referensikan file JSON masukan di AWS CLI dengan --parameters file://<input_file.json> menambahkan start-run permintaan Anda. Untuk informasi selengkapnya tentang parameter run, lihatHealthOmics jalankan input.

Anda dapat menentukan versi alur kerja untuk dijalankan.

aws omics start-run --workflow-id workflow id \ ... --workflow-version-name '1.2.1'

Anda dapat mengganti jenis penyimpanan run default, yang ditentukan dalam alur kerja.

aws omics start-run --workflow-id workflow id \ ... --storage-type STATIC --storage-capacity 2400

Anda juga dapat menggunakan API start-run dengan ID alur kerja GPU, seperti yang ditunjukkan.

aws omics start-run --workflow-id workflow id \ --role-arn arn:aws:iam::1234567892012:role/service-role/OmicsWorkflow-20221004T164236 \ --name GPUTestRunModel \ --output-uri s3://amzn-s3-demo-bucket1

Mendapatkan informasi tentang alur kerja

Anda dapat menggunakan ID dalam respons dengan API get-run untuk memeriksa status run, seperti yang ditunjukkan.

aws omics get-run --id run id

Respons dari operasi API ini memberi tahu Anda status alur kerja yang dijalankan. Status yang mungkin adalahPENDING,, STARTINGRUNNING, danCOMPLETED. Saat dijalankanCOMPLETED, Anda dapat menemukan file keluaran yang dipanggil outfile.txt di bucket Amazon S3 keluaran Anda, di folder yang dinamai sesuai dengan ID run.

Operasi API get-run juga menampilkan detail lainnya, seperti apakah alur kerja itu Ready2Run atau, mesin alur kerjaPRIVATE, dan detail akselerator. Contoh berikut menunjukkan respons untuk menjalankan alur kerja pribadi, dijelaskan dalam WDL dengan akselerator GPU dan tidak ada tag yang ditetapkan untuk menjalankan.

{ "arn": "arn:aws:omics:us-west-2:123456789012:run/7830534", "id": "7830534", "uuid":"96c57683-74bf-9d6d-ae7e-f09b097db14a", "outputUri":"s3://bucket/folder/8405154/96c57683-74bf-9d6d-ae7e-f09b097db14a" "status": "COMPLETED", "workflowId": "4074992", "workflowType": "PRIVATE", "workflowVersionName": "3.0.0", "roleArn": "arn:aws:iam::123456789012:role/service-role/OmicsWorkflow-20221004T164236", "name": "RunGroupMaxGpuTest", "runGroupId": "9938959", "digest": "sha256:a23a6fc54040d36784206234c02147302ab8658bed89860a86976048f6cad5ac", "accelerators": "GPU", "outputUri": "s3://amzn-s3-demo-bucket1", "startedBy": "arn:aws:sts::123456789012:assumed-role/Admin/<role_name>", "creationTime": "2023-04-07T16:44:22.262471+00:00", "startTime": "2023-04-07T16:56:12.504000+00:00", "stopTime": "2023-04-07T17:22:29.908813+00:00", "tags": {} }

Anda dapat melihat status semua proses dengan operasi API list-run, seperti yang ditunjukkan.

aws omics list-runs

Untuk melihat semua tugas diselesaikan untuk menjalankan tertentu, gunakan list-run-tasksAPI.

aws omics list-run-tasks --id task ID

Untuk mendapatkan detail tugas tertentu, gunakan get-run-task API.

aws omics get-run-task --id <run_id> --task-id task ID

Setelah proses selesai, metadata dikirim ke CloudWatch bawah aliran. manifest/run/<run ID>/<run UUID>

Berikut ini adalah contoh manifes.

{ "arn": "arn:aws:omics:us-east-1:123456789012:run/1695324", "creationTime": "2022-08-24T19:53:55.284Z", "resourceDigests": { "s3://omics-data/broad-references/hg38/v0/Homo_sapiens_assembly38.dict": "etag:3884c62eb0e53fa92459ed9bff133ae6", "s3://omics-data/broad-references/hg38/v0/Homo_sapiens_assembly38.fasta": "etag:e307d81c605fb91b7720a08f00276842-388", "s3://omics-data/broad-references/hg38/v0/Homo_sapiens_assembly38.fasta.fai": "etag:f76371b113734a56cde236bc0372de0a", "s3://omics-data/intervals/hg38-mjs-whole-chr.500M.intervals": "etag:27fdd1341246896721ec49a46a575334", "s3://omics-data/workflow-input-lists/dragen-gvcf-list.txt": "etag:e22f5aeed0b350a66696d8ffae453227" }, "digest": "sha256:a5baaff84dd54085eb03f78766b0a367e93439486bc3f67de42bb38b93304964", "engine": "WDL", "main": "gatk4-basic-joint-genotyping-v2.wdl", "name": "1044-gvcfs", "outputUri": "s3://omics-data/workflow-output", "parameters": { "callset_name": "cohort", "input_gvcf_uris": "s3://omics-data/workflow-input-lists/dragen-gvcf-list.txt", "interval_list": "s3://omics-data/intervals/hg38-mjs-whole-chr.500M.intervals", "ref_dict": "s3://omics-data/broad-references/hg38/v0/Homo_sapiens_assembly38.dict", "ref_fasta": "s3://omics-data/broad-references/hg38/v0/Homo_sapiens_assembly38.fasta", "ref_fasta_index": "s3://omics-data/broad-references/hg38/v0/Homo_sapiens_assembly38.fasta.fai" }, "roleArn": "arn:aws:iam::123456789012:role/OmicsServiceRole", "startedBy": "arn:aws:sts::123456789012:assumed-role/admin/ahenroid-Isengard", "startTime": "2022-08-24T20:08:22.582Z", "status": "COMPLETED", "stopTime": "2022-08-24T20:08:22.582Z", "storageCapacity": 9600, "uuid": "a3b0ca7e-9597-4ecc-94a4-6ed45481aeab", "workflow": "arn:aws:omics:us-east-1:123456789012:workflow/1558364", "workflowType": "PRIVATE" }, { "arn": "arn:aws:omics:us-east-1:123456789012:task/1245938", "cpus": 16, "creationTime": "2022-08-24T20:06:32.971290", "image": "123456789012.dkr.ecr.us-west-2.amazonaws.com/gatk", "imageDigest": "sha256:8051adab0ff725e7e9c2af5997680346f3c3799b2df3785dd51d4abdd3da747b", "memory": 32, "name": "geno-123", "run": "arn:aws:omics:us-east-1:123456789012:run/1695324", "startTime": "2022-08-24T20:08:22.278Z", "status": "SUCCESS", "stopTime": "2022-08-24T20:08:22.278Z", "uuid": "44c1a30a-4eee-426d-88ea-1af403858f76" }, ...

Jalankan metadata tidak dihapus jika tidak ada di log. CloudWatch Anda juga dapat menggunakan run ID untuk menjalankan kembali alur kerja berjalan menggunakan alat CLI. Pelajari lebih lanjut dan unduh alat dari GitHub repositori HealthOmics Alat.

Menjalankan kembali alur kerja

Contoh berikut menunjukkan cara menggunakan rerun alat untuk menjalankan kembali run. Anda memerlukan ID run, yang dapat Anda ambil dari CloudWatch log.

omics-rerun 9876543 --name workflow name --retention-mode REMOVE

Jika proses ada di CloudWatch, Anda menerima respons yang mirip dengan berikut ini.

Original request: { "workflowId": "9679729", "roleArn": "arn:aws:iam::123456789012:role/DemoRole", "name": "sample_rerun", "parameters": { "image": "123456789012.dkr.ecr.us-west-2.amazonaws.com/default:latest", "file1": "omics://123456789012.storage.us-west-2.amazonaws.com/8647780323/readSet/6389608538" }, "outputUri": "s3://workflow-output-bcf2fcb1" } StartRun request: { "workflowId": "9679729", "roleArn": "arn:aws:iam::123456789012:role/DemoRole", "name": "new test", "parameters": { "image": "123456789012.dkr.ecr.us-west-2.amazonaws.com/default:latest", "file1": "omics://123456789012.storage.us-west-2.amazonaws.com/8647780323/readSet/6389608538" }, "outputUri": "s3://workflow-output-bcf2fcb1" } StartRun response: { "arn": "arn:aws:omics:us-west-2:123456789012:run/9171779", "id": "9171779", "status": "PENDING", "tags": {} }

Jika alur kerja tidak ada lagi, Anda menerima pesan galat.