Création d'un magasin HealthOmics de référence - AWS HealthOmics

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Création d'un magasin HealthOmics de référence

Un magasin de référence dans HealthOmics est un magasin de données destiné au stockage de génomes de référence. Vous pouvez avoir un seul magasin de référence dans chaque Compte AWS région. Vous pouvez créer un magasin de référence à l'aide de la console ou de la CLI.

Création d'un magasin de référence à l'aide de la console

Pour créer un magasin de référence
  1. Ouvrez la HealthOmics console.

  2. Dans le volet de navigation de gauche, choisissez Commencer avec HealthOmics.

  3. Choisissez Génomes de référence dans les options de stockage des données génomiques.

  4. Vous pouvez soit choisir un génome de référence précédemment importé, soit en importer un nouveau. Si vous n'avez pas importé de génome de référence, choisissez Importer le génome de référence en haut à droite.

  5. Sur la page Créer une tâche d'importation du génome de référence, choisissez l'option Création rapide ou Création manuelle pour créer un magasin de référence, puis fournissez les informations suivantes.

    • Nom du génome de référence : nom unique pour ce magasin.

    • Description (facultatif) : description de ce magasin de référence.

    • Rôle IAM - Sélectionnez un rôle ayant accès à votre génome de référence.

    • Référence provenant d'Amazon S3 : sélectionnez votre fichier de séquence de référence dans un compartiment Amazon S3.

    • Balises (facultatif) - Fournissez jusqu'à 50 balises pour ce magasin de référence.

Création d'un magasin de référence à l'aide de la CLI

L'exemple suivant montre comment créer un magasin de référence à l'aide du AWS CLI. Vous pouvez avoir un magasin de référence par AWS région.

Les magasins de référence prennent en charge le stockage de fichiers FASTA avec les extensions .fasta .fa.fas,.fsa,,.faa,.fna,.ffn,.frn,, .mpfa.seq,.txt. La bgzip version de ces extensions est également prise en charge.

Dans l'exemple suivant, remplacez reference store name par le nom que vous avez choisi pour votre boutique de référence.

aws omics create-reference-store --name "reference store name"

Vous recevez une réponse JSON avec l'ID et le nom du magasin de référence, l'ARN et l'horodatage de la création de votre magasin de référence.

{ "id": "3242349265", "arn": "arn:aws:omics:us-west-2:555555555555:referenceStore/3242349265", "name": "MyReferenceStore", "creationTime": "2022-07-01T20:58:42.878Z" }

Vous pouvez utiliser l'ID du magasin de référence dans des AWS CLI commandes supplémentaires. Vous pouvez récupérer la liste des magasins de référence IDs liés à votre compte à l'aide de la list-reference-storescommande, comme illustré dans l'exemple suivant.

aws omics list-reference-stores

En réponse, vous recevez le nom du magasin de référence que vous venez de créer.

{ "referenceStores": [ { "id": "3242349265", "arn": "arn:aws:omics:us-west-2:555555555555:referenceStore/3242349265", "name": "MyReferenceStore", "creationTime": "2022-07-01T20:58:42.878Z" } ] }

Après avoir créé un magasin de référence, vous pouvez créer des tâches d'importation pour y charger des fichiers de référence génomiques. Pour ce faire, vous devez utiliser ou créer un rôle IAM pour accéder aux données. Voici un exemple de politique .

JSON
{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Action": [ "s3:GetObject", "s3:GetBucketLocation" ], "Resource": [ "arn:aws:s3:::amzn-s3-demo-bucket1", "arn:aws:s3:::amzn-s3-demo-bucket1/*" ] } ] }

Vous devez également avoir une politique de confiance similaire à l'exemple suivant.

JSON
{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Principal": { "Service": [ "omics.amazonaws.com" ] }, "Action": "sts:AssumeRole" } ] }

Vous pouvez désormais importer un génome de référence. Cet exemple utilise Human Build 38 (hg38) du Genome Reference Consortium, qui est en libre accès et disponible sur AWS le registre des données ouvertes le. Le bucket qui héberge ces données est basé dans l'est des États-Unis (Ohio). Pour utiliser des compartiments dans d'autres AWS régions, vous pouvez copier les données dans un compartiment Amazon S3 hébergé dans votre région. Utilisez la AWS CLI commande suivante pour copier le génome dans votre compartiment Amazon S3.

aws s3 cp s3://broad-references/hg38/v0/Homo_sapiens_assembly38.fasta s3://amzn-s3-demo-bucket

Vous pouvez ensuite commencer votre tâche d'importation. Remplacez reference store IDrole ARN, et source file path par votre propre entrée.

aws omics start-reference-import-job --reference-store-id reference store ID --role-arn role ARN --sources source file path

Une fois les données importées, vous recevez la réponse suivante au format JSON.

{ "id": "7252016478", "referenceStoreId": "3242349265", "roleArn": "arn:aws:iam::111122223333:role/OmicsReferenceImport", "status": "CREATED", "creationTime": "2022-07-01T21:15:13.727Z" }

Vous pouvez contrôler l'état d'une tâche à l'aide de la commande suivante. Dans l'exemple suivant, remplacez reference store ID et job ID par votre identifiant de magasin de référence et l'identifiant de tâche sur lesquels vous souhaitez en savoir plus.

aws omics get-reference-import-job --reference-store-id reference store ID --id job ID

En réponse, vous recevez une réponse contenant les détails de ce magasin de référence et son statut.

{ "id": "7252016478", "referenceStoreId": "3242349265", "roleArn": "arn:aws:iam::555555555555:role/OmicsReferenceImport", "status": "RUNNING", "creationTime": "2022-07-01T21:15:13.727Z", "sources": [ { "sourceFile": "s3://amzn-s3-demo-bucket/Homo_sapiens_assembly38.fasta", "status": "IN_PROGRESS", "name": "MyReference" } ] }

Vous pouvez également trouver la référence importée en répertoriant vos références et en les filtrant en fonction du nom de la référence. reference store IDRemplacez-le par l'identifiant de votre boutique de référence et ajoutez un filtre facultatif pour affiner la liste.

aws omics list-references --reference-store-id reference store ID --filter name=MyReference

En réponse, vous recevez les informations suivantes.

{ "references": [ { "id": "1234567890", "arn": "arn:aws:omics:us-west-2:555555555555:referenceStore/1234567890/reference/1234567890", "referenceStoreId": "12345678", "md5": "7ff134953dcca8c8997453bbb80b6b5e", "status": "ACTIVE", "name": "MyReference", "creationTime": "2022-07-02T00:15:19.787Z", "updateTime": "2022-07-02T00:15:19.787Z" } ] }

Pour en savoir plus sur les métadonnées de référence, utilisez l'opération get-reference-metadataAPI. Dans l'exemple suivant, remplacez-le reference store ID par l'ID de votre boutique de référence et reference ID par l'ID de référence sur lequel vous souhaitez en savoir plus.

aws omics get-reference-metadata --reference-store-id reference store ID --id reference ID

Vous recevez les informations suivantes en réponse.

{ "id": "1234567890", "arn": "arn:aws:omics:us-west-2:555555555555:referenceStore/referencestoreID/reference/referenceID", "referenceStoreId": "1234567890", "md5": "7ff134953dcca8c8997453bbb80b6b5e", "status": "ACTIVE", "name": "MyReference", "creationTime": "2022-07-02T00:15:19.787Z", "updateTime": "2022-07-02T00:15:19.787Z", "files": { "source": { "totalParts": 31, "partSize": 104857600, "contentLength": 3249912778 }, "index": { "totalParts": 1, "partSize": 104857600, "contentLength": 160928 } } }

Vous pouvez également télécharger des parties du fichier de référence à l'aide de get-reference. Dans l'exemple suivant, remplacez-le reference store ID par l'ID de votre magasin de référence et reference ID par l'ID de référence à partir duquel vous souhaitez effectuer le téléchargement.

aws omics get-reference --reference-store-id reference store ID --id reference ID --part-number 1 outfile.fa