Création d'un magasin HealthOmics de séquences - AWS HealthOmics

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Création d'un magasin HealthOmics de séquences

HealthOmics les magasins de séquences prennent en charge le stockage de fichiers génomiques dans les formats non alignés FASTQ (gzip uniquement) et. uBAM Il prend également en charge les formats alignés de BAM etCRAM.

Les fichiers importés sont stockés sous forme de jeux de lecture. Vous pouvez ajouter des balises aux ensembles de lecture et utiliser les politiques IAM pour contrôler l'accès aux ensembles de lecture. Les ensembles de lecture alignés nécessitent un génome de référence pour aligner les séquences génomiques, mais c'est facultatif pour les ensembles de lecture non alignés.

Pour stocker des ensembles de lecture, vous devez d'abord créer un magasin de séquences. Lorsque vous créez un magasin de séquences, vous pouvez spécifier un compartiment Amazon S3 facultatif comme emplacement de secours et comme emplacement de stockage des journaux d'accès S3. L'emplacement de secours est utilisé pour stocker tous les fichiers qui ne parviennent pas à créer un ensemble de lecture lors d'un téléchargement direct. Des emplacements de secours sont disponibles pour les magasins de séquences créés après le 15 mai 2023. Vous spécifiez l'emplacement de secours lorsque vous créez le magasin de séquences.

Vous pouvez spécifier jusqu'à cinq clés de balise Read Set. Lorsque vous créez ou mettez à jour un ensemble de lecture avec une clé de balise correspondant à l'une de ces clés, les balises d'ensemble de lecture sont propagées à l'objet Amazon S3 correspondant. Les balises système créées par HealthOmics sont propagées par défaut.

Création d'un magasin de séquences à l'aide de la console

Pour créer un magasin de séquences
  1. Ouvrez la HealthOmics console.

  2. Dans le volet de navigation de gauche, choisissez Sequence stores.

  3. Sur la page Créer un magasin de séquences, fournissez les informations suivantes

    • Nom du magasin de séquences : nom unique pour ce magasin.

    • Description (facultatif) : description de ce magasin de séquences.

  4. Pour l'emplacement de secours dans S3, spécifiez un emplacement Amazon S3. HealthOmics utilise l'emplacement de secours pour stocker tous les fichiers qui ne parviennent pas à créer un ensemble de lectures lors d'un téléchargement direct. Vous devez accorder au HealthOmics service un accès en écriture à l'emplacement de secours d'Amazon S3. Pour un exemple de politique, consultez Configuration d'un emplacement de secours.

    Les emplacements de secours ne sont pas disponibles pour les magasins de séquences créés avant le 16 mai 2023.

  5. (Facultatif) Pour les clés de balise Read Set pour la propagation S3, vous pouvez entrer jusqu'à cinq clés de lecture à propager d'un ensemble de lectures aux objets S3 sous-jacents. En propageant les balises d'un ensemble de lecture vers l'objet S3, vous pouvez accorder des autorisations d'accès à S3 en fonction des balises. Les utilisateurs and/or finaux peuvent ainsi voir les balises propagées via l'opération d' getObjectTagging API Amazon S3.

    1. Entrez une valeur clé dans la zone de texte. La console crée une nouvelle zone de texte pour ajouter la touche suivante.

    2. (Facultatif) Choisissez Supprimer pour supprimer toutes les clés.

  6. Sous Chiffrement des données, indiquez si vous souhaitez que le chiffrement des données soit détenu et géré par AWS ou qu'il utilise une clé CMK gérée par le client.

  7. (Facultatif) Sous Accès aux données S3, indiquez si vous souhaitez créer un nouveau rôle et une nouvelle politique pour accéder au magasin de séquences via Amazon S3.

  8. (Facultatif) Pour la journalisation des accès S3, indiquez Enabled si vous souhaitez qu'Amazon S3 collecte les enregistrements des journaux d'accès.

    Pour l'emplacement de journalisation des accès dans S3, spécifiez un emplacement Amazon S3 pour stocker les journaux. Ce champ n'est visible que si vous avez activé la journalisation des accès S3.

  9. Balises (facultatif) - Fournissez jusqu'à 50 balises pour ce magasin de séquences. Ces balises sont distinctes des balises d'ensemble de lecture définies lors de la mise à import/tag jour de l'ensemble de lecture

Une fois que vous avez créé le magasin, il est prêt pourImportation de fichiers génomiques.

Création d'un magasin de séquences à l'aide de la CLI

Dans l'exemple suivant, remplacez sequence store name par le nom que vous avez choisi pour votre magasin de séquences.

aws omics create-sequence-store --name sequence store name --fallback-location "s3://amzn-s3-demo-bucket"

Vous recevez la réponse suivante au format JSON, qui inclut le numéro d'identification du magasin de séquences que vous venez de créer.

{ "id": "3936421177", "arn": "arn:aws:omics:us-west-2:111122223333:sequenceStore/3936421177", "name": "sequence_store_example_name", "creationTime": "2022-07-13T20:09:26.038Z" "fallbackLocation" : "s3://amzn-s3-demo-bucket" }

Vous pouvez également afficher tous les magasins de séquences associés à votre compte à l'aide de la list-sequence-storescommande, comme indiqué ci-dessous.

aws omics list-sequence-stores

Vous recevez la réponse suivante.

{ "sequenceStores": [ { "arn": "arn:aws:omics:us-west-2:111122223333:sequenceStore/3936421177", "id": "3936421177", "name": "MySequenceStore", "creationTime": "2022-07-13T20:09:26.038Z", "updatedTime": "2024-09-13T04:11:31.242Z", "fallbackLocation" : "s3://amzn-s3-demo-bucket", "status": "Active" } ] }

Vous pouvez utiliser get-sequence-storepour en savoir plus sur un magasin de séquences en utilisant son identifiant, comme illustré dans l'exemple suivant :

aws omics get-sequence-store --id sequence store ID

Vous recevez la réponse suivante :

{ "arn": "arn:aws:omics:us-west-2:123456789012:sequenceStore/sequencestoreID", "creationTime": "2024-01-12T04:45:29.857Z", "updatedTime": "2024-09-13T04:11:31.242Z", "description": null, "fallbackLocation": null, "id": "2015356892", "name": "MySequenceStore", "s3Access": { "s3AccessPointArn": "arn:aws:s3:us-west-2:123456789012:accesspoint/592761533288-2015356892", "s3Uri": "s3://592761533288-2015356892-ajdpi90jdas90a79fh9a8ja98jdfa9jf98-s3alias/592761533288/sequenceStore/2015356892/", "accessLogLocation": "s3://IAD-seq-store-log/2015356892/" }, "sseConfig": { "keyArn": "arn:aws:kms:us-west-2:123456789012:key/eb2b30f5-635d-4b6d-b0f9-d3889fe0e648", "type": "KMS" }, "status": "Active", "statusMessage": null, "setTagsToSync": ["withdrawn","protocol"], }

Après la création, plusieurs paramètres du magasin peuvent également être mis à jour. Cela peut être effectué via la console ou l'updateSequenceStoreopération API.

Mettre à jour un magasin de séquences

Pour mettre à jour un magasin de séquences, procédez comme suit :

  1. Ouvrez la HealthOmics console.

  2. Dans le volet de navigation de gauche, choisissez Sequence stores.

  3. Choisissez le magasin de séquences à mettre à jour.

  4. Dans le panneau Détails, choisissez Modifier.

  5. Sur la page Modifier les détails, vous pouvez mettre à jour les champs suivants :

    • Nom du magasin de séquences : nom unique pour ce magasin.

    • Description : description de ce magasin de séquences.

    • Emplacement de secours dans S3, spécifiez un emplacement Amazon S3. HealthOmics utilise l'emplacement de secours pour stocker tous les fichiers qui ne parviennent pas à créer un ensemble de lectures lors d'un téléchargement direct.

    • Clés de balise Read Set pour la propagation dans S3 Vous pouvez saisir jusqu'à cinq clés de lecture à propager vers Amazon S3.

    • (Facultatif) Pour la journalisation des accès S3, indiquez Enabled si vous souhaitez qu'Amazon S3 collecte les enregistrements des journaux d'accès.

      Pour l'emplacement de journalisation des accès dans S3, spécifiez un emplacement Amazon S3 pour stocker les journaux. Ce champ n'est visible que si vous avez activé la journalisation des accès S3.

    • Balises (facultatif) - Fournissez jusqu'à 50 balises pour ce magasin de séquences.

Mise à jour des balises de jeu de lecture pour un magasin de séquences

Pour mettre à jour les balises de jeu de lecture ou les autres champs d'un magasin de séquences, procédez comme suit :

  1. Ouvrez la HealthOmics console.

  2. Dans le volet de navigation de gauche, choisissez Sequence stores.

  3. Choisissez le magasin de séquences que vous souhaitez mettre à jour.

  4. Cliquez sur l’onglet Détails.

  5. Choisissez Modifier.

  6. Ajoutez de nouvelles balises readset ou supprimez des balises existantes, selon les besoins.

  7. Mettez à jour le nom, la description, l'emplacement de secours ou l'accès aux données S3, selon les besoins.

  8. Sélectionnez Enregistrer les modifications.

Importation de fichiers génomiques

Pour importer des fichiers génomiques dans un magasin de séquences, procédez comme suit :

Pour importer un fichier génomique
  1. Ouvrez la HealthOmics console.

  2. Dans le volet de navigation de gauche, choisissez Sequence stores.

  3. Sur la page Magasins de séquences, choisissez le magasin de séquences dans lequel vous souhaitez importer vos fichiers.

  4. Sur la page du magasin de séquences individuelles, choisissez Importer des fichiers génomiques.

  5. Sur la page Spécifier les détails de l'importation, fournissez les informations suivantes

    • Rôle IAM : rôle IAM qui peut accéder aux fichiers génomiques sur Amazon S3.

    • Génome de référence - Le génome de référence pour ces données génomiques.

  6. Sur la page Spécifier le manifeste d'importation, spécifiez le fichier manifeste d'informations suivant. Le fichier manifeste est un fichier JSON ou YAML qui décrit les informations essentielles de vos données génomiques. Pour plus d'informations sur le fichier manifeste, consultezImportation de jeux de lecture dans un magasin de HealthOmics séquences.

  7. Cliquez sur Créer une tâche d'importation.