Crear un almacén de HealthOmics referencias - AWS HealthOmics

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Crear un almacén de HealthOmics referencias

Un almacén de referencia HealthOmics es un almacén de datos para el almacenamiento de genomas de referencia. Puede tener un único almacén de referencias en cada Cuenta de AWS región. Puede crear un almacén de referencias mediante la consola o la CLI.

Crear un almacén de referencias mediante la consola

Para crear un almacén de referencia
  1. Abra la consola de HealthOmics .

  2. En el panel de navegación izquierdo, selecciona Comenzar con HealthOmics.

  3. Elija Genomas de referencia en las opciones de almacenamiento de datos genómicos.

  4. Puede elegir un genoma de referencia previamente importado o importar uno nuevo. Si no has importado un genoma de referencia, selecciona Importar genoma de referencia en la parte superior derecha.

  5. En la página Crear un trabajo de importación de genomas de referencia, elija la opción de creación rápida o de creación manual para crear un almacén de referencias y, a continuación, proporcione la siguiente información.

    • Nombre del genoma de referencia: un nombre exclusivo para este almacén.

    • Descripción (opcional): descripción de este almacén de referencia.

    • Función de IAM: seleccione una función con acceso a su genoma de referencia.

    • Referencia de Amazon S3: seleccione el archivo de secuencia de referencia en un bucket de Amazon S3.

    • Etiquetas (opcional): proporciona hasta 50 etiquetas para esta tienda de referencia.

Creación de un almacén de referencias mediante la CLI

El siguiente ejemplo muestra cómo crear un almacén de referencias mediante AWS CLI. Puede tener una tienda de referencia por AWS región.

Los almacenes de referencia admiten el almacenamiento de archivos FASTA con las extensiones .fasta.fa,.fas,.fsa,.faa,.fna,.ffn,,.frn, .mpfa.seq,.txt. También se admite la bgzip versión de estas extensiones.

En el siguiente ejemplo, reference store name sustitúyalo por el nombre que haya elegido para su tienda de referencia.

aws omics create-reference-store --name "reference store name"

Recibirá una respuesta JSON con el ID y el nombre del almacén de referencia, el ARN y la marca de tiempo de cuando se creó el almacén de referencia.

{ "id": "3242349265", "arn": "arn:aws:omics:us-west-2:555555555555:referenceStore/3242349265", "name": "MyReferenceStore", "creationTime": "2022-07-01T20:58:42.878Z" }

Puedes usar el ID del almacén de referencia en comandos adicionales. AWS CLI Puede recuperar la lista de almacenes de referencia IDs vinculada a su cuenta mediante el list-reference-storescomando, como se muestra en el siguiente ejemplo.

aws omics list-reference-stores

Como respuesta, recibirá el nombre del almacén de referencia que acaba de crear.

{ "referenceStores": [ { "id": "3242349265", "arn": "arn:aws:omics:us-west-2:555555555555:referenceStore/3242349265", "name": "MyReferenceStore", "creationTime": "2022-07-01T20:58:42.878Z" } ] }

Tras crear un almacén de referencias, puede crear trabajos de importación para cargar en él archivos de referencia genómica. Para ello, debe usar o crear un rol de IAM para acceder a los datos. A continuación, se muestra una política de ejemplo.

JSON
{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Action": [ "s3:GetObject", "s3:GetBucketLocation" ], "Resource": [ "arn:aws:s3:::amzn-s3-demo-bucket1", "arn:aws:s3:::amzn-s3-demo-bucket1/*" ] } ] }

También debe tener una política de confianza similar a la del siguiente ejemplo.

JSON
{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Principal": { "Service": [ "omics.amazonaws.com" ] }, "Action": "sts:AssumeRole" } ] }

Ahora puede importar un genoma de referencia. En este ejemplo, se utiliza el Genome Reference Consortium Human Build 38 (hg38), que es de acceso abierto y está disponible en AWS el Registro de Datos Abiertos. El depósito que aloja estos datos se encuentra en el este de EE. UU. (Ohio). Para usar depósitos en otras AWS regiones, puede copiar los datos a un depósito de Amazon S3 alojado en su región. Utilice el siguiente AWS CLI comando para copiar el genoma a su bucket de Amazon S3.

aws s3 cp s3://broad-references/hg38/v0/Homo_sapiens_assembly38.fasta s3://amzn-s3-demo-bucket

A continuación, puede comenzar su trabajo de importación. Reemplace reference store IDrole ARN, y source file path con su propia entrada.

aws omics start-reference-import-job --reference-store-id reference store ID --role-arn role ARN --sources source file path

Una vez importados los datos, recibirá la siguiente respuesta en JSON.

{ "id": "7252016478", "referenceStoreId": "3242349265", "roleArn": "arn:aws:iam::111122223333:role/OmicsReferenceImport", "status": "CREATED", "creationTime": "2022-07-01T21:15:13.727Z" }

Puede supervisar el estado de un trabajo mediante el siguiente comando. En el siguiente ejemplo, sustituya reference store ID y job ID por su ID de almacén de referencia y el ID del trabajo sobre los que desee obtener más información.

aws omics get-reference-import-job --reference-store-id reference store ID --id job ID

Como respuesta, recibirá una respuesta con los detalles de ese almacén de referencia y su estado.

{ "id": "7252016478", "referenceStoreId": "3242349265", "roleArn": "arn:aws:iam::555555555555:role/OmicsReferenceImport", "status": "RUNNING", "creationTime": "2022-07-01T21:15:13.727Z", "sources": [ { "sourceFile": "s3://amzn-s3-demo-bucket/Homo_sapiens_assembly38.fasta", "status": "IN_PROGRESS", "name": "MyReference" } ] }

También puede encontrar la referencia que se importó enumerando sus referencias y filtrándolas según el nombre de la referencia. reference store IDSustitúyala por tu ID de tienda de referencia y añade un filtro opcional para reducir la lista.

aws omics list-references --reference-store-id reference store ID --filter name=MyReference

En respuesta, recibirá la siguiente información.

{ "references": [ { "id": "1234567890", "arn": "arn:aws:omics:us-west-2:555555555555:referenceStore/1234567890/reference/1234567890", "referenceStoreId": "12345678", "md5": "7ff134953dcca8c8997453bbb80b6b5e", "status": "ACTIVE", "name": "MyReference", "creationTime": "2022-07-02T00:15:19.787Z", "updateTime": "2022-07-02T00:15:19.787Z" } ] }

Para obtener más información sobre los metadatos de referencia, usa la operación de la get-reference-metadataAPI. En el siguiente ejemplo, reference store ID sustitúyalo por el ID de tu tienda de referencia y reference ID por el ID de referencia sobre el que deseas obtener más información.

aws omics get-reference-metadata --reference-store-id reference store ID --id reference ID

En respuesta, recibirás la siguiente información.

{ "id": "1234567890", "arn": "arn:aws:omics:us-west-2:555555555555:referenceStore/referencestoreID/reference/referenceID", "referenceStoreId": "1234567890", "md5": "7ff134953dcca8c8997453bbb80b6b5e", "status": "ACTIVE", "name": "MyReference", "creationTime": "2022-07-02T00:15:19.787Z", "updateTime": "2022-07-02T00:15:19.787Z", "files": { "source": { "totalParts": 31, "partSize": 104857600, "contentLength": 3249912778 }, "index": { "totalParts": 1, "partSize": 104857600, "contentLength": 160928 } } }

También puede descargar partes del archivo de referencia mediante get-reference. En el siguiente ejemplo, reference store ID sustitúyalo por el identificador de tu tienda de referencia y reference ID por el identificador de referencia desde el que deseas realizar la descarga.

aws omics get-reference --reference-store-id reference store ID --id reference ID --part-number 1 outfile.fa