Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Crear un almacén de HealthOmics referencias
Un almacén de referencia HealthOmics es un almacén de datos para el almacenamiento de genomas de referencia. Puede tener un único almacén de referencias en cada Cuenta de AWS región. Puede crear un almacén de referencias mediante la consola o la CLI.
Temas
Crear un almacén de referencias mediante la consola
Para crear un almacén de referencia
-
Abra la consola de HealthOmics
. -
En el panel de navegación izquierdo, selecciona Comenzar con HealthOmics.
-
Elija Genomas de referencia en las opciones de almacenamiento de datos genómicos.
-
Puede elegir un genoma de referencia previamente importado o importar uno nuevo. Si no has importado un genoma de referencia, selecciona Importar genoma de referencia en la parte superior derecha.
-
En la página Crear un trabajo de importación de genomas de referencia, elija la opción de creación rápida o de creación manual para crear un almacén de referencias y, a continuación, proporcione la siguiente información.
-
Nombre del genoma de referencia: un nombre exclusivo para este almacén.
-
Descripción (opcional): descripción de este almacén de referencia.
-
Función de IAM: seleccione una función con acceso a su genoma de referencia.
-
Referencia de Amazon S3: seleccione el archivo de secuencia de referencia en un bucket de Amazon S3.
-
Etiquetas (opcional): proporciona hasta 50 etiquetas para esta tienda de referencia.
-
Creación de un almacén de referencias mediante la CLI
El siguiente ejemplo muestra cómo crear un almacén de referencias mediante AWS CLI. Puede tener una tienda de referencia por AWS región.
Los almacenes de referencia admiten el almacenamiento de archivos FASTA con las extensiones .fasta
.fa
,.fas
,.fsa
,.faa
,.fna
,.ffn
,,.frn
, .mpfa
.seq
,.txt
. También se admite la bgzip
versión de estas extensiones.
En el siguiente ejemplo,
sustitúyalo por el nombre que haya elegido para su tienda de referencia.reference store name
aws omics create-reference-store --name
"reference store name"
Recibirá una respuesta JSON con el ID y el nombre del almacén de referencia, el ARN y la marca de tiempo de cuando se creó el almacén de referencia.
{ "id": "3242349265", "arn": "arn:aws:omics:us-west-2:555555555555:referenceStore/3242349265", "name": "MyReferenceStore", "creationTime": "2022-07-01T20:58:42.878Z" }
Puedes usar el ID del almacén de referencia en comandos adicionales. AWS CLI Puede recuperar la lista de almacenes de referencia IDs vinculada a su cuenta mediante el list-reference-storescomando, como se muestra en el siguiente ejemplo.
aws omics list-reference-stores
Como respuesta, recibirá el nombre del almacén de referencia que acaba de crear.
{ "referenceStores": [ { "id": "3242349265", "arn": "arn:aws:omics:us-west-2:555555555555:referenceStore/3242349265", "name": "MyReferenceStore", "creationTime": "2022-07-01T20:58:42.878Z" } ] }
Tras crear un almacén de referencias, puede crear trabajos de importación para cargar en él archivos de referencia genómica. Para ello, debe usar o crear un rol de IAM para acceder a los datos. A continuación, se muestra una política de ejemplo.
También debe tener una política de confianza similar a la del siguiente ejemplo.
Ahora puede importar un genoma de referencia. En este ejemplo, se utiliza el Genome Reference Consortium Human Build 38 (hg38), que es de acceso abierto y está disponible en AWS el Registro de Datos Abiertos
aws s3 cp s3://broad-references/hg38/v0/Homo_sapiens_assembly38.fasta s3://amzn-s3-demo-bucket
A continuación, puede comenzar su trabajo de importación. Reemplace reference store
ID
, y role ARN
con su propia entrada.source file
path
aws omics start-reference-import-job --reference-store-id
--role-arn
reference store ID
--sources
role ARN
source file path
Una vez importados los datos, recibirá la siguiente respuesta en JSON.
{ "id": "7252016478", "referenceStoreId": "3242349265", "roleArn": "arn:aws:iam::111122223333:role/OmicsReferenceImport", "status": "CREATED", "creationTime": "2022-07-01T21:15:13.727Z" }
Puede supervisar el estado de un trabajo mediante el siguiente comando. En el siguiente ejemplo, sustituya
y reference store ID
por su ID de almacén de referencia y el ID del trabajo sobre los que desee obtener más información.job
ID
aws omics get-reference-import-job --reference-store-id
--id
reference store ID
job ID
Como respuesta, recibirá una respuesta con los detalles de ese almacén de referencia y su estado.
{ "id": "7252016478", "referenceStoreId": "3242349265", "roleArn": "arn:aws:iam::555555555555:role/OmicsReferenceImport", "status": "RUNNING", "creationTime": "2022-07-01T21:15:13.727Z", "sources": [ { "sourceFile": "s3://amzn-s3-demo-bucket/Homo_sapiens_assembly38.fasta", "status": "IN_PROGRESS", "name": "MyReference" } ] }
También puede encontrar la referencia que se importó enumerando sus referencias y filtrándolas según el nombre de la referencia.
Sustitúyala por tu ID de tienda de referencia y añade un filtro opcional para reducir la lista.reference store ID
aws omics list-references --reference-store-id
--filter name=
reference store ID
MyReference
En respuesta, recibirá la siguiente información.
{ "references": [ { "id": "1234567890", "arn": "arn:aws:omics:us-west-2:555555555555:referenceStore/1234567890/reference/1234567890", "referenceStoreId": "12345678", "md5": "7ff134953dcca8c8997453bbb80b6b5e", "status": "ACTIVE", "name": "MyReference", "creationTime": "2022-07-02T00:15:19.787Z", "updateTime": "2022-07-02T00:15:19.787Z" } ] }
Para obtener más información sobre los metadatos de referencia, usa la operación de la get-reference-metadataAPI. En el siguiente ejemplo,
sustitúyalo por el ID de tu tienda de referencia y reference store ID
por el ID de referencia sobre el que deseas obtener más información.reference ID
aws omics get-reference-metadata --reference-store-id
--id
reference store ID
reference ID
En respuesta, recibirás la siguiente información.
{ "id": "1234567890", "arn": "arn:aws:omics:us-west-2:555555555555:referenceStore/referencestoreID/reference/referenceID", "referenceStoreId": "1234567890", "md5": "7ff134953dcca8c8997453bbb80b6b5e", "status": "ACTIVE", "name": "MyReference", "creationTime": "2022-07-02T00:15:19.787Z", "updateTime": "2022-07-02T00:15:19.787Z", "files": { "source": { "totalParts": 31, "partSize": 104857600, "contentLength": 3249912778 }, "index": { "totalParts": 1, "partSize": 104857600, "contentLength": 160928 } } }
También puede descargar partes del archivo de referencia mediante get-reference. En el siguiente ejemplo,
sustitúyalo por el identificador de tu tienda de referencia y reference store ID
por el identificador de referencia desde el que deseas realizar la descarga.reference ID
aws omics get-reference --reference-store-id
--id
reference store ID
--part-number 1 outfile.fa
reference ID