Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Creación de un almacén HealthOmics de secuencias
HealthOmics Los almacenes de secuencias admiten el almacenamiento de archivos genómicos en los formatos no alineados de FASTQ
(solo gzip) y. uBAM
También es compatible con los formatos alineados de y. BAM
CRAM
Los archivos importados se almacenan como conjuntos de lectura. Puede añadir etiquetas a los conjuntos de lectura y utilizar las políticas de IAM para controlar el acceso a los conjuntos de lectura. Los conjuntos de lectura alineados requieren un genoma de referencia para alinear las secuencias genómicas, pero es opcional para los conjuntos de lectura no alineados.
Para almacenar conjuntos de lecturas, primero debe crear un almacén de secuencias. Al crear un almacén de secuencias, puede especificar un bucket de Amazon S3 opcional como ubicación alternativa y la ubicación en la que se almacenan los registros de acceso a S3. La ubicación alternativa se utiliza para almacenar cualquier archivo que no pueda crear un conjunto de lecturas durante una carga directa. Las ubicaciones alternativas están disponibles para los almacenes de secuencias creados después del 15 de mayo de 2023. La ubicación de reserva se especifica al crear el almacén de secuencias.
Puede especificar hasta cinco claves de etiquetas de conjunto de lectura. Al crear o actualizar un conjunto de lecturas con una clave de etiqueta que coincide con una de estas claves, las etiquetas del conjunto de lecturas se propagan al objeto de Amazon S3 correspondiente. Las etiquetas del sistema creadas por HealthOmics se propagan de forma predeterminada.
Temas
Crear un almacén de secuencias mediante la consola
Para crear un almacén de secuencias
-
Abra la consola de HealthOmics
. -
En el panel de navegación izquierdo, elija Sequence stores.
-
En la página Crear almacén de secuencias, proporcione la siguiente información
-
Nombre del almacén de secuencias: un nombre exclusivo para este almacén.
-
Descripción (opcional): descripción de este almacén de secuencias.
-
-
Para la ubicación de respaldo en S3, especifique una ubicación de Amazon S3. HealthOmics utiliza la ubicación alternativa para almacenar los archivos que no puedan crear un conjunto de lecturas durante una carga directa. Debe conceder al HealthOmics servicio acceso de escritura a la ubicación alternativa de Amazon S3. Para ver una política de ejemplo, consulte Configure una ubicación alternativa.
Las ubicaciones alternativas no están disponibles para los almacenes secuenciales creados antes del 16 de mayo de 2023.
-
(Opcional) En el caso de las claves de etiquetas de conjuntos de lectura para la propagación de S3, puede introducir hasta cinco claves de conjuntos de lectura para propagarlas desde un conjunto de lecturas a los objetos S3 subyacentes. Al propagar etiquetas de un conjunto de lecturas al objeto S3, puede conceder permisos de acceso a S3 en función de las etiquetas a los usuarios and/or finales para ver las etiquetas propagadas a través de la operación de la getObjectTagging API de Amazon S3.
-
Introduzca un valor clave en el cuadro de texto. La consola crea un nuevo cuadro de texto para añadir la siguiente clave.
-
(Opcional) Seleccione Eliminar para eliminar todas las claves.
-
-
En Cifrado de datos, seleccione si desea que el cifrado de datos sea propiedad y esté gestionado por una CMK gestionada por el cliente AWS o si desea que se utilice una CMK gestionada por el cliente.
-
(Opcional) En Acceso a datos de S3, seleccione si desea crear una nueva función y política para acceder al almacén de secuencias a través de Amazon S3.
-
(Opcional) Para el registro de acceso de S3, seleccione
Enabled
si desea que Amazon S3 recopile los registros de acceso.En Ubicación de registro de acceso en S3, especifique una ubicación de Amazon S3 para almacenar los registros. Este campo solo está visible si ha activado el registro de acceso a S3.
-
Etiquetas (opcional): proporciona hasta 50 etiquetas para este almacén de secuencias. Estas etiquetas son independientes de las etiquetas del conjunto de lectura que se configuran durante la import/tag actualización del conjunto de lectura
Una vez que hayas creado la tienda, estará lista paraImportación de archivos genómicos.
Creación de un almacén de secuencias mediante la CLI
En el siguiente ejemplo,
sustitúyalo por el nombre que haya elegido para el almacén de secuencias.sequence store name
aws omics create-sequence-store --name
--fallback-location "s3://amzn-s3-demo-bucket"
sequence store name
Recibirás la siguiente respuesta en JSON, que incluye el número de ID del almacén de secuencias recién creado.
{ "id": "3936421177", "arn": "arn:aws:omics:us-west-2:111122223333:sequenceStore/3936421177", "name": "sequence_store_example_name", "creationTime": "2022-07-13T20:09:26.038Z" "fallbackLocation" : "s3://amzn-s3-demo-bucket" }
También puedes ver todos los almacenes de secuencias asociados a tu cuenta mediante el list-sequence-storescomando, como se muestra a continuación.
aws omics list-sequence-stores
Recibirás la siguiente respuesta.
{ "sequenceStores": [ { "arn": "arn:aws:omics:us-west-2:111122223333:sequenceStore/3936421177", "id": "3936421177", "name": "MySequenceStore", "creationTime": "2022-07-13T20:09:26.038Z", "updatedTime": "2024-09-13T04:11:31.242Z", "fallbackLocation" : "s3://amzn-s3-demo-bucket", "status": "Active" } ] }
Puede utilizarla get-sequence-storepara obtener más información sobre un almacén de secuencias utilizando su ID, como se muestra en el siguiente ejemplo:
aws omics get-sequence-store --id
sequence store ID
Recibirás la siguiente respuesta:
{ "arn": "arn:aws:omics:us-west-2:123456789012:sequenceStore/sequencestoreID", "creationTime": "2024-01-12T04:45:29.857Z", "updatedTime": "2024-09-13T04:11:31.242Z", "description": null, "fallbackLocation": null, "id": "2015356892", "name": "MySequenceStore", "s3Access": { "s3AccessPointArn": "arn:aws:s3:us-west-2:123456789012:accesspoint/592761533288-2015356892", "s3Uri": "s3://592761533288-2015356892-ajdpi90jdas90a79fh9a8ja98jdfa9jf98-s3alias/592761533288/sequenceStore/2015356892/", "accessLogLocation": "s3://IAD-seq-store-log/2015356892/" }, "sseConfig": { "keyArn": "arn:aws:kms:us-west-2:123456789012:key/eb2b30f5-635d-4b6d-b0f9-d3889fe0e648", "type": "KMS" }, "status": "Active", "statusMessage": null, "setTagsToSync": ["withdrawn","protocol"], }
Tras la creación, también se pueden actualizar varios parámetros de la tienda. Esto se puede hacer a través de la consola o la updateSequenceStore
operación de la API.
Actualización de un almacén de secuencias
Para actualizar un almacén de secuencias, sigue estos pasos:
-
Abra la consola de HealthOmics
. -
En el panel de navegación izquierdo, selecciona Sequence stores.
-
Elija el almacén de secuencias que desee actualizar.
-
En el panel de detalles, elija Editar.
-
En la página Editar detalles, puede actualizar los siguientes campos:
-
Nombre de almacén secuencial: nombre exclusivo para este almacén.
-
Descripción: descripción de este almacén de secuencias.
-
Ubicación alternativa en S3, especifique una ubicación de Amazon S3. HealthOmics utiliza la ubicación alternativa para almacenar los archivos que no puedan crear un conjunto de lectura durante una carga directa.
-
Lea las claves de conjunto de etiquetas para la propagación de S3; puede introducir hasta cinco claves de conjunto de lectura para propagarlas a Amazon S3.
-
(Opcional) Para el registro de acceso de S3, seleccione
Enabled
si desea que Amazon S3 recopile los registros de acceso.En Ubicación de registro de acceso en S3, especifique una ubicación de Amazon S3 para almacenar los registros. Este campo solo está visible si ha activado el registro de acceso a S3.
-
Etiquetas (opcional): proporciona hasta 50 etiquetas para este almacén de secuencias.
-
Actualización de las etiquetas de los conjuntos de lectura de un almacén de secuencias
Para actualizar las etiquetas del conjunto de lecturas u otros campos de un almacén de secuencias, sigue estos pasos:
-
Abra la consola de HealthOmics
. -
En el panel de navegación izquierdo, selecciona Almacenes de secuencias.
-
Elija el almacén de secuencias que desee actualizar.
-
Elija la pestaña Detalles.
-
Seleccione Editar.
-
Añada nuevas etiquetas de conjunto de lectura o elimine las etiquetas existentes, según sea necesario.
-
Actualice el nombre, la descripción, la ubicación alternativa o el acceso a los datos de S3, según sea necesario.
-
Seleccione Save changes (Guardar cambios).
Importación de archivos genómicos
Para importar archivos genómicos a un almacén de secuencias, siga estos pasos:
Para importar un archivo de genómica
-
Abra la consola de HealthOmics
. -
En el panel de navegación izquierdo, elija Sequence stores.
-
En la página Almacenes de secuencias, elija el almacén de secuencias al que desee importar los archivos.
-
En la página del almacén de secuencias individual, seleccione Importar archivos genómicos.
-
En la página Especificar los detalles de la importación, proporcione la siguiente información
-
Función de IAM: la función de IAM que puede acceder a los archivos genómicos de Amazon S3.
-
Genoma de referencia: el genoma de referencia para estos datos genómicos.
-
-
En la página Especificar el manifiesto de importación, especifique la siguiente información: archivo de manifiesto. El archivo de manifiesto es un archivo JSON o YAML que describe la información esencial de los datos genómicos. Para obtener información sobre el archivo de manifiesto, consulte. Importación de conjuntos de lectura a un almacén HealthOmics de secuencias
-
Haga clic en Crear trabajo de importación.