Crear instantáneas de índice en Amazon OpenSearch Service - Amazon OpenSearch Service

Crear instantáneas de índice en Amazon OpenSearch Service

Las instantáneas de Amazon OpenSearch Service son copias de seguridad de los índices y el estado de un clúster. Estado incluye configuraciones de clúster, información de nodos, configuración de índices y asignación de partición.

Las instantáneas de OpenSearch Service tienen las siguientes formas:

  • Las instantáneas automatizadas son solo para la recuperación de clústeres. Puede utilizarlas para restaurar el dominio en caso de que se produzca un estado rojo del clúster o se pierdan datos. Para más información, consulte Restaurar instantáneas a continuación. OpenSearch Service almacena instantáneas automatizadas en un bucket de Amazon S3 preconfigurado sin costo adicional.

  • Las instantáneas manuales son para la recuperación de clústeres o para el traslado de datos de un clúster a otro. Debe iniciar instantáneas manuales. Estas instantáneas se almacenan en su propio bucket de Amazon S3 y se aplican cargos estándar de S3. Si tiene una instantánea de un clúster de OpenSearch autoadministrado, puede utilizar esa instantánea para migrar a un dominio de OpenSearch Service. Para más información, consulte Migración a Amazon OpenSearch Service.

Todos los dominios de OpenSearch Service toman instantáneas automatizadas, pero la frecuencia varía de las siguientes maneras:

  • En el caso de los dominios que ejecutan OpenSearch o Elasticsearch 5.3 y versiones posteriores, OpenSearch Service realiza instantáneas automáticas cada hora y retiene hasta 336 de ellas durante 14 días. Las instantáneas por hora son menos disruptivas, debido a su naturaleza progresiva. También proporcionan un punto de recuperación más reciente en caso de problemas del dominio.

  • En el caso de los dominios que ejecutan Elasticsearch 5.1 y versiones anteriores, OpenSearch realiza instantáneas automatizadas diarias durante la hora que se especifique, retiene hasta 14 de ellas y no retiene ningún dato de instantáneas durante más de 30 días.

Si el clúster pasa al estado rojo, se produce un error en todas las instantáneas automatizadas mientras persiste el estado del clúster. Si no corrige el problema en dos semanas, puede perder de forma permanente los datos del clúster. Para ver los pasos de solución de problemas, consulte Estado rojo del clúster.

Requisitos previos

Para crear instantáneas manualmente, debe trabajar con IAM y Amazon S3. Compruebe que cumple los siguientes requisitos previos antes de intentar tomar una instantánea:

Requisito previo Descripción
Bucket de S3

Cree un bucket de S3 a fin de almacenar instantáneas manuales para su dominio de OpenSearch Service. Para obtener instrucciones, consulte Creación de un bucket de propósito general en la Guía del usuario de Amazon Simple Storage Service.

Recuerde el nombre del bucket para utilizarlo en los siguientes lugares:

  • La instrucción Resource de la política de IAM que se adjunta al rol de IAM

  • El cliente Python utilizado para registrar un repositorio de instantáneas (si utiliza este método)

importante

No aplique una regla de ciclo de vida de Amazon Glacier a este bucket. Las instantáneas manuales no admiten la clase de almacenamiento de Amazon Glacier.

rol de IAM

Cree un rol de IAM para delegar permisos a OpenSearch Service. Para obtener instrucciones, consulte Creación de roles de IAM (consola) en la Guía del usuario de IAM. En el resto de este capítulo, este rol se denomina TheSnapshotRole.

Adjuntar una política de IAM

Adjunte la siguiente política a TheSnapshotRole para permitir el acceso al bucket de S3:

{ "Version":"2012-10-17", "Statement": [{ "Action": [ "s3:ListBucket" ], "Effect": "Allow", "Resource": [ "arn:aws:s3:::amzn-s3-demo-bucket" ] }, { "Action": [ "s3:GetObject", "s3:PutObject", "s3:DeleteObject" ], "Effect": "Allow", "Resource": [ "arn:aws:s3:::amzn-s3-demo-bucket/*" ] } ] }

Para obtener instrucciones sobre cómo adjuntar una política a un rol, consulte Agregar permisos de identidad de IAM (consola) en la Guía del usuario de IAM.

Modificar la relación de confianza

Modifique la relación de confianza de TheSnapshotRole para especificar a OpenSearch Service en la instrucción Principal como se muestra en el ejemplo siguiente:

{ "Version":"2012-10-17", "Statement": [{ "Sid": "", "Effect": "Allow", "Principal": { "Service": "es.amazonaws.com" }, "Action": "sts:AssumeRole" }] }

Para obtener instrucciones a fin de editar la relación de confianza, consulte Actualización de una política de confianza de rol en la Guía del usuario de IAM.

Permisos

Para registrar el repositorio de instantáneas, necesita poder pasar TheSnapshotRole a OpenSearch Service. También necesita tener acceso a la acción es:ESHttpPut. Para conceder estos dos permisos, asocie la siguiente política al rol de IAM cuyas credenciales se utilicen para firmar la solicitud:

{ "Version":"2012-10-17", "Statement": [ { "Effect": "Allow", "Action": "iam:PassRole", "Resource": "arn:aws:iam::123456789012:role/TheSnapshotRole" }, { "Effect": "Allow", "Action": "es:ESHttpPut", "Resource": "arn:aws:es:us-east-1:123456789012:domain/domain-name/*" } ] }

Si su usuario o rol no tiene permisos de iam:PassRole para transferir TheSnapshotRole, puede que se produzca el siguiente error común cuando intente registrar un repositorio en el siguiente paso:

$ python register-repo.py {"Message":"User: arn:aws:iam::123456789012:user/MyUserAccount is not authorized to perform: iam:PassRole on resource: arn:aws:iam::123456789012:role/TheSnapshotRole"}

Eliminar instantáneas manuales

Ejecute el siguiente comando para tomar una instantánea manual:

DELETE _snapshot/repository-name/snapshot-name

Automatizar instantáneas con la administración de estado de índice

Puede utilizar la operación de administración de estado de índice (ISM) para activar automáticamente instantáneas de índices en función de los cambios en su antigüedad, tamaño o número de documentos. ISM es la mejor opción cuando se necesita una instantánea por índice. Si necesita hacer una instantánea de un grupo de índices, consulte Automatizar instantáneas con la administración de instantáneas.

Para usar SM en OpenSearch Service, debe registrar su propio repositorio de Amazon S3. Para obtener un ejemplo de política ISM con la operación snapshot, consulte Políticas de muestra.

Utilizar Curator para instantáneas

Si ISM no funciona para la administración de índices e instantáneas, puede utilizar Curator en su lugar. Ofrece una funcionalidad avanzada de filtrado que ayuda a simplificar tareas de administración en clústeres complejos. Utilice pip para instalar Curator:

pip install elasticsearch-curator

Puede utilizar Curator como una interfaz de línea de comandos (CLI) o una API de Python. Si utiliza la API de Python, debe utilizar la versión 7.13.4 o anterior del cliente elasticsearch-py heredado. No admite el cliente opensearch-py.

Si utiliza la CLI, exporte sus credenciales en la línea de comandos y configure curator.yml como se indica a continuación:

client: hosts: search-my-domain.us-west-1.es.amazonaws.com port: 443 use_ssl: True aws_region: us-west-1 aws_sign_request: True ssl_no_validate: False timeout: 60 logging: loglevel: INFO