Creación de canalizaciones OpenSearch de Amazon Ingestion - OpenSearch Servicio Amazon

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Creación de canalizaciones OpenSearch de Amazon Ingestion

Una canalización es el mecanismo que Amazon OpenSearch Ingestion utiliza para mover los datos desde su origen (de donde provienen los datos) hasta su receptor (adonde van los datos). En OpenSearch Ingestion, el receptor siempre será un único dominio de Amazon OpenSearch Service, mientras que la fuente de los datos podrían ser clientes como Amazon S3, Fluent Bit o OpenTelemetry Collector.

Para obtener más información, consulte Pipelines en la OpenSearch documentación.

Requisitos previos y rol de IAM requerido

Para crear una canalización OpenSearch de ingestión, debes disponer de los siguientes recursos:

  • Una función de IAM, denominada función de canalización, que OpenSearch Ingestion asume para poder trabajar en el receptor. Puedes crear esta función con antelación o puedes hacer que OpenSearch Ingestion la cree automáticamente mientras creas la canalización.

  • Un dominio OpenSearch de servicio o una colección OpenSearch sin servidor que sirva de receptor. Si escribes en un dominio, debe ejecutar la OpenSearch versión 1.0 o una versión posterior, o Elasticsearch 7.4 o una versión posterior. El receptor debe tener una política de acceso que conceda los permisos adecuados a su rol de canalización de IAM.

Si desea obtener instrucciones para crear estos recursos, consulte los siguientes temas:

nota

Si escribe en un dominio que usa un control de acceso detallado, debe completar algunos pasos adicionales. Consulte Asigne la función de canalización (solo para los dominios que utilizan un control de acceso detallado).

Permisos de IAM necesarios

OpenSearch Ingestion usa los siguientes permisos de IAM para crear canalizaciones:

  • osis:CreatePipeline: Crear una canalización.

  • osis:ValidatePipeline: Comprobar si la configuración de la canalización es válida.

  • iam:CreateRoleyiam:AttachPolicy: haga que OpenSearch Ingestion cree automáticamente el rol de canalización por usted.

  • iam:PassRole— Transfiera la función de canalización a OpenSearch Ingestion para que pueda escribir datos en el dominio. Este permiso debe estar en el recurso de rol de canalización o simplemente * si tienes pensado usar diferentes roles en cada canalización.

Por ejemplo, la siguiente política concede permiso para crear una canalización:

JSON
{ "Version":"2012-10-17", "Statement":[ { "Effect":"Allow", "Resource":"*", "Action":[ "osis:CreatePipeline", "osis:ListPipelineBlueprints", "osis:ValidatePipeline" ] }, { "Resource":[ "arn:aws:iam::your-account-id:role/pipeline-role" ], "Effect":"Allow", "Action":[ "iam:CreateRole", "iam:AttachPolicy", "iam:PassRole" ] } ] }

OpenSearch La ingestión también incluye un permiso denominadoosis:Ingest, que es necesario para enviar solicitudes firmadas a la canalización mediante la versión 4 de Signature. Para obtener más información, consulte Creación de un rol de ingesta.

nota

Además, el primer usuario que cree una canalización en una cuenta debe tener permisos para realizar la acción iam:CreateServiceLinkedRole. Para más información, consulte recurso de rol de canalización.

Para obtener más información sobre cada permiso, consulte las acciones, los recursos y las claves de condición de la OpenSearch ingestión en la Referencia de autorización de servicios.

Especificar la versión de la canalización

Al crear una canalización mediante el editor de configuración, debe especificar la versión principal de Data Prepper que ejecutará la canalización. Para especificar la versión, incluya la opción de version en la configuración de la canalización:

version: "2" log-pipeline: source: ...

Si eliges Crear, OpenSearch Ingestion determina la última versión secundaria disponible de la versión principal que especifiques y aprovisiona la canalización con esa versión. Por ejemplo, si lo especificas version: "2" y la última versión compatible de Data Prepper es la 2.1.1, OpenSearch Ingestion aprovisiona tu canalización con la versión 2.1.1. No mostramos públicamente la versión secundaria que está ejecutando la canalización.

Para actualizar la canalización cuando haya disponible una nueva versión principal de Data Prepper, edite la configuración de la canalización y especifique la nueva versión. No puede cambiar una canalización a una versión anterior.

nota

OpenSearch Ingestion no ofrece soporte inmediato a las nuevas versiones de Data Prepper tan pronto como se publican. Habrá cierto intervalo entre el momento en que una nueva versión esté disponible públicamente y el momento en OpenSearch que Ingestion la admita. Además, es posible que OpenSearch Ingestion no admita por completo determinadas versiones principales o secundarias de forma explícita. Para obtener una lista completa, consulte Versiones de Data Prepper admitidas.

Cada vez que realices un cambio en la canalización que inicie una blue/green implementación, OpenSearch Ingestion puede actualizarla a la última versión secundaria de la versión principal que esté configurada actualmente para la canalización. Para obtener más información, consulte. Implementaciones azul/verde para actualizaciones de canalización OpenSearch La ingestión no puede cambiar la versión principal de tu canalización a menos que actualices explícitamente la version opción en la configuración de la canalización.

Especificación de la ruta de ingesta

En el caso de las fuentes basadas en la extracción, como el OTel rastreo y OTel las métricas, OpenSearch Ingestion requiere la path opción adicional en la configuración de la fuente. La ruta es una cadena, por ejemplo/log/ingest, que representa la ruta del URI para la ingesta. Esta ruta define el URI que usa para enviar datos a la canalización.

Por ejemplo, supongamos que especificas la siguiente ruta para una canalización con una fuente HTTP:

Input field for specifying the path for ingestion, with an example path entered.

Al introducir datos de ingesta en la canalización, debe especificar el siguiente punto de conexión en la configuración de su cliente: https://pipeline-name-abc123.us-west-2.osis.amazonaws.com/my/test_path.

La ruta debe empezar con una barra (/) y puede contener los caracteres especiales '-', '_', '.' y '/', así como el marcador de posición ${pipelineName}. Si usas ${pipelineName} (por ejemplo/${pipelineName}/test_path), OpenSearch Ingestion reemplaza la variable por el nombre de la subcanalización asociada.

Creación de canalizaciones

En esta sección se describe cómo crear canalizaciones OpenSearch de ingestión mediante la consola de OpenSearch servicio y el. AWS CLI

Para crear una canalización, inicia sesión en la consola de Amazon OpenSearch Service en https://console.aws.amazon.com/aos/casa y selecciona Crear canalización.

Seleccione una canalización en blanco o elija un esquema de configuración. Los planos incluyen una canalización preconfigurada para una variedad de casos de uso comunes. Para obtener más información, consulte ¿Trabajando con planos.

Elija Seleccionar esquema.

Configurar el origen

  1. Si empiezas desde una canalización vacía, selecciona una fuente en el menú desplegable. Las fuentes disponibles pueden incluir otras Servicios de AWS o HTTP. OpenTelemetry Para obtener más información, consulte Integración de las canalizaciones OpenSearch de Amazon Ingestion con otros servicios y aplicaciones.

  2. En función de la fuente que elija, configure ajustes adicionales para la fuente. Por ejemplo, para utilizar Amazon S3 como fuente, debe especificar la URL de la cola de Amazon SQS de la canalización que recibe los mensajes. Para obtener una lista de los complementos fuente compatibles y los enlaces a su documentación, consulte. Complementos y opciones compatibles para las canalizaciones OpenSearch de Amazon Ingestion

  3. Para algunas fuentes, debe especificar las opciones de red de origen. Elija el acceso a la VPC o el acceso público. Si elige Acceso público, vaya al siguiente paso. Si elige Acceso a la VCP, configure los siguientes ajustes:

    Ajuste Descripción
    Administración de puntos de conexión

    Elija si quiere crear sus puntos de conexión de nube privada virtual (VPC) usted mismo o dejar que OpenSearch Ingestion los cree por usted. La administración de terminales utiliza de forma predeterminada los puntos finales gestionados por Ingestion. OpenSearch

    VPC

    Elija el ID de la VPC que desee usar. La VPC y la canalización deben estar en la misma Región de AWS.

    Subredes

    Elija una o más subredes. OpenSearch El servicio colocará un punto final de VPC e interfaces de red elásticas en las subredes.

    Grupos de seguridad

    Elija uno o más grupos de seguridad de VPC que permitan que la aplicación requerida llegue a la canalización de OpenSearch ingestión en los puertos (80 o 443) y protocolos (HTTP o HTTPs) expuestos por la canalización.

    Opciones de conexión de VPC

    Si el origen es un punto de conexión autoadministrado, conecte la canalización a una VPC. Elija una de las opciones de CIDR predeterminadas que se proporcionan o utilice un CIDR personalizado.

    Para obtener más información, consulte Configuración del acceso a la VPC para canalizaciones de Amazon Ingestion OpenSearch .

  4. Elija Siguiente.

Configure el procesador

Añada uno o más procesadores a su canalización. Los procesadores son componentes de una subcanalización que permiten filtrar, transformar y enriquecer los eventos antes de publicar los registros en el dominio o en el receptor de la colección. Para obtener una lista de los procesadores compatibles y los enlaces a su documentación, consulteComplementos y opciones compatibles para las canalizaciones OpenSearch de Amazon Ingestion.

Puede elegir Acciones y añadir lo siguiente:

  • Enrutamiento condicional: enruta los eventos a diferentes sumideros en función de condiciones específicas. Para obtener más información, consulte Enrutamiento condicional.

  • Subcanalización: cada subcanalización es una combinación de una sola fuente, cero o más procesadores y un único receptor. Solo una subcanalización puede tener una fuente externa. Todas las demás deben tener fuentes que sean otras subcanalizaciones dentro de la configuración general de la canalización. Una configuración de canalización única puede contener de 1 a 10 subcanalizaciones.

Elija Siguiente.

Configurar el sumidero

Seleccione el destino en el que la canalización publica los registros. Cada subtubería debe contener al menos un sumidero. Puede añadir un máximo de 10 sumideros a una tubería.

Para los OpenSearch sumideros, configura los siguientes campos:

Opción Descripción
Nombre de la política de red

(Solo sumideros sin servidor)

Si seleccionó una colección OpenSearch sin servidor, introduzca un nombre de política de red. OpenSearch La ingestión crea la política si no existe o la actualiza con una regla que concede acceso al punto final de la VPC que conecta la canalización y la colección. Para obtener más información, consulte Otorgar a Amazon OpenSearch Ingestion pipelines acceso a las colecciones.

Nombre del índice

El nombre del índice al que la canalización envía los datos. OpenSearch La ingestión crea este índice si aún no existe.

Opciones de mapeo de índices

Elija la forma en que la canalización almacena e indexa los documentos y sus campos en el OpenSearch sumidero. Si selecciona el mapeo dinámico, OpenSearch agrega campos automáticamente al indexar un documento. Si selecciona Personalizar el mapeo, introduzca una plantilla de mapeo indexado. Para obtener más información, consulte Plantillas de índice.

Habilite DLQ

Configure una cola de cartas muertas (DLQ) de Amazon S3 para la canalización. Para obtener más información, consulte Colas de mensajes fallidos.

Ajustes adicionales

Configure las opciones avanzadas para el OpenSearch fregadero. Para obtener más información, consulte las opciones de configuración en la documentación de Data Prepper.

Para añadir un sumidero de Amazon S3, seleccione Añadir colector y Amazon S3. Para obtener más información, consulte Amazon S3 como destino.

Elija Siguiente.

Configure la canalización

Configure los siguientes ajustes de canalización adicionales:

Opción Descripción
Nombre de la canalización

Un nombre único para la canalización.

Búfer persistente

Un búfer persistente almacena los datos en un búfer basado en disco en varias zonas de disponibilidad. Para obtener más información, consulte Almacenamiento en búfer persistente.

Si habilita el almacenamiento en búfer persistente, seleccione la AWS Key Management Service clave para cifrar los datos del búfer.

Capacidad de canalización

La capacidad mínima y máxima de canalización, en unidades de OpenSearch cómputo de ingestión (OCUs). Para obtener más información, consulte Escalar las canalizaciones en Amazon OpenSearch Ingestion.

Rol de canalización

La función de IAM que proporciona los permisos necesarios para que la canalización escriba en el receptor y lea desde fuentes basadas en la extracción. Puede crear el rol usted mismo o hacer que OpenSearch Ingestion lo cree por usted en función del caso de uso que haya seleccionado.

Para obtener más información, consulte Configuración de roles y usuarios en Amazon OpenSearch Ingestion.

Etiquetas

Añade una o más etiquetas a tu canalización. Para obtener más información, consulte Etiquetado de canalizaciones de Amazon OpenSearch Ingestion.

Opciones de publicación de registros Habilita la publicación de registros de canalización en Amazon CloudWatch Logs. Le recomendamos que habilite la publicación de registros para poder solucionar más fácilmente los problemas de la canalización. Para obtener más información, consulte Monitoreo de registros de canalización.

Selecciona Siguiente, revisa la configuración de la canalización y selecciona Crear canalización.

OpenSearch Ingestion ejecuta un proceso asíncrono para crear la canalización. Una vez que el estado de la canalización sea Active, puede empezar a incorporar datos.

El comando create-pipeline acepta la configuración de la canalización como una cadena o dentro de un archivo.yaml o .json. Si proporciona la configuración en forma de cadena, cada nueva línea debe ir acompañada de secuencias de escape \n. Por ejemplo, "log-pipeline:\n source:\n http:\n processor:\n - grok:\n ...

El siguiente comando de ejemplo crea una canalización con la siguiente configuración:

  • Mínimo 4 ingestas, máximo 10 ingestas OCUs OCUs

  • Aprovisionada en una nube privada virtual (VPC)

  • Publicación de registros habilitada

aws osis create-pipeline \ --pipeline-name my-pipeline \ --min-units 4 \ --max-units 10 \ --log-publishing-options IsLoggingEnabled=true,CloudWatchLogDestination={LogGroup="MyLogGroup"} \ --vpc-options SecurityGroupIds={sg-12345678,sg-9012345},SubnetIds=subnet-1212234567834asdf \ --pipeline-configuration-body "file://pipeline-config.yaml" \ --pipeline-role-arn arn:aws:iam::1234456789012:role/pipeline-role

OpenSearch La ingestión ejecuta un proceso asíncrono para crear la canalización. Una vez que el estado de la canalización sea Active, puede empezar a incorporar datos. Para comprobar el estado de la canalización, usa el comando. GetPipeline

Para crear una canalización OpenSearch de ingestión mediante la API de OpenSearch ingestión, llama a la operación. CreatePipeline

Una vez que la canalización se haya creado correctamente, puede configurar su cliente y empezar a ingerir datos en su OpenSearch dominio de servicio. Para obtener más información, consulte Integración de las canalizaciones OpenSearch de Amazon Ingestion con otros servicios y aplicaciones.

Seguimiento del estado de creación de la canalización

Puede realizar un seguimiento del estado de una canalización a medida que OpenSearch Ingestion la aprovisiona y la prepara para ingerir datos.

Una vez creada inicialmente una canalización, ésta pasa por varias etapas a medida que OpenSearch Ingestion la prepara para la ingesta de datos. Para ver las distintas etapas de creación de la canalización, seleccione el nombre de la canalización para ver la página de Configuración de la canalización. En Estado, seleccione Ver detalles.

Una canalización pasa por las siguientes etapas antes de estar disponible para incorporar datos:

  • Validación: se valida la configuración de la canalización. Cuando se complete esta etapa, todas las validaciones se han realizado correctamente.

  • Crear entorno: preparar y aprovisionar recursos. Cuando se complete esta etapa, se habrá creado el nuevo entorno de canalización.

  • Implementar canalización: implementar la canalización. Cuando se complete esta etapa, la canalización se habrá implementado correctamente.

  • Comprobar el estado de la canalización: comprobación del estado de la canalización. Cuando se complete esta etapa, todas las comprobaciones de estado se habrán aprobado.

  • Habilitar tráfico: permitir que la canalización incorpore datos. Cuando se complete esta etapa, puede empezar a incorporar datos a la canalización.

Usa el get-pipeline-change-progresscomando para comprobar el estado de una canalización. La siguiente AWS CLI solicitud comprueba el estado de una canalización denominadamy-pipeline:

aws osis get-pipeline-change-progress \ --pipeline-name my-pipeline

Respuesta:

{ "ChangeProgressStatuses": { "ChangeProgressStages": [ { "Description": "Validating pipeline configuration", "LastUpdated": 1.671055851E9, "Name": "VALIDATION", "Status": "PENDING" } ], "StartTime": 1.671055851E9, "Status": "PROCESSING", "TotalNumberOfStages": 5 } }

Para realizar un seguimiento del estado de la creación de la canalización mediante la API OpenSearch de ingestión, llama a la GetPipelineChangeProgressoperación.