Complementos y opciones compatibles para las canalizaciones de Amazon OpenSearch Ingestion
Amazon OpenSearch Ingestion admite un subconjunto de fuentes, procesadores y destinos dentro de OpenSearch Data Prepper
nota
OpenSearch Ingestion no admite ningún complemento de búfer porque configura automáticamente un búfer predeterminado. Si incluye un búfer en la configuración de la canalización, recibirá un error de validación.
Temas
Complementos compatibles
OpenSearch Ingestion es compatible con los siguientes complementos de Data Prepper:
Fuentes:
Procesadores:
-
Evento de mutación
(serie de procesadores) -
Cadena de mutación
(serie de procesadores)
Receptores:
-
OpenSearch
(compatible con OpenSearch Service, OpenSearch sin servidor y Elasticsearch 6.8 o versiones posteriores)
Códecs de receptor:
Procesadores sin estado frente a procesadores con estado
Los procesadores sin estado llevan a cabo operaciones como las transformaciones y el filtrado, mientras que los procesadores con estado llevan a cabo operaciones como las agregaciones que recuerdan el resultado de la ejecución anterior. OpenSearch Ingestion es compatible con los procesadores con estado Aggregate
En el caso de las canalizaciones que solo contienen procesadores sin estado, el límite máximo de capacidad es de 96 OCU de ingesta. Si la canalización contiene algún procesador con estado, el límite máximo de capacidad es de 48 OCU de ingesta. Sin embargo, si una canalización tiene habilitado el almacenamiento en búfer persistente, puede tener un máximo de 384 OCU de ingesta solo con procesadores sin estado, o 192 OCU de ingesta si contiene algún procesador con estado. Para obtener más información, consulte Escalado de canalizaciones en Amazon OpenSearch Ingestion.
El reconocimiento de extremo a extremo solo es compatible con procesadores sin estado. Para más información, consulte Reconocimiento integral.
Requisitos y restricciones de configuración
A menos que se especifique lo contrario a continuación, todas las opciones descritas en la referencia de configuración de Data Prepper para los complementos compatibles enumerados anteriormente están permitidas en las canalizaciones de OpenSearch Ingestion. En las siguientes secciones se explican las restricciones que OpenSearch Ingestion impone a determinadas opciones de los complementos.
nota
OpenSearch Ingestion no admite ningún complemento de búfer porque configura automáticamente un búfer predeterminado. Si incluye un búfer en la configuración de la canalización, recibirá un error de validación.
OpenSearch Ingestion configura y administra internamente muchas opciones, como authentication y acm_certificate_arn. Otras opciones, como thread_count yrequest_timeout, tienen un impacto en el rendimiento si se modifican manualmente. Por lo tanto, estos valores se establecen internamente para garantizar un rendimiento óptimo de sus canalizaciones.
Por último, algunas opciones no se pueden pasar a OpenSearch Ingestion, como ism_policy_file y sink_template, porque son archivos locales cuando se ejecutan en Data Prepper de código abierto. No se admiten estos valores.
Temas
Opciones generales de canalización
OpenSearch Ingestion establece las siguientes opciones generales de canalización
-
workers -
delay
Procesador Grok
No se admiten las siguientes opciones de procesador Grok
-
patterns_directories -
patterns_files_glob
Origen de HTTP
El complemento fuente HTTP
-
La opción
pathes obligatoria. La ruta es una cadena, por ejemplo/log/ingest, que representa la ruta del URI para la ingesta de registros. Esta ruta define el URI que usa para enviar datos a la canalización. Por ejemplo,https://log-pipeline.us-west-2.osis.amazonaws.com. La ruta debe empezar con una barra (/) y puede contener los caracteres especiales '-', '_', '.' y '/', así como el marcador de posición/log/ingest${pipelineName}. -
OpenSearch Ingestion establece las siguientes opciones de origen de HTTP que no se admiten en las configuraciones de canalización:
-
port -
ssl -
ssl_key_file -
ssl_certificate_file -
aws_region -
authentication -
unauthenticated_health_check -
use_acm_certificate_for_ssl -
thread_count -
request_timeout -
max_connection_count -
max_pending_requests -
health_check_service -
acm_private_key_password -
acm_certificate_timeout_millis -
acm_certificate_arn
-
Receptor de OpenSearch
El complemento del receptor de OpenSearch
-
La opción
awses obligatoria y debe contener las siguientes opciones:-
sts_role_arn -
region -
hosts -
serverless(si el receptor es una colección OpenSearch sin servidor)
-
-
La opción
sts_role_arndebe apuntar al mismo rol para cada receptor de un archivo de definición YAML. -
La opción
hostsdebe especificar un punto de conexión del dominio de OpenSearch Service o un punto de conexión de la colección de OpenSearch sin servidor. No se puede especificar un punto de conexión personalizado para un dominio; este debe ser el punto de conexión estándar. -
Si la opción de
hostses un punto de conexión de la colección sin servidor, debe configurar la opciónserverlessentrue. Además, si su archivo de definición YAML contiene la opciónindex_type, debe estar configurada enmanagement_disabled, de lo contrario, la validación fallará. -
Las siguientes opciones no son compatibles:
-
username -
password -
cert -
proxy -
dlq_file: si quiere descargar los eventos fallidos a una cola de mensajes fallidos (DLQ), debe usar la opcióndlqy especificar un bucket de S3. -
ism_policy_file -
socket_timeout -
template_file -
insecure
-
Fuente de métricas de OTel, fuente de rastreo de OTel y fuente de registros de OTel
Los complementos de la fuente de métricas de OTel
-
La opción
pathes obligatoria. La ruta es una cadena, por ejemplo/log/ingest, que representa la ruta del URI para la ingesta de registros. Esta ruta define el URI que usa para enviar datos a la canalización. Por ejemplo,https://log-pipeline.us-west-2.osis.amazonaws.com. La ruta debe empezar con una barra (/) y puede contener los caracteres especiales '-', '_', '.' y '/', así como el marcador de posición/log/ingest${pipelineName}. -
OpenSearch Ingestion establece las siguientes opciones que no se admiten en las configuraciones de canalización:
-
port -
ssl -
sslKeyFile -
sslKeyCertChainFile -
authentication -
unauthenticated_health_check -
useAcmCertForSSL -
unframed_requests -
proto_reflection_service -
thread_count -
request_timeout -
max_connection_count -
acmPrivateKeyPassword -
acmCertIssueTimeOutMillis -
health_check_service -
acmCertificateArn -
awsRegion
-
Procesador de grupos de rastreo de OTel
El procesador de grupos de rastreo de OTel
-
La opción
awses obligatoria y debe contener las siguientes opciones:-
sts_role_arn -
region -
hosts
-
-
La
sts_role_arnopción especifica el mismo rol que el rol de canalización que se especifica en la configuración del receptor de OpenSearch. -
No se admiten las opciones
username,password,cert, yinsecure. -
La opción
aws_sigv4es obligatoria y se debe establecer en verdadero. -
La opción
serverlessdel complemento del receptor de OpenSearch no es compatible. El procesador del grupo de rastreo de OTel no funciona actualmente con los receptores de las colecciones de OpenSearch sin servidor. -
El número de procesadores
otel_trace_groupen el cuerpo de configuración de la canalización no puede ser superior a 8.
Procesador de rastreo de OTel
El procesador de rastreo de OTel
-
El valor de la opción
trace_flush_intervalno puede superar los 300 segundos.
Procesador de mapas de servicio
El procesador de Service-map
-
El valor de la opción
window_durationno puede superar los 300 segundos.
Fuente de S3
El complemento fuente de S3
-
La opción
awses obligatoria y debe contener las opcionesregionysts_role_arn. -
El valor de la opción
records_to_accumulateno puede ser superior a 200. -
El valor de la opción
maximum_messagesno puede ser superior a 10. -
Si se especifica, la opción
disable_bucket_ownership_validationse debe establecer en falso. -
Si se especifica, la opción
input_serializationse debe establecer enparquet.