Plug-ins e opções compatíveis com pipelines da Ingestão do Amazon OpenSearch
O Amazon OpenSearch Ingestion é compatível com um subconjunto de origens, processadores e coletores no OpenSearch Data Prepper
nota
A Ingestão do OpenSearch não oferece suporte a nenhum plug-in de buffer porque configura automaticamente um buffer padrão. Você receberá um erro de validação se incluir um buffer na configuração do pipeline.
Tópicos
Plug-ins compatíveis
A Ingestão do OpenSearch é compatível com os seguintes plug-ins do Data Prepper:
Sources (Origens:
Processadores:
-
Mudar evento
(série de processadores) -
Mudar string
(série de processadores)
Coletores:
-
OpenSearch
(compatível com OpenSearch Service, OpenSearch de tecnologia sem servidor e Elasticsearch 6.8 ou posterior)
Codecs Sink:
Processadores sem estado x processadores com estado
Os processadores sem estado realizam operações como transformações e filtragem, enquanto os processadores com estado realizam operações como agregações que lembram o resultado da execução anterior. A Ingestão do OpenSearch é compatível com os processadores com estado Aggregate
Para pipelines que contêm apenas processadores sem estado, o limite máximo de capacidade são 96 OCUs de ingestão. Se um pipeline contiver algum processador sem estado, o limite máximo de capacidade são 48 OCUs de ingestão. No entanto, se um pipeline tiver o buffer persistente habilitado, ele poderá ter, no máximo, 384 OCUs de ingestão com apenas processadores sem estado ou 192 OCUs de ingestão se contiver algum processador com estado. Para obter mais informações, consulte Escalar pipelines no Amazon OpenSearch Ingestion.
A confirmação de ponta a ponta é compatível somente com processadores sem estado. Para obter mais informações, consulte Confirmação de ponta a ponta.
Requisitos e restrições de configuração
A menos que especificado de outra forma abaixo, todas as opções descritas na referência de configuração do Data Prepper para os plug-ins compatíveis listados acima são permitidas nos pipelines da Ingestão do OpenSearch. As seções a seguir explicam as restrições que a Ingestão do OpenSearch impõe a determinadas opções de plug-in.
nota
A Ingestão do OpenSearch não oferece suporte a nenhum plug-in de buffer porque configura automaticamente um buffer padrão. Você receberá um erro de validação se incluir um buffer na configuração do pipeline.
Muitas opções são configuradas e gerenciadas internamente pela Ingestão do OpenSearch, como authentication e acm_certificate_arn. Outras opções, como thread_count e request_timeout, sofrem impactos no desempenho se alteradas manualmente. Portanto, esses valores são definidos internamente para garantir o desempenho ideal de seus pipelines.
Por fim, algumas opções não podem ser passadas para a Ingestão do OpenSearch, como ism_policy_file esink_template, porque são arquivos locais quando executados no Data Prepper de código aberto. Não oferece suporte a esses valores.
Tópicos
Opções gerais de pipeline
As seguintes opções gerais de pipeline
-
workers -
delay
Processador Grok
As seguintes opções do processador Grok
-
patterns_directories -
patterns_files_glob
Origem HTTP
O plug-in de origem HTTP
-
A opção
pathé obrigatória. O caminho é uma string como/log/ingest, que representa o caminho do URI para ingestão de logs. Esse caminho define o URI que você usa para enviar dados para o pipeline. Por exemplo,https://log-pipeline.us-west-2.osis.amazonaws.com. O caminho deve começar com uma barra (/) e pode conter os caracteres especiais '-', '_', ' . 'e'/', bem como o placeholder/log/ingest${pipelineName}. -
As seguintes opções de origem HTTP são definidas pela Ingestão do OpenSearch e não são compatíveis com as configurações de pipeline:
-
port -
ssl -
ssl_key_file -
ssl_certificate_file -
aws_region -
authentication -
unauthenticated_health_check -
use_acm_certificate_for_ssl -
thread_count -
request_timeout -
max_connection_count -
max_pending_requests -
health_check_service -
acm_private_key_password -
acm_certificate_timeout_millis -
acm_certificate_arn
-
OpenSearch SQL
O plug-in do coletor do OpenSearch
-
A opção
awsé obrigatória e deve conter as opções a seguir.-
sts_role_arn -
region -
hosts -
serverless(se o coletor for uma coleção OpenSearch de tecnologia sem servidor)
-
-
A opção
sts_role_arndeve apontar para a mesma função para cada coletor em um arquivo de definição YAML. -
A
hostsopção deve especificar um endpoint de domínio do OpenSearch Service ou um endpoint de coleta do OpenSearch de tecnologia sem servidor. Você não pode especificar um endpoint personalizado para um domínio; ele deve ser o endpoint padrão. -
Se a opção
hostsfor um endpoint de coleta de tecnologia sem servidor, você deverá definir a opçãoserverlesscomotrue. Além disso, se o arquivo de definição YAML contiver a opçãoindex_type, ela deverá ser definida comomanagement_disabled, caso contrário, a validação falhará. -
As seguintes opções não são compatíveis:
-
username -
password -
cert -
proxy -
dlq_file: se quiser transferir eventos com falha para uma fila de mensagens não entregues (DLQ), você deve usar a opçãodlqe especificar um bucket do S3. -
ism_policy_file -
socket_timeout -
template_file -
insecure
-
Fonte de métricas do OTel, fonte de rastreamento do OTel e fonte de logs do OTel
Os plug-ins OTel metrics
-
A opção
pathé obrigatória. O caminho é uma string como/log/ingest, que representa o caminho do URI para ingestão de logs. Esse caminho define o URI que você usa para enviar dados para o pipeline. Por exemplo,https://log-pipeline.us-west-2.osis.amazonaws.com. O caminho deve começar com uma barra (/) e pode conter os caracteres especiais '-', '_', ' . 'e'/', bem como o placeholder/log/ingest${pipelineName}. -
As opções a seguir são definidas pela Ingestão do OpenSearch e não são compatíveis com as configurações de pipeline:
-
port -
ssl -
sslKeyFile -
sslKeyCertChainFile -
authentication -
unauthenticated_health_check -
useAcmCertForSSL -
unframed_requests -
proto_reflection_service -
thread_count -
request_timeout -
max_connection_count -
acmPrivateKeyPassword -
acmCertIssueTimeOutMillis -
health_check_service -
acmCertificateArn -
awsRegion
-
Processador de grupos de rastreamento OTel
O processador OTel trace group
-
A opção
awsé obrigatória e deve conter as opções a seguir.-
sts_role_arn -
region -
hosts
-
-
A opção
sts_role_arnespecifica a mesma função que a função do pipeline que você especifica na configuração do coletor do OpenSearch. -
As opções
username,password,certeinsecurenão são compatíveis. -
A opção
aws_sigv4é obrigatória e deve ser definida como verdadeira. -
Não há suporte para a opção
serverlessdo plug-in de coletor do OpenSearch. Atualmente, o processador OTel trace group não funciona com coleções OpenSearch de tecnologia sem servidor. -
O número de processadores
otel_trace_groupdentro do corpo de configuração do pipeline não pode exceder 8.
Processador OTel trace
O processador OTel trace
-
O valor da opção
trace_flush_intervalnão pode exceder 300 segundos.
Processador de mapas de serviços
O processador Service-map
-
O valor da opção
window_durationnão pode exceder 300 segundos.
Origem do S3
O plug-in de origem do S3
-
A opção
awsé obrigatória e deve conter as opçõesregionests_role_arn. -
O valor da opção
records_to_accumulatenão pode exceder 200. -
O valor da opção
maximum_messagesnão pode exceder 10. -
Se especificada, a opção
disable_bucket_ownership_validationdeve ser definida como falsa. -
Se especificada, a opção
input_serializationdeve ser definida comoparquet.