Processadores configuráveis do tipo analisador

Esta seção contém informações sobre os processadores de analisadores de dados configuráveis que você pode usar em um transformador de eventos de log.

Sumário

parseJSON

O processador parseJSON analisa os eventos de logs JSON e insere os pares de valores-chave JSON extraídos no destino. Se você não especificar um destino, o processador colocará o par de valores-chave sob o nó raiz. Ao usar o parseJSON como primeiro processador, você deve analisar todo o evento de logs usando @message como campo de origem. Após a análise inicial do JSON, você pode manipular campos específicos nos processadores subsequentes.

O conteúdo @message original não é alterado, as novas chaves são adicionadas à mensagem.

Campo Description Obrigatório? Padrão Limites

Campo	Description	Obrigatório?	Padrão	Limites
origem	Caminho para o campo no evento de logs que será analisado. Use a notação de pontos para acessar os campos secundários. Por exemplo, `store.book`.	Não	`@message`	Tamanho máximo: 128 Profundidade máxima de chave aninhada: 3
destination	O campo de destino do JSON analisado	Não	`Parent JSON node`	Tamanho máximo: 128 Profundidade máxima de chave aninhada: 3

origem

Caminho para o campo no evento de logs que será analisado. Use a notação de pontos para acessar os campos secundários. Por exemplo, store.book.

Não

@message

Tamanho máximo: 128

Profundidade máxima de chave aninhada: 3

destination

O campo de destino do JSON analisado

Não

Parent JSON node

Tamanho máximo: 128

Profundidade máxima de chave aninhada: 3

Exemplo

Suponha que um evento de logs ingerido seja semelhante a:


{
    "outer_key": {
        "inner_key": "inner_value"
    }
}

Então, se tivermos esse processador parseJSON:


[
   {
        "parseJSON": {
            "destination": "new_key"
        }
   }
]

O evento de logs transformado seria o seguinte.


{
    "new_key": {
        "outer_key": {
            "inner_key": "inner_value"
        }
    }
}

grok

Use o processador Grok para analisar e estruturar dados não estruturados usando correspondência de padrões. Esse processador também pode extrair campos de mensagens de log.

Campo Description Obrigatório? Padrão Limites Observações

Campo	Description	Obrigatório?	Padrão	Limites	Observações
origem	Caminho do campo no qual aplicar a correspondência Grok	Não	`@message`	Tamanho máximo: 128 Profundidade máxima de chave aninhada: 3
match	O padrão Grok para combinar com o evento de logs	Sim		Tamanho máximo: 512 Máximo de padrões Grok: 20 Alguns tipos de padrões Grok têm limites de uso individuais. Qualquer combinação dos seguintes padrões pode ser usada até cinco vezes: {URI, URIPARAM, URIPATHPARAM, SPACE, DATA, GREEDYDATA, GREEDYDATA_MULTILINE} Os padrões Grok não oferecem suporte a conversões de tipos. Para padrões de formato de log comuns (APACHE_ACCESS_LOG, NGINX_ACCESS_LOG, SYSLOG5424), somente os padrões DATA, GREEDYDATA ou GREEDYDATA_MULTILINE podem ser incluídos após o padrão de log comum.	Veja todos os padrões Grok compatíveis

origem

Caminho do campo no qual aplicar a correspondência Grok

Não

@message

Tamanho máximo: 128

Profundidade máxima de chave aninhada: 3

match

O padrão Grok para combinar com o evento de logs

Sim

Tamanho máximo: 512

Máximo de padrões Grok: 20

Alguns tipos de padrões Grok têm limites de uso individuais. Qualquer combinação dos seguintes padrões pode ser usada até cinco vezes: {URI, URIPARAM, URIPATHPARAM, SPACE, DATA, GREEDYDATA, GREEDYDATA_MULTILINE}

Os padrões Grok não oferecem suporte a conversões de tipos.

Para padrões de formato de log comuns (APACHE_ACCESS_LOG, NGINX_ACCESS_LOG, SYSLOG5424), somente os padrões DATA, GREEDYDATA ou GREEDYDATA_MULTILINE podem ser incluídos após o padrão de log comum.

Veja todos os padrões Grok compatíveis

Estrutura de um padrão Grok

Esta é a estrutura do padrão Grok compatível:


%{PATTERN_NAME:FIELD_NAME}

PATTERN_NAME: refere-se a uma expressão regular predefinida para corresponder a um tipo específico de dados. Somente padrões grok predefinidos são suportados. Não é permitido criar padrões personalizados.
FIELD_NAME: atribui um nome ao valor extraído. FIELD_NAME é opcional, mas se você não especificar esse valor, os dados extraídos serão eliminados do evento de logs transformado. Se FIELD_NAME usa notação pontilhada (por exemplo, “parent.child”), ele é considerado um caminho JSON.
Conversão de tipo: conversões de tipo explícitas não são suportadas. Use o TypeConverter processador para converter o tipo de dados de qualquer valor extraído pelo grok.

Para criar expressões de correspondência mais complexas, você pode combinar vários padrões Grok. Até 20 padrões Grok podem ser combinados para corresponder a um evento de logs. Por exemplo, essa combinação de padrões %{NUMBER:timestamp} [%{NUMBER:db} %{IP:client_ip}:%{NUMBER:client_port}] %{GREEDYDATA:data} pode ser usada para extrair campos de uma entrada de log lenta do Redis, como esta:

1629860738.123456 [0 127.0.0.1:6379] "SET" "key1" "value1"

Exemplos do Grok

Exemplo 1: use o Grok para extrair um campo de logs não estruturados

Log de amostra:


293750 server-01.internal-network.local OK "[Thread-000] token generated"

Transformador usado:


[
     {
         "grok": {
             "match": "%{NUMBER:version} %{HOSTNAME:hostname} %{NOTSPACE:status} %{QUOTEDSTRING:logMsg}"
         }
    }
]

Saída:


{
  "version": "293750",
  "hostname": "server-01.internal-network.local",
  "status": "OK",
  "logMsg": "[Thread-000] token generated"
}

Log de amostra:


23/Nov/2024:10:25:15 -0900 172.16.0.1 200

Transformador usado:


[
    {
        "grok": {
            "match": "%{HTTPDATE:timestamp} %{IPORHOST:clientip} %{NUMBER:response_status}"
        }
    }
]

Saída:


{
  "timestamp": "23/Nov/2024:10:25:15 -0900",
  "clientip": "172.16.0.1",
  "response_status": "200"
}

Exemplo 2: use o Grok em combinação com parseJSON para extrair campos de um evento de logs JSON

Log de amostra:


{
    "timestamp": "2024-11-23T16:03:12Z",
    "level": "ERROR",
    "logMsg": "GET /page.html HTTP/1.1"
}

Transformador usado:


[
     {
        "parseJSON": {}
    },
    {
         "grok": {
            "source": "logMsg",
             "match": "%{WORD:http_method} %{NOTSPACE:request} HTTP/%{NUMBER:http_version}"
         }
    }
]

Saída:


{
  "timestamp": "2024-11-23T16:03:12Z",
  "level": "ERROR",
  "logMsg": "GET /page.html HTTP/1.1",
  "http_method": "GET",
  "request": "/page.html",
  "http_version": "1.1"
}

Exemplo 3: padrão Grok com anotação pontilhada em FIELD_NAME

Log de amostra:


192.168.1.1 GET /index.html?param=value 200 1234

Transformador usado:


[
    {
        "grok": {
            "match": "%{IP:client.ip} %{WORD:method} %{URIPATHPARAM:request.uri} %{NUMBER:response.status} %{NUMBER:response.bytes}"
        }
    }
]

Saída:


{
  "client": {
    "ip": "192.168.1.1"
  },
  "method": "GET",
  "request": {
    "uri": "/index.html?param=value"
  },
  "response": {
    "status": "200",
    "bytes": "1234"
  }
}

Padrões Grok compatíveis

As tabelas a seguir listam os padrões que são compatíveis com o processador grok.

Padrões Grok gerais

Padrão Grok	Description	Limite máximo de padrões	Exemplo
USERNAME ou USER	Corresponde a um ou mais caracteres que podem incluir letras minúsculas (a-z), letras maiúsculas (A-Z), dígitos (0-9), pontos (.), sublinhados (_) ou hifens (-).	20	Entrada: `user123.name-TEST` Padrão: `%{USERNAME:name}` Saída: `{"name": "user123.name-TEST"}`
INT	Corresponde a um sinal opcional de mais ou menos seguido por um ou mais dígitos.	20	Entrada: `-456` Padrão: `%{INT:num}` Saída: `{"num": "-456"}`
BASE10NUM	Corresponde a um número inteiro ou de ponto flutuante com sinal e ponto decimal opcionais	20	Entrada: `-0.67` Padrão: `%{BASE10NUM:num}` Saída: `{"num": "-0.67"}`
BASE16NUM	Combina números decimais e hexadecimais com um sinal opcional (+ ou -) e um prefixo 0x opcional	20	Entrada: `+0xA1B2` Padrão: `%{BASE16NUM:num}` Saída: `{"num": "+0xA1B2"}`
POSINT	Corresponde a números inteiros positivos sem zeros à esquerda, consistindo em um ou mais dígitos (1-9 seguido por 0-9)	20	Entrada: `123` Padrão: `%{POSINT:num}` Saída: `{"num": "123"}`
NONNEGINT	Corresponde a qualquer número inteiro (consistindo em um ou mais dígitos de 0 a 9), incluindo zero e números com zeros à esquerda.	20	Entrada: `007` Padrão: `%{NONNEGINT:num}` Saída: `{"num": "007"}`
WORD	Corresponde a palavras inteiras compostas por um ou mais caracteres (\w), incluindo letras, dígitos e sublinhados	20	Entrada: `user_123` Padrão: `%{WORD:user}` Saída: `{"user": "user_123"}`
NOTSPACE	Corresponde a um ou mais caracteres que não sejam espaços em branco.	5	Entrada: `hello_world123` Padrão: `%{NOTSPACE:msg}` Saída: `{"msg": "hello_world123"}`
SPACE	Corresponde a zero ou mais caracteres de espaço em branco.	5	Entrada: `" "` Padrão: `%{SPACE:extra}` Saída: `{"extra": " "}`
DATA	Corresponde a qualquer caractere (exceto nova linha) zero ou mais vezes, de forma não gananciosa.	5	Entrada: `abc def ghi` Padrão: `%{DATA:x} %{DATA:y}` Saída: `{"x": "abc", "y": "def ghi"}`
GREEDYDATA	Corresponde a qualquer caractere (exceto nova linha) zero ou mais vezes, de forma gananciosa.	5	Entrada: `abc def ghi` Padrão: `%{GREEDYDATA:x} %{GREEDYDATA:y}` Saída: `{"x": "abc def", "y": "ghi"}`
GREEDYDATA_MULTILINE	Corresponde a qualquer caractere (incluindo nova linha) zero ou mais vezes, de forma gananciosa.	1	Entrada: `abc` `def` `ghi` Padrão: `%{GREEDYDATA_MULTILINE:data}` Saída: `{"data": "abc\ndef\nghi"}`
QUOTEDSTRING	Combina cadeias de caracteres entre aspas (aspas simples ou duplas) com caracteres de escape.	20	Entrada: `"Hello, world!"` Padrão: `%{QUOTEDSTRING:msg}` Saída: `{"msg": "Hello, world!"}`
UUID	Corresponde a um formato UUID padrão: 8 caracteres hexadecimais, seguidos por três grupos de 4 caracteres hexadecimais e terminando com 12 caracteres hexadecimais, todos separados por hifens.	20	Entrada: `550e8400-e29b-41d4-a716-446655440000` Padrão: `%{UUID:id}` Saída: `{"id": "550e8400-e29b-41d4-a716-446655440000"}`
URN	Corresponde à sintaxe URN (Uniform Resource Name).	20	Entrada: `urn:isbn:0451450523` Padrão: `%{URN:urn}` Saída: `{"urn": "urn:isbn:0451450523"}`

AWS padrões grok

Padrão Description Limite máximo de padrões Exemplo

Padrão	Description	Limite máximo de padrões	Exemplo
ARN	Corresponde aos nomes de recursos da AWS Amazon (ARNs), capturando a partição (`aws`,`aws-cn`, ou`aws-us-gov`), o serviço, a região, o ID da conta e até 5 identificadores hierárquicos de recursos separados por barras. Não corresponderá às informações ARNs que faltam entre dois pontos.	5	Entrada: `arn:aws:iam:us-east-1:123456789012:user/johndoe` Padrão: `%{ARN:arn}` Saída: `{"arn": "arn:aws:iam:us-east-1:123456789012:user/johndoe"}`

ARN

Corresponde aos nomes de recursos da AWS Amazon (ARNs), capturando a partição (aws,aws-cn, ouaws-us-gov), o serviço, a região, o ID da conta e até 5 identificadores hierárquicos de recursos separados por barras. Não corresponderá às informações ARNs que faltam entre dois pontos.

Entrada: arn:aws:iam:us-east-1:123456789012:user/johndoe

Padrão: %{ARN:arn}

Saída: {"arn": "arn:aws:iam:us-east-1:123456789012:user/johndoe"}

Padrões Grok de redes

Padrão Grok	Description	Limite máximo de padrões	Exemplo
CISCOMAC	Corresponde a um endereço MAC no formato hexadecimal 4-4-4.	20	Entrada: `0123.4567.89AB` Padrão: `%{CISCOMAC:MacAddress}` Saída: `{"MacAddress": "0123.4567.89AB"}`
WINDOWSMAC	Corresponde a um endereço MAC em formato hexadecimal com hifens	20	Entrada: `01-23-45-67-89-AB` Padrão: `%{WINDOWSMAC:MacAddress}` Saída: `{"MacAddress": "01-23-45-67-89-AB"}`
COMMONMAC	Corresponde a um endereço MAC em formato hexadecimal com dois pontos.	20	Entrada: `01:23:45:67:89:AB` Padrão: `%{COMMONMAC:MacAddress}` Saída: `{"MacAddress": "01:23:45:67:89:AB"}`
Mac	Corresponde a um dos padrões Grok CISCOMAC, WINDOWSMAC ou COMMONMAC	20	Entrada: `01:23:45:67:89:AB` Padrão: `%{MAC:m1}` Saída: `{"m1":"01:23:45:67:89:AB"}`
IPV6	Corresponde a IPv6 endereços, incluindo formulários compactados e endereços IPv4 mapeados IPv6 .	5	Entrada: `2001:db8:3333:4444:5555:6666:7777:8888` Padrão: `%{IPV6:ip}` Saída: `{"ip": "2001:db8:3333:4444:5555:6666:7777:8888"}`
IPV4	Corresponde a um IPv4 endereço.	20	Entrada: `192.168.0.1` Padrão: `%{IPV4:ip}` Saída: `{"ip": "192.168.0.1"}`
IP	Corresponde aos IPv6 endereços suportados por% {IPv6} ou aos IPv4 endereços compatíveis com% {IPv4}	5	Entrada: `192.168.0.1` Padrão: `%{IP:ip}` Saída: `{"ip": "192.168.0.1"}`
HOSTNAME ou HOST	Corresponde a nomes de domínio, incluindo subdomínios	5	Entrada: `server-01.internal-network.local` Padrão: `%{HOST:host}` Saída: `{"host": "server-01.internal-network.local"}`
IPORHOST	Corresponde a um nome de host ou endereço IP	5	Entrada: `2001:db8:3333:4444:5555:6666:7777:8888` Padrão: `%{IPORHOST:ip}` Saída: `{"ip": "2001:db8:3333:4444:5555:6666:7777:8888"}`
HOSTPORT	Corresponde a um endereço IP ou nome de host, conforme suportado pelo padrão %{IPORHOST} seguido por dois pontos e um número de porta, capturando a porta como “PORT” na saída.	5	Entrada: `192.168.1.1:8080` Padrão: `%{HOSTPORT:ip}` Saída: `{"ip":"192.168.1.1:8080","PORT":"8080"}`
URIHOST	Corresponde a um endereço IP ou nome de host, conforme suportado pelo padrão %{IPORHOST}, opcionalmente seguido por dois pontos e um número de porta, capturando a porta como “port”, se presente.	5	Entrada: `example.com:443 10.0.0.1` Padrão: `%{URIHOST:host} %{URIHOST:ip}` Saída: `{"host":"example.com:443","port":"443","ip":"10.0.0.1"}`

Padrões Grok de caminho

Padrão Grok	Description	Limite máximo de padrões	Exemplo
UNIXPATH	Corresponde aos caminhos de URL, incluindo potencialmente parâmetros de consulta.	20	Entrada: `/search?q=regex` Padrão: `%{UNIXPATH:path}` Saída: `{"path":"/search?q=regex"}`
WINPATH	Corresponde aos caminhos dos arquivos do Windows.	5	Entrada: `C:\Users\John\Documents\file.txt` Padrão: `%{WINPATH:path}` Saída: `{"path": "C:\\Users\\John\\Documents\\file.txt"}`
PATH	Corresponde aos caminhos de arquivo do URL ou do Windows	5	Entrada: `/search?q=regex` Padrão: `%{PATH:path}` Saída: `{"path":"/search?q=regex"}`
TTY	Combina caminhos de dispositivos Unix para terminais e pseudoterminais.	20	Entrada: `/dev/tty1` Padrão: `%{TTY:path}` Saída: `{"path":"/dev/tty1"}`
URIPROTO	Corresponde a letras, opcionalmente seguidas por um caractere de adição (+) e letras adicionais ou caracteres de adição (+)	20	Entrada: `web+transformer` Padrão: `%{URIPROTO:protocol}` Saída: `{"protocol":"web+transformer"}`
URIPATH	Corresponde ao componente de caminho de um URI	20	Entrada: `/category/sub-category/product_name` Padrão: `%{URIPATH:path}` Saída: `{"path":"/category/sub-category/product_name"}`
URIPARAM	Corresponde aos parâmetros de consulta de URL	5	Entrada: `?param1=value1&param2=value2` Padrão: `%{URIPARAM:url}` Saída: `{"url":"?param1=value1&param2=value2"}`
URIPATHPARAM	Corresponde a um caminho de URI, opcionalmente seguido por parâmetros de consulta	5	Entrada: `/category/sub-category/product?id=12345&color=red` Padrão: `%{URIPATHPARAM:path}` Saída: `{"path":"/category/sub-category/product?id=12345&color=red"}`
URI	Corresponde a um URI completo	5	Entrada: `https://user:password@example.com/path/to/resource?param1=value1&param2=value2` Padrão: `%{URI:uri}` Saída: `{"path":"https://user:password@example.com/path/to/resource?param1=value1&param2=value2"}`

Padrões Grok de data e hora

Padrão Grok	Description	Limite máximo de padrões	Exemplo
MONTH	Combina nomes completos ou abreviados dos meses em inglês como palavras inteiras	20	Entrada: `Jan` Padrão: `%{MONTH:month}` Saída: `{"month":"Jan"}` Entrada: `January` Padrão: `%{MONTH:month}` Saída: `{"month":"January"}`
MONTHNUM	Corresponde aos números dos meses de 1 a 12, com zero inicial opcional para meses de um dígito.	20	Entrada: `5` Padrão: `%{MONTHNUM:month}` Saída: `{"month":"5"}` Entrada: `05` Padrão: `%{MONTHNUM:month}` Saída: `{"month":"05"}`
MONTHNUM2	Corresponde a números de meses de dois dígitos de 01 a 12.	20	Entrada: `05` Padrão: `%{MONTHNUM2:month}` Saída: `{"month":"05"}`
MONTHDAY	Corresponde ao dia do mês de 1 a 31, com zero inicial opcional.	20	Entrada: `31` Padrão: `%{MONTHDAY:monthDay}` Saída: `{"monthDay":"31"}`
YEAR	Corresponde ao ano em dois ou quatro dígitos	20	Entrada: `2024` Padrão: `%{YEAR:year}` Saída: `{"year":"2024"}` Entrada: `24` Padrão: `%{YEAR:year}` Saída: `{"year":"24"}`
DAY	Corresponde aos nomes dos dias completos ou abreviados.	20	Entrada: `Tuesday` Padrão: `%{DAY:day}` Saída: `{"day":"Tuesday"}`
HOUR	Corresponde à hora no formato de 24 horas com um zero (0)0-23 à esquerda opcional.	20	Entrada: `22` Padrão: `%{HOUR:hour}` Saída: `{"hour":"22"}`
MINUTE	Corresponde aos minutos (00-59).	20	Entrada: `59` Padrão: `%{MINUTE:min}` Saída: `{"min":"59"}`
SECOND	Corresponde a um número que representa os segundos (0)0-60, opcionalmente seguido por um ponto decimal ou dois pontos e um ou mais dígitos para minutos fracionários	20	Entrada: `3` Padrão: `%{SECOND:second}` Saída: `{"second":"3"}` Entrada: `30.5` Padrão: `%{SECOND:minSec}` Saída: `{"minSec":"30.5"}` Entrada: `30:5` Padrão: `%{SECOND:minSec}` Saída: `{"minSec":"30:5"}`
TIME	Corresponde a um formato de tempo com horas, minutos e segundos no formato (H)H:mm:(s)s. Os segundos incluem o segundo bissexto (0)0-60.	20	Entrada: `09:45:32` Padrão: `%{TIME:time}` Saída: `{"time":"09:45:32"}`
DATE_US	Corresponde a uma data no formato (M)M/(d)d/(aa)aa ou (M)M-(d)d-(aa)aa.	20	Entrada: `11/23/2024` Padrão: `%{DATE_US:date}` Saída: `{"date":"11/23/2024"}` Entrada: `1-01-24` Padrão: `%{DATE_US:date}` Saída: `{"date":"1-01-24"}`
DATE_EU	Corresponde à data no formato (d)d/(M)M/(aa)aa, (d)d-(M)M-(aa)aa ou (d)d.(M)M.(aa)aa.	20	Entrada: `23/11/2024` Padrão: `%{DATE_EU:date}` Saída: `{"date":"23/11/2024"}` Entrada: `1.01.24` Padrão: `%{DATE_EU:date}` Saída: `{"date":"1.01.24"}`
ISO8601_FUSO HORÁRIO	Corresponde ao deslocamento UTC 'Z' ou ao deslocamento de fuso horário com dois pontos opcionais no formato [+-](H)H(:)mm.	20	Entrada: `+05:30` Padrão: `%{ISO8601_TIMEZONE:tz}` Saída: `{"tz":"+05:30"}` Entrada: `-530` Padrão: `%{ISO8601_TIMEZONE:tz}` Saída: `{"tz":"-530"}` Entrada: `Z` Padrão: `%{ISO8601_TIMEZONE:tz}` Saída: `{"tz":"Z"}`
ISO8601_SEGUNDO	Corresponde a um número que representa os segundos (0)0-60, opcionalmente seguido por um ponto decimal ou dois pontos e um ou mais dígitos por segundos fracionários	20	Entrada: `60` Padrão: `%{ISO8601_SECOND:second}` Saída: `{"second":"60"}`
CARIMBO DE DATA/HORA _ ISO8601	Corresponde ao formato de ISO8601 data e hora (yy) yy- (M) M- (d) dT (H) H:mm: ((s) s) (Z\| [+-] (H) H:mm) com segundos e fuso horário opcionais.	20	Entrada: `2023-05-15T14:30:00+05:30` Padrão: `%{TIMESTAMP_ISO8601:timestamp}` Saída: `{"timestamp":"2023-05-15T14:30:00+05:30"}` Entrada: `23-5-1T1:25+5:30` Padrão: `%{TIMESTAMP_ISO8601:timestamp}` Saída: `{"timestamp":"23-5-1T1:25+5:30"}` Entrada: `23-5-1T1:25Z` Padrão: `%{TIMESTAMP_ISO8601:timestamp}` Saída: `{"timestamp":"23-5-1T1:25Z"}`
DATE	Corresponde a uma data no formato dos EUA usando %{DATE_US} ou no formato da UE usando %{DATE_EU}	20	Entrada: `11/29/2024` Padrão: `%{DATE:date}` Saída: `{"date":"11/29/2024"}` Entrada: `29.11.2024` Padrão: `%{DATE:date}` Saída: `{"date":"29.11.2024"}`
DATESTAMP	Corresponde a %{DATE} seguido pelo padrão %{TIME}, separado por espaço ou hífen.	20	Entrada: `29-11-2024 14:30:00` Padrão: `%{DATESTAMP:dateTime}` Saída: `{"dateTime":"29-11-2024 14:30:00"}`
TZ	Corresponde às abreviações de fuso horário comuns (PST, PDT, MST, MDT, CST CDT, EST, EDT, UTC).	20	Entrada: `PDT` Padrão: `%{TZ:tz}` Saída: `{"tz":"PDT"}`
CARIMBO DE DATA_ RFC822	Corresponde à data e hora no formato: Dia MonthName (D) D (YY) YY (H) H:mm :( s) s Fuso horário	20	Entrada: `Monday Jan 5 23 1:30:00 CDT` Padrão: `%{DATESTAMP_RFC822:dateTime}` Saída: `{"dateTime":"Monday Jan 5 23 1:30:00 CDT"}` Entrada: `Mon January 15 2023 14:30:00 PST` Padrão: `%{DATESTAMP_RFC822:dateTime}` Saída: `{"dateTime":"Mon January 15 2023 14:30:00 PST"}`
CARIMBO DE DATA_ RFC2822	Corresponde ao formato RFC2822 de data e hora: Dia, (d) d MonthName (yy) yy (H) H:mm :( s) s Z\| [+-] (H) H:mm	20	Entrada: `Mon, 15 May 2023 14:30:00 +0530` Padrão: `%{DATESTAMP_RFC2822:dateTime}` Saída: `{"dateTime":"Mon, 15 May 2023 14:30:00 +0530"}` Entrada: `Monday, 15 Jan 23 14:30:00 Z` Padrão: `%{DATESTAMP_RFC2822:dateTime}` Saída: `{"dateTime":"Monday, 15 Jan 23 14:30:00 Z"}`
DATESTAMP_OTHER	Corresponde à data e hora no formato: Dia MonthName (d) d (H) H:mm :( s) s Fuso horário (yy) yy	20	Entrada: `Mon May 15 14:30:00 PST 2023` Padrão: `%{DATESTAMP_OTHER:dateTime}` Saída: `{"dateTime":"Mon May 15 14:30:00 PST 2023"}`
DATESTAMP_EVENTLOG	Corresponde ao formato compacto de data e hora sem separadores: (aa)aaMM(d)d(H)Hmm(s)s	20	Entrada: `20230515143000` Padrão: `%{DATESTAMP_EVENTLOG:dateTime}` Saída: `{"dateTime":"20230515143000"}`

Padrões Grok de log

Padrão Grok	Description	Limite máximo de padrões	Exemplo
LOGLEVEL	Corresponde aos níveis de log padrão em diferentes letras maiúsculas e abreviações, incluindo as seguintes: `Alert/ALERT`, `Trace/TRACE`, `Debug/DEBUG`, `Notice/NOTICE`, `Info/INFO`, `Warn/Warning/WARN/WARNING`, `Err/Error/ERR/ERROR`, `Crit/Critical/CRIT/CRITICAL`, `Fatal/FATAL`, `Severe/SEVERE`, `Emerg/Emergency/EMERG/EMERGENCY`	20	Entrada: `INFO` Padrão: `%{LOGLEVEL:logLevel}` Saída: `{"logLevel":"INFO"}`
HTTPDATE	Corresponde ao formato de data e hora frequentemente usado em arquivos de log. Formato: (d) MonthName d/ (yy) yy :( H) H:mm :( s) s Fuso horário: corresponde aos nomes completos ou abreviados dos meses em inglês (exemplo MonthName: “janeiro” ou “janeiro”) Fuso horário: corresponde ao padrão% {INT} grok	20	Entrada: `23/Nov/2024:14:30:00 +0640` Padrão: `%{HTTPDATE:date}` Saída: `{"date":"23/Nov/2024:14:30:00 +0640"}`
SYSLOGTIMESTAMP	Corresponde ao formato de data com MonthName (d) d (H) H:mm :( s) s MonthName: Corresponde aos nomes completos ou abreviados dos meses em inglês (exemplo: “janeiro” ou “janeiro”)	20	Entrada: `Nov 29 14:30:00` Padrão: `%{SYSLOGTIMESTAMP:dateTime}` Saída: `{"dateTime":"Nov 29 14:30:00"}`
PROG	Corresponde a um nome de programa que consiste em uma sequência de letras, dígitos, ponto, sublinhado, barra, sinal de porcentagem e caracteres de hífen.	20	Entrada: `user.profile/settings-page` Padrão: `%{PROG:program}` Saída: `{"program":"user.profile/settings-page"}`
SYSLOGPROG	Corresponde ao padrão Grok PROG opcionalmente seguido por um ID de processo entre colchetes.	20	Entrada: `user.profile/settings-page[1234]` Padrão: `%{SYSLOGPROG:programWithId}` Saída: `{"programWithId":"user.profile/settings-page[1234]","program":"user.profile/settings-page","pid":"1234"}`
SYSLOGHOST	Corresponde a um padrão %{HOST} ou %{IP}	5	Entrada: `2001:db8:3333:4444:5555:6666:7777:8888` Padrão: `%{SYSLOGHOST:ip}` Saída: `{"ip": "2001:db8:3333:4444:5555:6666:7777:8888"}`
SYSLOGFACILITY	Corresponde à prioridade do syslog no formato decimal. O valor deve estar entre colchetes angulares (<>).	20	Entrada: `<13.6>` Padrão: `%{SYSLOGFACILITY:syslog}` Saída: `{"syslog":"<13.6>","facility":"13","priority":"6"}`

Padrões Grok de log comum

Você pode usar padrões Grok personalizados predefinidos para corresponder aos formatos de log Apache, NGINX e protocolo Syslog (RFC 5424). Quando você usa esses padrões específicos, eles devem ser os primeiros em sua configuração correspondente, e nenhum outro padrão pode precedê-los. Além disso, você pode segui-los somente com exatamente um DADO. Padrão GREEDYDATA ou GREEDYDATA_MULTILINE,

Padrão grok	Description	Limite máximo de padrões
APACHE ACCESS_LOG	Corresponde aos logs de acesso do Apache	1
NGINX_ACCESS_LOG	Corresponde aos logs de acesso do NGINX	1
SYSLOG5424	Corresponde aos logs do protocolo Syslog (RFC 5424)	1

Veja a seguir exemplos válidos e inválidos do uso desses padrões comuns de formato de log.


"%{NGINX_ACCESS_LOG} %{DATA}" // Valid
"%{SYSLOG5424}%{DATA:logMsg}" // Valid
"%{APACHE_ACCESS_LOG} %{GREEDYDATA:logMsg}" // Valid
"%{APACHE_ACCESS_LOG} %{SYSLOG5424}" // Invalid (multiple common log patterns used)
"%{NGINX_ACCESS_LOG} %{NUMBER:num}" // Invalid (Only GREEDYDATA and DATA patterns are supported with common log patterns)
"%{GREEDYDATA:logMsg} %{SYSLOG5424}" // Invalid (GREEDYDATA and DATA patterns are supported only after common log patterns)

Exemplos comuns de formato de log

Exemplo de log do Apache

Log de amostra:


127.0.0.1 - - [03/Aug/2023:12:34:56 +0000] "GET /page.html HTTP/1.1" 200 1234

Transformador:


[
     {
        "grok": {
            "match": "%{APACHE_ACCESS_LOG}"
        }
    }
]

Saída:


{
    "request": "/page.html",
    "http_method": "GET",
    "status_code": 200,
    "http_version": "1.1",
    "response_size": 1234,
    "remote_host": "127.0.0.1",
    "timestamp": "2023-08-03T12:34:56Z"
}

Exemplo de log do NGINX

Log de amostra:


192.168.1.100 - Foo [03/Aug/2023:12:34:56 +0000] "GET /account/login.html HTTP/1.1" 200 42 "https://www.amazon.com/" "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.131 Safari/537.36"

Transformador:


[
     {
        "grok": {
            "match": "%{NGINX_ACCESS_LOG}"
        }
    }
]

Saída:


{
    "request": "/account/login.html",
    "referrer": "https://www.amazon.com/",
    "agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.131 Safari/537.36",
    "http_method": "GET",
    "status_code": 200,
    "auth_user": "Foo",
    "http_version": "1.1",
    "response_size": 42,
    "remote_host": "192.168.1.100",
    "timestamp": "2023-08-03T12:34:56Z"
}

Exemplo de log do protocolo Syslog (RFC 5424)

Log de amostra:


<165>1 2003-10-11T22:14:15.003Z mymachine.example.com evntslog - ID47 [exampleSDID@32473 iut="3" eventSource= "Application" eventID="1011"][examplePriority@32473 class="high"]

Transformador:


[
     {
        "grok": {
            "match": "%{SYSLOG5424}"
        }
    }
]

Saída:


{
  "pri": 165,
  "version": 1,
  "timestamp": "2003-10-11T22:14:15.003Z",
  "hostname": "mymachine.example.com",
  "app": "evntslog",
  "msg_id": "ID47",
  "structured_data": "exampleSDID@32473 iut=\"3\" eventSource= \"Application\" eventID=\"1011\"",
  "message": "[examplePriority@32473 class=\"high\"]"
}

csv

O processador csv analisa valores separados por vírgulas (CSV) dos eventos de logs em colunas.

Campo	Description	Obrigatório?	Padrão	Limites
origem	Caminho para o campo no evento de logs que será analisado	Não	`@message`	Tamanho máximo: 128 Profundidade máxima de chave aninhada: 3
delimitador	O caractere usado para separar cada coluna no evento de logs original com valores separados por vírgula	Não	`,`	Comprimento máximo: 1, a menos que o valor seja `\t` ou `\s`
quoteCharacter	Caractere usado como qualificador de texto para uma única coluna de dados	Não	`"`	Tamanho máximo: 1
colunas	Lista de nomes a serem usados para as colunas no evento de logs transformado.	Não	`[column_1, column_2 ...]`	Máximo de colunas CSV: 100 Tamanho máximo: 128 Profundidade máxima de chave aninhada: 3

Definir delimiter como \t separará cada coluna em um caractere de tabulação e \t separará cada coluna em um único caractere de espaço.

Exemplo

Suponha que parte de um evento de logs ingerido seja semelhante a:


'Akua Mansa':28:'New York: USA'

Suponha que usemos apenas o processador csv:


[
     {
        "csv": {
            "delimiter": ":",
            "quoteCharacter": "'"
        }
    }
]

O evento de logs transformado seria o seguinte.


{
  "column_1": "Akua Mansa",
  "column_2": "28",
  "column_3": "New York: USA"
}

parseKeyValue

Use o parseKeyValueprocessador para analisar um campo especificado em pares de valores-chave. Você pode personalizar o processador para analisar as informações do campo com as seguintes opções.

Campo	Description	Obrigatório?	Padrão	Limites
origem	Caminho para o campo no evento de logs que será analisado	Não	`@message`	Tamanho máximo: 128 Profundidade máxima de chave aninhada: 3
destination	O campo de destino no qual colocar os pares de valores-chave extraídos	Não		Tamanho máximo: 128
fieldDelimiter	A string delimitadora de campo que é usada entre pares de valores-chave nos eventos de logs originais	Não	`&`	Tamanho máximo: 128
keyValueDelimiter	A string delimitadora a ser usada entre a chave e o valor em cada par no evento de logs transformado	Não	`=`	Tamanho máximo: 128
nonMatchValue	Um valor a ser inserido no campo de valor no resultado, quando um par de valores-chave não é dividido com sucesso.	Não		Tamanho máximo: 128
keyPrefix	Se você quiser adicionar um prefixo a todas as chaves transformadas, especifique-o aqui.	Não		Tamanho máximo: 128
overwriteIfExists	Se o valor deve ser substituído caso a chave de destino já exista	Não	`false`

Exemplo

Observe o seguinte exemplo de evento de logs:


key1:value1!key2:value2!key3:value3!key4

Suponha que usemos a seguinte configuração de processador:


[
    {
        "parseKeyValue": {
            "destination": "new_key",
            "fieldDelimiter": "!",
            "keyValueDelimiter": ":",
            "nonMatchValue": "defaultValue",
            "keyPrefix": "parsed_"
        }
    }
]

O evento de logs transformado seria o seguinte.


{
  "new_key": {
    "parsed_key1": "value1",
    "parsed_key2": "value2",
    "parsed_key3": "value3",
    "parsed_key4": "defaultValue"
  }
}

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Excluir um log-group-level transformador

Processadores integrados para AWS registros vendidos