

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Criar identificadores de dados personalizados
<a name="custom-data-identifiers"></a>

Além de usar os identificadores de dados gerenciados fornecidos pelo Amazon Macie, você pode criar e usar identificadores de dados personalizados. Um *identificador de dados personalizado* é um conjunto de critérios que você define para detectar dados confidenciais em objetos do Amazon Simple Storage Service (Amazon S3). Os critérios consistem em uma expressão regular (*regex*) que define um padrão de texto a ser correspondido e, opcionalmente, sequências de caracteres e uma regra de proximidade que refinam os resultados. As sequências de caracteres podem ser: *palavras-chave*, que são palavras ou frases que devem estar próximas ao texto que corresponde ao regex, ou *ignorar palavras*, que são palavras ou frases para excluir dos resultados.

Com identificadores de dados personalizados, você pode definir critérios de detecção que refletem cenários, propriedade intelectual ou dados proprietários particulares da organização. Por exemplo, você pode detectar funcionários IDs, números de contas de clientes ou classificações internas de dados. Se você configurar [trabalhos de descoberta de dados confidenciais](discovery-jobs.md) ou [descoberta automatizada de dados confidenciais](discovery-asdd.md) para usar esses identificadores, poderá complementar os [identificadores de dados gerenciados](managed-data-identifiers.md) fornecidos pelo Macie.

Além dos critérios de detecção, você pode definir configurações de severidade personalizadas para as descobertas produzidas por um identificador de dados personalizado. Por padrão, o Macie atribui a severidade *Média* a todas as descobertas produzidas por um identificador de dados personalizado. A severidade não muda com base no número de ocorrências de texto que correspondem aos critérios de detecção de um identificador. Se você definir configurações de severidade personalizadas, a severidade poderá ter como base o número de ocorrências de texto que correspondem aos critérios.

**Topics**
+ [Opções de configuração para identificadores de dados personalizados](cdis-options.md)
+ [Criar um identificador de dados personalizado](cdis-create.md)
+ [Excluindo um identificador de dados personalizado](cdis-delete.md)

# Opções de configuração para identificadores de dados personalizados
<a name="cdis-options"></a>

Ao usar identificadores de dados personalizados, você pode definir critérios personalizados para detectar dados confidenciais em objetos do Amazon Simple Storage Service (Amazon S3). Você pode complementar os [identificadores de dados gerenciados](managed-data-identifiers.md) fornecidos pelo Amazon Macie e detectar dados confidenciais que refletem cenários, propriedade intelectual ou dados proprietários particulares da organização.

Cada identificador de dados personalizado especifica critérios de detecção e, como opção, configurações de severidade das descobertas produzidas pelo identificador. Os critérios de detecção especificam uma expressão regular que define um padrão de texto para corresponder em um objeto do S3. Os critérios também podem especificar sequências de caracteres e uma regra de proximidade que refina os resultados. As configurações de severidade especificam qual severidade atribuir às descobertas. A severidade pode ser baseada no número de ocorrências de texto que correspondem aos critérios de detecção do identificador.

**Topics**
+ [Critérios de detecção](#cdis-detection-criteria)
+ [Configurações de severidade das descobertas](#cdis-finding-severity)

## Critérios de detecção
<a name="cdis-detection-criteria"></a>

Ao criar um identificador de dados personalizado, você especifica uma expressão regular (*regex*) que define um padrão de texto para correspondência. Você também pode especificar sequências de caracteres, como palavras e frases, e uma regra de proximidade que refine os resultados. As sequências de caracteres podem ser: *palavras-chave*, que são palavras ou frases que devem estar próximas ao texto que corresponde ao regex, ou *ignorar palavras*, que são palavras ou frases para excluir dos resultados.

Para o regex, o Amazon Macie suporta um subconjunto da sintaxe do padrão fornecida pela [biblioteca Perl Compatible Regular Expressions (PCRE)](https://www.pcre.org/). Das estruturas fornecidas pela biblioteca PCRE, o Macie não suporta os seguintes elementos de padrão:
+ Referências anteriores
+ Capturar grupos
+ Padrões condicionais
+ Código incorporado
+ Sinalizadores de padrões globais, como `/i``/m`, e `/x`
+ Padrões recursivos
+ Afirmações positivas e negativas de largura zero de retrospectiva e prospectiva, como e `?=`, `?!`, `?<=` e `?<!`.

A regex pode conter até 512 caracteres.

Para criar um padrão regex eficaz para um identificador de dados personalizado, observe as dicas e recomendações a seguir:
+ Use âncoras (`^` ou `$`) somente se você esperar que o padrão apareça no início ou no final de um arquivo, não no início ou no final de uma linha.
+ Por motivos de desempenho, o Macie limita o tamanho dos grupos de repetição vinculados. Por exemplo, `\d{100,1000}` não compilará no Macie. Para aproximar essa funcionalidade, você pode usar uma repetição aberta, como. `\d{100,}`
+ Para tornar partes de um padrão insensíveis a maiúsculas e minúsculas, use o constructo `(?i)` em vez do sinalizador `/i`.
+ Não há necessidade de otimizar prefixos ou alternâncias manualmente. Por exemplo, mudar `/hello|hi|hey/` para `/h(?:ello|i|ey)/` não melhorará o desempenho.
+ Por motivos de desempenho, o Macie limita o número de curingas repetidos. Por exemplo, `a*b*a*` não compilará no Macie.

Para se proteger contra expressões malformadas ou de longa duração, o Macie testa automaticamente os padrões regex em uma coleção de texto de amostra quando você cria um identificador de dados personalizado. Se houver um problema com o regex, o Macie retornará um erro descrevendo o que aconteceu.

Além do regex, você pode especificar sequências de caracteres e uma regra de proximidade para refinar os resultados.

**Palavras-chave**  
Estas são sequências de caracteres específicas que devem estar próximas do texto que corresponde ao padrão regex. Os requisitos de proximidade variam de acordo com o formato de armazenamento ou o tipo de arquivo de um objeto S3:  
+ **Dados colunares estruturados** — o Macie inclui um resultado se o texto corresponder ao padrão regex e uma palavra-chave estiver no nome do campo ou coluna que armazena o texto, ou se o texto for precedido por e dentro da distância máxima de correspondência de uma palavra-chave no mesmo campo ou valor de célula. Isso vale para pastas de trabalho do Microsoft Excel, arquivos CSV e arquivos TSV.
+ **Dados estruturados baseados em registros** — o Macie inclui um resultado se o texto corresponder ao padrão regex e estiver dentro da distância máxima de correspondência de uma palavra-chave. A palavra-chave pode estar no nome de um elemento no caminho para o campo ou matriz que armazena o texto, ou pode preceder e fazer parte do mesmo valor no campo ou matriz que armazena o texto. Isso vale para contêineres de objetos Apache Avro, arquivos Apache Parquet, arquivos JSON e arquivos JSON Lines.
+ **Dados não estruturados**: o Macie inclui um resultado se o texto corresponder ao padrão regex e for precedido e estiver dentro da distância máxima de correspondência de uma palavra-chave. Isso vale para arquivos Adobe Portable Document Format, documentos do Microsoft Word, mensagens de e-mail e arquivos de texto não binários que não sejam arquivos CSV, JSON, JSON Lines e TSV. Isso inclui quaisquer dados estruturados, como tabelas, nesses tipos de arquivos.
Você pode especificar até 50 palavras-chave. Cada palavra-chave pode conter de 3 a 90 caracteres UTF-8. Palavras-chave não diferenciam maiúsculas de minúsculas.

**Distância máxima de partida**  
Essa é uma regra de proximidade baseada em caracteres para palavras-chave. O Macie usa essa configuração para determinar se uma palavra-chave precede o texto que corresponde ao padrão regex. A configuração define o número máximo de caracteres que podem existir entre o fim de uma palavra-chave completa e o fim do texto que corresponde ao padrão regex. O Macie incluirá um resultado se o texto:  
+ Corresponder ao padrão regex,
+ Ocorrer após pelo menos uma palavra-chave completa e
+ Ocorrer dentro da distância especificada da palavra-chave.
Caso contrário, Macie excluirá o texto dos resultados.  
Você pode especificar uma distância de 1 a 300 caracteres. A distância padrão é de 50 caracteres. Para obter melhores resultados, essa distância deve ser maior que o número mínimo de caracteres de texto que o regex foi projetado para detectar. Se apenas parte do texto estiver dentro da distância máxima de correspondência de uma palavra-chave, Macie não a incluirá nos resultados.

**Ignorar palavras**  
Essas são sequências de caracteres específicas a serem excluídas dos resultados. Se o texto corresponder ao padrão regex, mas contiver uma palavra ignorada, Macie não a incluirá nos resultados.  
Você pode especificar até 10 palavras ignoradas. Cada palavra a ser ignorada pode conter de 4 a 90 caracteres UFT-8. Palavras ignoradas diferenciam maiúsculas de minúsculas.

**nota**  
Antes de criar um identificador de dados personalizado, é altamente recomendável testar e refinar seus critérios de detecção com dados de amostra. Como os identificadores de dados personalizados são usados por trabalhos confidenciais de descoberta de dados, você não pode alterar um identificador de dados personalizado depois de criá-lo. Isso ajuda a garantir que você tenha um histórico imutável de descobertas de dados sigilosos e resultados de descoberta para auditorias de privacidade de dados e proteção de dados ou investigações que você realiza.  
Você pode testar os critérios de detecção usando o console do Amazon Macie ou a API do Amazon Macie. Para testar os critérios usando o console, use as opções na seção **Avaliar** ao criar o identificador de dados personalizado. Para testar os critérios de forma programática, use a [TestCustomDataIdentifier](https://docs.aws.amazon.com/macie/latest/APIReference/custom-data-identifiers-test.html)operação da API Amazon Macie. Se você estiver usando o AWS Command Line Interface, execute o [test-custom-data-identifier](https://docs.aws.amazon.com/cli/latest/reference/macie2/test-custom-data-identifier.html)comando para testar os critérios.

Para ver uma demonstração de como as palavras-chave podem ajudar você a encontrar dados confidenciais e evitar falsos positivos, assista ao vídeo a seguir:




## Configurações de severidade das descobertas
<a name="cdis-finding-severity"></a>

Ao criar um identificador de dados personalizado, você também pode especificar configurações de severidade personalizadas para descobertas de dados confidenciais produzidas pelo identificador. Por padrão, o Amazon Macie atribui a severidade *Média* a todas as descobertas produzidas por um identificador de dados personalizado. O Macie atribuirá de forma automática a severidade *Média* à descoberta resultante se um objeto S3 contiver pelo menos uma ocorrência de texto que corresponda aos critérios de detecção.

Com as configurações de severidade personalizadas, você especifica qual severidade atribuir com base no número de ocorrências de texto que correspondem aos critérios de detecção. Você pode definir *limites de ocorrências* para até três níveis de severidade: *Baixo* (menos grave), *Médio* e *Alto* (mais grave). Um *limite de ocorrências* é o número mínimo de correspondências que devem existir em um objeto do S3 para produzir uma descoberta com a gravidade especificada. Se você especificar mais de um limite, os limites deverão estar em ordem crescente por severidade, passando de *Baixo* para *Alto*.

Por exemplo, a imagem a seguir mostra as configurações de severidade que especificam três limites de ocorrências, um para cada nível suportado pelo Macie.

![\[Configurações de severidade que especificam limites de ocorrências para os níveis de severidade Baixo, Médio e Alto.\]](http://docs.aws.amazon.com/pt_br/macie/latest/user/images/scrn-cdi-severity.png)


A tabela a seguir indica a gravidade das descobertas que o identificador de dados personalizado produz.


| Limite de ocorrências | Nível de gravidade | Resultado | 
| --- | --- | --- | 
| 1 | Baixo | Se um objeto do S3 contiver de 1 a 49 ocorrências de texto que correspondam aos critérios de detecção, a gravidade da descoberta resultante será Baixa.  | 
| 50 | Médio | Se um objeto do S3 contiver de 50 a 99 ocorrências de texto que correspondam aos critérios de detecção, a gravidade da descoberta resultante será Média. | 
| 100 | Alta | Se um objeto do S3 contiver 100 ou mais ocorrências de texto que correspondam aos critérios de detecção, a gravidade da descoberta resultante será Alta. | 

Você também pode usar as configurações de gravidade para especificar se deseja criar uma descoberta. Se um objeto do S3 contiver menos ocorrências do que o limite mais baixo de ocorrências, o Macie não criará uma descoberta.

# Criar um identificador de dados personalizado
<a name="cdis-create"></a>

Um *identificador de dados personalizado* é um conjunto de critérios que você define para detectar dados confidenciais em objetos do Amazon Simple Storage Service (Amazon S3). Ao criar um identificador de dados personalizado, você especifica uma expressão regular (*regex*) que define um padrão de texto para corresponder a um objeto S3. Você também pode especificar sequências de caracteres e uma regra de proximidade que refina os resultados. As sequências de caracteres podem ser: *palavras-chave*, que são palavras ou frases que devem estar próximas ao texto que corresponde ao regex, ou *ignorar palavras*, que são palavras ou frases para excluir dos resultados. Ao usar identificadores de dados personalizados, você pode complementar os [identificadores de dados gerenciados](managed-data-identifiers.md) fornecidos pelo Amazon Macie e detectar dados confidenciais que refletem cenários, propriedade intelectual ou dados proprietários particulares da organização.

Por exemplo, muitas empresas têm uma sintaxe específica para funcionários IDs. Uma dessas sintaxes pode ser: uma letra maiúscula que indica se o funcionário é funcionário em tempo integral (*F*) ou meio período (*P*), seguida por um hífen (-), seguido por uma sequência de oito dígitos que identifica o funcionário. *Os exemplos são: *F—12345678* para um funcionário em tempo integral e P—87654321 para um funcionário em tempo parcial.* Para detectar funcionários IDs que usam essa sintaxe, você pode criar um identificador de dados personalizado que especifique o seguinte regex:. `[A-Z]-\d{8}` Para refinar a análise e evitar falsos positivos, você também pode configurar o identificador para usar palavras-chave (`employee` e `employee ID`) e uma distância máxima de correspondência de 20 caracteres. Com esses critérios, os resultados incluem texto que corresponda ao regex se o texto ocorrer após a palavra-chave *funcionário* *ou ID* do funcionário e todo o texto ocorrer dentro de 20 caracteres de uma dessas palavras-chave.

Para ver uma demonstração de como as palavras-chave podem ajudar você a encontrar dados confidenciais e evitar falsos positivos, assista ao vídeo a seguir:




Além dos critérios de detecção, você pode especificar configurações de severidade personalizadas para as descobertas produzidas por um identificador de dados personalizado. A severidade pode ser baseada no número de ocorrências de texto que correspondem aos critérios de detecção do identificador. Se você não especificar essas configurações, o Macie atribuirá automaticamente a severidade *Média* a todas as descobertas produzidas pelo identificador. A severidade não muda com base no número de ocorrências de texto que correspondem aos critérios de detecção do identificador.

Para obter informações detalhadas sobre estas e outras configurações, consulte [Opções de configuração para identificadores de dados personalizados](cdis-options.md).

**Para criar um identificador de dados personalizado**  
Você pode criar um identificador de dados personalizado usando o console do Amazon Macie ou a API do Amazon Macie.

------
#### [ Console ]

Siga estas etapas para criar um identificador de dados personalizado usando o console do Amazon Macie.

**Para criar um identificador de dados personalizado**

1. Abra o console do Amazon Macie em. [https://console.aws.amazon.com/macie/](https://console.aws.amazon.com/macie/)

1. No painel de navegação, em **Configurações**, escolha **Identificadores de dados personalizados**.

1. Escolha **Criar**.

1. Para **Nome** insira um nome para o identificador de dados personalizado. Um nome pode conter até 128 caracteres.

1. Em **Descrição**, você pode inserir uma breve descrição do identificador de dados personalizado. A descrição pode conter até 512 caracteres.
**nota**  
Evite incluir dados confidenciais no nome ou na descrição de um identificador de dados personalizado. Outros usuários da sua conta podem acessar o nome ou a descrição, dependendo das ações que eles estão autorizados a realizar no Macie.

1. Para **Expressão regular**, insira a expressão regular (*regex*) que define o padrão de texto a ser correspondido. Um nome regex pode conter até 512 caracteres.

   O Macie suporta um subconjunto da sintaxe do padrão fornecida pela [biblioteca Perl Compatible Regular Expressions (PCRE)](https://www.pcre.org/). Para obter outros detalhes e dicas, consulte [Critérios de detecção para identificadores de dados personalizados](cdis-options.md#cdis-detection-criteria).

1. Em **Palavras-chave**, você pode inserir até 50 sequências de caracteres (separadas por vírgulas) para definir um texto específico que deve estar próximo ao texto que corresponde ao padrão regex.

   O Macie inclui uma ocorrência nos resultados somente se o texto corresponder ao padrão regex e estiver dentro da distância máxima de correspondência de uma dessas palavras-chave. Cada palavra-chave pode conter de 3 a 90 caracteres UTF-8. Palavras-chave não diferenciam maiúsculas de minúsculas.

1. **Em Ignorar palavras**, opcionalmente, insira até 10 sequências de caracteres (separadas por vírgulas) que definam um texto específico a ser excluído dos resultados.

   O Macie exclui uma ocorrência dos resultados se o texto corresponder ao padrão regex, mas contiver uma dessas palavras ignoradas. Cada palavra a ser ignorada pode conter de 4 a 90 caracteres UFT-8. Palavras ignoradas diferenciam maiúsculas de minúsculas.

1. Em **Distância máxima de correspondência**, você pode inserir o número máximo de caracteres que pode existir entre o final de uma palavra-chave e o final do texto que corresponde ao padrão regex.

   O Macie inclui uma ocorrência nos resultados somente se o texto corresponder ao padrão regex e o texto estiver dentro dessa distância de uma palavra-chave completa. A distância pode ser de 1 a 300 caracteres. A distância padrão é de 50 caracteres.

1. Em **Severidade**, escolha como determinar a severidade das descobertas de dados confidenciais produzidas pelo identificador de dados personalizado:
   + Para atribuir automaticamente a gravidade *Média* a todas as descobertas, escolha **Usar gravidade Média para qualquer número de correspondências (padrão)**. Com essa opção, o Macie atribui automaticamente a gravidade*Média* a uma descoberta se o objeto S3 afetado contiver uma ou mais ocorrências de texto que correspondam aos critérios de detecção.
   + Para atribuir gravidade com base nos limites de ocorrências que você especificar, escolha **Usar configurações personalizadas para determinar a gravidade**. Em seguida, use as opções **Limite de ocorrências** e **Nível de severidade** para especificar o número mínimo de correspondências que devem existir em um objeto do S3 para produzir uma descoberta com uma severidade selecionada.

     Você pode especificar até três limites de ocorrências, um para cada nível de severidade suportado pelo Macie: *Baixo* (menos grave), *Médio* ou *Alto* (mais grave). Se você especificar mais de um, os limites deverão estar em ordem crescente por gravidade, de *Baixo* a *Alto*. Se um objeto do S3 contiver menos ocorrências do que o limite mais baixo, o Macie não criará uma descoberta.

1. (Opcional) Em **Tags**, escolha **Adicionar tag** e, em seguida, insira até 50 tags para atribuir ao trabalho.

   Uma *tag* é um rótulo que você define e atribui a determinados tipos de AWS recursos. Cada tag consiste em uma chave de tag necessária e um valor de tag opcional. As tags podem ajudá-lo a identificar, categorizar e gerenciar recursos de diferentes maneiras, como por finalidade, proprietário, ambiente ou outros critérios. Para saber mais, consulte [Marcar recursos do Macie](tagging-resources.md).

1. (Opcional) Em **Avaliar**, insira até 1.000 caracteres na caixa **Dados da amostra** e escolha **Testar** para testar os critérios de detecção. Macie avalia os dados da amostra e relata o número de ocorrências de texto que correspondem aos critérios. Você pode repetir essa etapa quantas vezes quiser para refinar e otimizar os critérios.
**nota**  
É altamente recomendável que você teste e refine os critérios de detecção com dados de amostra. Como os identificadores de dados personalizados são usados por trabalhos confidenciais de descoberta de dados, você não pode alterar um identificador de dados personalizado depois de criá-lo. Isso ajuda a garantir que você tenha um histórico imutável de descobertas de dados sensíveis e resultados de descoberta.  
Como o Macie aplica lógica adicional ao processar registros estruturados, a contagem de correspondências retornada pela caixa **Avaliar** pode diferir, em certos casos, dos resultados produzidos pelos trabalhos.

1. Quando terminar, escolha **Enviar**.

O Macie testa as configurações e verifica se pode compilar o regex. Se houver um problema com uma configuração ou com o regex, o Macie exibirá um erro descrevendo o que aconteceu. Depois de resolver qualquer problema, você pode salvar o identificador de dados personalizado.

------
#### [ API ]

Para criar um identificador de dados personalizado de forma programática, use a [CreateCustomDataIdentifier](https://docs.aws.amazon.com/macie/latest/APIReference/custom-data-identifiers.html)operação da API Amazon Macie. Ou, se você estiver usando o AWS Command Line Interface (AWS CLI), execute o [create-custom-data-identifier](https://docs.aws.amazon.com/cli/latest/reference/macie2/create-custom-data-identifier.html)comando.

**nota**  
Antes de criar um identificador de dados personalizado, é altamente recomendável testar e refinar seus critérios de detecção com dados de amostra. Como os identificadores de dados personalizados são usados por trabalhos confidenciais de descoberta de dados, você não pode alterar um identificador de dados personalizado depois de criá-lo. Isso ajuda a garantir que você tenha um histórico imutável de descobertas de dados sensíveis e resultados de descoberta.  
Para testar os critérios de forma programática, você pode usar a [TestCustomDataIdentifier](https://docs.aws.amazon.com/macie/latest/APIReference/custom-data-identifiers-test.html)operação da API Amazon Macie. Essa operação fornece um ambiente para avaliar dados de amostra com critérios de detecção. Se você estiver usando o AWS CLI, você pode executar o [test-custom-data-identifier](https://docs.aws.amazon.com/cli/latest/reference/macie2/test-custom-data-identifier.html)comando para testar os critérios.

Quando você estiver pronto para criar o identificador de dados personalizado, use os seguintes parâmetros para definir seus critérios de detecção:
+ `regex`— Especifique a expressão regular (*regex*) que define o padrão de texto a ser correspondente. A regex pode conter até 512 caracteres.

  O Macie suporta um subconjunto da sintaxe do padrão fornecida pela [biblioteca Perl Compatible Regular Expressions (PCRE)](https://www.pcre.org/). Para obter outros detalhes e dicas, consulte [Critérios de detecção para identificadores de dados personalizados](cdis-options.md#cdis-detection-criteria).
+ `keywords`— Opcionalmente, especifique sequências de 1 a 50 caracteres (*palavras-chave*) que devem estar próximas ao texto que corresponda ao padrão regex.

  O Macie inclui uma ocorrência nos resultados somente se o texto corresponder ao padrão regex e estiver dentro da distância máxima de correspondência de uma dessas palavras-chave. Cada palavra-chave pode conter de 3 a 90 caracteres UTF-8. Palavras-chave não diferenciam maiúsculas de minúsculas.
+ `maximumMatchDistance`— Opcionalmente, especifique o número máximo de caracteres que podem existir entre o final de uma palavra-chave e o final do texto que corresponda ao padrão regex. Se você estiver usando o AWS CLI, use o `maximum-match-distance` parâmetro para especificar esse valor.

  O Macie inclui uma ocorrência nos resultados somente se o texto corresponder ao padrão regex e o texto estiver dentro dessa distância de uma palavra-chave completa. A distância pode ser de 1 a 300 caracteres. A distância padrão é de 50 caracteres.
+ `ignoreWords`— Opcionalmente, especifique sequências de 1 a 10 caracteres (*ignore palavras*) para excluir dos resultados. Se você estiver usando o AWS CLI, use o `ignore-words` parâmetro para especificar essas sequências de caracteres.

  O Macie exclui uma ocorrência dos resultados se o texto corresponder ao padrão regex, mas contiver uma dessas palavras ignoradas. Cada palavra a ser ignorada pode conter de 4 a 90 caracteres UFT-8. Palavras ignoradas diferenciam maiúsculas de minúsculas.

Para especificar a gravidade das descobertas de dados confidenciais que o identificador de dados personalizado produz, use o `severityLevels` parâmetro ou, se estiver usando o AWS CLI, o `severity-levels` parâmetro:
+ Para atribuir automaticamente a `MEDIUM` severidade a todas as descobertas, omita esse parâmetro. Em seguida, Macie usa a configuração padrão. Por padrão, o Macie atribui a `MEDIUM` severidade a uma descoberta se o objeto do S3 afetado contiver uma ou mais ocorrências de texto que correspondam aos critérios de detecção.
+ Para atribuir severidade com base nos limites de ocorrências que você especifica, especifique o número mínimo de correspondências que devem existir em um objeto do S3 para produzir uma descoberta com uma severidade especificada.

  Você pode especificar até três limites de ocorrências, um para cada nível de severidade suportado pelo Macie: `LOW` (menos grave) ou `HIGH` (mais grave). `MEDIUM` Se você especificar mais de um, os limites deverão estar em ordem crescente por severidade, passando de `LOW` para. `HIGH` Se um objeto do S3 contiver menos ocorrências do que o limite mais baixo, o Macie não criará uma descoberta.

Use parâmetros adicionais para especificar um nome e outras configurações, como tags, para o identificador de dados personalizado. Evite incluir dados confidenciais nessas configurações. Outros usuários da sua conta podem acessar esses valores, dependendo das ações que eles estão autorizados a realizar no Macie.

Quando você envia sua solicitação, o Macie testa as configurações e verifica se ele pode compilar o regex. Se houver um problema com uma configuração ou com o regex, a solicitação falhará e o Macie retornará uma mensagem descrevendo o problema. Se a solicitação for bem-sucedida, você receberá uma saída semelhante à seguinte:

```
{
    "customDataIdentifierId": "393950aa-82ea-4bdc-8f7b-e5be3example"
}
```

Onde `customDataIdentifierId` especifica o identificador exclusivo (ID) para o identificador de dados personalizado que foi criado.

Para recuperar e revisar posteriormente as configurações do identificador de dados personalizado, use a [GetCustomDataIdentifier](https://docs.aws.amazon.com/macie/latest/APIReference/custom-data-identifiers-id.html)operação ou, se estiver usando o AWS CLI, execute o [get-custom-data-identifier](https://docs.aws.amazon.com/cli/latest/reference/macie2/get-custom-data-identifier.html)comando. Para o `id` parâmetro, especifique o ID do identificador de dados personalizado.

Os exemplos a seguir mostram como usar o AWS CLI para criar um identificador de dados personalizado. Os exemplos criam um identificador de dados personalizado projetado para detectar funcionários IDs que usam uma sintaxe específica e estão próximos de uma palavra-chave específica. Os exemplos também definem configurações de severidade personalizadas para as descobertas que o identificador produz.

Este exemplo está formatado para Linux, macOS ou Unix e usa o caractere de continuação de linha “barra invertida (\$1)” para melhorar a legibilidade.

```
$ aws macie2 create-custom-data-identifier \
--name "EmployeeIDs" \
--regex "[A-Z]-\d{8}" \
--keywords '["employee","employee ID"]' \
--maximum-match-distance 20 \
--severity-levels '[{"occurrencesThreshold":1,"severity":"LOW"},{"occurrencesThreshold":50,"severity":"MEDIUM"},{"occurrencesThreshold":100,"severity":"HIGH"}]' \
--description "Detects employee IDs in proximity of a keyword." \
--tags '{"Stack":"Production"}'
```

Este exemplo foi formatado para Microsoft Windows e usa o caractere de continuação de linha circunflexo (^) para melhorar a legibilidade.

```
C:\> aws macie2 create-custom-data-identifier ^
--name "EmployeeIDs" ^
--regex "[A-Z]-\d{8}" ^
--keywords "[\"employee\",\"employee ID\"]" ^
--maximum-match-distance 20 ^
--severity-levels "[{\"occurrencesThreshold\":1,\"severity\":\"LOW\"},{\"occurrencesThreshold\":50,\"severity\":\"MEDIUM\"},{\"occurrencesThreshold\":100,\"severity\":\"HIGH\"}]" ^
--description "Detects employee IDs in proximity of a keyword." ^
--tags={\"Stack\":\"Production\"}
```

Em que:
+ `EmployeeIDs`é o nome do identificador de dados personalizado.
+ `[A-Z]-\d{8}`é a expressão regular para a correspondência do padrão de texto.
+ `employee`e `employee ID` são palavras-chave que devem estar próximas ao texto que corresponda ao padrão regex.
+ `20`é o número máximo de caracteres que podem existir entre o final de uma palavra-chave e o final do texto que corresponde ao padrão regex.
+ `description`especifica uma breve descrição do identificador de dados personalizado.
+ `severity-levels`define limites de ocorrências personalizados para a severidade das descobertas que o identificador de dados personalizado produz: `LOW` para 1 a 49 ocorrências; para 50 a 99 ocorrências; e `MEDIUM` para 100 ou mais ocorrências. `HIGH`
+ `Stack`é a chave de tag da tag a ser atribuída ao identificador de dados personalizado. `Production`é o valor da tag para a chave de tag especificada.

------

Depois de criar o identificador de dados personalizado, você pode [criar e configurar trabalhos de descoberta de dados confidenciais](discovery-jobs-create.md) para usá-lo ou [adicioná-lo às suas configurações para descoberta automática de dados confidenciais](discovery-asdd-account-configure.md).

# Excluindo um identificador de dados personalizado
<a name="cdis-delete"></a>

Depois de criar um identificador de dados personalizado, você pode excluí-lo. Se você fizer isso, o Amazon Macie excluirá temporariamente o identificador de dados personalizado. Isso significa que um registro do identificador de dados personalizado permanece na sua conta, mas está marcado como excluído. Se um identificador de dados personalizado tiver esse status, você não poderá configurar novos trabalhos de descoberta de dados confidenciais para usá-lo ou adicioná-lo às suas configurações para descoberta automática de dados confidenciais. Além disso, você não pode mais acessá-lo usando o console do Amazon Macie. No entanto, você pode recuperar suas configurações usando a API do Amazon Macie. Se você excluir um identificador de dados personalizado, ele não será contabilizado na cota de identificadores de dados personalizados da sua conta.

Se você configurar um trabalho de descoberta de dados confidenciais para usar um identificador de dados personalizado que você exclui posteriormente, o trabalho será executado conforme programado e continuará usando o identificador de dados personalizado. Isso significa que os resultados do seu trabalho, tanto as descobertas de dados confidenciais quanto os resultados da descoberta de dados confidenciais, reportarão um texto que corresponda aos critérios do identificador. Isso ajuda a garantir que você tenha um histórico imutável de descobertas de dados sigilosos e resultados de descoberta para auditorias de privacidade de dados e proteção de dados ou investigações que você realiza.

Da mesma forma, se você configurar a descoberta automática de dados confidenciais para usar um identificador de dados personalizado que você exclui posteriormente, os ciclos diários de análise continuarão e continuarão usando o identificador de dados personalizado. Isso significa que descobertas de dados confidenciais, estatísticas e outros tipos de resultados continuarão a relatar textos que correspondam aos critérios do identificador.

Antes de excluir um identificador de dados personalizado, faça o seguinte para evitar que o Macie o use durante ciclos de análise e execuções de tarefas subsequentes:
+ Verifique suas configurações para a descoberta automática de dados confidenciais. Se você adicionou o identificador de dados personalizado a essas configurações, remova-o. Para obter mais informações, consulte [Definir configurações da descoberta automatizada de dados confidenciais](discovery-asdd-account-configure.md).
+ Revise seu inventário de trabalhos para identificar trabalhos que usam o identificador de dados personalizado e estão programados para serem executados no futuro. Se você quiser que um trabalho pare de usar o identificador de dados personalizado, você pode cancelar o trabalho. Em seguida, crie uma cópia da tarefa, ajuste as configurações da cópia e salve a cópia como uma nova tarefa. Para obter mais informações, consulte [Gerenciar trabalhos de descoberta de dados confidenciais](discovery-jobs-manage.md).

Também é uma boa ideia observar o identificador exclusivo (ID) que Macie atribuiu ao identificador de dados personalizado. Você precisará desse ID se quiser revisar posteriormente as configurações do identificador de dados personalizado.

Depois de concluir as tarefas anteriores, exclua o identificador de dados personalizado.

**Para excluir um identificador de dados personalizado**  
Você pode excluir um identificador de dados personalizado usando o console do Amazon Macie ou a API do Amazon Macie.

------
#### [ Console ]

Siga estas etapas para excluir um identificador de dados personalizado usando o console do Amazon Macie.

**Para excluir um identificador de dados personalizado**

1. Abra o console do Amazon Macie em. [https://console.aws.amazon.com/macie/](https://console.aws.amazon.com/macie/)

1. No painel de navegação, em **Configurações**, escolha **Identificadores de dados personalizados**.

1. Para observar o identificador exclusivo (ID) do identificador de dados personalizado que você deseja excluir, escolha o nome do identificador de dados personalizado. Na página exibida, a caixa **ID** exibe essa ID. Depois de anotar a ID, escolha **Identificadores de dados personalizados** no painel de navegação novamente.

1. Na página **Identificadores de dados personalizados**, marque a caixa de seleção do identificador de dados personalizado a ser excluído.

1. No menu **Ações**, escolha **Excluir**.

1. Quando a confirmação for solicitada, escolha **OK.**

------
#### [ API ]

Para excluir programaticamente um identificador de dados personalizado, use a [DeleteCustomDataIdentifier](https://docs.aws.amazon.com/macie/latest/APIReference/custom-data-identifiers-id.html)operação da API Amazon Macie. Ou, se você estiver usando o AWS Command Line Interface (AWS CLI), execute o [delete-custom-data-identifier](https://docs.aws.amazon.com/cli/latest/reference/macie2/delete-custom-data-identifier.html)comando.

Para o `id` parâmetro, especifique o identificador exclusivo (ID) do identificador de dados personalizado que você deseja excluir. Você pode obter esse ID usando a [ListCustomDataIdentifiers](https://docs.aws.amazon.com/macie/latest/APIReference/custom-data-identifiers-list.html)operação. Essa operação recupera um subconjunto de informações sobre os identificadores de dados personalizados da sua conta. Se você estiver usando o AWS CLI, você pode executar o [list-custom-data-identifiers](https://docs.aws.amazon.com/cli/latest/reference/macie2/list-custom-data-identifiers.html)comando para recuperar essas informações.

O exemplo a seguir mostra como excluir um identificador de dados personalizado usando AWS CLI o.

```
$ aws macie2 delete-custom-data-identifier --id 393950aa-82ea-4bdc-8f7b-e5be3example
```

Onde *393950aa-82ea-4bdc-8f7b-e5be3example* está o ID do identificador de dados personalizado a ser excluído.

Se a solicitação for bem-sucedida, o Macie retornará uma resposta HTTP 200 vazia. Caso contrário, o Macie retornará uma resposta HTTP 4 *xx* ou 500 indicando por que a solicitação falhou.

------

Para revisar as configurações de um identificador de dados personalizado depois de excluí-lo, use a [GetCustomDataIdentifier](https://docs.aws.amazon.com/macie/latest/APIReference/custom-data-identifiers-id.html)operação da API Amazon Macie. Ou, se você estiver usando o AWS CLI, execute o [get-custom-data-identifier](https://docs.aws.amazon.com/cli/latest/reference/macie2/get-custom-data-identifier.html)comando. Para o `id` parâmetro, especifique o ID do identificador de dados personalizado. Depois de excluir um identificador de dados personalizado, você não poderá acessar suas configurações usando o console do Amazon Macie.