

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# カスタムデータ識別子の構築
<a name="custom-data-identifiers"></a>

Amazon Macie が提供するマネージドデータ識別子を使用するだけでなく、カスタムデータ識別子を作成して使用することもできます。カスタムデータ識別子は、機密データを検出するために定義する基準のセットです。基準は、一致するテキストパターン、オプションで文字シーケンス、結果を絞り込む近接ルールを定義する正規表現 (*正規表現*) から設定されています。文字シーケンスは、正規表現に一致するテキストに近接する必要がある単語またはフレーズである「キーワード」**、または結果から除外する単語またはフレーズである「無視する単語」**になります。

カスタムデータ識別子を使用すると、組織の特定のシナリオ、知的財産、または独自のデータを反映する検出基準を定義できます。例えば、従業員 ID、顧客アカウント番号、内部データの分類などを検出できます。[機密データの検出ジョブ](discovery-jobs.md)または[機密データ自動検出](discovery-asdd.md)でこれらの識別子を使用するように設定すると、Macie が提供している[マネージドデータ識別子](managed-data-identifiers.md)を補足できます。

検出基準に加えて、カスタムデータ識別子が生成する検出結果のカスタム重要度設定を定義できます。デフォルトでは、Macie はカスタムデータ識別子が生成するすべての検出結果に**中程度の重要度を割り当てます。重要度は、識別子の検出基準に一致するテキストの出現回数によって変化しません。カスタム重要度設定を定義すると、基準に一致するテキストの出現回数に基づいて、重要度を指定できます。

**Topics**
+ [カスタムデータ識別子の設定オプション](cdis-options.md)
+ [カスタムデータ識別子の作成](cdis-create.md)
+ [カスタムデータ識別子の削除](cdis-delete.md)

# カスタムデータ識別子の設定オプション
<a name="cdis-options"></a>

カスタムデータ識別子を使用して、Amazon Simple Storage Service (Amazon S3) 内の機密データを検出するためのカスタム基準を定義できます。Amazon Macie が提供する[マネージドデータ識別子](managed-data-identifiers.md)を補足し、組織の特定のシナリオ、知的財産、または専有データを反映する機密データを検出できます。

各カスタムデータ識別子では、識別子によって生成される検出結果の検出基準と重要度設定 (オプション) を指定します。検出基準では、S3 オブジェクト内で一致させるテキストパターンを定義する正規表現を指定します。この基準では、結果を絞り込む文字シーケンスと近接ルールを指定することもできます。重要度設定では、結果に割り当てる重要度を指定します。重要度は、識別子の検出基準に一致するテキストの出現回数に基づいて指定できます。

**Topics**
+ [検出基準](#cdis-detection-criteria)
+ [検出結果の重要度設定](#cdis-finding-severity)

## 検出基準
<a name="cdis-detection-criteria"></a>

各カスタムデータ識別子を作成するときに、一致するテキストパターンを定義する正規表現 (*regex*) を指定します。また、単語やフレーズなどの文字シーケンス、および結果を絞り込む近接ルールを指定することもできます。文字シーケンスは、正規表現に一致するテキストに近接する必要がある単語またはフレーズである「キーワード」**、または結果から除外する単語またはフレーズである「無視する単語」**になります。

正規表現では、Amazon Macie は、[Perl 互換正規表現 (PCRE) ライブラリ](https://www.pcre.org/)によって提供されるパターン構文のサブセットをサポートしています。PCRE ライブラリによって提供される設定のうち、Macie は次のパターン要素をサポートしていません。
+ バックリファレンス
+ キャプチャグループ
+ 条件付きパターン
+ 埋め込みコード
+ グローバルパターンフラグ (`/i`、`/m`、および `/x` など)
+ 再帰的なパターン
+ 正と負のルックビハインドおよびルックアヘッドのゼロ幅アサーション (`?=`、`?!`、`?<=`、および `?<!` など)。

正規表現には最大 512 文字を含めることができます。

カスタムデータ識別子に効果的な正規表現パターンを作成するには、以下のヒントとレコメンデーションにも注意してください。
+ 行の先頭または末尾ではなく、ファイルの先頭または末尾にパターンが表示されることを想定している場合にのみ、アンカー (`^` または `$`) を使用します。
+ パフォーマンス上の理由から、Macie は有界リピートグループのサイズを制限します。例えば、`\d{100,1000}` は Macie ではコンパイルしません。この機能に近づくには、`\d{100,}` のようなオープンエンドリピートを使用できます。
+ パターンの一部で大文字と小文字を区別しないようにするには、`/i` フラグの代わりに `(?i)` 設定を使用します。
+ プレフィックスや交代を手動で最適化する必要はありません。たとえば、`/hello|hi|hey/` から `/h(?:ello|i|ey)/` に変更してもパフォーマンスは向上しません。
+ パフォーマンス上の理由から、Macie はワイルドカードの繰り返し数を制限します。例えば、`a*b*a*` は Macie ではコンパイルしません。

不正な形式または長時間実行される式から保護するために、Macie は、カスタムデータ識別子を作成する際、サンプルテキストのコレクションに対して正規表現パターンを自動的にテストします。正規表現に問題がある場合、Macie は問題を説明するエラーを返します。

正規表現に加えて、オプションで文字シーケンスと近接ルールを指定して結果を絞り込むこともできます。

**キーワード**  
これらは、正規表現パターンに一致するテキストの近接内にある必要がある文字シーケンスです。近接要件は、S3 オブジェクトのストレージ形式またはファイルタイプによって異なります。  
+ **構造化列データ** – Macie は、テキストが正規表現パターンに一致し、キーワードがテキストを保存するフィールドまたは列の名前にある場合、または同じフィールドまたはセル値内のキーワードの最大一致距離の先頭と範囲内にある場合、結果を含めます。これは、Microsoft Excel ワークブック、CSV ファイル、および TSV ファイルに当てはまります。
+ **構造化レコードベースのデータ** – Macie は、テキストが正規表現パターンと一致し、テキストがキーワードの最大一致距離内にある場合、結果を含めます。キーワードは、テキストを保存するフィールドまたは配列へのパス内の要素の名前に含めるか、またはテキストを保存するフィールドまたは配列内の同じ値の前にくるかその一部にすることができます。これは Apache Avro オブジェクトコンテナ、Apache Parquet ファイル、JSON ファイル、および JSON Lines ファイルに当てはまります。
+ **非構造化データ** – テキストが正規表現パターンに一致し、テキストの前にキーワードがあり、かつテキストがキーワードの最大一致距離内にある場合、Macie は結果をレポートします。これは、Adobe ポータブルドキュメント形式ファイル、Microsoft Word ドキュメント、E メールメッセージ、および CSV、JSON、JSON Lines、および TSV ファイル以外の非バイナリテキストファイルに当てはまります。これには、これらのタイプのファイルに含まれるテーブルなどの構造化データが含まれます。
最大 50 個のキーワードを指定できます。各キーワードには、3～90 の UTF-8 文字を含めることができます。キーワードでは、大文字と小文字が区別されません。

**Maximum match distance** (最大一致距離)  
これは文字ベースのキーワードの近接ルールです。Macie はこの設定を使用して、キーワードが正規表現パターンに一致するテキストの前に置かれているかどうかを判断します。この設定は、キーワード全体の終わりと正規表現パターンに一致するテキストの終わりの間に存在できる最大文字数を定義します。Macie は、テキストが次の場合、結果を含めます。  
+ 正規表現パターンに一致する
+ 少なくとも 1 つのキーワードが完了した後に出現する
+ キーワードから指定された距離内に出現する
それ以外の場合、Macie は結果からテキストを除外します。  
1～300 文字の距離を指定できます。デフォルトの距離は 50 文字です。最良の結果を得るには、この距離が正規表現が検出するように設計されているテキストの最小文字数よりも大きくなければなりません。テキストの一部のみがキーワードの最大一致距離内にある場合、Macie はそのテキストを結果に含めません。

**無視する単語**  
これらは、結果から除外する特定の文字シーケンスです。テキストが正規表現パターンと一致しても無視ワードが含まれている場合、Macie は結果にそれを含めません。  
無視する単語を 10 個まで指定できます。無視する単語には、4～90 の UTF-8 文字を含めることができます。無視する単語では、大文字と小文字が区別されます。

**注記**  
カスタムデータ識別子を作成する前に、サンプルデータを使用して検出基準をテストおよび改良することを強くお勧めします。カスタムデータ識別子は機密データ検出ジョブで使用されるため、作成後にカスタムデータ識別子を変更することはできません。これにより、実施するデータプライバシーと保護の監査または調査に関する機密データの調査結果と検出結果のイミュータブルな履歴を確実に保持できます。  
Amazon Macie コンソールまたは Amazon Macie API を使用して、検出基準をテストできます。コンソールを使用して基準をテストするには、カスタムデータ識別子の作成中に **[評価]** セクションのオプションを使用します。プログラムで基準をテストするには、Amazon Macie API の [TestCustomDataIdentifier](https://docs.aws.amazon.com/macie/latest/APIReference/custom-data-identifiers-test.html) オペレーションを使用します。を使用している場合は AWS Command Line Interface、[test-custom-data-identifier](https://docs.aws.amazon.com/cli/latest/reference/macie2/test-custom-data-identifier.html) コマンドを実行して基準をテストします。

キーワードが機密データの検索や誤検出の回避にどのように役立つかについては、以下の動画をご覧ください。




## 検出結果の重要度設定
<a name="cdis-finding-severity"></a>

カスタムデータ識別子を作成するときに、識別子が生成する機密データの検出結果のカスタム重要度設定も指定できます。デフォルトでは、Amazon Macie はカスタムデータ識別子が生成するすべての検出結果に**中程度の重要度を割り当てます。S3 オブジェクトに検出基準と一致するテキストが少なくとも 1 つ含まれている場合、Macie は検出結果に自動的に中程度**の重大度を割り当てます。

カスタム重要度設定により、検出基準に一致するテキストの出現回数に基づいて、割り当てる重要度を指定できます。この場合、**低 (最小重要度)、中**、および 高** (最大重要度) の最大 3 つの重要度レベルで頻度しきい値**を定義できます。頻度しきい値は、指定された重要度で結果を生成するために S3 オブジェクトに存在する必要がある一致の最小数です。しきい値を超える値を指定する場合、しきい値は重要度で昇順 (低 から 高 に移動) である必要があります。

例えば、次の図は 3 つの頻度しきい値を指定する重要度設定 (Macie がサポートする重要度レベルごとに 1 つ) を示しています。

![\[各重要度のレベル (低、中、高) の頻度しきい値を指定する重要度設定。\]](http://docs.aws.amazon.com/ja_jp/macie/latest/user/images/scrn-cdi-severity.png)


次のテーブルに、カスタムデータ識別子が生成する結果の重要度を示します。


| 頻度しきい値 | 重要度レベル | 結果 | 
| --- | --- | --- | 
| 1 | 低 | S3 オブジェクトに、検出基準に一致するテキストの出現が 1～49 回含まれている場合、Macie はオブジェクトで低重要度の結果を作成します。 | 
| 50 | 中 | S3 オブジェクトに、検出基準に一致するテキストの出現が 50～99 回含まれている場合、Macie はオブジェクトで中重要度の結果を作成します。 | 
| 100 | 高 | S3 オブジェクトに、検出基準に一致するテキストの出現が 100 回以上含まれている場合、Macie はオブジェクトで高重要度の結果を作成します。 | 

重要度設定を使用して、結果を作成するかどうかを指定することもできます。S3 オブジェクトに含まれる出現の回数が最小頻度しきい値よりも少ない場合、Macie は結果を作成しません。

# カスタムデータ識別子の作成
<a name="cdis-create"></a>

カスタムデータ識別子は、機密データを検出するために定義する基準のセットです。各カスタムデータ識別子を作成するときに、S3 オブジェクト内で一致するテキストパターンを定義する正規表現 (*regex*) を指定します。また、結果を絞り込む文字シーケンスと近接ルールを指定することもできます。文字シーケンスは、正規表現に一致するテキストに近接する必要がある単語またはフレーズである「キーワード」**、または結果から除外する単語またはフレーズである「無視する単語」**になります。カスタムデータ識別子を使用して、Amazon Macie が提供する[マネージドデータ識別子](managed-data-identifiers.md)を補足し、組織の特定のシナリオ、知的財産、または専有データを反映する機密データを検出できます。

例えば、多くの企業は、従業員 ID の特定の構文を持っています。そのような構文の 1 つは、従業員がフルタイム (*F*) またはパートタイム (*P*) の従業員であるかを示す大文字で、その後にハイフン (-)、その後に従業員を識別する 8 桁のシーケンスが続きます。例: フルタイム従業員の場合は *F–12345678*、パートタイム従業員の場合は *P–87654321*。この構文を使用する従業員 IDs を検出するには、 という正規表現を指定するカスタムデータ識別子を作成できます`[A-Z]-\d{8}`。分析を絞り込み、誤検出を回避するために、キーワード (`employee` と `employee ID`) と最大一致距離 (20 文字) を使用するように識別子を設定することもできます。これらの基準では、テキストがキーワード*従業員*または*従業員 ID* の後に発生し、すべてのテキストがそれらのキーワードの 1 つから 20 文字以内に発生した場合、結果には正規表現に一致するテキストが含まれます。

キーワードが機密データの検索や誤検出の回避にどのように役立つかについては、以下の動画をご覧ください。




検出基準に加えて、カスタムデータ識別子が生成する検出結果のカスタム重要度設定を任意で指定できます。重要度は、識別子の検出基準に一致するテキストの出現回数に基づいて指定できます。これらの設定を指定しない場合、Macie は識別子が生成するすべての検出結果に中程度の**重要度を自動的に割り当てます。重要度は、識別子の検出基準に一致するテキストの出現回数によって変化しません。

これらの情報およびその他の設定の詳細については、「[カスタムデータ識別子の設定オプション](cdis-options.md)」を参照してください。

**カスタムデータ識別子を作成するには**  
Amazon Macie コンソールまたは Amazon Macie API を使用して、カスタムデータ識別子を作成できます。

------
#### [ Console ]

Amazon Macie コンソールを使用してカスタムデータ識別子を作成するには、次のステップに従います。

**カスタムデータ識別子を作成するには**

1. Amazon Macie コンソール ([https://console.aws.amazon.com/macie/](https://console.aws.amazon.com/macie/)) を開きます。

1. ナビゲーションペインの **設定** の下で、**カスタムデータ識別子** を選択します。

1. **作成** を選択します。

1. **名前** では、カスタムデータ識別子の名前を入力します。名前には最大 128 文字を含めることができます。

1. **[説明]** では、カスタムデータ識別子の簡単な説明を任意で入力します。説明には最大 512 文字を含めることができます。
**注記**  
カスタムデータ識別子の名前または説明に機密データを含めないでください。Macie で実行できるアクションによっては、アカウントの他のユーザーが名前や説明にアクセスできる場合があります。

1. **正規表現** では、一致するテキストパターンを定義する正規表現 (*正規表現*) を入力します。正規表現には最大 512 文字を含めることができます。

   Macie は、[Perl 互換正規表現 (PCRE) ライブラリ](https://www.pcre.org/)によって提供されるパターン構文のサブセットをサポートしています。詳細とヒントについては、「[カスタムデータ識別子の検出基準](cdis-options.md#cdis-detection-criteria)」を参照してください。

1. **[キーワード]** では、一致する特定のテキストを定義する 50 文字のシーケンス (カンマ区切り) を入力します。

   Macie は、テキストが正規表現パターンと一致し、テキストがこれらのキーワードのいずれかの最大一致距離内にある場合にのみ、結果に出現を含めます。各キーワードには、3～90 の UTF-8 文字を含めることができます。キーワードでは、大文字と小文字が区別されません。

1. **単語を無視**する場合は、オプションで、結果から除外する特定のテキストを定義する最大 10 文字のシーケンス (カンマで区切る) を入力します。

   Macie は、テキストが正規表現パターンと一致するが、これらの無視ワードのいずれかが含まれている場合、結果から出現を除外します。無視する単語には、4～90 の UTF-8 文字を含めることができます。無視する単語では、大文字と小文字が区別されます。

1. **[最大一致距離]** では、正規表現に一致するテキストとキーワードの間に存在できる文字の最大数を入力します。

   Macie は、テキストが正規表現パターンと一致し、テキストが完全なキーワードからこの距離内にある場合にのみ、結果に出現を含めます。距離は 1〜300 文字です。デフォルトの距離は 50 文字です。

1. **[重要度]** の下で、カスタムデータ識別子が生成する機密データの検出結果の重要度を特定する方法を選択します。
   + *中*重要度をすべての結果に自動的に割り当てるには、**任意の数の一致に対して中重要度を使用する (デフォルト)** を選択します。このオプションでは、影響を受ける S3 オブジェクトに検出基準と一致するテキストが 1 つ以上含まれている場合、Macie は検出結果に自動的に重大度中を割り当てます。
   + 指定したカスタム頻度しきい値に基づいて重要度を割り当てるには、カスタム設定を使用して重要度を判断する を選択します。次に、**頻度しきい値** および **重要度レベル** オプションを使用して、選択した重要度で結果を生成するために S3 オブジェクトに存在する必要がある一致の最小数を指定します。

     Macie がサポートする重大度レベルごとに 1 つずつ、最大 3 つの頻度しきい値を指定できます: **[低] (最小の重要度)、**[中]、または [高]** (最大の重要度)。1 を超える値を指定する場合、しきい値は重要度で昇順 (*低* から *高* に移動) である必要があります。S3 オブジェクトに含まれる出現回数が最低しきい値よりも少ない場合、Macie は検出結果を作成しません。

1. (オプショナル) **タグ** で **タグを追加** を選択し、カスタムデータ識別子に割り当てるタグを 50 個まで入力します。

    *タグ* は、特定のタイプの AWS リソースを定義して割り当てるラベルです。各タグは、必要なタグキーとオプションのタグ値で設定されています。タグを使用することで、目的、所有者、環境、その他の条件など、さまざまな方法でリソースを分類および管理できます。詳細については、[Macie リソースにタグ付けする](tagging-resources.md)を参照してください。

1. (オプショナル) **評価** では、**サンプルデータ** ボックスに最大 1,000 文字を入力し、**テスト** を選択して検出条件をテストします。Macie はサンプルデータを評価し、基準に一致するテキストの出現回数をレポートします。基準を調整して最適化するために、このステップを何回でも繰り返すことができます。
**注記**  
サンプルデータを使用して検出基準をテストおよび改良することを強くお勧めします。カスタムデータ識別子は機密データ検出ジョブで使用されるため、作成後にカスタムデータ識別子を変更することはできません。これにより、機密データの検出結果と結果の不変の履歴を確保できます。  
Macie は構造化レコードを処理するときに追加のロジックを適用するため、**評価**ボックスによって返される一致数は、ジョブによって生成される結果とは異なる場合があります。

1. 完了したら、**送信** を選択します。

Macie は設定をテストし、正規表現をコンパイルできることを確認します。設定または正規表現に問題がある場合、Macie は問題を説明するエラーを表示します。問題を解決したら、カスタムデータ識別子を保存できます。

------
#### [ API ]

カスタムデータ識別子をプログラムで作成するには、Amazon Macie APIの [CreateCustomDataIdentifier](https://docs.aws.amazon.com/macie/latest/APIReference/custom-data-identifiers.html) オペレーションを使用します。または、 AWS Command Line Interface (AWS CLI) を使用している場合は、[create-custom-data-identifier](https://docs.aws.amazon.com/cli/latest/reference/macie2/create-custom-data-identifier.html) コマンドを実行します。

**注記**  
カスタムデータ識別子を作成する前に、サンプルデータを使用して検出基準をテストおよび改良することを強くお勧めします。カスタムデータ識別子は機密データ検出ジョブで使用されるため、作成後にカスタムデータ識別子を変更することはできません。これにより、機密データの検出結果と結果の不変の履歴を確保できます。  
プログラムで基準をテストするには、Amazon Macie API の [TestCustomDataIdentifier](https://docs.aws.amazon.com/macie/latest/APIReference/custom-data-identifiers-test.html) オペレーションを使用できます。このオペレーションは、検出基準を使用してサンプルデータを評価する環境を提供します。を使用している場合は AWS CLI、[test-custom-data-identifier](https://docs.aws.amazon.com/cli/latest/reference/macie2/test-custom-data-identifier.html) コマンドを実行して基準をテストできます。

カスタムデータ識別子を作成する準備ができたら、次のパラメータを使用して検出基準を定義します。
+ `regex` – 一致するテキストパターンを定義する正規表現 (*regex*) を指定します。正規表現には最大 512 文字を含めることができます。

  Macie は、[Perl 互換正規表現 (PCRE) ライブラリ](https://www.pcre.org/)によって提供されるパターン構文のサブセットをサポートしています。詳細とヒントについては、「[カスタムデータ識別子の検出基準](cdis-options.md#cdis-detection-criteria)」を参照してください。
+ `keywords` – 必要に応じて、正規表現パターンに一致するテキストの近くにある必要がある 1～50 文字のシーケンス (*キーワード*) を指定します。

  Macie は、テキストが正規表現パターンと一致し、テキストがこれらのキーワードのいずれかの最大一致距離内にある場合にのみ、結果に出現を含めます。各キーワードには、3～90 の UTF-8 文字を含めることができます。キーワードでは、大文字と小文字が区別されません。
+ `maximumMatchDistance` – オプションで、キーワードの末尾と正規表現パターンに一致するテキストの末尾の間に存在できる最大文字数を指定します。を使用している場合は AWS CLI、 `maximum-match-distance`パラメータを使用してこの値を指定します。

  Macie は、テキストが正規表現パターンと一致し、テキストが完全なキーワードからこの距離内にある場合にのみ、結果に出現を含めます。距離は 1〜300 文字です。デフォルトの距離は 50 文字です。
+ `ignoreWords` – オプションで、結果から除外する 1～10 文字のシーケンス (*単語を無視) *を指定します。を使用している場合は AWS CLI、 `ignore-words`パラメータを使用してこれらの文字シーケンスを指定します。

  Macie は、テキストが正規表現パターンと一致するが、これらの無視ワードのいずれかが含まれている場合、結果から出現を除外します。無視する単語には、4～90 の UTF-8 文字を含めることができます。無視する単語では、大文字と小文字が区別されます。

カスタムデータ識別子が生成する機密データの検出結果の重要度を指定するには、 `severityLevels`パラメータを使用するか、 を使用している場合は AWS CLI`severity-levels`パラメータを使用します。
+ すべての結果に`MEDIUM`重要度を自動的に割り当てるには、このパラメータを省略します。その後、Macie はデフォルト設定を使用します。デフォルトでは、影響を受ける S3 オブジェクトに検出基準に一致するテキストの出現が 1 つ以上含まれている場合、Macie は検出結果に`MEDIUM`重要度を割り当てます。
+ 指定した出現しきい値に基づいて重要度を割り当てるには、指定した重要度の結果を生成するために S3 オブジェクトに存在する必要がある一致の最小数を指定します。

  Macie がサポートする重要度レベルごとに 1 つずつ、最大 3 つの出現しきい値を指定できます: `LOW` (最も重要度が低い）、`MEDIUM`、または `HIGH` (最も重要度が高い）。複数の を指定する場合、しきい値は重要度別に昇順で、 から `LOW` に移行する必要があります`HIGH`。S3 オブジェクトに含まれる出現回数が最低しきい値よりも少ない場合、Macie は検出結果を作成しません。

追加のパラメータを使用して、カスタムデータ識別子の名前とタグなどのその他の設定を指定します。これらの設定に機密データを含めないでください。Macie で実行できるアクションによっては、アカウントの他のユーザーがこれらの値にアクセスできる場合があります。

リクエストを送信すると、Macie は設定をテストし、正規表現をコンパイルできることを確認します。設定または正規表現に問題がある場合、リクエストは失敗し、Macie は問題を説明するメッセージを返します。リクエストが成功すると、次のような出力を受け取ります。

```
{
    "customDataIdentifierId": "393950aa-82ea-4bdc-8f7b-e5be3example"
}
```

ここで、 は、作成されたカスタムデータ識別子の一意の識別子 (ID) `customDataIdentifierId`を指定します。

その後、カスタムデータ識別子の設定を取得して確認するには、[GetCustomDataIdentifier](https://docs.aws.amazon.com/macie/latest/APIReference/custom-data-identifiers-id.html) オペレーションを使用するか、 を使用している場合は AWS CLI get[get-custom-data-identifier](https://docs.aws.amazon.com/cli/latest/reference/macie2/get-custom-data-identifier.html) コマンドを実行します。`id` パラメータには、カスタムデータ識別子の ID を指定します。

次の例は、 を使用してカスタムデータ識別子 AWS CLI を作成する方法を示しています。この例では、特定の構文を使用し、指定されたキーワードの近くにある従業員 IDs を検出するように設計されたカスタムデータ識別子を作成します。この例では、識別子が生成する検出結果のカスタム重要度設定も定義します。

この例は Linux、macOS、または Unix 用にフォーマットされており、読みやすさを向上させるためにバックスラッシュ (\$1) の行継続文字を使用しています。

```
$ aws macie2 create-custom-data-identifier \
--name "EmployeeIDs" \
--regex "[A-Z]-\d{8}" \
--keywords '["employee","employee ID"]' \
--maximum-match-distance 20 \
--severity-levels '[{"occurrencesThreshold":1,"severity":"LOW"},{"occurrencesThreshold":50,"severity":"MEDIUM"},{"occurrencesThreshold":100,"severity":"HIGH"}]' \
--description "Detects employee IDs in proximity of a keyword." \
--tags '{"Stack":"Production"}'
```

この例は Microsoft Windows 用にフォーマットされており、読みやすさを向上させるためにキャレット (^) の行継続文字を使用しています。

```
C:\> aws macie2 create-custom-data-identifier ^
--name "EmployeeIDs" ^
--regex "[A-Z]-\d{8}" ^
--keywords "[\"employee\",\"employee ID\"]" ^
--maximum-match-distance 20 ^
--severity-levels "[{\"occurrencesThreshold\":1,\"severity\":\"LOW\"},{\"occurrencesThreshold\":50,\"severity\":\"MEDIUM\"},{\"occurrencesThreshold\":100,\"severity\":\"HIGH\"}]" ^
--description "Detects employee IDs in proximity of a keyword." ^
--tags={\"Stack\":\"Production\"}
```

コードの説明は以下のとおりです。
+ `EmployeeIDs` はカスタムデータ識別子の名前です。
+ `[A-Z]-\d{8}` は、一致するテキストパターンの正規表現です。
+ `employee` および `employee ID`は、正規表現パターンに一致するテキストの近くにある必要があるキーワードです。
+ `20` は、キーワードの末尾と正規表現パターンに一致するテキストの末尾の間に存在できる最大文字数です。
+ `description` は、カスタムデータ識別子の簡単な説明を指定します。
+ `severity-levels` は、カスタムデータ識別子が生成する検出結果の重要度のカスタム出現しきい値を定義します。1～49 件の出現`LOW`の場合、50～99 `MEDIUM` 件の出現の場合、100 件以上の出現`HIGH`の場合。
+ `Stack` は、カスタムデータ識別子に割り当てるタグのタグキーです。 `Production`は、指定されたタグキーのタグ値です。

------

カスタムデータ識別子を作成したら、それを使用するように[機密データ検出ジョブを作成および設定](discovery-jobs-create.md)したり、[機密データ自動検出の設定に追加したりできます](discovery-asdd-account-configure.md)。

# カスタムデータ識別子の削除
<a name="cdis-delete"></a>

カスタムデータ識別子を作成したら、削除できます。これを行うと、Amazon Macie はカスタムデータ識別子をソフト削除します。つまり、カスタムデータ識別子のレコードはアカウントに残りますが、削除済みとしてマークされます。カスタムデータ識別子にこのステータスがある場合、それを使用するように新しい機密データ検出ジョブを設定したり、機密データ自動検出の設定に追加したりすることはできません。さらに、Amazon Macie コンソールを使用してアクセスできなくなります。ただし、Amazon Macie API を使用して設定を取得できます。カスタムデータ識別子を削除しても、アカウントのカスタムデータ識別子のクォータにはカウントされません。

後で削除するカスタムデータ識別子を使用するように機密データ検出ジョブを設定すると、ジョブはスケジュールどおりに実行され、引き続きカスタムデータ識別子が使用されます。つまり、機密データの検出結果と機密データの検出結果の両方が、識別子の基準に一致するテキストをレポートします。これにより、実施するデータプライバシーと保護の監査または調査に関する機密データの調査結果と検出結果のイミュータブルな履歴を確実に保持できます。

同様に、後で削除するカスタムデータ識別子を使用するように機密データ自動検出を設定すると、毎日の分析サイクルが続行され、引き続きカスタムデータ識別子が使用されます。つまり、機密データの検出結果、統計、およびその他のタイプの結果は、識別子の基準に一致するテキストを引き続きレポートします。

カスタムデータ識別子を削除する前に、次の操作を実行して、Macie が以降の分析サイクルとジョブの実行中にそれを使用しないようにします。
+ 機密データの自動検出の設定を確認します。これらの設定にカスタムデータ識別子を追加した場合は、削除します。詳細については、「[機密データ自動検出設定を構成する](discovery-asdd-account-configure.md)」を参照してください。
+ ジョブインベントリを確認して、カスタムデータ識別子を使用し、将来実行される予定のジョブを特定します。ジョブでカスタムデータ識別子の使用を停止する場合は、ジョブをキャンセルできます。次に、ジョブのコピーを作成し、コピーの設定を調整し、コピーを新しいジョブとして保存します。詳細については、「[機密データ検出ジョブの管理](discovery-jobs-manage.md)」を参照してください。

また、Macie がカスタムデータ識別子に割り当てた一意の識別子 (ID) を書き留めておくことをお勧めします。後でカスタムデータ識別子の設定を確認する場合は、この ID が必要です。

上記のタスクが完了したら、カスタムデータ識別子を削除します。

**カスタムデータ識別子を削除するには**  
Amazon Macie コンソールまたは Amazon Macie API を使用して、カスタムデータ識別子を削除できます。

------
#### [ Console ]

Amazon Macie コンソールを使用してカスタムデータ識別子を削除するには、次の手順に従います。

**カスタムデータ識別子を削除するには**

1. Amazon Macie コンソール ([https://console.aws.amazon.com/macie/](https://console.aws.amazon.com/macie/)) を開きます。

1. ナビゲーションペインの **設定** の下で、**カスタムデータ識別子** を選択します。

1. 削除するカスタムデータ識別子の一意の識別子 (ID) を書き留めるには、カスタムデータ識別子の名前を選択します。表示されるページに、**ID** ボックスにこの ID が表示されます。ID を記録したら、ナビゲーションペインで**カスタムデータ識別子**を再度選択します。

1. **カスタムデータ識別子**ページで、削除するカスタムデータ識別子のチェックボックスをオンにします。

1. **Actions** メニューで、**Delete** を選択します。

1. 確認を求められたら、**OK** を選択します。

------
#### [ API ]

プログラムでカスタムデータ識別子を削除するには、Amazon Macie API の [DeleteCustomDataIdentifier](https://docs.aws.amazon.com/macie/latest/APIReference/custom-data-identifiers-id.html) オペレーションを使用します。または、 AWS Command Line Interface (AWS CLI) を使用している場合は、[delete-custom-data-identifier](https://docs.aws.amazon.com/cli/latest/reference/macie2/delete-custom-data-identifier.html) コマンドを実行します。

`id` パラメータには、削除するカスタムデータ識別子の一意の識別子 (ID) を指定します。この ID は、[ListCustomDataIdentifiers](https://docs.aws.amazon.com/macie/latest/APIReference/custom-data-identifiers-list.html) オペレーションを使用して取得できます。このオペレーションは、アカウントのカスタムデータ識別子に関する情報のサブセットを取得します。を使用している場合は AWS CLI、[list-custom-data-identifiers](https://docs.aws.amazon.com/cli/latest/reference/macie2/list-custom-data-identifiers.html) コマンドを実行してこの情報を取得できます。

次の例は、 を使用してカスタムデータ識別子を削除する方法を示しています AWS CLI。

```
$ aws macie2 delete-custom-data-identifier --id 393950aa-82ea-4bdc-8f7b-e5be3example
```

ここで、*393950aa-82ea-4bdc-8f7b-e5be3example* は削除するカスタムデータ識別子の ID です。

リクエストが成功すると、Macie は空の HTTP 200 レスポンスを返します。それ以外の場合、Macie はリクエストが失敗した理由を示す HTTP 4*xx* または 500 レスポンスを返します。

------

削除した後にカスタムデータ識別子の設定を確認するには、Amazon Macie API の [GetCustomDataIdentifier](https://docs.aws.amazon.com/macie/latest/APIReference/custom-data-identifiers-id.html) オペレーションを使用します。または、 を使用している場合は AWS CLI、[get-custom-data-identifier](https://docs.aws.amazon.com/cli/latest/reference/macie2/get-custom-data-identifier.html) コマンドを実行します。`id` パラメータには、カスタムデータ識別子の ID を指定します。カスタムデータ識別子を削除した後は、Amazon Macie コンソールを使用してその設定にアクセスすることはできません。