

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# 調教データのテスト
<a name="testing-the-model"></a>

モデルを調教した後、Amazon Comprehend はカスタム分類子モデルをテストします。テストデータセットを指定しないと、Amazon Comprehend は調教データの 90% を使用してモデルを調教します。調教データの 10% はテスト用に確保されます。テストデータセットを与える場合、テストデータには調教データセット内の固有のラベルごとに少なくとも 1 つの例が含まれている必要があります。

モデルをテストすると、モデルの精度推定に使用できる指標が得られます。コンソールの**分類子の詳細**ページの**分類子パフォーマンス**セクションに指標が表示されます。また、[DescribeDocumentClassifier](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_DescribeDocumentClassifier.html) 演算機能によって `Metrics` フィールドにも返されます。

次の調教データ例では、 DOCUMENTARY、DOCUMENTARY、SCIENCE\$1FICTION、DOCUMENTARY、ROMANTIC\$1COMEDY の 5 つのラベルがあります。DOCUMENTARY、SCIENCE\$1FICTION、ROMANTIC\$1COMEDY の 3 つの固有クラスがあります。


| 列 1 | 列 2 | 
| --- | --- | 
| DOCUMENTARY | 文書テキスト 1 | 
| DOCUMENTARY | 文書テキスト 2 | 
| SCIENCE\$1FICTION | 文書テキスト 3 | 
| DOCUMENTARY | 文書テキスト 4 | 
| ROMANTIC\$1COMEDY | 文書テキスト 5 | 

自動分割（Amazon Comprehend が調教データの 10% をテスト用に確保）では、調教データに含まれている特定のラベルが限られていると、テストデータセットにはそのラベルの例が全くないという結果になり得ます。たとえば、調教データセットに DOCUMENTARY クラスのインスタンスが 1000 個、SCIENCE\$1FICTION のインスタンスが 900 個、ROMANTIC\$1COMEDY クラスのインスタンスが 1 つしかない場合、テストデータセットには 100 個のドキュメンタリーインスタンスと 90 個の SCIENCE\$1FICTION インスタンスが含まれていても、ROMANTIC\$1COMEDY インスタンスはゼロになる可能性があります。

モデルの調教が終わると、調教指標で得られる情報から、モデルがニーズに十分合っているかどうかを判断できます。