翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
トピックモデリングの非同期分析
ドキュメントセットでトピックを特定するには、StartTopicsDetectionJob を使用して非同期ジョブを開始します。英語またはスペイン語のドキュメントのトピックを監視できます。
開始する前に
始める前に、次の有無を確認します。
-
入出力バケット — 入出力に使用する Amazon S3 バケットを指定します。バケットは、呼び出す API と同じリージョンに存在している必要があります。
-
IAM サービスロール — 入出力バケットにアクセス許可を持つ IAM サービスロールが必要です。詳細については、「バッチ操作に必要なロールベースのアクセス許可」を参照してください。
の使用 AWS Command Line Interface
次の例は、 で StartTopicsDetectionJobオペレーションを使用する方法を示しています。 AWS CLI
例は、Unix、Linux、および macOS 用にフォーマットされています。Windows の場合は、各行末のバックスラッシュ (\) Unix 連結文字をキャレット (^) に置き換えてください。
aws comprehend start-topics-detection-job \ --number-of-topicstopics to return\ --job-name "job name" \ --regionregion\ --cli-input-json file://path to JSON input file
次の例に示すように、cli-input-json パラメータには、リクエストデータを含む JSON ファイルへのパスを指定します。
{ "InputDataConfig": { "S3Uri": "s3://input bucket/input path", "InputFormat": "ONE_DOC_PER_FILE" }, "OutputDataConfig": { "S3Uri": "s3://output bucket/output path" }, "DataAccessRoleArn": "arn:aws:iam::account ID:role/data access role" }
トピック検出ジョブの開始リクエストが成功すると、以下のようなレスポンスが返されます。
{
"JobStatus": "SUBMITTED",
"JobId": "job ID"
}
送信したトピック検出ジョブを一覧表示するには、ListEventsDetectionJobs オペレーションを使用します。このリストには、使用された入力および出力の場所、各検出ジョブのステータスに関する情報が含まれます 例は、Unix、Linux、および macOS 用にフォーマットされています。Windows の場合は、各行末のバックスラッシュ (\) Unix 連結文字をキャレット (^) に置き換えてください。
aws comprehend list-topics-detection-jobs \--region
レスポンスには、以下に類似した JSON が返されます。
{
"TopicsDetectionJobPropertiesList": [
{
"InputDataConfig": {
"S3Uri": "s3://input bucket/input path",
"InputFormat": "ONE_DOC_PER_LINE"
},
"NumberOfTopics": topics to return,
"JobId": "job ID",
"JobStatus": "COMPLETED",
"JobName": "job name",
"SubmitTime": timestamp,
"OutputDataConfig": {
"S3Uri": "s3://output bucket/output path"
},
"EndTime": timestamp
},
{
"InputDataConfig": {
"S3Uri": "s3://input bucket/input path",
"InputFormat": "ONE_DOC_PER_LINE"
},
"NumberOfTopics": topics to return,
"JobId": "job ID",
"JobStatus": "RUNNING",
"JobName": "job name",
"SubmitTime": timestamp,
"OutputDataConfig": {
"S3Uri": "s3://output bucket/output path"
}
}
]
}
DescribeTopicsDetectionJob オペレーションを使用すると、既存のジョブのステータスを取得できます。例は、Unix、Linux、および macOS 用にフォーマットされています。Windows の場合は、各行末のバックスラッシュ (\) Unix 連結文字をキャレット (^) に置き換えてください。
aws comprehend describe-topics-detection-job --job-idjob ID
レスポンスには、次のような JSON が返されます。
{
"TopicsDetectionJobProperties": {
"InputDataConfig": {
"S3Uri": "s3://input bucket/input path",
"InputFormat": "ONE_DOC_PER_LINE"
},
"NumberOfTopics": topics to return,
"JobId": "job ID",
"JobStatus": "COMPLETED",
"JobName": "job name",
"SubmitTime": timestamp,
"OutputDataConfig": {
"S3Uri": "s3://output bucket/ouput path"
},
"EndTime": timestamp
}
}
SDK for Python または の使用 SDK for .NET
トピックモデリングジョブの開始方法を示す SDK の例については、「AWS SDK または CLI StartTopicsDetectionJobで を使用する」を参照してください。