As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Análise assíncrona para modelagem de tópicos
Para determinar os tópicos em um conjunto de documentos, use o StartTopicsDetectionJobpara iniciar um trabalho assíncrono. Você pode monitorar tópicos em documentos escritos em inglês ou espanhol.
Antes de começar
Antes de começar, garanta que você tenha:
-
Buckets de entrada e saída: identifique os buckets do Amazon S3 que você deseja usar para entrada e saída. O buckets devem estar na mesma região que o API que você está chamando.
-
Perfil de serviço do IAM: você deve ter um perfil de serviço do IAM com permissão para acessar seus buckets de entrada e saída. Para obter mais informações, consulte Permissões baseadas em perfis necessárias para operações assíncronas.
Usando o AWS Command Line Interface
O exemplo a seguir demonstra o uso da StartTopicsDetectionJob operação com o AWS CLI
O exemplo é formatado para Unix, Linux e macOS. Para Windows, substitua o caractere de continuação Unix de barra invertida (\) no final de cada linha por um circunflexo (^).
aws comprehend start-topics-detection-job \ --number-of-topicstopics to return\ --job-name "job name" \ --regionregion\ --cli-input-json file://path to JSON input file
Para o parâmetro cli-input-json, você fornece um caminho para um arquivo JSON que contém os dados da solicitação, conforme exibido no exemplo a seguir.
{ "InputDataConfig": { "S3Uri": "s3://input bucket/input path", "InputFormat": "ONE_DOC_PER_FILE" }, "OutputDataConfig": { "S3Uri": "s3://output bucket/output path" }, "DataAccessRoleArn": "arn:aws:iam::account ID:role/data access role" }
Se a solicitação para iniciar o trabalho de detecção de tópicos for bem-sucedida, você receberá a seguinte resposta:
{
"JobStatus": "SUBMITTED",
"JobId": "job ID"
}
Use a ListTopicsDetectionJobsoperação para ver uma lista dos trabalhos de detecção de tópicos que você enviou. A lista inclui informações sobre os locais de entrada e saída que você usou, além do status de cada um dos trabalhos de detecção. O exemplo é formatado para Unix, Linux e macOS. Para Windows, substitua o caractere de continuação Unix de barra invertida (\) no final de cada linha por um circunflexo (^).
aws comprehend list-topics-detection-jobs \--region
Em resposta, você verá um JSON semelhante a:
{
"TopicsDetectionJobPropertiesList": [
{
"InputDataConfig": {
"S3Uri": "s3://input bucket/input path",
"InputFormat": "ONE_DOC_PER_LINE"
},
"NumberOfTopics": topics to return,
"JobId": "job ID",
"JobStatus": "COMPLETED",
"JobName": "job name",
"SubmitTime": timestamp,
"OutputDataConfig": {
"S3Uri": "s3://output bucket/output path"
},
"EndTime": timestamp
},
{
"InputDataConfig": {
"S3Uri": "s3://input bucket/input path",
"InputFormat": "ONE_DOC_PER_LINE"
},
"NumberOfTopics": topics to return,
"JobId": "job ID",
"JobStatus": "RUNNING",
"JobName": "job name",
"SubmitTime": timestamp,
"OutputDataConfig": {
"S3Uri": "s3://output bucket/output path"
}
}
]
}
Você pode usar a DescribeTopicsDetectionJoboperação para obter o status de um trabalho existente. O exemplo é formatado para Unix, Linux e macOS. Para Windows, substitua o caractere de continuação Unix de barra invertida (\) no final de cada linha por um circunflexo (^).
aws comprehend describe-topics-detection-job --job-idjob ID
Em resposta, você verá o seguinte JSON:
{
"TopicsDetectionJobProperties": {
"InputDataConfig": {
"S3Uri": "s3://input bucket/input path",
"InputFormat": "ONE_DOC_PER_LINE"
},
"NumberOfTopics": topics to return,
"JobId": "job ID",
"JobStatus": "COMPLETED",
"JobName": "job name",
"SubmitTime": timestamp,
"OutputDataConfig": {
"S3Uri": "s3://output bucket/ouput path"
},
"EndTime": timestamp
}
}
Usando o SDK para Python ou SDK para .NET
Para exemplos de SDK de como iniciar um trabalho de modelagem de tópicos, consulte Use StartTopicsDetectionJob com um AWS SDK ou CLI.