

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# 사용자 지정 개체 감지 작업 시작(API)
<a name="detecting-cer-async-api"></a>

API를 사용하여 사용자 지정 개체 인식을 위한 비동기 분석 작업을 시작하고 모니터링할 수 있습니다.

[StartEntitiesDetectionJob](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_StartEntitiesDetectionJob.html) 작업으로 사용자 지정 개체 감지 작업을 시작하려면 학습된 모델의 Amazon 리소스 이름(ARN)인 EntityRecognizerArn을 제공합니다. 이 ARN은 [CreateEntityRecognizer](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_CreateEntityRecognizer.html) 작업에 대한 응답에서 찾을 수 있습니다.

**Topics**
+ [를 사용하여 사용자 지정 개체 감지 AWS Command Line Interface](#detecting-cer-async-api-cli)
+ [를 사용하여 사용자 지정 개체 감지 AWS SDK for Java](#detecting-cer-async-api-java)
+ [를 사용하여 사용자 지정 개체 감지 AWS SDK for Python (Boto3)](#detecting-cer-async-api-python)
+ [PDF 파일에 대한 API 작업 우선 지정](#detecting-cer-api-pdf)

## 를 사용하여 사용자 지정 개체 감지 AWS Command Line Interface
<a name="detecting-cer-async-api-cli"></a>

다음의 Unix, Linux, macOS용 예제를 사용하십시오. Windows의 경우 각 줄의 끝에 있는 백슬래시(\$1) Unix 연속 문자를 캐럿(^)으로 바꿉니다. 문서 집합에서 사용자 지정 개체를 감지하려면 다음 요청 구문을 사용하십시오.

```
aws comprehend start-entities-detection-job \
     --entity-recognizer-arn "arn:aws:comprehend:region:account number:entity-recognizer/test-6" \
     --job-name infer-1 \
     --data-access-role-arn "arn:aws:iam::account number:role/service-role/AmazonComprehendServiceRole-role" \
     --language-code en \
     --input-data-config "S3Uri=s3://Bucket Name/Bucket Path" \
     --output-data-config "S3Uri=s3://Bucket Name/Bucket Path/" \
     --region region
```

Amazon Comprehend는 `JobID` 및 `JobStatus`로 응답하고 요청에서 지정한 S3 버킷의 작업 출력을 반환합니다.

## 를 사용하여 사용자 지정 개체 감지 AWS SDK for Java
<a name="detecting-cer-async-api-java"></a>

Java를 사용하는 Amazon Comprehend 예제는 [Amazon Comprehend Java](https://github.com/awsdocs/aws-doc-sdk-examples/tree/main/javav2/example_code/comprehend) 예제를 참조하세요.

## 를 사용하여 사용자 지정 개체 감지 AWS SDK for Python (Boto3)
<a name="detecting-cer-async-api-python"></a>

이 예제에서는 사용자 지정 개체 인식기를 생성하고 모델을 학습시킨 다음 AWS SDK for Python (Boto3)를 사용하여 엔터니 인식기 작업에서 실행합니다.

Python용 SDK를 인스턴스화합니다.

```
import boto3
import uuid
comprehend = boto3.client("comprehend", region_name="region")
```

개체 인식기 생성: 

```
response = comprehend.create_entity_recognizer(
    RecognizerName="Recognizer-Name-Goes-Here-{}".format(str(uuid.uuid4())),
    LanguageCode="en",
    DataAccessRoleArn="Role ARN",
    InputDataConfig={
        "EntityTypes": [
            {
                "Type": "ENTITY_TYPE"
            }
        ],
        "Documents": {
            "S3Uri": "s3://Bucket Name/Bucket Path/documents"
        },
        "Annotations": {
            "S3Uri": "s3://Bucket Name/Bucket Path/annotations"
        }
    }
)
recognizer_arn = response["EntityRecognizerArn"]
```

모든 인식기 나열: 

```
response = comprehend.list_entity_recognizers()
```

개체 인식기가 학습됨(TRAINED) 상태에 도달할 때까지 기다립니다: 

```
while True:
    response = comprehend.describe_entity_recognizer(
        EntityRecognizerArn=recognizer_arn
    )

    status = response["EntityRecognizerProperties"]["Status"]
    if "IN_ERROR" == status:
        sys.exit(1)
    if "TRAINED" == status:
        break

    time.sleep(10)
```

사용자 지정 개체 감지 작업을 시작합니다: 

```
response = comprehend.start_entities_detection_job(
    EntityRecognizerArn=recognizer_arn,
    JobName="Detection-Job-Name-{}".format(str(uuid.uuid4())),
    LanguageCode="en",
    DataAccessRoleArn="Role ARN",
    InputDataConfig={
        "InputFormat": "ONE_DOC_PER_LINE",
        "S3Uri": "s3://Bucket Name/Bucket Path/documents"
    },
    OutputDataConfig={
        "S3Uri": "s3://Bucket Name/Bucket Path/output"
    }
)
```

## PDF 파일에 대한 API 작업 우선 지정
<a name="detecting-cer-api-pdf"></a>

이미지 파일 및 PDF 파일의 경우 `DocumentReaderConfig`의 `InputDataConfig` 파라미터를 사용하여 기본 추출 작업을 재정의할 수 있습니다.

다음 예제에서는 myInputDataConfig.json이라는 이름의 JSON 파일을 정의하여 `InputDataConfig` 값을 설정합니다. `DocumentReadConfig`이 모든 PDF 파일에 대해 Amazon Textract `DetectDocumentText` API를 사용하도록 설정합니다.

**Example**  

```
"InputDataConfig": {
  "S3Uri": s3://Bucket Name/Bucket Path",
  "InputFormat": "ONE_DOC_PER_FILE",
  "DocumentReaderConfig": {
      "DocumentReadAction": "TEXTRACT_DETECT_DOCUMENT_TEXT",
      "DocumentReadMode": "FORCE_DOCUMENT_READ_ACTION"
  }
}
```

`StartEntitiesDetectionJob` 작업 시 myInputDataConfig.json 파일을 `InputDataConfig` 파라미터로 지정합니다.

```
  --input-data-config file://myInputDataConfig.json  
```

`DocumentReaderConfig` 파라미터에 대한 자세한 내용은 [텍스트 추출 옵션을 설정하는](idp-set-textract-options.md)을 참조하세요.