

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# 새 어휘 개체 추가
<a name="bda-library-adding-cv"></a>

[InvokeDataAutomationLibraryIngestionJob](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_data-automation_InvokeDataAutomationLibraryIngestionJob.html) API를 사용하여 라이브러리에 어휘를 추가할 수 있습니다. S3 매니페스트 파일 또는 인라인 페이로드를 통해 어휘를 제공할 수 있습니다.

**중요**  
UPSERT 작업은 개체 수준에서 clobber 스타일 대체를 사용합니다. 즉, 전체 개체가 기존 콘텐츠와 병합되지 않고 대체됩니다.

## 옵션 1: S3 매니페스트 파일 사용
<a name="bda-library-adding-cv-manifest"></a>

### 1단계: JSONL 매니페스트 파일 생성
<a name="bda-library-adding-cv-manifest-step1"></a>

예시: `vocabulary-manifest.json`

```
{"entityId":"medical-en","description":"Medication terms in English language","phrases":[{"text":"paracetamol"},{"text":"ibuprofen"},{"text":"acetaminophen","displayAsText":"acetaminophen"}],"language":"EN"}
{"entityId":"medical-es","description":"Medication terms in Spanish language","phrases":[{"text":"paracetamol"},{"text":"ibuprofen"},{"text":"acetaminophen","displayAsText":"acetaminophen"}],"language":"ES"}
```

**매니페스트 파일 요구 사항:**
+ **파일 형식:** JSONL(JSON 라인)
+ **개체 JSON:**
  + **entityId**(필수): 고유 식별자(최대 128자)
  + **설명**(선택 사항): entityId에 대한 설명
  + **언어**(필수): ISO 언어 코드([지원되는 언어](bda-library-character-sets.md))
  + **phrases**(필수): 텍스트 객체 배열입니다. 각 객체에는 다음이 포함됩니다.
    + **text**(필수): 개별 단어 또는 문구
    + **displayAsText**(선택 사항): 트랜스크립트의 실제 단어를 대체하는 데 사용합니다(참고: 대소문자 구분).

### 2단계: S3에 매니페스트 업로드
<a name="bda-library-adding-cv-manifest-step2"></a>

```
aws s3 cp vocabulary-manifest.json s3://my-bucket/manifests/
```

### 3단계: 수집 작업 시작
<a name="bda-library-adding-cv-manifest-step3"></a>

[InvokeDataAutomationLibraryIngestionJob](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_data-automation_InvokeDataAutomationLibraryIngestionJob.html)을 사용하여 어휘 수집 작업을 시작합니다.

**AWS CLI 예제:**

**요청**

```
aws bedrock-data-automation-data-automation invoke-data-automation-library-ingestion-job \
    --library-arn "arn:aws:bedrock:us-east-1:123456789012:data-automation-library/healthcare-vocabulary" \
    --entity-type "VOCABULARY" \
    --operation-type "UPSERT" \
    --input-configuration '{"s3Object":{"s3Uri":"s3://my-bucket/manifests/vocabulary-manifest.json"}}' \
    --output-configuration '{"s3Uri":"s3://my-bucket/outputs/"}'
```

**응답**:

```
{
  "jobArn": "arn:aws:bedrock:us-east-1:123456789012:data-automation-library-ingestion-job/job-12345"
}
```

**AWS 콘솔 예제:**

1. "라이브러리 세부 정보" 페이지로 이동합니다.

1. “사용자 지정 어휘 목록 추가”를 선택합니다.

1. "매니페스트 업로드/선택"을 선택합니다.

1. 매니페스트 파일을 직접 업로드할지 아니면 S3 위치에서 업로드할지 선택합니다.

![\[alt text not found\]](http://docs.aws.amazon.com/ko_kr/bedrock/latest/userguide/images/bda/library-add-cv-manifest-console.png)


## 옵션 2: 인라인 페이로드 사용
<a name="bda-library-adding-cv-inline"></a>

이 옵션은 최대 100개의 문구로 빠른 업데이트에 사용할 수 있습니다.

[InvokeDataAutomationLibraryIngestionJob](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_data-automation_InvokeDataAutomationLibraryIngestionJob.html)을 사용하여 어휘 수집 작업을 시작합니다.

**AWS CLI 예제:**

**요청**

```
aws bedrock-data-automation-data-automation invoke-data-automation-library-ingestion-job \
    --library-arn "arn:aws:bedrock:us-east-1:123456789012:data-automation-library/healthcare-vocabulary" \
    --entity-type "VOCABULARY" \
    --operation-type "UPSERT" \
    --input-configuration '{"inlinePayload":{"upsertEntitiesInfo":[{"vocabulary":{"entityId":"medical-en","language":"EN","phrases":[{"text":"paracetamol"},{"text":"ibuprofen"}]}}]}}' \
    --output-configuration '{"s3Uri":"s3://bda-data-bucket/output/"}'
```

**응답**:

```
{
  "jobArn": "arn:aws:bedrock:us-east-1:123456789012:data-automation-library-ingestion-job/job-12345"
}
```

**AWS 콘솔 예제:**

1. "라이브러리 세부 정보" 페이지로 이동합니다.

1. “사용자 지정 어휘 목록 추가”를 선택합니다.

1. "수동으로 추가"를 선택합니다.

![\[alt text not found\]](http://docs.aws.amazon.com/ko_kr/bedrock/latest/userguide/images/bda/library-add-cv-inline-console.png)
