

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# 추출을 위한 블루프린트 생성
<a name="idp-cases-extraction"></a>

BDA를 사용하면 블루프린트를 생성할 때 문서에서 추출하려는 특정 데이터 필드를 정의할 수 있습니다. 이는 검색할 정보와 해석 방법을 BDA에 안내하는 일련의 지침 역할을 합니다.

**필드 정의**  
시작하려면 employee\$1id 또는 product\$1name과 같이 추출이 필요한 각 필드에 대한 속성을 생성할 수 있습니다. 각 필드에 대해 설명, 데이터 유형 및 추론 유형을 제공해야 합니다.

추출할 필드를 정의하려면 다음 파라미터를 지정해야 합니다.
+ Field Name: 필드가 나타내는 내용에 대한 설명을 사람이 읽을 수 있는 형식으로 제공합니다. 이 설명은 필드의 컨텍스트와 목적을 이해하여 데이터를 정확하게 추출하는 데 도움이 됩니다.
+ Instruction: 필드가 나타내는 내용에 대한 자연어 설명을 제공합니다. 이 설명은 필드의 컨텍스트와 목적을 이해하여 데이터를 정확하게 추출하는 데 도움이 됩니다.
+ 유형: 필드의 값에 대한 데이터 유형을 지정합니다. BDA는 다음 데이터 유형을 지원합니다.
  + 문자열: 텍스트 기반 값
  + 숫자: 숫자 값
  + 부울: true 또는 false 값
  + 배열: 동일한 유형의 여러 값을 가질 수 있는 필드의 경우(예: 문자열 배열 또는 숫자 배열)
+ Inference Type: 필드 값의 추출을 처리하는 방법을 BDA에 지시합니다. 지원되는 추론 유형은 다음과 같습니다.
  + Explicit: BDA가 문서에서 직접 값을 추출합니다.
  + Inferred: BDA가 문서에 있는 정보를 기반으로 값을 추론합니다.

다음은 모든 파라미터가 포함된 필드 정의의 예입니다.

------
#### [ Console ]

![\['Field name' 및 'Instruction'을 추가하는 방법을 보여주는 콘솔입니다. 'Type'은 'String'으로 설정되고 'Extraction type'은 'Explicit'으로 설정됩니다.\]](http://docs.aws.amazon.com/ko_kr/bedrock/latest/userguide/images/bda/bdaadd.png)


------
#### [ API ]

```
"product_name":{
   "type":"string",
   "inferenceType":"Explicit",
   "description":"The short name of the product without any extra details"
}
```

------

이 예시는 다음과 같이 설정되어 있습니다.
+ Type은 String으로 설정되어 있으며 이는 product\$1name 필드의 값이 텍스트 기반이어야 함을 나타냅니다.
+ inferenceType은 Explicit으로 설정되어 있으며 이는 변환 또는 검증 없이 문서에서 직접 값을 추출하도록 BDA에 지시합니다.
+ Instruction은 추가 컨텍스트를 제공하여 필드에 추가 세부 정보 없이 제품의 짧은 이름이 포함되어야 함을 명시합니다.

각 필드에 이러한 파라미터를 지정하면 문서에서 원하는 데이터를 정확하게 추출하고 해석하는 데 필요한 정보를 BDA에 제공할 수 있습니다.


| Field | Instruction | Extraction Type | Type | 
| --- | --- | --- | --- | 
|  ApplicantsName  |  신청자의 전체 이름  |  Explicit  |  문자열  | 
|  DateOfBirth  |  직원 생년월일  |  Explicit  |  문자열  | 
|  Sales  |  총 영수증 또는 매출  |  Explicit  |  number  | 
|  Statement\$1starting\$1balance  |  기간 시작 시 잔액  |  Explicit  |  number  | 

**다중 값 필드**  
필드에 여러 값이 포함될 수 있는 경우 배열 또는 테이블을 정의할 수 있습니다.

**필드 목록**  
값 목록이 포함된 필드의 경우 배열 데이터 유형을 정의할 수 있습니다.

이 예제에서 'OtherExpenses'는 문자열 배열로 정의되므로 BDA가 해당 필드에 대해 여러 비용 항목을 추출할 수 있습니다.

------
#### [ Console ]

![\['Field name' 및 'Instruction'을 추가하는 방법을 보여주는 콘솔입니다. 'Type'은 'Array of String'으로 설정되고 'Extraction type'은 'Explicit'으로 설정됩니다.\]](http://docs.aws.amazon.com/ko_kr/bedrock/latest/userguide/images/bda/bdaarray.png)


------
#### [ API ]

```
"OtherExpenses":{
   "type":"array",
   "inferenceType":"Explicit",
   "description":"Other business expenses not included in fields 8-26 or field 30",
   "items":{
      "type":"string"
   }
}
```

------

**테이블**  
문서에 테이블 형식 데이터가 포함된 경우 스키마 내에서 테이블 구조를 정의할 수 있습니다.

이 예제에서 'SERVICES\$1TABLE'은 제품 이름, 설명, 수량, 단가 및 금액과 같은 열 필드가 있는 테이블 유형으로 정의됩니다.

------
#### [ Console ]

![\['Field name' 및 'Instruction'을 추가하는 방법을 보여주는 콘솔입니다. 'Type'은 'Table'로 설정되고 'Extraction type'은 'Explicit'으로 설정되며 추가된 열별 필드를 표시합니다.\]](http://docs.aws.amazon.com/ko_kr/bedrock/latest/userguide/images/bda/bdatable.png)


------
#### [ API ]

```
"definitions":{
   "LINEITEM":{
      "properties":{
         "quantity":{
            "type":"number",
            "inferenceType":"Explicit"
         },
         "unit price":{
            "type":"number",
            "inferenceType":"Explicit"
         },
         "amount":{
            "type":"number",
            "inferenceType":"Explicit",
            "description":"Unit Price * Quantity"
         },
         "product name":{
            "type":"string",
            "inferenceType":"Explicit",
            "description":"The short name of the product without any extra details"
         },
         "product description":{
            "type":"string",
            "inferenceType":"Explicit",
            "description":"The full item list description text"
         }
      }
   }
},
"properties":{
   "SERVICES_TABLE":{
      "type":"array",
      "description":"Line items table listing all the items / services charged in the invoice including quantity, price, amount, product / service name and description.",
      "items":{
         "$ref":"#/definitions/LINEITEM"
      }
   },
   "...
        ..."
]
```

------

적절한 필드 설명, 데이터 형식 및 추론 유형을 사용하여 포괄적인 스키마를 정의하면 형식이나 표현의 차이에 관계없이 BDA가 문서에서 원하는 정보를 정확하게 추출할 수 있습니다.