

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# 지식 기반을 사용자 지정 데이터 소스에 연결
<a name="custom-data-source-connector"></a>

지원되는 데이터 소스 서비스를 선택하는 대신 다음과 같은 이점을 위해 사용자 지정 데이터 소스에 연결할 수 있습니다.
+ 지식 기반이 액세스할 수 있도록 하려는 데이터 유형에 대한 유연성 및 제어.
+ `KnowledgeBaseDocuments` API 작업을 사용하여 변경 사항을 동기화할 필요 없이 문서를 직접 수집하거나 삭제할 수 있습니다.
+ Amazon Bedrock 콘솔 또는 API를 통해 직접 데이터 소스의 문서를 볼 수 있는 기능입니다.
+ 에서 직접 데이터 소스에 문서를 업로드 AWS Management Console 하거나 인라인으로 추가할 수 있습니다.
+ 데이터 소스에서 문서를 추가하거나 업데이트할 때 메타데이터를 각 문서에 직접 추가할 수 있는 기능입니다. 데이터 소스에서 정보를 검색할 때 필터링에 메타데이터를 사용하는 방법에 대한 자세한 내용은 [쿼리와 응답 생성 구성 및 사용자 지정](kb-test-config.md)의 **메타데이터 및 필터링** 탭을 참조하세요.

**멀티모달 콘텐츠 지원**  
사용자 지정 데이터 소스는 최대 10MB base64 인코딩 이미지, 오디오 및 비디오 파일을 포함한 멀티모달 콘텐츠를 지원합니다. 멀티모달 콘텐츠 작업에 대한 포괄적인 지침은 섹션을 참조하세요[멀티모달 콘텐츠를 위한 지식 기반 구축](kb-multimodal.md).

지식 기반을 사용자 지정 데이터 소스에 연결하려면 [Amazon Bedrock Agents 빌드 타임 엔드포인트](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#bra-bt)를 사용하여 [CreateDataSource](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_CreateDataSource.html) 요청을 보냅니다. 연결할 지식 기반의 `knowledgeBaseId`를 지정하고, 데이터 소스에 `name`을 제공하고, `dataSourceConfiguration`의 `type` 필드를 `CUSTOM`으로 지정합니다. 다음은 이 데이터 소스를 생성하는 최소 예제입니다.

```
PUT /knowledgebases/{{KB12345678}}/datasources/ HTTP/1.1
Content-type: application/json

{
    "name": "MyCustomDataSource",
    "dataSourceConfiguration": {
        "type": "CUSTOM"
    }
}
```

다음 선택적 필드 중 하나를 포함하여 데이터 소스를 구성할 수 있습니다.


****  

| Field | 사용 사례: | 
| --- | --- | 
| description | 데이터 소스에 대한 설명을 제공합니다. | 
| clientToken | API 요청이 한 번만 완료되도록 합니다. 자세한 내용은 [멱등성 보장하기](https://docs.aws.amazon.com/ec2/latest/devguide/ec2-api-idempotency.html)를 참조하세요. | 
| serverSideEncryptionConfiguration | 데이터를 임베딩으로 변환하는 동안 임시 데이터 스토리지에 대한 사용자 지정 KMS 키를 지정합니다. 자세한 내용은 [데이터 모으기 중 임시 데이터 스토리지의 암호화](encryption-kb.md#encryption-kb-ingestion) 섹션을 참조하세요. | 
| dataDeletionPolicy | 데이터 소스를 삭제한 경우 벡터 스토어의 데이터 소스에 대한 벡터 임베딩으로 수행할 작업을 구성합니다. 벡터 저장소에 데이터를 보존하려면 RETAIN을 지정하고 삭제하려면 DELETE의 기본 옵션을 지정합니다. | 
| vectorIngestionConfiguration | 데이터 소스 수집 옵션을 구성합니다. 자세한 내용은 아래를 참조하세요. | 

`vectorIngestionConfiguration` 필드는 다음 필드가 포함된 [VectorIngestionConfiguration](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_VectorIngestionConfiguration.html) 객체에 매핑됩니다.
+ chunkingConfiguration - 데이터 소스의 문서를 청킹하는 데 사용할 전략을 구성합니다. 청킹 전략에 대한 자세한 내용은 [지식 기반에서 콘텐츠 청킹 작동 방식](kb-chunking.md) 섹션을 참조하세요.
+ parsingConfiguration - 데이터 소스를 구문 분석하는 데 사용할 전략을 구성합니다. 구문 분석 옵션에 대한 자세한 내용은 [데이터 소스에 대한 구문 분석 옵션](kb-advanced-parsing.md) 섹션을 참조하세요.
+ customTransformationConfiguration - 데이터 변환 방법을 사용자 지정하고 더 큰 사용자 지정을 위해 Lambda 함수를 적용합니다. Lambda 함수를 사용하여 데이터 청킹 및 메타데이터 처리를 사용자 지정하는 방법에 대한 자세한 내용은 [사용자 지정 변환 Lambda 함수를 사용하여 데이터 수집 방법 정의](kb-custom-transformation.md) 섹션을 참조하세요.

사용자 지정 데이터 소스를 설정한 후 여기에 문서를 추가하고 지식 기반에 직접 수집할 수 있습니다. 다른 데이터 소스와 달리 사용자 지정 데이터 소스를 동기화할 필요가 없습니다. 문서를 직접 수집하는 방법을 알아보려면 [변경 사항을 지식 기반에 직접 수집](kb-direct-ingestion.md) 섹션을 참조하세요.