기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
지식 기반을 사용자 지정 데이터 소스에 연결
지원되는 데이터 소스 서비스를 선택하는 대신 다음과 같은 이점을 위해 사용자 지정 데이터 소스에 연결할 수 있습니다.
-
지식 기반이 액세스할 수 있도록 하려는 데이터 유형에 대한 유연성 및 제어.
-
KnowledgeBaseDocumentsAPI 작업을 사용하여 변경 사항을 동기화할 필요 없이 문서를 직접 수집하거나 삭제할 수 있습니다. -
Amazon Bedrock 콘솔 또는 API를 통해 직접 데이터 소스의 문서를 볼 수 있는 기능입니다.
-
에서 직접 데이터 소스에 문서를 업로드AWS Management 콘솔하거나 인라인으로 추가할 수 있습니다.
-
데이터 소스에서 문서를 추가하거나 업데이트할 때 메타데이터를 각 문서에 직접 추가할 수 있는 기능입니다. 데이터 소스에서 정보를 검색할 때 필터링에 메타데이터를 사용하는 방법에 대한 자세한 내용은 쿼리와 응답 생성 구성 및 사용자 지정의 메타데이터 및 필터링 탭을 참조하세요.
멀티모달 콘텐츠 지원
사용자 지정 데이터 소스는 최대 10MB base64 인코딩 이미지, 오디오 및 비디오 파일을 포함한 멀티모달 콘텐츠를 지원합니다. 멀티모달 콘텐츠 작업에 대한 포괄적인 지침은 섹션을 참조하세요멀티모달 콘텐츠를 위한 지식 기반 구축.
지식 기반을 사용자 지정 데이터 소스에 연결하려면 Amazon Bedrock Agents 빌드 타임 엔드포인트를 사용하여 CreateDataSource 요청을 보냅니다. 연결할 지식 기반의 knowledgeBaseId를 지정하고, 데이터 소스에 name을 제공하고, dataSourceConfiguration의 type 필드를 CUSTOM으로 지정합니다. 다음은 이 데이터 소스를 생성하는 최소 예제입니다.
PUT /knowledgebases/KB12345678/datasources/ HTTP/1.1 Content-type: application/json { "name": "MyCustomDataSource", "dataSourceConfiguration": { "type": "CUSTOM" } }
다음 선택적 필드 중 하나를 포함하여 데이터 소스를 구성할 수 있습니다.
| Field | 사용 사례: |
|---|---|
| description | 데이터 소스에 대한 설명을 제공합니다. |
| clientToken | API 요청이 한 번만 완료되도록 합니다. 자세한 내용은 멱등성 보장을 참조하세요. |
| serverSideEncryptionConfiguration | 데이터를 임베딩으로 변환하는 동안 임시 데이터 스토리지에 대한 사용자 지정 KMS 키를 지정합니다. 자세한 내용은 데이터 모으기 중 임시 데이터 스토리지의 암호화 섹션을 참조하세요. |
| dataDeletionPolicy | 데이터 소스를 삭제한 경우 벡터 스토어의 데이터 소스에 대한 벡터 임베딩으로 수행할 작업을 구성합니다. 벡터 저장소에 데이터를 보존하려면 RETAIN을 지정하고 삭제하려면 DELETE의 기본 옵션을 지정합니다. |
| vectorIngestionConfiguration | 데이터 소스 수집 옵션을 구성합니다. 자세한 내용은 아래를 참조하세요. |
vectorIngestionConfiguration 필드는 다음 필드가 포함된 VectorIngestionConfiguration 객체에 매핑됩니다.
-
chunkingConfiguration - 데이터 소스의 문서를 청킹하는 데 사용할 전략을 구성합니다. 청킹 전략에 대한 자세한 내용은 지식 기반에서 콘텐츠 청킹 작동 방식 섹션을 참조하세요.
-
parsingConfiguration - 데이터 소스를 구문 분석하는 데 사용할 전략을 구성합니다. 구문 분석 옵션에 대한 자세한 내용은 데이터 소스에 대한 구문 분석 옵션 섹션을 참조하세요.
-
customTransformationConfiguration - 데이터 변환 방법을 사용자 지정하고 더 큰 사용자 지정을 위해 Lambda 함수를 적용합니다. Lambda 함수를 사용하여 데이터 청킹 및 메타데이터 처리를 사용자 지정하는 방법에 대한 자세한 내용은 사용자 지정 변환 Lambda 함수를 사용하여 데이터 수집 방법 정의 섹션을 참조하세요.
사용자 지정 데이터 소스를 설정한 후 여기에 문서를 추가하고 지식 기반에 직접 수집할 수 있습니다. 다른 데이터 소스와 달리 사용자 지정 데이터 소스를 동기화할 필요가 없습니다. 문서를 직접 수집하는 방법을 알아보려면 변경 사항을 지식 기반에 직접 수집 섹션을 참조하세요.