문서 메타데이터 - Amazon Quick

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

문서 메타데이터

Amazon S3 버킷의 문서에 메타데이터를 추가하여 채팅 결과를 사용자 지정하고 문서 수준 액세스를 제어할 수 있습니다. 메타데이터는 제목, 생성 날짜 및 액세스 권한과 같은 문서에 대한 추가 정보입니다.

Amazon Quick은 인용과 함께 소스 어트리뷰션을 지원합니다. _source_uri 메타데이터 필드를 지정하면 채팅 결과의 소스 속성 링크가 사용자를 구성된 URL로 안내합니다. 를 지정하지 않은 경우에도 _source_uri사용자는 쿼리 시 파일을 다운로드하는 클릭 가능한 인용 링크를 통해 소스 문서에 액세스할 수 있습니다.

문서 메타데이터 위치

Amazon S3에서는 각 메타데이터 파일을 인덱싱된 문서와 연결할 수 있습니다. 메타데이터 파일은 인덱싱된 파일과 동일한 Amazon S3 버킷에 저장해야 합니다. Amazon Quick에서 Amazon S3 통합을 구성할 때 메타데이터 파일의 Amazon S3 버킷 내 위치를 지정할 수 있습니다.

Amazon S3 접두사를 지정하지 않으면 메타데이터 파일을 인덱싱된 문서와 동일한 위치에 저장해야 합니다. 메타데이터 파일에 Amazon S3 접두사를 지정하는 경우 인덱싱된 문서와 병렬인 디렉터리 구조에 있어야 합니다. Amazon Quick은 지정된 디렉터리에서만 메타데이터를 찾습니다. 메타데이터를 읽을 수 없는 경우 디렉터리 위치가 메타데이터의 위치와 일치하는지 확인하세요.

다음 예시에서는 인덱싱된 문서 위치가 메타데이터 파일 위치에 매핑되는 방식을 보여줍니다. 문서의 Amazon S3 키는 메타데이터의 Amazon S3 접두사에 추가된 다음 접미사를 사용하여 메타데이터 파일의 Amazon S3 경로를 .metadata.json 형성합니다.

참고

결합된 Amazon S3 키, 메타데이터의 Amazon S3 접두사 및 .metadata.json 접미사는 총 1,024자 이하여야 합니다. 키를 접두사 및 접미사와 결합할 때 추가 문자를 고려하려면 Amazon S3 키가 1,000자 미만인 것이 좋습니다.

예예제 1: 메타데이터 경로가 지정되지 않음
Bucket name: s3://bucketName Document path: documents Metadata path: none File mapping s3://bucketName/documents/file.txt -> s3://bucketName/documents/file.txt.metadata.json
예예제 2: 지정된 메타데이터 경로
Bucket name: s3://bucketName Document path: documents/legal Metadata path: metadata File mapping s3://bucketName/documents/legal/file.txt -> s3://bucketName/metadata/documents/legal/file.txt.metadata.json

문서 메타데이터 구조

문서 메타데이터 자체를 JSON 파일에 정의합니다. 파일은 BOM 마커가 없는 UTF-8 텍스트 파일이어야 합니다. JSON 파일의 이름은 <document>.<extension>.metadata.json이어야 합니다. 이 예제에서 document는 메타데이터가 적용되는 문서의 이름이고 extension는 문서의 파일 확장명입니다. 문서 ID는 <document>.<extension>.metadata.json에서 고유해야 합니다.

JSON 파일의 콘텐츠는 다음 템플릿을 사용합니다.

{ "DocumentId": "document ID", "Attributes": { "_authors": ["author of the document"], "_category": "document category", "_created_at": "ISO 8601 encoded string", "_last_updated_at": "ISO 8601 encoded string", "_source_uri": "document URI", "_version": "file version", "_view_count": number of times document has been viewed }, "AccessControlList": [ { "Name": "user1@example.com", "Type": "GROUP | USER", "Access": "ALLOW | DENY" } ], "Title": "document title", "ContentType": "PDF | HTML | MS_WORD | PLAIN_TEXT | PPT | RTF | XML | XSLT | MS_EXCEL | CSV | JSON | MD" }

메타데이터 경로를 제공하는 경우 메타데이터 디렉터리 내의 디렉터리 구조가 데이터 파일의 디렉터리 구조와 정확히 일치하는지 확인합니다.

예를 들어 데이터 파일 위치가 s3://bucketName/documents/legal/file.txt인 경우 메타데이터 파일 위치는 s3://bucketName/metadata/documents/legal/file.txt.metadata.json이어야 합니다.

모든 속성 및 필드는 선택 사항이므로, 모든 속성을 포함할 필요는 없습니다. 그러나 포함하려는 각 속성에 값을 입력해야 합니다. 값은 비워둘 수 없습니다.

_created_at_last_updated_at 메타데이터 필드는 ISO 8601로 인코딩된 날짜입니다. 예를 들어, 2012-03-25T12:30:10+01:00은 중부 유럽 시간대로 2012년 3월 25일 오후 12시 30분 10초에 대한 ISO 8601 날짜/시간 형식입니다.

AccessControlList 필드는 문서 수준 액세스 제어를 정의하는 선택적 배열입니다. 배열의 각 항목에는 다음 필드가 포함됩니다.

  • Name - USER 유형의 경우 Quick에 있는 사용자의 이메일 주소입니다. GROUP 유형의 경우 Quick의 그룹 이름입니다.

  • Type - USER 또는 GROUP.

  • Access - ALLOW 또는 DENY.

참고

AccessControlList 필드를 사용하려면 지식 기반을 생성할 때 문서 수준 ACLs을 활성화해야 합니다. 자세한 내용은 문서 수준 ACLs 단원을 참조하십시오.