벡터 인덱스
참고
Amazon S3 Vectors는 Amazon Simple Storage Service의 미리 보기 릴리스이며 변경될 수 있습니다.
참고
벡터 인덱스 구성 파라미터를 신중하게 선택합니다. 벡터 인덱스를 만든 후에는 벡터 인덱스 이름, 차원, 거리 지표 또는 필터링할 수 없는 메타데이터 키를 업데이트할 수 없습니다. 이러한 값을 변경하려면 새 벡터 인덱스를 만들어야 합니다.
벡터 인덱스는 효율적인 유사성 검색 작업을 위해 벡터 데이터를 저장하고 구성하는 벡터 버킷 내의 리소스입니다. 벡터 인덱스를 만들 때 거리 지표(Cosine
또는 Euclidean
), 벡터에 있어야 하는 차원 수, 유사성 쿼리 중에 필터링에서 제외하려는 메타데이터 필드 목록(선택 사항)을 지정합니다.
버킷당 벡터 인덱스 제한, 인덱스당 벡터 제한 및 벡터당 차원 제한에 대한 자세한 내용은 한계 및 제한 섹션을 참조하세요.
벡터마다 고유한 Amazon 리소스 이름(ARN)이 있습니다. 벡터 인덱스의 ARN은 다음 형식을 따릅니다.
arn:aws:s3vectors:
region
:account-id
:bucket/bucket-name
/index/index-name
벡터 인덱스 이름 지정 요구 사항
-
벡터 인덱스 이름은 벡터 버킷 내에서 고유해야 합니다.
-
벡터 인덱스 이름은 3~63자 이내여야 합니다.
-
유효한 문자는 소문자(a~z), 숫자(0~9), 하이픈(-), 점(.)입니다.
-
벡터 인덱스 이름은 글자 또는 숫자로 시작하고 끝나야 합니다.
차원 요구 사항
차원은 벡터의 값 수입니다. 인덱스에 추가된 모든 벡터는 정확히 이 수의 값을 가져야 합니다.
-
차원은 1에서 4,096 사이의 정수여야 합니다.
-
차원이 클수록 스토리지 공간이 더 많이 필요합니다.
거리 지표 옵션
거리 지표는 벡터 간의 유사성을 계산하는 방법을 지정합니다. 벡터 임베딩을 만들 때 더 정확한 결과를 얻으려면 임베딩 모델의 권장 거리 지표를 선택합니다.
-
코사인 - 벡터 간 각도의 코사인을 측정합니다. 정규화된 벡터 및 방향이 크기보다 중요한 경우에 가장 적합합니다.
-
유클리드 - 벡터 간의 직선 거리를 측정합니다. 방향과 크기가 모두 중요한 경우에 가장 적합합니다.
필터링 불가능한 메타데이터 키
메타데이터 키를 사용하면 저장 및 검색 중에 벡터에 추가 정보를 키-값 페어로 연결할 수 있습니다. 기본적으로 모든 메타데이터는 필터링이 가능하므로 이를 사용하여 쿼리 결과를 필터링할 수 있습니다. 그러나 필터링에 사용하지 않고 벡터와 함께 정보를 저장하려는 경우 특정 메타데이터 키를 필터링할 수 없는 것으로 지정할 수 있습니다.
기본 메타데이터 키와 달리 이러한 키는 쿼리 필터로 사용할 수 없습니다. 필터링 불가능한 메타데이터 키는 검색할 수 있지만 검색, 쿼리 또는 필터링할 수는 없습니다. 인덱스를 찾은 후에만 액세스할 수 있습니다.
필터링 불가능한 메타데이터 키를 사용하면 검색 결과로 검색하려고 하지만 필터링할 필요는 없는 추가 컨텍스트로 벡터를 보강할 수 있습니다. 필터링 불가능한 메타데이터 키의 일반적인 예는 텍스트를 벡터에 임베딩하고 원래 텍스트 자체를 필터링 불가능한 메타데이터로 포함하려는 경우입니다. 이렇게 하면 필터링 가능한 메타데이터 크기 제한을 늘리지 않고도 벡터 검색 결과와 함께 소스 텍스트를 반환할 수 있습니다. 다른 예로는 단지 참조용으로 생성 타임스탬프, 소스 URL 또는 설명 정보를 저장하는 것이 있습니다. 벡터를 검색할 때 필터링 불가능한 메타데이터 키에 액세스할 수 있지만 기본 메타데이터 키와 달리 이러한 키는 쿼리 필터로 사용할 수 없습니다.
필터링 불가능한 메타데이터 키에 대한 요구 사항은 다음과 같습니다.
-
필터링 불가능한 메타데이터 키는 벡터 인덱스 내에서 고유해야 합니다.
-
필터링 불가능한 메타데이터 키는 1~63자여야 합니다.
-
벡터 인덱스가 만들어진 후에는 필터링 불가능한 메타데이터 키를 수정할 수 없습니다.
-
S3 Vectors는 인덱스당 필터링 불가능한 메타데이터 키를 10개까지 지원합니다.