View a markdown version of this page

데이터 자동화 라이브러리 - Amazon Bedrock

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

데이터 자동화 라이브러리

AWS Bedrock Data Automation Library를 사용하면 콘텐츠에 대한 BDA의 이해를 높이고 데이터에서 더 정확한 인사이트를 생성할 수 있습니다. 데이터 자동화 라이브러리는 엔터티를 저장하는 컨테이너 역할을 하며 BDA 프로젝트와 연결하여 특정 사용 사례에 맞게 여러 엔터티 유형 및 양식에서 추출 정확도를 개선할 수 있습니다. 현재 Data Automation Library는 오디오 및 비디오 콘텐츠의 추출 정확도를 높이기 위해 사용자 지정 어휘를 지원합니다. 이 기능과 관련된 제한은 할당량 및 제한 페이지에 있습니다.

주요 이점

  1. 향상된 정확도: 특정 요구 사항에 맞게 인식을 조정합니다.

  2. 교차 양식 지원: 오디오 및 비디오 분석을 개선합니다.

  3. 유연한 관리: 프로젝트를 쉽게 생성, 업데이트 및 연결합니다.

  4. 재사용 가능한 리소스: 라이브러리를 한 번 생성하고 여러 프로젝트에서 사용합니다.

  5. 간편한 통합: 라이브러리 관리를 위한 간단한 API 기반 워크플로입니다.

데이터 자동화 라이브러리 작동 방식

Data Automation Library를 생성하고 도메인별 엔터티로 채워 BDA가 콘텐츠 처리 중에 사용자 지정 지식을 적용하고 사용 사례 전반에서 추출 정확도를 개선할 수 있습니다. 라이브러리를 BDA 프로젝트와 연결하면 해당 프로젝트를 통해 처리된 모든 작업이 작업당 추가 구성 없이 라이브러리의 엔터티를 자동으로 활용할 수 있습니다.

수집이 완료되면 수집 API 요청에 제공된 S3 URI에 작업 ID 이름이 인 폴더가 생성됩니다. 입력 매니페스트와 최종 수집 결과가 모두 해당 폴더에 업로드됩니다. 예를 들어 요청에 제공된 출력 버킷이 s3://my-bucket/outputs/ 이고 jobId가 328c43e7-d226-41c9-9acb-e71a37022b99 입력 매니페스트이고 최종 수집 결과가에 업로드되는 경우 s3://my-bucket/outputs/328c43e7-d226-41c9-9acb-e71a37022b99

기본 워크플로:

  1. 라이브러리 생성 - CreateDataAutomationLibrary를 사용하여 빈 라이브러리 컨테이너를 초기화합니다.

  2. 라이브러리에 엔터티 추가 - InvokeDataAutomationLibraryIngestionJob을 사용하여 도메인별 엔터티를 추가합니다.

  3. 라이브러리를 프로젝트와 연결 - 프로젝트 생성 중에 라이브러리를 CreateDataAutomationProject와 연결하거나 UpdateDataAutomationProject를 사용하여 기존 프로젝트를 업데이트합니다.

  4. 콘텐츠 처리 - 연결된 프로젝트를 통해 InvokeDataAutomationAsync를 사용하여 작업을 실행하여 콘텐츠 전체에 향상된 추출 정확도를 적용합니다.

핵심 개념

데이터 자동화 라이브러리

하나 이상의 유형의 개체를 저장하는 컨테이너입니다. 라이브러리는 여러 데이터 자동화 프로젝트에 연결하고 다양한 워크로드에서 재사용할 수 있습니다.

데이터 자동화 라이브러리 엔터티 유형

라이브러리에 저장된 콘텐츠의 유형입니다. 현재 VOCABULARY 엔터티 유형만 지원됩니다.

데이터 자동화 라이브러리 엔터티

개체 유형 내의 특정 인스턴스입니다. 사용자 지정 어휘의 경우 개체는 특정 언어에 대한 단어 및 문구 모음을 나타냅니다.

데이터 자동화 라이브러리 수집 작업

라이브러리에서 개체를 추가, 업데이트 또는 삭제하는 비동기 작업입니다. 작업은 데이터 일관성을 유지하기 위해 순차적으로 처리됩니다.

프로젝트 연결

라이브러리와 BDA 프로젝트 간의 링크입니다. 라이브러리를 프로젝트와 연결하면 해당 프로젝트를 통해 처리된 모든 작업이 라이브러리의 엔터티를 적용하여 콘텐츠의 추출 정확도를 개선합니다. 단, 프로젝트는 하나의 라이브러리에만 연결할 수 있지만 하나의 라이브러리는 여러 프로젝트에 연결할 수 있습니다.

BDA 콘솔에서 데이터 자동화 라이브러리 페이지로 이동

  1. Amazon Bedrock 서비스로 이동합니다.

  2. 사이드바 메뉴에서 "데이터 자동화"를 선택합니다.

  3. "라이브러리 관리"를 선택합니다.

리전별 가용성

데이터 자동화 라이브러리는 다음 AWS 리전에서 사용할 수 있습니다.

리전 이름

리전 코드

미국 동부(버지니아 북부)

us-east-1

미국 서부(오리건)

us-west-2

유럽(아일랜드)

eu-west-1

유럽(런던)

eu-west-2

유럽(프랑크푸르트)

eu-central-1

아시아 태평양(뭄바이)

ap-south-1

아시아 태평양(시드니)

ap-southeast-2