기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
Amazon OpenSearch Ingestion 파이프라인 생성
파이프라인은 Amazon OpenSearch Ingestion이 데이터를 소스(데이터의 출처)에서 싱크 (데이터가 이동하는 곳)로 이동하는 데 사용하는 메커니즘입니다. OpenSearch Ingestion에서 싱크는 항상 단일 Amazon OpenSearch Service 도메인이지만, 데이터 소스는 Amazon S3, Fluent Bit 또는 OpenTelemetry Collector와 같은 클라이언트일 수 있습니다.
자세한 내용은 OpenSearch 설명서의 파이프라인
사전 조건 및 필요한 IAM 역할
OpenSearch Ingestion 파이프라인을 생성하려면 다음과 같은 리소스가 있어야 합니다.
-
OpenSearch Ingestion이 싱크에 쓰기 위해 수임하는 파이프라인 역할이라는 IAM 역할입니다. 이 역할을 미리 생성하거나 파이프라인을 생성하는 동안 OpenSearch Ingestion에서 자동으로 생성하도록 할 수 있습니다.
-
싱크 역할을 하는 OpenSearch Service 도메인 또는 OpenSearch Serverless 컬렉션입니다. 도메인에 쓰는 경우 OpenSearch 1.0 이상 또는 Elasticsearch 7.4 이상이 실행되고 있어야 합니다. 싱크에는 IAM 파이프라인 역할에 적절한 권한을 부여하는 액세스 정책이 있어야 합니다.
이러한 리소스를 만드는 방법 설명은 다음 주제를 참조하세요.
참고
세분화된 액세스 제어를 사용하는 도메인에 쓰는 경우 완료해야 할 추가 단계가 있습니다. 파이프라인 역할 매핑(세분화된 액세스 제어를 사용하는 도메인에만 해당)을(를) 참조하세요.
필수 IAM 권한
OpenSearch Ingestion은 다음 IAM 권한을 사용하여 파이프라인을 생성합니다.
-
osis:CreatePipeline
- 파이프라인을 생성합니다. -
osis:ValidatePipeline
— 파이프라인 구성이 유효한지 확인하세요. -
iam:CreateRole
및iam:AttachPolicy
- OpenSearch Ingestion이 자동으로 파이프라인 역할을 생성하도록 합니다. -
iam:PassRole
- OpenSearch Ingestion에 파이프라인 역할을 전달하여 도메인에 데이터를 쓸 수 있도록 합니다. 이 권한은 파이프라인 역할 리소스에 대해 또는 각 파이프라인에서 서로 다른 역할을 사용할 계획인*
경우에만 있어야 합니다.
예를 들어 다음 정책에서 파이프라인을 호출할 권한을 부여합니다.
{ "Version":"2012-10-17", "Statement":[ { "Effect":"Allow", "Resource":"*", "Action":[ "osis:CreatePipeline", "osis:ListPipelineBlueprints", "osis:ValidatePipeline" ] }, { "Resource":[ "arn:aws:iam::
your-account-id
:role/pipeline-role
" ], "Effect":"Allow", "Action":[ "iam:CreateRole", "iam:AttachPolicy", "iam:PassRole" ] } ] }
OpenSearch Ingestion에는 서명 버전 4를 사용하여 파이프라인에 서명된 요청을 보내는 데 필요한 osis:Ingest
권한도 포함되어 있습니다. 자세한 내용은 수집 역할 생성 단원을 참조하십시오.
참고
또한 계정에서 파이프라인을 생성하는 첫 번째 사용자에게 iam:CreateServiceLinkedRole
작업에 대한 권한이 있어야 합니다. 자세한 내용은 파이프라인 역할 리소스를 참조하세요.
각 권한에 대한 자세한 내용은 서비스 권한 부여 참조에서 OpenSearch Ingestion에 대한 작업, 리소스 및 조건 키에 대한 액션, 리소스 및 조건 키를 참조하세요.
파이프라인 버전 지정
구성 편집기를 사용하여 파이프라인을 생성할 때는 파이프라인이 실행될 Data Prepper의 메이저 버전을version
옵션을 포함하세요.
version: "2"
log-pipeline: source: ...
생성을 선택하면 OpenSearch Ingestion은 지정한 메이저 버전의 사용 가능한 최신 마이너 버전을 확인하고 해당 버전으로 파이프라인을 프로비저닝합니다. 예를 들어 version:
"2"
을 지정하고 Data Prepper의 최신 지원 버전이 2.1.1인 경우 OpenSearch Ingestion은 파이프라인을 버전 2.1.1로 프로비저닝합니다. 파이프라인이 실행 중인 마이너 버전은 공개적으로 표시하지 않습니다.
Data Prepper의 새 메이저 버전이 출시될 때 파이프라인을 업그레이드하려면 파이프라인 구성을 편집하고 새 버전을 지정하세요. 파이프라인을 이전 버전으로 다운그레이드할 수 없습니다.
참고
OpenSearch Ingestion은 새 버전의 Data Prepper가 출시되자마자 바로 지원되지는 않습니다. 새 버전이 공개되는 시점과 OpenSearch Ingestion에서 새 버전이 지원되는 시점 사이에는 약간의 지연이 있을 수 있습니다. 또한 OpenSearch Ingestion은 명시적으로 특정 메이저 또는 마이너 버전을 모두 지원하지 않을 수도 있습니다. 포괄적인 목록은 지원되는 Data Prepper 버전 섹션을 참조하십시오.
블루/그린 배포를 시작하는 파이프라인을 변경할 때마다 OpenSearch Ingestion은 파이프라인에 대해 현재 구성된 메이저 버전의 최신 마이너 버전으로 업그레이드할 수 있습니다. 자세한 내용은 파이프라인 업데이트를 위한 블루/그린 배포 단원을 참조하십시오. OpenSearch Ingestion은 파이프라인 구성 내에서 version
옵션을 명시적으로 업데이트하지 않는 한 파이프라인의 메이저 버전을 변경할 수 없습니다.
수집 경로 지정
OTel 추적path
옵션이 추가로 필요합니다. 경로는 수집을 위한 URI 경로를 나타내는 /log/ingest
와 같은 문자열입니다. 이 경로는 파이프라인으로 데이터를 전송하는 데 사용하는 URI를 정의합니다.
예를 들어 HTTP 소스가 있는 파이프라인에 대해 다음 경로를 지정한다고 가정해 보겠습니다.

파이프라인으로 데이터를 수집할 때는 클라이언트 구성에서 https://
와 같은 엔드포인트를 지정해야 합니다.pipeline-name-abc123
.us-west-2
.osis.amazonaws.com/my
/test_path
경로는 슬래시(/) 로 시작해야 하며 특수 문자 '-', '_', '.', '/'를 비롯해 ${pipelineName}
자리 표시자를 포함할 수 있습니다. ${pipelineName}
(예: /${pipelineName}/test_path
)를 사용하는 경우 OpenSearch Ingestion은 변수를 연결된 하위 파이프라인의 이름으로 바꿉니다.
파이프라인 생성
이 섹션에서는 OpenSearch Service 콘솔 및 AWS CLI을 사용하여 OpenSearch Ingestion 파이프라인을 생성하는 방법을 설명합니다.
파이프라인을 생성하려면 https://console.aws.amazon.com/aos/home
빈 파이프라인을 선택하거나 구성 블루프린트를 선택합니다. 블루프린트에는 다양한 일반 사용 사례를 위한 사전 구성된 파이프라인이 포함되어 있습니다. 자세한 내용은 블루프린트 작업 단원을 참조하십시오.
블루프린트 선택을 선택합니다.
소스를 구성합니다.
-
빈 파이프라인에서 시작하는 경우 드롭다운 메뉴에서 소스를 선택합니다. 사용 가능한 소스에는 기타 AWS 서비스, OpenTelemetry 또는 HTTP가 포함될 수 있습니다. 자세한 내용은 Amazon OpenSearch Ingestion 파이프라인을 다른 서비스 및 애플리케이션과 통합 단원을 참조하십시오.
-
선택한 소스에 따라 소스에 대한 추가 설정을 구성합니다. 예를 들어 Amazon S3를 소스로 사용하려면 파이프라인에서 메시지를 수신하는 Amazon SQS 대기열의 URL을 지정해야 합니다. 지원되는 소스 플러그인 및 설명서 링크 목록은 섹션을 참조하세요Amazon OpenSearch Ingestion 파이프라인에 지원되는 플러그인 및 옵션.
-
일부 소스의 경우 소스 네트워크 옵션을 지정해야 합니다. VPC 액세스 또는 퍼블릭 액세스를 선택합니다. 퍼블릭 액세스(Public access)를 선택한 경우, 다음 단계로 건너뜁니다. VPC 액세스를 선택하는 경우 다음 설정을 구성하세요.
설정 설명 엔드포인트 관리 Virtual Private Cloud(VPC) 엔드포인트를 직접 생성할지 아니면 OpenSearch Ingestion이 자동으로 생성할지 선택합니다. 엔드포인트 관리는 기본적으로 OpenSearch Ingestion에서 관리하는 엔드포인트로 설정됩니다.
VPC 사용할 VPC의 ID를 선택합니다. VPC와 파이프라인의 AWS 리전(은)는 동일해야 합니다.
서브넷 서브넷을 하나 이상 선택합니다. OpenSearch Service가 서브넷에 VPC 엔드포인트와 탄력적 네트워크 인터페이스를 배치합니다.
보안 그룹 필요한 애플리케이션이 파이프라인에 의해 노출된 포트(80 또는 443) 및 프로토콜(HTTP 또는 HTTPS)에서 OpenSearch Ingestion 파이프라인에 도달하도록 허용하는 VPC 보안 그룹을 하나 이상 선택합니다.
VPC 연결 옵션 소스가 자체 관리형 엔드포인트인 경우 파이프라인을 VPC에 연결합니다. 제공된 기본 CIDR 옵션 중 하나를 선택하거나 사용자 지정 CIDR을 사용합니다.
자세한 내용은 Amazon OpenSearch Ingestion 파이프라인에 대한 VPC 액세스 구성 단원을 참조하십시오.
-
다음을 선택합니다.
프로세서 구성
파이프라인에 프로세서를 하나 이상 추가합니다. 프로세서는 도메인 또는 컬렉션 싱크에 레코드를 게시하기 전에 이벤트를 필터링, 변환 및 보강할 수 있는 하위 파이프라인 내의 구성 요소입니다. 지원되는 프로세서 목록과 설명서 링크는 섹션을 참조하세요Amazon OpenSearch Ingestion 파이프라인에 지원되는 플러그인 및 옵션.
작업을 선택하고 다음을 추가할 수 있습니다.
-
조건부 라우팅 - 특정 조건에 따라 이벤트를 다른 싱크로 라우팅합니다. 자세한 내용은 조건부 라우팅
을 참조하세요. -
하위 파이프라인 - 각 하위 파이프라인은 단일 소스, 0개 이상의 프로세서 및 단일 싱크의 조합입니다. 하나의 하위 파이프라인에만 외부 소스가 있을 수 있습니다. 다른 모든 소스에는 전체 파이프라인 구성 내의 다른 하위 파이프라인인 소스가 있어야 합니다. 단일 파이프라인 구성에는 1~10개의 하위 파이프라인이 포함될 수 있습니다.
다음을 선택합니다.
싱크 구성
파이프라인이 레코드를 게시하는 대상을 선택합니다. 모든 하위 파이프라인에는 하나 이상의 싱크가 포함되어야 합니다. 파이프라인에 최대 10개의 싱크를 추가할 수 있습니다.
OpenSearch 싱크의 경우 다음 필드를 구성합니다.
설정 | 설명 |
---|---|
네트워크 정책 이름 (서버리스 싱크만 해당) |
OpenSearch Serverless 컬렉션을 선택한 경우 네트워크 정책 이름을 입력합니다. OpenSearch Ingestion은 정책이 없는 경우 정책을 생성하거나 파이프라인과 컬렉션을 연결하는 VPC 엔드포인트에 대한 액세스 권한을 부여하는 규칙으로 정책을 업데이트합니다. 자세한 내용은 컬렉션에 대한 액세스 권한을 Amazon OpenSearch Ingestion 파이프라인에 부여 단원을 참조하십시오. |
인덱스 이름 |
파이프라인이 데이터를 전송하는 인덱스의 이름입니다. OpenSearch Ingestion은 인덱스가 아직 없는 경우이 인덱스를 생성합니다. |
인덱스 매핑 옵션 |
파이프라인이 문서와 해당 필드를 OpenSearch 싱크에 저장하고 인덱싱하는 방법을 선택합니다. 동적 매핑을 선택하면 문서를 인덱싱할 때 OpenSearch가 자동으로 필드를 추가합니다. 매핑 사용자 지정을 선택한 경우 인덱스 매핑 템플릿을 입력합니다. 자세한 내용은 인덱스 템플릿을 |
DLQ 활성화 |
파이프라인에 대한 Amazon S3 DLQ(Dead Letter Queue)를 구성합니다. 자세한 내용은 배달 못한 편지 대기열 단원을 참조하십시오. |
추가 설정 |
OpenSearch 싱크에 대한 고급 옵션을 구성합니다. 자세한 내용은 Data Prepper 설명서의 구성 옵션을 |
Amazon S3 싱크를 추가하려면 싱크 및 Amazon S3 추가를 선택합니다. 자세한 내용은 대상으로서의 Amazon S3 단원을 참조하십시오.
다음을 선택합니다.
파이프라인 구성
다음과 같은 추가 파이프라인 설정을 구성합니다.
설정 | 설명 |
---|---|
파이프라인 이름 |
파이프라인의 고유한 이름입니다. |
영구 버퍼 |
영구 버퍼는 여러 가용 영역에 걸쳐 디스크 기반 버퍼에 데이터를 저장합니다. 자세한 내용은 영구 버퍼링 단원을 참조하십시오. 영구 버퍼링을 활성화하는 경우 AWS Key Management Service 키를 선택하여 버퍼 데이터를 암호화합니다. |
파이프라인 용량 |
Ingestion OpenSearch 컴퓨팅 단위(OCUs. 자세한 내용은 Amazon OpenSearch Ingestion에서 파이프라인 조정 단원을 참조하십시오. |
파이프라인 역할 |
파이프라인이 싱크에 쓰고 풀 기반 소스에서 읽는 데 필요한 권한을 제공하는 IAM 역할입니다. 역할을 직접 생성하거나 선택한 사용 사례에 따라 OpenSearch Ingestion에서 역할을 생성하도록 할 수 있습니다. 자세한 내용은 Amazon OpenSearch Ingestion 내 역할 및 사용자 설정 단원을 참조하십시오. |
태그 |
파이프라인에 하나 이상의 태그를 추가합니다. 자세한 내용은 Amazon OpenSearch Ingestion 파이프라인 태그 지정 단원을 참조하십시오. |
로그 게시 옵션 | Amazon CloudWatch Logs에 파이프라인 로그 게시를 활성화합니다. 파이프라인 문제를 보다 쉽게 해결할 수 있도록 로그 게시를 활성화하는 것이 좋습니다. 자세한 내용은 파이프라인 모니터링 단원을 참조하십시오. |
다음을 선택한 후 파이프라인 구성을 검토하고 파이프라인 생성을 선택합니다.
OpenSearch Ingestion은 비동기 프로세스를 실행하여 파이프라인을 구축합니다. 파이프라인이 Active
상태가 되면 데이터 수집을 시작할 수 있습니다.
create-pipeline 명령은 파이프라인 구성을 문자열로 수락하거나 .yaml 또는 .json 파일 내에서 수락합니다. 구성을 문자열로 제공하는 경우 각 새 줄을 \n
로 이스케이프해야 합니다. 예: "log-pipeline:\n source:\n
http:\n processor:\n - grok:\n ...
다음 샘플 명령은 다음과 같은 구성으로 파이프라인을 생성합니다.
-
최소 4개의 Ingestion OCU, 최대 10개의 Ingestion OCU
-
Virtual Private Cloud(VPC) 내에서 프로비저닝됨
-
로그 게시 활성
aws osis create-pipeline \ --pipeline-name
my-pipeline
\ --min-units 4 \ --max-units 10 \ --log-publishing-options IsLoggingEnabled=true,CloudWatchLogDestination={LogGroup="MyLogGroup
"} \ --vpc-options SecurityGroupIds={sg-12345678
,sg-9012345
},SubnetIds=subnet-1212234567834asdf
\ --pipeline-configuration-body "file://pipeline-config.yaml
" \ --pipeline-role-arn arn:aws:iam::1234456789012
:role/pipeline-role
OpenSearch Ingestion은 비동기 프로세스를 실행하여 파이프라인을 구축합니다. 파이프라인이 Active
상태가 되면 데이터 수집을 시작할 수 있습니다. 파이프라인 상태를 확인하려면 GetPipeline 명령을 사용하세요.
OpenSearch Ingestion API를 사용하여 OpenSearch Ingestion 파이프라인을 생성하려면 CreatePipeline 작업을 호출하세요.
파이프라인이 성공적으로 생성되면 클라이언트를 구성하고 OpenSearch Service 도메인으로 데이터 수집을 시작할 수 있습니다. 자세한 내용은 Amazon OpenSearch Ingestion 파이프라인을 다른 서비스 및 애플리케이션과 통합 단원을 참조하십시오.
파이프라인 생성 상태 추적
OpenSearch Ingestion이 파이프라인을 프로비저닝하고 데이터 수집을 준비할 때 파이프라인의 상태를 추적할 수 있습니다.
파이프라인을 처음 생성한 후에는 OpenSearch Ingestion에서 데이터 수집을 준비하면서 여러 단계를 거칩니다. 파이프라인 생성의 다양한 단계를 보려면 파이프라인 이름을 선택하여 해당 파이프라인 설정 페이지를 확인하세요. 상태에서 세부 정보 보기를 선택합니다.
파이프라인은 다음 단계를 거친 후 데이터를 수집할 수 있게 됩니다.
-
검증 — 파이프라인 구성을 검증합니다. 이 단계가 완료되면 모든 검증이 성공한 것입니다.
-
환경 조성 — 리소스를 준비 및 프로비저닝합니다. 이 단계가 완료되면 새 파이프라인 환경이 만들어진 것입니다.
-
파이프라인 배포 - 파이프라인을 배포합니다. 이 단계가 완료되면 파이프라인이 성공적으로 배포된 것입니다.
-
파이프라인 상태 확인 - 파이프라인 상태를 확인합니다. 이 단계가 완료되면 모든 상태 확인이 통과된 것입니다.
-
트래픽 활성화 - 파이프라인이 데이터를 수집할 수 있도록 합니다. 이 단계가 완료되면 파이프라인으로 데이터 수집을 시작할 수 있습니다.
파이프라인 상태를 확인하려면 get-pipeline-change-progress 명령을 사용하세요. 다음 AWS CLI 요청은 라는 파이프라인의 상태를 확인합니다my-pipeline
.
aws osis get-pipeline-change-progress \ --pipeline-name
my-pipeline
응답:
{ "ChangeProgressStatuses": { "ChangeProgressStages": [ { "Description": "Validating pipeline configuration", "LastUpdated": 1.671055851E9, "Name": "VALIDATION", "Status": "PENDING" } ], "StartTime": 1.671055851E9, "Status": "PROCESSING", "TotalNumberOfStages": 5 } }
OpenSearch Ingestion API를 사용하여 파이프라인 생성 상태를 추적하려면 GetPipelineChangeProgress 작업을 호출하세요.