기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
Amazon Data Firehose를 사용하여 Apache Iceberg 테이블 작업
Amazon Data Firehose는 AWS WAF 로그, Amazon CloudWatch Logs, Amazon Kinesis Data Streams AWS IoT, Amazon Managed Streaming for Apache Kafka(Amazon MSK)와 같은 20개 이상의 소스에서 Amazon S3, Amazon Redshift, Snowflake, Splunk와 같은 대상으로 데이터 스트림을 전송하기 위한 서버리스 노코드 서비스입니다.
Firehose를 사용하여 스트리밍 데이터를 Amazon S3의 Apache Iceberg 테이블로 직접 전송할 수 있습니다. Firehose를 사용하면 단일 스트림의 레코드를 다른 Apache Iceberg 테이블로 라우팅하고 테이블의 레코드에 삽입, 업데이트 및 삭제 작업을 자동으로 적용할 수 있습니다. Firehose는 Iceberg 테이블로의 정확히 한 번 전송을 보장합니다. 이 기능을 사용하려면 AWS Glue Data Catalog를 사용해야 합니다.
Firehose는 스트리밍 데이터를 Amazon S3 테이블에 직접 전송할 수도 있습니다. 이러한 테이블은 대규모 분석 워크로드에 최적화된 스토리지를 제공하며 쿼리 성능을 지속적으로 개선하고 테이블 형식 데이터의 스토리지 비용을 절감하는 기능을 포함합니다.
데이터를 Apache Iceberg 테이블로 전송하도록 Firehose 스트림을 설정하는 방법에 대한 자세한 내용은 Firehose 설명서의 Firehose 스트림 설정을 참조하세요.