Uso de Apache Iceberg en AWS - AWS Guía prescriptiva

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Uso de Apache Iceberg en AWS

Amazon Web Services (colaboradores)

Agosto de 2025 (historial del documento)

Apache Iceberg es un formato de tabla de código abierto que simplifica la administración de tablas y mejora el rendimiento. AWS Los servicios de análisis como Amazon EMR AWS Glue, Amazon Athena y Amazon Redshift incluyen soporte nativo para Iceberg, de modo que puede crear fácilmente lagos de datos transaccionales sobre Amazon Simple Storage Service (Amazon S3). AWS

Además, la próxima generación de Amazon SageMaker se basa en una arquitectura abierta que unifica el acceso a los datos a través de lagos de AWS datos, almacenes de datos y fuentes federadas y de terceros. The Lakehouse es totalmente compatible con Iceberg y le brinda la flexibilidad de acceder a los datos y consultarlos in situ mediante la API REST de Iceberg.

Esta guía técnica proporciona orientación sobre cómo empezar a utilizar Iceberg en distintos ámbitos e incluye las mejores prácticas y recomendaciones para utilizar Iceberg a gran escala y Servicios de AWS, al mismo tiempo, optimizar los costes y el AWS rendimiento.

Tanto si acaba de empezar con Iceberg como si es un usuario experimentado que busca optimizar sus cargas de trabajo actuales de Iceberg AWS, esta guía ofrece información valiosa para cada etapa de su proyecto

En esta guía: