Processi Spark e PySpark AWS Glue - AWS Glue

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Processi Spark e PySpark AWS Glue

AWS Glue supporta i processi Spark e PySpark. Un processo Spark viene eseguito in un ambiente Apache Spark gestito da AWS Glue. Elabora i dati in batch. Un processo ETL di streaming è simile a un processo Spark, ad eccezione del fatto che esegue ETL sui flussi di dati. Esso utilizza il framework Apache Spark Structured Streaming. Alcune caratteristiche dei processi Spark non sono disponibili per i processi ETL in streaming.

Nelle sezioni seguenti vengono fornite informazioni sui processi Spark e PySpark in AWS Glue.