

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

# Caratteristiche e concetti importanti
<a name="features"></a>

## Registrazione di log e monitoraggio
<a name="logging-monitoring"></a>

AWS Glue dispone di diverse [opzioni di registrazione e monitoraggio](https://docs.aws.amazon.com/glue/latest/dg/logging-and-monitoring.html). Per impostazione predefinita, AWS Glue invia i log al gruppo di `aws-glue` log in Amazon CloudWatch. Questi log includono informazioni come l'ora di inizio e di fine, le impostazioni di configurazione ed eventuali errori o avvisi che potrebbero essersi verificati.

Inoltre, i job AWS Glue Spark ETL forniscono le seguenti opzioni, che devono essere abilitate per il monitoraggio avanzato:
+ [Job metrics](https://docs.aws.amazon.com/glue/latest/dg/monitoring-awsglue-with-cloudwatch-metrics.html) riporta le metriche specifiche del lavoro nel AWS Glue namespace ogni 30 secondi. CloudWatch Queste metriche specifiche del lavoro, come i record elaborati, la dimensione totale input/output dei dati e il tempo di esecuzione, forniscono informazioni dettagliate sulle prestazioni di un lavoro. Possono aiutare a identificare i punti deboli o le opportunità di ottimizzazione delle configurazioni.
+ [La registrazione continua invia i log dei job di](https://docs.aws.amazon.com/glue/latest/dg/monitor-continuous-logging.html) Apache Spark in tempo reale al gruppo di log in entrata. `/aws-glue/jobs/logs-v2` CloudWatch Utilizzando i log in tempo reale, è possibile monitorare dinamicamente i lavori mentre sono in esecuzione. AWS Glue 
+ L'[interfaccia utente di Spark](https://docs.aws.amazon.com/glue/latest/dg/monitor-spark-ui.html) fornisce un'interfaccia web del server di cronologia Spark per visualizzare le informazioni sul job Spark, come la cronologia degli eventi di ogni fase, un grafico aciclico diretto e le variabili dell'ambiente di lavoro. I log degli eventi persistenti dell'interfaccia utente Spark sono archiviati in Amazon S3 e puoi utilizzarli in tempo reale o dopo il completamento del processo.
+ [Job run insights](https://docs.aws.amazon.com/glue/latest/dg/monitor-job-insights.html) semplifica il debug e l'ottimizzazione dei job ascoltando le eccezioni Spark più comuni, eseguendo l'analisi della causa principale e fornendo azioni consigliate per risolvere i problemi. Le informazioni vengono archiviate in. CloudWatch

## Automazione
<a name="automation"></a>

AWS Glue offre due modi principali per automatizzare i lavori ETL: trigger e flussi di lavoro.

**AWS Glue fattori scatenanti**

Quando vengono attivati, AWS Glue i trigger avviano job e crawler specifici. Un trigger può essere attivato su richiesta, in base a una pianificazione predefinita o in base a eventi specifici. È possibile utilizzare i trigger per progettare una catena di job e crawler dipendenti. [Per ulteriori informazioni, consulta i trigger.AWS Glue](https://docs.aws.amazon.com/glue/latest/dg/about-triggers.html) 

**AWS Glue flussi di lavoro**

Per carichi di lavoro più complessi, puoi utilizzare i AWS Glue flussi di lavoro per creare grafici aciclici diretti e creare dipendenze tra AWS Glue entità separate (trigger, crawler e job). I flussi di lavoro forniscono anche un'interfaccia unificata in cui è possibile condividere parametri, monitorare l'avanzamento e risolvere i problemi tra le entità associate.

La configurazione di molte entità associate all'interno dei AWS Glue flussi di lavoro può diventare sempre più complessa. Gli sviluppatori possono creare [AWS Glue progetti](https://aws.amazon.com/blogs/big-data/simplify-data-integration-pipeline-development-using-aws-glue-custom-blueprints/) per condividere pipeline di dati complesse con data scientist e analisti aziendali. Questi modelli consentono la creazione coerente e ripetibile di AWS Glue flussi di lavoro, eliminando i dettagli tecnici.

Per ulteriori informazioni su AWS Glue blueprint e flussi di lavoro, consulta [Esecuzione di attività ETL complesse utilizzando](https://docs.aws.amazon.com/glue/latest/dg/orchestrate-using-workflows.html) blueprint e flussi di lavoro in. AWS Glue

**Orchestrazione dei lavori con altri servizi AWS Glue AWS **

Per ulteriori opzioni di automazione, AWS Glue si integra con altri AWS servizi AWS Lambda AWS Step Functions, come Amazon Managed Workflows for Apache Airflow (Amazon MWAA).

[Per ulteriori informazioni sui metodi di orchestrazione per i lavori ETL, consulta Orchestrazione in. AWS GlueAWS Glue](https://docs.aws.amazon.com/glue/latest/dg/etl-jobs.html)

## Segnalibri di processo
<a name="bookmarks"></a>

I Job bookmark in AWS Glue vengono utilizzati per tenere traccia dello stato di avanzamento dei job ETL, evitando così la necessità di rielaborare i dati nelle esecuzioni di job successive. Quando i segnalibri dei lavori sono abilitati, AWS Glue mantiene un record di dati che sono già stati elaborati. Quindi, ad ogni esecuzione, elabora solo i nuovi dati nella fonte dati. Per ulteriori informazioni, consulta [Tracciamento dei dati elaborati utilizzando i segnalibri dei lavori](https://docs.aws.amazon.com/glue/latest/dg/monitor-continuations.html).