Versioni del motore supportate Context Probabili cause di aumento delle attese Azioni

Eventi di attesa IPC:parallel

I seguenti IPC:parallel wait events indicano che una sessione è in attesa della comunicazione tra processi relativa alle operazioni di esecuzione di query parallele.

IPC:BgWorkerStartup: un processo è in attesa che un processo worker parallelo completi la sequenza di avvio. Ciò si verifica durante l’inizializzazione dei worker per l’esecuzione di query parallele.
IPC:BgWorkerShutdown: un processo è in attesa che un processo worker parallelo completi la sequenza di arresto. Ciò si verifica durante la fase di pulizia dell’esecuzione di query parallele.
IPC:ExecuteGather: un processo è in attesa di ricevere dati da processi worker paralleli durante l’esecuzione di query. Ciò si verifica quando il processo leader deve raccogliere i risultati dai propri worker.
IPC:ParallelFinish: un processo è in attesa che i worker paralleli completino l’esecuzione e riportino i risultati finali. Ciò avviene durante la fase di completamento dell’esecuzione di query parallele.

Versioni del motore supportate

Queste informazioni relative all'evento di attesa sono supportate per tutte el versioni di Aurora PostgreSQL.

Context

L’esecuzione parallela delle query in PostgreSQL implica la collaborazione di più processi per elaborare una singola query. Quando si determina che una query è adatta alla parallelizzazione, un processo leader si coordina con uno o più processi worker paralleli in base all’impostazione del parametro max_parallel_workers_per_gather. Il processo leader divide il lavoro tra i worker, ciascuno dei quali elabora la propria porzione di dati in modo indipendente, e i risultati vengono raccolti dal processo leader.

Nota

Ogni worker parallelo opera come un processo separato con requisiti di risorse simili a quelli di una sessione utente completa. Ciò significa che una query parallela con 4 worker può consumare fino a 5 volte le risorse (CPU, memoria, larghezza di banda I/O) rispetto a una query non parallela, poiché sia il processo leader che ogni processo worker mantengono le proprie allocazioni di risorse. Ad esempio, impostazioni come work_mem vengono applicate singolarmente a ciascun worker, moltiplicando potenzialmente l’utilizzo totale della memoria in tutti i processi.

L’architettura di query parallela è composta da tre componenti principali:

Processo leader: il processo principale che avvia l’operazione parallela, divide il carico di lavoro e si coordina con i processi worker.
Processi worker: processi in background che eseguono parti della query in parallelo.
Gather/Gather merge: operazioni che combinano i risultati di più processi worker e li restituiscono al leader

Durante l’esecuzione parallela, i processi devono comunicare tra loro tramite meccanismi di comunicazione tra processi (IPC). Questi eventi di attesa IPC si verificano durante diverse fasi:

Avvio del worker: quando i worker paralleli vengono inizializzati
Scambio di dati: quando i worker elaborano i dati e inviano i risultati al leader
Arresto del worker: quando l’esecuzione parallela viene completata e i worker vengono terminati
Punti di sincronizzazione: quando i processi devono coordinarsi o attendere che altri processi completino le proprie attività

La comprensione di questi eventi di attesa è fondamentale per diagnosticare i problemi di prestazioni relativi all’esecuzione di query parallele, specialmente in ambienti ad alta concorrenza in cui più query parallele possono essere eseguite contemporaneamente.

Probabili cause di aumento delle attese

Diversi fattori possono contribuire a un aumento degli eventi di attesa IPC correlati alle query parallele:

Elevata concorrenza di query parallele: L’esecuzione simultanea di più query parallele può portare a un conflitto di risorse e a un aumento dei tempi di attesa per le operazioni IPC. Ciò è particolarmente comune nei sistemi con elevati volumi di transazioni o carichi di lavoro analitici.
Piani di query parallele non ottimali: Se il pianificatore di query sceglie piani paralleli inefficienti, ciò può comportare una parallelizzazione non necessaria o una scarsa distribuzione del lavoro tra i worker. Ciò può portare a un aumento delle attese IPC, in particolare per gli eventi IPC:ExecuteGather e IPC:ParallelFinish. Questi problemi di pianificazione spesso derivano da statistiche obsolete e dal sovraccarico di tabelle/indici.
Avvio e arresto frequenti dei worker paralleli: Le query di breve durata che avviano e terminano frequentemente i worker paralleli possono causare un aumento degli eventi IPC:BgWorkerStartup e IPC:BgWorkerShutdown. Ciò si verifica spesso nei carichi di lavoro OLTP con molte query di piccole dimensioni e parallelizzabili.
Vincoli delle risorse: Una capacità limitata di CPU, memoria o I/O può causare colli di bottiglia nell’esecuzione parallela, con conseguente aumento dei tempi di attesa in tutti gli eventi IPC. Ad esempio, se la CPU è satura, i processi worker potrebbero impiegare più tempo per avviarsi o elaborare la relativa parte di lavoro.
Strutture di query complesse: Le query con più livelli di parallelismo (ad esempio, join paralleli seguiti da aggregazioni parallele) possono portare a modelli IPC più complessi e tempi di attesa potenzialmente maggiori, soprattutto per gli eventi IPC:ExecuteGather.
Serie di risultati di grandi dimensioni: Le query che producono set di risultati di grandi dimensioni possono aumentare i tempi di attesa IPC:ExecuteGather poiché il processo leader dedica più tempo alla raccolta e all’elaborazione dei risultati dei processi worker.

La comprensione di questi fattori può aiutare a diagnosticare e risolvere i problemi di prestazioni relativi all’esecuzione di query parallele in Aurora PostgreSQL.

Azioni

Quando si verificano attese relative a query parallele, in genere significa che un processo di backend sta coordinando o attendendo processi worker paralleli. Queste attese sono comuni durante l’esecuzione di piani paralleli. È possibile analizzare e mitigare l’impatto di queste attese monitorando l’utilizzo dei worker paralleli, esaminando le impostazioni dei parametri e ottimizzando l’esecuzione delle query e l’allocazione delle risorse.

Argomenti

Analizzare i piani di query per individuare eventuali parallelismi inefficienti
Monitoraggio dell’utilizzo delle query parallele
Esaminare e modificare le impostazioni delle interrogazioni parallele
Ottimizzare l’allocazione delle risorse
Esaminare la gestione delle connessioni
Esaminare e ottimizzare le operazioni di manutenzione

Analizzare i piani di query per individuare eventuali parallelismi inefficienti

L’esecuzione parallela delle query può spesso portare a instabilità del sistema, picchi di CPU e variazioni imprevedibili delle prestazioni delle query. È fondamentale analizzare a fondo se il parallelismo migliora effettivamente il carico di lavoro specifico. Utilizzare EXPLAIN ANALYZE per esaminare i piani di esecuzione delle query parallele.

Disattivare temporaneamente il parallelismo a livello di sessione per confrontare l’efficienza del piano:



SET max_parallel_workers_per_gather = 0;
EXPLAIN ANALYZE <your_query>;

Riattivare il parallelismo e confrontare:



RESET max_parallel_workers_per_gather;
EXPLAIN ANALYZE <your_query>;

Se la disabilitazione del parallelismo produce risultati migliori o più coerenti, prendere in considerazione la possibilità di disabilitarlo per query specifiche a livello di sessione utilizzando i comandi SET. Per un impatto più ampio, può essere opportuno disabilitare il parallelismo a livello di istanza regolando i parametri pertinenti nel gruppo di parametri del database. Per ulteriori informazioni, consulta Modifica dei parametri in un gruppo di parametri database in Amazon RDS.

Monitoraggio dell’utilizzo delle query parallele

Utilizzare le seguenti query per ottenere visibilità sull’attività e sulla capacità delle query parallele:

Controllare i processi worker paralleli attivi:



SELECT
    COUNT(*)
FROM
    pg_stat_activity
WHERE
    backend_type = 'parallel worker';

Questa query mostra il numero di processi worker paralleli attivi. Un valore elevato può indicare che `max_parallel_workers` è configurato con un valore elevato e potrebbe essere opportuno ridurlo.

Controllare le query parallele simultanee:



SELECT
    COUNT(DISTINCT leader_pid)
FROM
    pg_stat_activity
WHERE
    leader_pid IS NOT NULL;

Questa query restituisce il numero di processi leader distinti che hanno avviato query parallele. Un numero elevato indica che più sessioni eseguono query parallele contemporaneamente, il che può aumentare la richiesta di CPU e memoria.

Esaminare e modificare le impostazioni delle interrogazioni parallele

Controllare i seguenti parametri per assicurarsi che siano in linea con il carico di lavoro:

max_parallel_workers: numero totale di worker paralleli in tutte le sessioni.
max_parallel_workers_per_gather: numero massimo di worker per query.

Per i carichi di lavoro OLAP, l’aumento di questi valori può migliorare le prestazioni. Per i carichi di lavoro OLTP, in genere sono preferiti valori inferiori.



SHOW max_parallel_workers;
SHOW max_parallel_workers_per_gather;

Ottimizzare l’allocazione delle risorse

Monitorare l’utilizzo della CPU e valutare la possibilità di modificare il numero di vCPU se è costantemente elevato e se l’applicazione trae vantaggio dalle query parallele. Assicurarsi che sia disponibile una memoria adeguata per le operazioni parallele.

Utilizzare le metriche di Approfondimenti sulle prestazioni per determinare se il sistema è legato alla CPU.
Ogni worker parallelo utilizza il proprio work_mem. Assicurarsi che l’utilizzo totale della memoria rientri nei limiti delle istanze.

Le query parallele possono consumare molte più risorse rispetto alle query non parallele, poiché ogni processo worker è un processo completamente separato che ha all’incirca lo stesso impatto sul sistema di una sessione utente aggiuntiva. Questo deve essere tenuto in considerazione quando si sceglie un valore per questa impostazione, nonché quando si configurano altre impostazioni che controllano l’utilizzo delle risorse come work_mem. Per ulteriori informazioni, consultare la documentazione di PostgreSQL. I limiti delle risorse come work_mem vengono applicati individualmente a ciascun worker, il che significa che l’utilizzo totale può essere molto più elevato in tutti i processi rispetto a quanto sarebbe normalmente per ogni singolo processo.

Prendere in considerazione l’aumento delle vCPU o l’ottimizzazione dei parametri di memoria se il carico di lavoro è fortemente parallelizzato.

Esaminare la gestione delle connessioni

In caso di esaurimento delle connessioni, esaminare le strategie di pooling delle connessioni dell’applicazione. Prendere in considerazione l’implementazione del pooling delle connessioni a livello di applicazione, se non è già in uso.

Esaminare e ottimizzare le operazioni di manutenzione

Coordinare la creazione degli indici e le altre attività di manutenzione per prevenire il conflitto di risorse. Prendere in considerazione la possibilità di pianificare queste operazioni durante le ore non di picco. Evitare di pianificare una manutenzione intensa (ad esempio, build di indici paralleli) durante i periodi di elevato carico di query da parte degli utenti. Queste operazioni possono consumare worker paralleli e influire sulle prestazioni delle query regolari.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

IO:WALWrite

IPC: ProcArrayGroupUpdate