Présentation d’Aurora Optimized Reads dans PostgreSQL Utilisation Cas d’utilisation Contrôle Bonnes pratiques

Amélioration des performances des requêtes pour Aurora PostgreSQL avec Aurora Optimized Reads

Vous pouvez accélérer le traitement des requêtes pour Aurora PostgreSQL avec Aurora Optimized Reads. Une instance de base de données Aurora PostgreSQL qui utilise Aurora Optimized Reads permet d’améliorer jusqu’à 8 fois le temps de latence des requêtes et de réaliser des économies pouvant atteindre 30 % pour les applications comportant des jeux de données volumineux, qui dépassent la capacité de mémoire d’une instance de base de données.

Rubriques

Présentation d’Aurora Optimized Reads dans PostgreSQL
Utilisation d’Aurora Optimized Reads
Cas d’utilisation d’Aurora Optimized Reads
Surveillance des instances de base de données qui utilisent Aurora Optimized Reads
Bonnes pratiques pour Aurora Optimized Reads

Présentation d’Aurora Optimized Reads dans PostgreSQL

Aurora Optimized Reads est disponible par défaut lorsque vous créez un cluster de base de données qui utilise des instances Graviton-based R6gd, R8gd et Intel-based R6id avec un stockage NVMe (NVMe) non volatile. Il est disponible à partir des versions PostgreSQL suivantes :

Versions 14.12 et supérieures, versions 15.7 et supérieures, versions 16.3 et supérieures, versions 17.4 et supérieures pour les instances R8gd
Versions 14.9 et supérieures, versions 15.4 et supérieures, 16.1 et toutes les versions supérieures pour les instances R6gd et R6id

Aurora Optimized Reads prend en charge deux fonctionnalités : le cache à plusieurs niveaux et les objets temporaires.

Cache Reads-enabled hiérarchisé optimisé : à l'aide du cache hiérarchisé, vous pouvez étendre la capacité de mise en cache de votre instance de base de données jusqu'à 5 fois la mémoire de l'instance. Cela permet de maintenir le cache à jour automatiquement de manière à ce qu’il contienne les données les plus récentes et les plus homogènes sur le plan transactionnel, et de libérer ainsi les applications de la charge de gestion de la mise à jour des données des solutions de mise en cache externes basées sur des ensembles de résultats. Il réduit jusqu’à 8 fois le temps de latence des requêtes qui récupéraient auparavant des données du stockage Aurora.

Dans Aurora, la valeur pour shared_buffers dans le groupe de paramètres par défaut est généralement définie sur environ 75 % de la mémoire disponible. Toutefois, pour les types d'instances r8gd, r6gd et r6id, Aurora réduit l'shared_buffersespace de 4,5 % pour héberger les métadonnées du cache de lectures optimisées.

Objets Reads-enabled temporaires optimisés : à l'aide d'objets temporaires, vous pouvez accélérer le traitement des requêtes en plaçant les fichiers temporaires générés par PostgreSQL sur le stockage NVMe local. Cela réduit le trafic à destination d’Elastic Block Storage (EBS) sur le réseau. La latence et le débit sont jusqu’à deux fois supérieurs pour les requêtes avancées qui trient, joignent ou fusionnent les gros volumes de données qui ne rentrent pas dans la capacité de mémoire disponible sur une instance de base de données.

Sur un I/O-Optimized cluster Aurora, Optimized Reads utilise à la fois du cache hiérarchisé et des objets temporaires sur le stockage NVMe. Grâce à la fonctionnalité de cache Reads-enabled hiérarchisé optimisée, Aurora alloue deux fois plus de mémoire d'instance aux objets temporaires, environ 10 % de l'espace de stockage pour les opérations internes et le reste du stockage sous forme de cache hiérarchisé. Sur un cluster Aurora standard, Optimized Reads utilise uniquement des objets temporaires.

I/O-Optimized Les clusters Aurora vous permettent de redimensionner l'espace alloué aux objets Reads-enabled temporaires optimisés à l'aide du paramètre dynamique aurora_temp_space_size au niveau de l'instance. Cette fonctionnalité de redimensionnement est disponible à partir des versions PostgreSQL suivantes :

Version 16.8 et toutes les versions ultérieures
15.12 et versions 15 ultérieures
14.17 et versions 14 ultérieures

Avec ce paramètre, vous pouvez redimensionner la capacité de 2 fois la mémoire de l'instance à 90 % de la capacité de stockage NVMe totale de l'instance sans avoir à redémarrer le moteur de base de données. Lorsque vous élargissez l’espace des objets temporaires, cette modification prend effet immédiatement, quelles que soient les charges de travail simultanées. Toutefois, lorsque vous réduisez l’espace, cette modification ne prend effet qu’une fois qu’il y a suffisamment d’espace inutilisé dans les objets temporaires pour répondre à la nouvelle demande de taille. Une fois que vous avez redimensionné les objets Reads-enabled temporaires optimisés, le cache hiérarchisé s'ajuste automatiquement pour utiliser l'espace disponible.

Engine	Configuration du stockage en cluster	Objets Reads-enabled temporaires optimisés	Cache Reads-enabled hiérarchisé optimisé	Versions prises en charge
PostgreSQL-Compatible Édition Aurora	Standard	Oui	Non	Versions 14.9 et supérieures, versions 15.4 et supérieures, 16.1 et toutes les versions supérieures pour les instances r6gd et r6id Versions 14.12 et supérieures, versions 15.7 et supérieures, versions 16.3 et supérieures, versions 17.4 et supérieures pour les instances r8gd
PostgreSQL-Compatible Édition Aurora	I/O-Optimized	Oui	Oui

Note

Un basculement entre IO-Optimized les clusters standard d'une classe d' NVMe-based instance de base de données entraîne le redémarrage immédiat du moteur de base de données.

Dans Aurora PostgreSQL, utilisez le paramètre temp_tablespaces pour configurer l’espace de la table sur lequel les objets temporaires seront stockés.

Pour vérifier si les objets temporaires sont configurés, utilisez la commande suivante :


postgres=> show temp_tablespaces;
temp_tablespaces
---------------------
aurora_temp_tablespace
(1 row)

aurora_temp_tablespace est un espace de table configuré par Aurora qui pointe vers le stockage local NVMe. Vous ne pouvez pas modifier ce paramètre ou revenir au stockage Amazon EBS.

Pour vérifier si le cache Optimized Reads est activé, utilisez la commande suivante :


postgres=> show shared_preload_libraries;
                 shared_preload_libraries
--------------------------------------------------------
rdsutils,pg_stat_statements,aurora_optimized_reads_cache

Utilisation d’Aurora Optimized Reads

Lorsque vous provisionnez une instance de base de données Aurora PostgreSQL avec l'une des instances de base de données, NVMe-based l'instance de base de données utilise automatiquement les lectures optimisées Aurora.

Pour activer Aurora Optimized Reads, effectuez l’une des actions suivantes :

Créez un cluster de base de données Aurora PostgreSQL à l'aide de l'une des classes d'instance de base NVMe-based de données. Pour de plus amples informations, veuillez consulter Création d’un cluster de bases de données Amazon Aurora.
Modifiez un cluster de base de données Aurora PostgreSQL existant pour utiliser l'une des classes d'instance de base NVMe-based de données. Pour de plus amples informations, veuillez consulter Modification d’un cluster de bases de données Amazon Aurora.

Aurora Optimized Reads est disponible partout Régions AWS où une ou plusieurs classes d'instances de base de données avec stockage SSD NVMe local sont prises en charge. Pour de plus amples informations, veuillez consulter Amazon AuroraClasses d'instances de base de données.

Pour revenir à une instance Aurora non optimisée pour les lectures, remplacez la classe d’instance de base de données de votre instance Aurora par la classe d’instance similaire sans le stockage éphémère NVMe pour les charges de travail de votre base de données. Par exemple, si la classe d’instance de base de données actuelle est db.r6gd.4xlarge, choisissez db.r6g.4xlarge pour revenir en arrière. Pour plus d’informations, consultez Modification d’une instance de base de données Amazon RDS.

Cas d’utilisation d’Aurora Optimized Reads

Cache Reads-enabled hiérarchisé optimisé

Voici quelques cas d’utilisation du cache à plusieurs niveaux Optimized Reads :

Applications Internet (traitement des paiements, facturation, commerce électronique, etc.) avec des SLA de performance stricts.
Real-time des tableaux de bord de reporting qui exécutent des centaines de requêtes ponctuelles à des fins de metrics/data collecte.
Applications d’IA générative avec l’extension pgvector pour rechercher des voisins exacts ou les voisins les plus proches parmi des millions de vecteurs intégrés.

Objets Reads-enabled temporaires optimisés

Voici quelques cas d’utilisation des objets temporaires Optimized Reads :

Requêtes d’application avec des expressions de table communes (CTE), des tables dérivées et des opérations de regroupement complexes.
Réplicas en lecture qui gèrent les requêtes non optimisées pour une application.
On-demand ou des requêtes de reporting dynamiques comportant des opérations complexes telles que GROUP BY et ORDER BY qui ne peuvent pas toujours utiliser les index appropriés.
Opérations CREATE INDEX ou REINDEX pour le tri.
Autres charges de travail utilisant des tables temporaires internes.

Surveillance des instances de base de données qui utilisent Aurora Optimized Reads

Vous pouvez surveiller vos requêtes qui utilisent le cache Reads-enabled hiérarchisé optimisé à l'aide de la commande EXPLAIN, comme illustré dans l'exemple suivant :


Postgres=> EXPLAIN (ANALYZE, BUFFERS) SELECT c FROM sbtest15 WHERE id=100000000                   

QUERY PLAN
--------------------------------------------------------------------------------------
 Index Scan using sbtest15_pkey on sbtest15  (cost=0.57..8.59 rows=1 width=121) (actual time=0.287..0.288 rows=1 loops=1)
   Index Cond: (id = 100000000)
   Buffers: shared hit=3 read=2 aurora_orcache_hit=2
   I/O Timings: shared/local read=0.264
 Planning:
   Buffers: shared hit=33 read=6 aurora_orcache_hit=6
   I/O Timings: shared/local read=0.607
 Planning Time: 0.929 ms
 Execution Time: 0.303 ms
(9 rows)
Time: 2.028 ms

Note

Les champs aurora_orcache_hit et aurora_storage_read de la section Buffers du plan d’explication ne sont affichés que lorsqu’Optimized Reads est activé et que le résultat est supérieur à zéro. Le champ de lecture est le total des champs aurora_orcache_hit et aurora_storage_read.

Vous pouvez surveiller les instances de base de données qui utilisent les lectures optimisées Aurora à l'aide CloudWatch des métriques suivantes :

AuroraOptimizedReadsCacheHitRatio
FreeEphemeralStorage
ReadIOPSEphemeralStorage
ReadLatencyEphemeralStorage
ReadThroughputEphemeralStorage
WriteIOPSEphemeralStorage
WriteLatencyEphemeralStorage
WriteThroughputEphemeralStorage

Ces métriques fournissent des données sur le stockage disponible dans le stockage d’instances, les IOPS et le débit. Pour plus d’informations sur ces métriques, consultez Instance-level métriques pour Amazon Aurora.

Vous pouvez utiliser l’extension pg_proctab pour surveiller le stockage NVMe.


postgres=>select * from pg_diskusage();

major | minor |       devname       | reads_completed | reads_merged | sectors_read | readtime | writes_completed | writes_merged | sectors_written | writetime | current_io | iotime  | totaliotime
------+-------+---------------------+-----------------+--------------+--------------+----------+------------------+---------------+-----------------+-----------+------------+---------+-------------
      |       | rdstemp             |           23264 |            0 |       191450 |    11670 |          1750892 |             0 |        24540576 |    819350 |          0 | 3847580 |      831020
      |       | rdsephemeralstorage |           23271 |            0 |       193098 |     2620 |           114961 |             0 |        13845120 |    130770 |          0 |  215010 |      133410
(2 rows)

Bonnes pratiques pour Aurora Optimized Reads

Utilisez les bonnes pratiques suivantes pour Aurora Optimized Reads :

Surveillez l'espace de stockage disponible sur le magasin d'instances à l'aide de la CloudWatch métriqueFreeEphemeralStorage. Si le stockage d’instances atteint sa limite en raison de la charge de travail de l’instance de base de données, ajustez la simultanéité et les requêtes qui utilisent des objets temporaires de manière intensive, ou modifiez le stockage d’instances pour qu’il utilise une classe d’instance de base de données plus grande.
Surveillez la CloudWatch métrique du taux de réussite du cache Optimized Reads. Des opérations telles que VACUUM modifient très rapidement un grand nombre de blocs. Cela peut entraîner une baisse temporaire du taux d’accès. L’extension pg_prewarm peut être utilisée pour charger des données dans le cache de tampon, ce qui permet à Aurora d’écrire de manière proactive certains de ces blocs dans le cache Optimized Reads.
Vous pouvez activer la gestion du cache de cluster pour réchauffer le cache d tampon et le cache à plusieurs niveaux sur un lecteur de niveau 0, qui sera utilisé comme cible de basculement. Lorsque la gestion du cache de cluster est activée, le cache de tampon est scanné périodiquement pour écrire les pages susceptibles d’être expulsées dans le cache à plusieurs niveaux. Pour plus d’informations sur la gestion du cache de cluster, consultez Récupération rapide après basculement avec la gestion des caches de clusters pour Aurora PostgreSQL.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Optimisation des performances des requêtes dans Aurora PostgreSQL

Optimisation des sous-requêtes corrélées dans Aurora PostgreSQL