Amazon Redshift ne prendra plus en charge la création de nouveaux UDFs Python à partir du patch 198. Les fonctions Python définies par l’utilisateur existantes continueront de fonctionner normalement jusqu’au 30 juin 2026. Pour plus d’informations, consultez le billet de blog
Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Métriques dans Amazon Redshift Spectrum
Cette rubrique décrit les vues système que vous pouvez utiliser pour surveiller les requêtes des lacs de données.
Vous pouvez surveiller les requêtes du lac de données à l'aide des vues système suivantes :
-
Utilisez la vue SVL_S3QUERY pour obtenir des informations détaillées sur les requêtes de lac de données au niveau du segment et de la tranche de nœud.
-
Utilisez la vue SVL_S3QUERY_SUMMARY pour obtenir un résumé de toutes les requêtes de lac de données exécutées sur le système.
Voici quelques-uns des éléments à rechercher dans SVL_S3QUERY_SUMMARY :
-
Nombre de fichiers traités par la requête Redshift Spectrum.
-
Le nombre d’octets analysés à partir d’Amazon S3. Le coût d’une requête Redshift Spectrum est répercuté dans la quantité de données analysées depuis Amazon S3.
-
Nombre d’octets retournés par la couche Redshift Spectrum au cluster. Si le volume de données renvoyées est important, les performances du système peuvent être affectées.
-
Durée maximale et durée moyenne des demandes Redshift Spectrum. Long-running les demandes peuvent indiquer un goulot d'étranglement.
Remarque concernant les clusters provisionnés par RG
Sur les clusters provisionnés par RG, les requêtes Redshift Spectrum s'exécutent sur le propre calcul du cluster plutôt que sur le parc de fréquences dédié utilisé par les clusters provisionnés RA3 et DC2. SVL_S3QUERYet SVL_S3QUERY_SUMMARYcontinuent à être renseignés sur des clusters RG. Les colonnes suivantes ont une sémantique différente ou sont obsolètes.
Colonnes remplies avec une sémantique différente sur les clusters provisionnés par RG
Sur les clusters provisionnés RA3 et DC2, ces colonnes décrivent les lignes, les octets et les unités de travail se déplaçant entre le cluster et le parc Spectrum. Sur les clusters provisionnés par RG, ils décrivent le travail équivalent effectué par le lecteur natif du cluster :
s3_scanned_rows : lignes lues directement depuis Amazon S3 par le lecteur natif du cluster (préfiltre).
s3_scanned_bytes : taille totale de la plage de numérisation en octets traités par le lecteur natif du cluster.
s3query_returned_rows — lignes produites après le filtrage par le lecteur natif du cluster.
s3query_returned_bytes — octets produits après le filtrage par le lecteur natif du cluster.
splits : nombre de plages de numérisation consommées par le lecteur natif du cluster.
total_split_size — taille totale de toutes les plages de numérisation consommées, en octets.
max_split_size — taille de la plus grande plage de numérisation consommée, en octets.
Colonnes déconseillées sur les clusters provisionnés par RG
Ces colonnes décrivent Spectrum-fleet des concepts qui n'existent pas sur RG. Sur les clusters RG, ils sont enregistrés sous la forme -1 dans STL_S3QUERY, et apparaissent donc sous la forme -1 ou ne sont pas significatifs dans SVL_S3QUERY et SVL_S3QUERY_SUMMARY :
total_retries, max_retries — Sur RG, les nouvelles tentatives ont lieu au niveau du client Amazon S3. Utilisez STL_S3CLIENT et STL_S3CLIENT_ERROR pour les détails relatifs aux nouvelles tentatives.
max_request_duration, avg_request_duration — RG n'utilise pas le modèle de demande Spectrum.
max_request_parallelism, avg_request_parallelism — RG n'utilise pas de jetons de demande Spectrum.
slowdown_count, max_concurrent_slowdown_count — Sur RG, les ralentissements d'Amazon S3 sont suivis dans STL_S3CLIENT.
Pour les métriques agrégées par requête sur les clusters RG (partitions, fichiers analysés, lignes et octets renvoyés, format de fichier, emplacement des fichiers, listage et temps de récupération des partitions), vous pouvez également utiliser la vue de surveillance. SYS_EXTERNAL_QUERY_DETAIL