Évaluation des modèles de requêtes - Amazon Redshift

Amazon Redshift ne prendra plus en charge la création de nouveaux Python UDFs à compter du 1er novembre 2025. Si vous souhaitez utiliser Python UDFs, créez la version UDFs antérieure à cette date. Le Python existant UDFs continuera à fonctionner normalement. Pour plus d'informations, consultez le billet de blog.

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Évaluation des modèles de requêtes

Le choix des styles de distribution n’est qu’un des aspects de la conception de base de données. Prenez les styles de distribution dans le contexte du système entier, en équilibrant la distribution avec d’autres facteurs importants tels que la taille du cluster, les méthodes d’encodage de compression, les clés de tri et les contraintes de table.

Testez votre système avec des données qui sont aussi proches que possible des données réelles.

Pour faire de bons choix en matière de styles de distribution, vous devez comprendre les modèles de requête de votre application Amazon Redshift. Identifiez les requêtes les plus coûteuses de votre système et fondez votre conception de base de données initiale sur les exigences de ces requêtes. Les facteurs qui déterminent le coût total d’une requête comprennent la durée d’exécution de la requête et les ressources informatiques qu’elle consomme. Les autres facteurs qui déterminent le coût d’une requête sont la fréquence d’exécution et la perturbation des autres requêtes et des opérations de la base de données.

Identifiez les tables utilisées par les requêtes les plus coûteuses et évaluez leur rôle dans la durée d’exécution des requêtes. Réfléchissez à la manière dont les tables sont jointes et regroupées.

Utilisez les instructions fournies dans cette section pour choisir un style de distribution pour chaque table. Une fois cela fait, créez les tables et chargez-les avec des données aussi proches que possible des données réelles. Testez ensuite les tables pour les types de requêtes que vous pensez utiliser. Vous pouvez évaluer les plans EXPLAIN de la requête pour identifier des opportunités de réglage. Comparez les temps de chargement, l’espace de stockage et les durées d’exécution des requêtes pour équilibrer les configurations requises de votre système.