Contraintes des fonctions Python définies par l’utilisation - Amazon Redshift

Amazon Redshift ne prendra plus en charge la création de nouvelles fonctions Python définies par l’utilisateur à compter du 1er novembre 2025. Si vous souhaitez utiliser des fonctions Python définies par l’utilisateur, créez-les avant cette date. Les fonctions Python définies par l’utilisateur existantes continueront de fonctionner normalement. Pour plus d’informations, consultez le billet de blog .

Contraintes des fonctions Python définies par l’utilisation

Dans la limite des contraintes répertoriées dans cette rubrique, vous pouvez utiliser les fonctions UDF partout où vous utilisez les fonctions scalaires intégrées Amazon Redshift. Pour plus d'informations, consultez Référence sur les fonctions SQL.

Les fonctions Python définies par l'utilisateur Amazon Redshift sont soumises aux contraintes suivantes :

  • Les fonctions Python définies par l'utilisateur ne peuvent pas accéder au réseau ou écrire ou lire dans le système de fichiers.

  • La taille totale des bibliothèques Python installées par l'utilisateur ne peut pas dépasser 100 Mo.

  • Amazon Redshift ne peut exécuter qu’une seule fonction Python définie par l’utilisateur à la fois pour les clusters alloués à l’aide de la gestion automatique de la charge de travail (WLM) et pour les groupes de travail sans serveur. Si vous essayez d’exécuter plusieurs fonctions définies par l’utilisateur simultanément, Amazon Redshift met en file d’attente les fonctions Python définies par l’utilisateur restantes pour qu’elles s’exécutent dans les files d’attente de gestion de la charge de travail. Les fonctions SQL définies par l’utilisateur ne sont pas soumises à une limite de simultanéité lors de l’utilisation de la gestion automatique de la charge de travail.

  • Avec l’utilisation de la gestion manuelle de la charge de travail pour les clusters alloués, le nombre de fonctions Python définies par l’utilisateur pouvant s’exécuter simultanément par cluster est limité à un quart du niveau de simultanéité total du cluster. Par exemple, un cluster alloué avec une simultanéité de 15 peut exécuter un maximum de trois fonctions Python définies par l’utilisateur simultanées.

  • Lorsque vous utilisez des UDF Python, Amazon Redshift ne prend pas en charge les types de données SUPER et HLLSKETCH.