Utilisation des vues de catalogue de données dans Athena
Vous pouvez créer de vues de catalogue de données dans Amazon Athena à l’aide d’une instruction CREATE VIEW spéciale et les interroger avec la syntaxe SQL SELECT classique. Les vues de catalogue de données sont également appelées vues multidialectes ou MDV.
Création d’une vue de catalogue de données
Pour créer une vue de catalogue de données dans Athena, utilisez la syntaxe suivante.
CREATE [ OR REPLACE ] PROTECTED MULTI DIALECT VIEWview_nameSECURITY DEFINER [ SHOW VIEW JSON ] ASathena-sql-statement
Note
L’option SHOW VIEW JSON s’applique uniquement aux vues de catalogue de données (et non aux vues Athena). SHOW VIEW JSON permet d’effectuer un test à blanc qui valide l’entrée et, si la validation aboutit, renvoie le JSON de l’objet de table AWS Glue qui représentera la vue. La vue n’est pas réellement créée. Si l’option SHOW VIEW JSON n’est pas spécifiée, des validations sont effectuées et la vue est créée selon la procédure habituelle dans le catalogue de données.
L’exemple suivant montre comment un utilisateur ayant le rôle Definer crée la vue de catalogue de données orders_by_date. L’exemple suppose que le rôle Definer dispose d’autorisations SELECT complètes sur la table orders de la base de données default.
CREATE PROTECTED MULTI DIALECT VIEW orders_by_date SECURITY DEFINER AS SELECT orderdate, sum(totalprice) AS price FROM orders WHERE order_city = 'SEATTLE' GROUP BY orderdate
Pour plus d’informations sur la syntaxe, consultez CREATE PROTECTED MULTI DIALECT VIEW.
Interrogation d’une vue de catalogue de données
Une fois la vue de catalogue de données créée, l’administrateur Lake Formation peut accorder aux principaux Invoker des autorisations SELECT sur cette vue. Les principaux Invoker peuvent ensuite interroger l’affichage sans avoir accès aux tables de base sous-jacentes référencées par l’affichage. Voici un exemple de requête Invoker.
SELECT * from orders_by_date where price > 5000
Considérations et restrictions
La plupart des restrictions suivantes concernant les vues de catalogue de données sont propres à Athena. Pour connaître les restrictions relatives aux vues de catalogue de données qui s’appliquent également à d’autres services, consultez la documentation Lake Formation.
-
Les vues de catalogue de données ne peuvent pas référencer d’autres vues, des liens de ressources de base de données ou des liens de ressources de table.
-
Vous pouvez référencer jusqu’à 10 tables dans la définition de l’affichage.
-
L’autorisation de lac de données
IAMAllowedPrincipalsne doit pas être accordée aux tables dans Lake Formation. Si elle est présente, l’erreurLes vues de dialectes multiples ne peuvent référencer que des tables sans autorisations IAMAllowedPrincipalsse produit. -
L’emplacement Amazon S3 de la table doit être enregistré en tant qu’emplacement de lac de données Lake Formation. Le non-respect de cette condition génère l’erreur
Multi Dialect views may only reference Lake Formation managed tables. Pour plus d’informations sur l’enregistrement des emplacements Amazon S3 dans Lake Formation, consultez Registering an Amazon S3 location dans le Guide de développement d’AWS Lake Formation. -
Les appels d’API AWS Glue GetTables et SearchTables ne mettent pas à jour le paramètre
IsRegisteredWithLakeFormation. Pour afficher la valeur correcte du paramètre, utilisez l’API AWS Glue GetTable. Pour plus d’informations, consultez GetTables and SearchTables APIs do not update the value for the IsRegisteredWithLakeFormation parameter dans le Guide de développement d’AWS Lake Formation. -
Le principal
DEFINERne peut être qu’un rôle IAM. -
Le rôle
DEFINERdoit disposer d’autorisations (octroyables)SELECTcomplètes sur les tables sous-jacentes. -
Les affichages
UNPROTECTEDdu Catalogue de données ne sont pas pris en charge. -
Les fonctions définies par l’utilisateur (UDF) ne sont pas prises en charge dans la définition d’affichage.
-
Les sources de données fédérées Athena ne peuvent pas être utilisées dans les affichages du Catalogue de données.
-
Les affichages du Catalogue de données ne sont pas pris en charge pour les métastores Hive externes.
-
Athena affiche un message d'erreur lorsqu'il détecte des vues périmées. Une vue obsolète est signalée lorsque l'une des situations suivantes se produit :
-
La vue fait référence à des tables ou à des bases de données qui n'existent pas.
-
Une modification de schéma ou de métadonnées est effectuée dans une table référencée.
-
Une table référencée est supprimée et recréée avec un autre schéma ou une autre configuration.
-
Autorisations
Les affichages du Catalogue de données nécessitent trois rôles : Lake Formation Admin, Definer et Invoker.
-
Lake Formation Admin– peut configurer toutes les autorisations de Lake Formation. -
Definer– crée l’affichage du Catalogue de données. Le rôleDefinerdoit disposer d’autorisationsSELECToctroyables complètes pouvant être accordées sur toutes les tables sous-jacentes auxquelles la définition de l’affichage fait référence. -
Invoker– peut interroger l’affichage du Catalogue de données ou vérifier ses métadonnées. Vous pouvez utiliser la fonction DMLinvoker_principal()pour afficher l’appelant d’une requête. Pour de plus amples informations, consultez invoker_principal().
Les relations de confiance du rôle Definer doivent autoriser l’action sts:AssumeRole pour les principaux de service AWS Glue et Lake Formation. Pour plus d’informations, consultez Prerequisites for creating views dans le Guide de développement d’AWS Lake Formation.
Les autorisations IAM pour accéder à Athena sont également requises. Pour de plus amples informations, consultez AWSPolitiques gérées par pour Amazon Athena.