View a markdown version of this page

Annexe : Sources de données AWS prises en charge par Microsoft Power BI - Utilisation de Microsoft Power BI avec le AWS Cloud

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Annexe : Sources de données AWS prises en charge par Microsoft Power BI

La liste complète des sources de données prises en charge est fournie par Microsoft (reportez-vous aux sources de données Power BI) ; toutefois, les sections suivantes pour chaque source de données AWS fournissent des conseils d'utilisation et de configuration qui peuvent être utiles à certains lecteurs.

Amazon Redshift

Amazon Redshift est un service d'entrepôt de données de plusieurs pétaoctets entièrement géré dans le cloud AWS. Un entrepôt des données Amazon Redshift est un ensemble de ressources informatiques appelées nœuds, qui sont organisées en un groupe appelé cluster. Chaque cluster exécute un moteur Amazon Redshift et contient une ou plusieurs bases de données.

Vous devriez envisager d'utiliser Amazon Redshift lorsque :

  • Vous créez ou migrez vers un entrepôt de données cloud natif.

  • Vous devrez peut-être passer de quelques téraoctets à des centaines de téraoctets.

  • Vous souhaitez permettre aux utilisateurs de Power BI d'accéder de manière transparente aux données du lac de données stocké dans Amazon S3 et de les associer aux tables de l'entrepôt de données.

  • La charge de travail de vos requêtes inclut :

    • Requêtes qui calculent l'agrégation sur de grandes tables (plusieurs gigaoctets et plusieurs téraoctets).

    • SQL extrêmement complexe avec plusieurs jointures et sous-requêtes.

    • Combinaison de requêtes analytiques complexes et de requêtes simples et hautement filtrées utilisées dans les tableaux de bord.

Lorsque vous utilisez Amazon Redshift avec Microsoft Power BI, gardez les points suivants à l'esprit :

  • Amazon Redshift est pris en charge de manière native en tant que source de données Power BI dans les services Microsoft Power BI Desktop et Power BI, et chacun prend en charge les modes d'importation et de requête directe.

  • Bien qu'un cluster Redshift puisse être lancé dans un sous-réseau public et configuré pour autoriser l'accès depuis Internet, la majorité des clients préfèrent le lancer dans un sous-réseau privé pour renforcer la sécurité. Lorsque vous utilisez un sous-réseau privé, utilisez la passerelle de données sur site pour vous connecter du service Power BI à Amazon Redshift.

  • Le connecteur Redshift prend en charge l'authentification Azure AD dans Power BI Desktop and Service.

  • Les tables externes accessibles via Spectrum ne sont pas traitées différemment des tables Redshift natives, et Power BI n'a aucun moyen de les différencier. Lorsque vous accédez à des données dans des tables externes, assurez-vous que :

    • Les colonnes contenant des chaînes de caractères sont répertoriées sous la forme « VARCHAR » dans le catalogue de données AWS Glue et non sous la forme « STRING », sinon Power BI générera l'erreur suivante : Exception: OLE DB or ODBC error: [Expression.Error] We couldn't fold the expression to the data source. Please try a simpler expression..

    • Les colonnes contenant des types de données complexes tels que ARRAY ne sont pas prises en charge. Lorsque des colonnes contenant des types de données complexes sont utilisées, Power BI génère l'erreur suivante : Exception: ODBC: ERROR [42703] [Microsoft]Amazon Redshift Error occurred while trying to execute a query

      Si vous devez les inclure dans votre modèle, vous pouvez soit activer (dans Amazon Redshift) la sérialisation JSON au niveau de l'utilisateur, soit stocker les types de données complexes dans une colonne SUPER d'une table native.

Amazon RDS

Amazon RDS facilite la configuration, l'exploitation et le dimensionnement d'une base de données relationnelle dans le cloud. Amazon RDS est disponible sur plusieurs types d'instances de base de données (optimisés pour la mémoire, les performances ou les E/S) et vous propose six moteurs de base de données courants parmi lesquels choisir, notamment Amazon Aurora, PostgreSQL, MySQL, MariaDB, Oracle Database et SQL Server.

Vous devriez envisager d'utiliser RDS lorsque :

  • Vous créez un magasin de données opérationnel.

  • Vous êtes en train de migrer l'entrepôt de données SQL Server ou Oracle Database vers le cloud, mais le refactoring ne vous intéresse pas.

  • La charge de travail de vos requêtes inclut :

    • Requêtes qui accèdent à des données hautement filtrées sur des tables facilement indexables.

    • Requêtes d'analyse sur des tables small-to-medium de taille (gigaoctets).

    • Un mélange de requêtes analytiques de complexité moyenne et de requêtes simples et hautement filtrées utilisées dans les tableaux de bord.

Lorsque vous utilisez Amazon RDS avec Microsoft Power BI, gardez les points suivants à l'esprit :

  • Amazon RDS fournit plusieurs moteurs de base de données, notamment SQL Server, MariaDB, MySQL, Oracle Database et PostgreSQL. Notez que les moteurs de base de données sont répertoriés dans Power BI Desktop et le service Power BI, et non dans le service Amazon RDS.

  • Pour Amazon Aurora, utilisez le type de connexion My SQL ou PostgreSQL, selon le moteur de base de données sélectionné.

  • Bien qu'une instance Amazon RDS puisse être lancée dans un sous-réseau public et configurée pour autoriser l'accès depuis Internet, la majorité des clients préfèrent la lancer dans un sous-réseau privé pour renforcer la sécurité. Lorsque vous utilisez un sous-réseau privé, utilisez la passerelle de données locale pour vous connecter du service Power BI à RDS.

  • Amazon RDS vous permet de déployer plusieurs éditions de SQL Server (2012, 2014, 2016, 2017 et 2019), notamment Express, Web, Standard et Enterprise.

Amazon Athena

Amazon Athena est un service de requête interactif qui facilite l'analyse des données dans Amazon S3 à l'aide du langage SQL standard. Athena est out-of-the-box intégrée à AWS Glue Data Catalog, ce qui vous permet de créer un référentiel de métadonnées unifié pour différents services, d'explorer des sources de données pour découvrir des schémas, de remplir votre catalogue de données avec des définitions de tables et de partitions nouvelles ou modifiées, et de gérer le versionnement des schémas.

Vous devez considérer Athéna comme une source de données lorsque :

  • Vous souhaitez interroger directement votre lac de données.

  • La charge de travail de vos requêtes inclut :

    • Requêtes qui calculent l'agrégation sur de grandes tables (plusieurs gigaoctets et plusieurs téraoctets)

    • SQL ad hoc interactif, à des fins exploratoires.

Lorsque vous utilisez Amazon Athena avec Microsoft Power BI, gardez les points suivants à l'esprit :

  • Avec la version de juillet 2021 de Microsoft Power BI, un connecteur certifié Microsoft a été introduit pour Amazon Athena. Vous pouvez utiliser le connecteur Microsoft Power BI pour Amazon Athena afin d'analyser les données d'Amazon Athena dans Microsoft Power BI Desktop. Après avoir publié du contenu sur le service Power BI, vous pouvez utiliser la passerelle de données Microsoft sur site pour maintenir le contenu à jour par le biais d'actualisations à la demande ou planifiées.

  • Le connecteur Microsoft Power BI pour Amazon Athena prend en charge les modes de connectivité des données Import et Direct Query. Avec le mode d'importation, les tables et les colonnes sélectionnées sont importées dans Power BI Desktop pour être interrogées. Avec le mode de requête directe, aucune donnée n'est importée ou copiée dans Power BI Desktop, mais Power BI Desktop interroge directement la source de données sous-jacente.

  • Pour plus d'informations sur le connecteur Microsoft Power BI pour Amazon Athena, consultez la section Utilisation du connecteur Amazon Athena Power BI.

  • Notez que le connecteur Microsoft Power BI pour Amazon Athena nécessite l'utilisation du pilote ODBC Amazon Athena et une configuration DSN ODBC valide sur votre système pour interroger Amazon Athena. Pour télécharger le dernier pilote ODBC et pour obtenir des informations de configuration, reportez-vous à la section Connexion à Amazon Athena avec ODBC.

  • Pour un didacticiel sur les étapes de configuration et les meilleures pratiques relatives à l'utilisation du connecteur Microsoft Power BI pour Amazon Athena, reportez-vous à la section Création rapide de tableaux de bord sur Microsoft Power BI à l'aide d'Amazon Athena.

Amazon OpenSearch Service

Vous pouvez utiliser SQL pour interroger votre Amazon OpenSearch Service, plutôt que d'utiliser la requête de recherche DSL basée sur JSON. Les requêtes SQL sont utiles si vous connaissez déjà le langage ou si vous souhaitez intégrer votre domaine à une application qui l'utilise, telle que Microsoft Power BI.

Vous devez considérer Amazon OpenSearch Service comme une source de données lorsque :

  • Vous disposez de données semi-structurées telles que des fichiers journaux ou des sorties JSON, et vous devez rechercher, analyser ou visualiser rapidement les informations.

Lorsque vous utilisez Amazon OpenSearch Service avec Microsoft Power BI, gardez les points suivants à l'esprit :

  • La connectivité à Amazon OpenSearch Service nécessite le pilote Open Database Connectivity (ODBC), un pilote ODBC en lecture seule pour Windows et macOS qui vous permet de connecter des applications de business intelligence (BI) et de visualisation de données telles que Tableau, Microsoft Excel et Power BI au plug-in SQL de votre cluster. Le pilote est disponible sur le site Web OpenSearch Download & Get Started. Pour les instructions de configuration, reportez-vous à la section « Personnalisation du pilote ODBC » du site Web du pilote OpenSearch ODBC.

  • Seul le mode d'importation est actuellement pris en charge.

  • La connectivité de Power BI à Amazon OpenSearch Service nécessite actuellement l'utilisation d'un connecteur bêta. Reportez-vous à la documentation Microsoft Power Query - Référence du connecteur : Amazon Opensearch Service (bêta) pour commencer.

AWS Lake Formation

Lake Formation vous aide à collecter et à cataloguer des données à partir de bases de données et de stockage d'objets, à déplacer les données vers votre nouveau lac de données Amazon S3, à nettoyer et à classer vos données à l'aide d'algorithmes d'apprentissage automatique et à sécuriser l'accès à vos données sensibles. Vos utilisateurs peuvent accéder à un catalogue de données centralisé qui décrit les ensembles de données disponibles et leur utilisation appropriée. Vos utilisateurs utilisent ensuite ces ensembles de données avec les services d'analyse et d'apprentissage automatique de leur choix, tels qu'Amazon Redshift, Amazon Athena et (en version bêta) Amazon EMR pour Apache Spark. Lake Formation s'appuie sur les fonctionnalités disponibles dans AWS Glue.

Vous devriez envisager Lake Formation si vous avez besoin d'un accès précis (ligne et colonne) à votre lac de données au lieu des contrôles traditionnels basés sur l'IAM.

Lorsque vous utilisez Lake Formation avec Microsoft Power BI, gardez les points suivants à l'esprit :

  • Pour interroger les données du catalogue de données de Lake Formation avec Power BI Desktop ou le service Power BI, utilisez le même processus et la même configuration que ceux utilisés pour interroger des données dans Athena. Si vous utilisez le modèle d'autorisation Lake Formation, assurez-vous que la valeur de la clé de propriété de la configuration ODBC DSN pour Amazon Athena est LakeformationEnabled définie sur. true Cela indique au pilote ODBC Amazon Athena d'utiliser le service Lake Formation pour l'autorisation, au lieu d'utiliser directement AWS Security Token Service. Pour plus d'informations, consultez la documentation relative à la connexion à Amazon Athena avec ODBC.

  • Le paramètre « Utiliser uniquement le contrôle d'accès IAM » activé pour assurer la compatibilité avec le comportement existant du catalogue de données garantit une compatibilité totale.

  • La mise à niveau des autorisations de données AWS Glue vers le modèle Lake Formation peut entraîner des incompatibilités et doit être testée avant utilisation. Les tests préliminaires indiquent que l'autorisation ou le refus au niveau des colonnes sont respectés, mais le filtrage au niveau des lignes et des cellules n'a pas été testé par les auteurs, car il est toujours en version préliminaire et sujet à modification.