

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# Création d’un jeu de données à partir d’une base de données
<a name="create-a-database-data-set"></a>

Les procédures suivantes vous guident pour vous connecter aux sources de données de base de données et pour créer des jeux de données. Pour créer des ensembles de données à partir de sources de AWS données découvertes automatiquement par votre compte Amazon Quick, utilisez. [Création d’un jeu de données à partir d’un cluster Amazon Redshift ou d’une instance Amazon RDS découvert(e) automatiquement](#create-a-data-set-autodiscovered) Pour créer des jeux de données à partir de toute autre source de données de base de données, utilisez [Création d’un jeu de données à partir d’une base de données qui n’est pas découverte automatiquement](#create-a-data-set-database). 

## Création d’un jeu de données à partir d’un cluster Amazon Redshift ou d’une instance Amazon RDS découvert(e) automatiquement
<a name="create-a-data-set-autodiscovered"></a>

Utilisez la procédure suivante pour créer une connexion à une source de données AWS détectée automatiquement.

**Pour créer une connexion à une source de AWS données découverte automatiquement**

1. Vérifiez les [Quotas de source de données](data-source-limits.md) pour vous assurer que votre table ou requête cible ne dépasse pas les quotas de source de données.

1. Confirmez que les informations d’identification de la base de données que vous prévoyez disposent des autorisations nécessaires présentées sur la page [Autorisations requises](required-permissions.md). 

1. Assurez-vous d'avoir configuré le cluster ou l'instance pour l'accès rapide à Amazon en suivant les instructions de[Exigences de configuration de réseau et de bases de données](configure-access.md).

1. Sur la page de démarrage rapide d'Amazon, sélectionnez **Data**.

1. Choisissez **Créer**, puis sélectionnez **Nouvel ensemble de données**.

1. Choisissez l'icône **RDS** ou **Redshift** Auto-discovered, selon AWS le service auquel vous souhaitez vous connecter.

1. Saisissez les informations de connexion pour la source de données, comme suit :
   + Dans **Data source name (Nom de la source de données)**, attribuez un nom à la source de données.
   + Pour **Instance ID (ID d’instance)**, choisissez le nom de l’instance ou du cluster auquel vous souhaitez vous connecter.
   + **Database name** présente la base de données par défaut pour le cluster ou l’instance **Instance ID**. Si vous souhaitez utiliser une base de données différente sur le cluster ou sur l’instance, tapez son nom.
   + Pour **UserName**, entrez le nom d'utilisateur d'un compte utilisateur autorisé à effectuer les opérations suivantes : 
     + Accédez à la base de données cible. 
     + Lisez (exécutez une instruction `SELECT` dessus) toutes les tables de la base de données que vous souhaitez utiliser.
   + Pour **Mot de passe**, entrez le mot de passe du compte que vous avez entré.

1. Choisissez **Validate connection** pour vérifier l’exactitude de vos informations de connexion.

1. Si la connexion est valide, choisissez **Create data source**. Dans le cas contraire, corrigez les informations de connexion et essayez à nouveau de valider.
**Note**  
Amazon Quick sécurise automatiquement les connexions aux instances Amazon RDS et aux clusters Amazon Redshift à l'aide du protocole SSL (Secure Sockets Layer). Vous n’avez pas besoin de faire quoi que ce soit.

1. Sélectionnez l’une des méthodes suivantes : 
   + **SQL personnalisé**

     Sur l’écran suivant, vous pouvez choisir d’écrire une requête avec l’option **Use custom SQL (Utiliser un SQL personnalisé)**. Cette opération ouvre un écran nommé **Enter custom SQL query (Entrer une requête SQL personnalisée)**, où vous pouvez taper un nom pour votre requête, puis entrer la requête SQL. Pour obtenir de meilleurs résultats, composez la requête dans un éditeur SQL, puis collez-la dans cette fenêtre. Après avoir nommé et saisi la requête, vous pouvez choisir **Edit/Preview data (Modifier/Prévisualiser les données)** ou **Confirm query (Confirmer la requête)**. Sélectionnez **Edit/Preview data (Modifier/Prévisualiser les données)** pour accéder immédiatement à la préparation des données. Sélectionnez **Confirm query (Confirmer la requête)** pour valider le SQL et s’assurer qu’il n’y a pas d’erreurs.
   + **Choisir des tables**

     Si vous préférez vous connecter à des tableaux spécifiques, pour **Schéma : contient des ensembles de tableaux**, choisissez **Sélectionner**, puis choisissez un schéma. Dans certains cas où la base de données ne contient qu’un seul schéma, celui-ci est choisi automatiquement et l’option de sélection de schémas ne s’affiche pas.

     Pour préparer les données avant de créer une analyse, choisissez **Edit/Preview data** pour ouvrir la préparation des données. Utilisez cette option si vous souhaitez rejoindre plusieurs tables.

     Sinon, après avoir choisi une table, choisissez **Select (Sélectionner)**.

1. Choisissez l’une des options suivantes :
   + Préparez les données avant de créer une analyse. Pour ce faire, choisissez **Edit/Preview data (Modifier/Prévisualiser les données)** pour ouvrir la préparation des données pour la table sélectionnée. Pour plus d’informations sur la préparation des données, consultez [Exemples de jeux de données préparés](preparing-data-sets.md).
   + Créez un jeu de données et une analyse en utilisant les données du tableau telles quelles, ainsi que pour importer les données du jeu de données dans SPICE pour améliorer les performances (recommandé). Pour ce faire, vérifiez la taille de la table et l’indicateur SPICE pour voir si vous avez suffisamment de capacité.

     Si vous avez suffisamment de capacité SPICE, choisissez **Importer vers SPICE pour des analyses plus rapides**, puis créez une analyse en choisissant **Visualiser**.
**Note**  
Si vous souhaitez utiliser SPICE et que vous n’avez pas suffisamment d’espace, choisissez **Modifier/apercevoir des données**. Lors de la préparation des données, vous pouvez supprimer des champs du jeu de données afin d’en réduire la taille. Vous pouvez également appliquer un filtre ou écrire une requête SQL qui réduit le nombre de lignes ou de colonnes renvoyées. Pour plus d’informations sur la préparation des données, consultez [Exemples de jeux de données préparés](preparing-data-sets.md).
   + Pour créer un jeu de données et une analyse à l’aide des données d’un tableau telles quelles, et pour que les données soient interrogées directement à partir de la base de données, choisissez **Interroger directement vos données**. Créez ensuite une analyse en choisissant **Visualize (Visualiser)**.

## Création d’un jeu de données à partir d’une base de données qui n’est pas découverte automatiquement
<a name="create-a-data-set-database"></a>

Utilisez la procédure suivante pour créer une connexion à une base de données autre qu’un cluster Amazon Redshift ou une instance Amazon RDS découvert(e) automatiquement. Ces bases de données incluent les clusters Amazon Redshift et les instances Amazon RDS qui se trouvent dans un autre compte Région AWS ou qui sont associées à un autre compte. AWS Elles incluent également les instances MariaDB, Microsoft SQL Server, MySQL, Oracle et PostgreSQL qui sont sur site, dans Amazon EC2 ou dans un autre environnement accessible.

**Créer une connexion à une base de données qui n’est pas un cluster Amazon Redshift ou une instance RDS découverts automatiquement**

1. Vérifiez les [Quotas de source de données](data-source-limits.md) pour vous assurer que votre table ou requête cible ne dépasse pas les quotas de source de données.

1. Confirmez que les informations d’identification de la base de données que vous prévoyez disposent des autorisations nécessaires présentées sur la page [Autorisations requises](required-permissions.md). 

1. Assurez-vous d'avoir configuré le cluster ou l'instance pour l'accès rapide à Amazon en suivant les instructions de[Exigences de configuration de réseau et de bases de données](configure-access.md).

1. Sur la page de démarrage rapide d'Amazon, sélectionnez **Gérer les données**.

1. Choisissez **Créer**, puis sélectionnez **Nouvel ensemble de données**.

1. Choisissez l'icône de **connexion manuelle Redshift** si vous souhaitez vous connecter à un cluster Amazon Redshift situé dans un Région AWS autre ou associé à un autre compte. AWS Sinon, choisissez l’icône de système de gestion de base de données approprié pour se connecter à une instance Amazon Aurora, MariaDB, Microsoft SQL Server, MySQL, Oracle ou PostgreSQL.

1. Saisissez les informations de connexion pour la source de données, comme suit :
   + Dans **Data source name (Nom de la source de données)**, attribuez un nom à la source de données.
   + Pour **Database server (Serveur de base de données)**, entrez l’une des valeurs suivantes :
     + Pour un cluster Amazon Redshift ou une instance Amazon RDS, tapez le point de terminaison du cluster ou de l’instance sans le numéro de port. Par exemple, si la valeur du point de terminaison est `clustername.1234abcd.us-west-2.redshift.amazonaws.com:1234`, entrez `clustername.1234abcd.us-west-2.redshift.amazonaws.com`. Vous pouvez obtenir la valeur du point de terminaison dans le champ **Point** de terminaison de la page détaillée du cluster ou de l'instance dans la AWS console.
     + Pour une instance Amazon EC2 de MariaDB, Microsoft SQL Server, MySQL, Oracle ou PostgreSQL, tapez l’adresse du DNS public. Vous pouvez obtenir la valeur DNS publique à partir du champ **Public DNS** dans le volet de détail d’instance dans la console Amazon EC2.
     + Pour un instance autre qu’une instance Amazon EC2 de MariaDB, Microsoft SQL Server, MySQL, Oracle ou PostgreSQL, tapez le nom d’hôte ou l’adresse IP publique du serveur de base de données. Si vous utilisez SSL (Secure Sockets Layer) pour obtenir une connexion sécurisée (recommandé), vous devez probablement fournir le nom de l’hôte pour établir une correspondance avec les informations requises par le certificat SSL. Pour obtenir une liste des certificats acceptés, consultez [Certificats Amazon Quick SSL et CA](configure-access.md#ca-certificates).
   + Pour **Port**, tapez le port que le cluster ou l’instance utilise pour les connexions.
   + Pour **Database name (Nom de la base de données)**, tapez le nom de la base de données que vous souhaitez utiliser.
   + Pour **UserName**, entrez le nom d'utilisateur d'un compte utilisateur autorisé à effectuer les opérations suivantes : 
     + Accédez à la base de données cible. 
     + Lisez (exécutez une instruction `SELECT` dessus) toutes les tables de la base de données que vous souhaitez utiliser.
   + Dans **Mot de passe**, tapez le mot de passe associé au compte que vous avez entré.

1. (Facultatif) Si vous vous connectez à autre chose qu’un cluster Amazon Redshift et que vous ne voulez *pas* d’une connexion sécurisée, assurez-vous que l’option **Activer SSL** est désactivée. *Nous vous recommandons vivement de laisser la case cochée*, car une connexion non sécurisée peut faire l’objet d’une effraction. 

   Pour plus d’informations sur la façon dont l’instance cible utilise le protocole SSL pour sécuriser les connexions, consultez la documentation concernant le système de gestion de base de données cible. Amazon Quick n'accepte pas les certificats SSL auto-signés comme valides. Pour obtenir une liste des certificats acceptés, consultez [Certificats Amazon Quick SSL et CA](configure-access.md#ca-certificates).

   Amazon Quick sécurise automatiquement les connexions aux clusters Amazon Redshift à l'aide du protocole SSL. Vous n’avez pas besoin de faire quoi que ce soit.

   Certaines bases de données, telles que Presto et Apache Spark, doivent répondre à des exigences supplémentaires avant qu'Amazon Quick puisse se connecter. Pour de plus amples informations, consultez [Création d’une source de données en utilisant Presto](create-a-data-source-presto.md) ou [Création d’une source de données en utilisant Apache Spark](create-a-data-source-spark.md).

1. (Facultatif) Choisissez **Validate connection** pour vérifier l’exactitude de vos informations de connexion.

1. Si la connexion est valide, choisissez **Create data source**. Dans le cas contraire, corrigez les informations de connexion et essayez à nouveau de valider.

1. Sélectionnez l’une des méthodes suivantes : 
   + **SQL personnalisé**

     Sur l’écran suivant, vous pouvez choisir d’écrire une requête avec l’option **Use custom SQL (Utiliser un SQL personnalisé)**. Cette opération ouvre un écran nommé **Enter custom SQL query (Entrer une requête SQL personnalisée)**, où vous pouvez taper un nom pour votre requête, puis entrer la requête SQL. Pour obtenir de meilleurs résultats, composez la requête dans un éditeur SQL, puis collez-la dans cette fenêtre. Après avoir nommé et saisi la requête, vous pouvez choisir **Edit/Preview data (Modifier/Prévisualiser les données)** ou **Confirm query (Confirmer la requête)**. Sélectionnez **Edit/Preview data (Modifier/Prévisualiser les données)** pour accéder immédiatement à la préparation des données. Sélectionnez **Confirm query (Confirmer la requête)** pour valider le SQL et s’assurer qu’il n’y a pas d’erreurs.
   + **Choisir des tables**

     Si vous préférez vous connecter à des tableaux spécifiques, pour **Schéma : contient des ensembles de tableaux**, choisissez **Sélectionner**, puis choisissez un schéma. Dans certains cas où la base de données ne contient qu’un seul schéma, celui-ci est choisi automatiquement et l’option de sélection de schémas ne s’affiche pas.

     Pour préparer les données avant de créer une analyse, choisissez **Edit/Preview data** pour ouvrir la préparation des données. Utilisez cette option si vous souhaitez rejoindre plusieurs tables.

     Sinon, après avoir choisi une table, choisissez **Select (Sélectionner)**.

1. Choisissez l’une des options suivantes :
   + Préparez les données avant de créer une analyse. Pour ce faire, choisissez **Edit/Preview data (Modifier/Prévisualiser les données)** pour ouvrir la préparation des données pour la table sélectionnée. Pour plus d’informations sur la préparation des données, consultez [Exemples de jeux de données préparés](preparing-data-sets.md).
   + Créez un jeu de données et une analyse à l’aide des données de la table telles quelles et importez les données du jeu de données dans SPICE pour améliorer les performances (recommandé). Pour ce faire, vérifiez la taille de la table et l’indicateur SPICE pour voir si vous avez assez d’espace.

     Si vous avez suffisamment de capacité SPICE, choisissez **Importer vers SPICE pour des analyses plus rapides**, puis créez une analyse en choisissant **Visualiser**.
**Note**  
Si vous souhaitez utiliser SPICE et que vous n’avez pas suffisamment d’espace, choisissez **Modifier/apercevoir des données**. Lors de la préparation des données, vous pouvez supprimer des champs du jeu de données afin d’en réduire la taille. Vous pouvez également appliquer un filtre ou écrire une requête SQL qui réduit le nombre de lignes ou de colonnes renvoyées. Pour plus d’informations sur la préparation des données, consultez [Exemples de jeux de données préparés](preparing-data-sets.md).
   + Créez un jeu de données et une analyse à l’aide des données de la table telles quelles et interrogez les données directement depuis la base de données. Pour ce faire, choisissez l’option **Directly query your data (Interrogation directe de vos données)**. Créez ensuite une analyse en choisissant **Visualize (Visualiser)**.