Utilisation de Mountpoint pour Amazon S3 Configuration de la mise en cache dans Mountpoint

Configuration et utilisation de Mountpoint

Pour utiliser Mountpoint pour Amazon S3, votre hôte a besoin AWS d'informations d'identification valides permettant d'accéder au ou aux compartiments Amazon S3 que vous souhaitez monter. Pour connaître les différentes méthodes d’authentification, consultez les informations d’identification AWS de Mountpoint sur GitHub.

Par exemple, vous pouvez créer un nouvel utilisateur Gestion des identités et des accès AWS (IAM) et un nouveau rôle à cette fin. Assurez-vous que ce rôle a accès au ou aux compartiments que vous souhaitez monter. Vous pouvez transmettre le rôle IAM à votre instance Amazon EC2 avec un profil d’instance.

Rubriques

Utilisation de Mountpoint pour Amazon S3
Configuration de la mise en cache dans Mountpoint

Utilisation de Mountpoint pour Amazon S3

Utilisez Mountpoint pour Amazon S3 pour effectuer les opérations suivantes :

Montez vos compartiments Amazon S3.

Vous pouvez monter des compartiments Amazon S3 manuellement à l’aide de la commande mount-s3.

Dans l’exemple suivant, remplacez amzn-s3-demo-bucket par le nom de votre compartiment S3 et remplacez ~/mnt par le répertoire situé sur votre hôte, où vous souhaitez que votre compartiment S3 soit monté.
```
mkdir ~/mnt
mount-s3 amzn-s3-demo-bucket ~/mnt
```
Comme le client Mountpoint s’exécute en arrière-plan par défaut, le répertoire ~/mnt vous donne désormais accès aux objets de votre compartiment Amazon S3.

Depuis Mountpoint v1.18, vous pouvez également configurer le montage automatique des buckets Amazon S3 au démarrage ou au redémarrage d'une instance.

Pour les instances Amazon EC2 existantes ou en cours d’exécution, recherchez le fichier fstab dans le répertoire /etc/fstab de votre système Linux. Ajoutez ensuite une ligne à votre fichier fstab. Par exemple, pour monter amzn-s3-demo-bucket en utilisant le préfixe example-prefix/ dans votre chemin système /mnt/mountpoint, lisez ce qui suit. Pour utiliser l’exemple suivant, remplacez les user input placeholders par vos propres informations.


s3://amzn-s3-demo-bucket/example-prefix/ /mnt/mountpoint mount-s3 _netdev,nosuid,nodev,nofail,rw 0 0

Consultez le tableau suivant pour obtenir une explication des options utilisées dans l’exemple.

Option	Description
`_netdev`	Indique que le système de fichiers a besoin d’un réseau pour le montage.
`nosuid`	Indique que le système de fichiers ne peut pas contenir de fichiers avec un ID utilisateur défini.
`nodev`	Indique que le système de fichiers ne peut pas contenir de périphériques spéciaux.
`nofail`	Indique que l’échec du montage du système de fichiers doit tout de même permettre au système de démarrer.
`rw`	Indique que le point de montage est créé avec des autorisations de lecture et d’écriture. Vous pouvez également utiliser `ro` en lecture seule.

Pour les nouvelles instances Amazon EC2, vous pouvez modifier les données utilisateur sur un modèle Amazon EC2 et configurer le fichier fstab comme suit. Pour utiliser l’exemple suivant, remplacez les user input placeholders par vos propres informations.


#!/bin/bash -e
MP_RPM=$(mktemp --suffix=.rpm)
curl https://s3.amazonaws.com/mountpoint-s3-release/latest/x86_64/mount-s3.rpm > $MP_RPM
yum install -y $MP_RPM
rm $MP_RPM

MNT_PATH=/mnt/mountpoint
echo "s3://amzn-s3-demo-bucket/ ${MNT_PATH} mount-s3 _netdev,nosuid,nodev,rw,allow-other,nofail" >> /etc/fstab
mkdir $MNT_PATH

systemctl daemon-reload
mount -a

Accédez aux objets dans votre compartiment Amazon S3 via Mountpoint.

Après avoir monté votre compartiment localement, vous pouvez utiliser les commandes Linux courantes, telles que cat et ls, pour manipuler vos objets S3. Mountpoint pour Amazon S3 interprète les clés de votre compartiment Amazon S3 comme des chemins de système de fichiers en les séparant par le caractère de barre oblique (/). Par exemple, si vous avez la clé d’objet Data/2023-01-01.csv dans votre compartiment, vous aurez un répertoire nommé Datadans votre système de fichiers Mountpoint, avec un fichier nommé 2023-01-01.csv à l’intérieur.

Mountpoint pour Amazon S3, volontairement, n’implémente pas l’intégralité de la spécification standard POSIX pour les systèmes de fichiers. Mountpoint est optimisé pour les charges de travail qui nécessitent un accès haut débit en lecture et en écriture aux données stockées dans Amazon S3 via une interface de système de fichiers, mais qui ne dépendent pas des fonctionnalités du système de fichiers. Pour plus d’informations, consultez le comportement du système de fichiers de Mountpoint pour Amazon S3 sur GitHub. Les clients qui ont besoin d'une sémantique de système de fichiers plus riche devraient envisager d'autres services de AWS fichiers, tels qu'Amazon Elastic File System (Amazon EFS) ou Amazon FSx.
Démontez votre compartiment Amazon S3 à l’aide de la commande umount. Cette commande démonte votre compartiment S3 et quitte Mountpoint.

Pour utiliser l’exemple de commande suivant, remplacez ~/mnt par le répertoire situé sur votre hôte, où votre compartiment S3 est monté.
```
umount ~/mnt
```
Note
Pour obtenir la liste des options pour cette commande, exécutez umount --help.

Pour plus de détails sur la configuration de Mountpoint, consultez Amazon S3 bucket configuration et File system configuration sur GitHub.

Configuration de la mise en cache dans Mountpoint

Mountpoint pour Amazon S3 prend en charge différents types de mise en cache des données. Pour accélérer les demandes de lecture répétées, vous pouvez activer l’une des options suivantes :

Cache local : vous pouvez utiliser un cache local dans le stockage de votre instance Amazon EC2 ou dans un volume Amazon Elastic Block Store. Si vous lisez à plusieurs reprises les mêmes données à partir de la même instance de calcul et si vous disposez d’un espace inutilisé dans le stockage de votre instance locale pour le jeu de données lu à plusieurs reprises, vous devez activer un cache local.
Cache partagé : vous pouvez utiliser un cache partagé sur S3 Express One Zone. Si vous lisez de petits objets à plusieurs reprises à partir de plusieurs instances de calcul ou si vous ne connaissez pas la taille de votre jeu de données lu régulièrement et souhaitez bénéficier de l’élasticité de la taille du cache, vous devez activer le cache partagé. Une fois que vous avez activé cette option, Mountpoint conserve les objets d’une taille maximale d’un mégaoctet dans un compartiments de répertoires qui utilise S3 Express One Zone.
Cache local et cache partagé combinés : si vous avez de l’espace inutilisé dans votre cache local, mais que vous souhaitez également un cache partagé entre plusieurs instances, vous pouvez activer à la fois un cache local et un cache partagé.

La mise en cache dans Mountpoint est idéale pour les cas d’utilisation où vous lisez à plusieurs reprises les mêmes données qui ne changent pas au cours des multiples lectures. Par exemple, vous pouvez utiliser la mise en cache avec des tâches d’entraînement de machine learning qui nécessitent de lire plusieurs fois un jeu de données d’entraînement pour améliorer la précision du modèle.

Pour plus d’informations sur la configuration de la mise en cache dans Mountpoint, consultez les exemples suivants.

Cache local

Vous pouvez activer un cache local à l’aide de l’indicateur --cache CACHE_PATH. Dans l’exemple suivant, remplacez CACHE_PATH par le chemin d’accès au répertoire dans lequel vous souhaitez mettre en cache les données. Remplacez amzn-s3-demo-bucket par le nom de votre compartiment Amazon S3 et ~/mnt par le répertoire de votre hôte dans lequel vous souhaitez monter votre compartiment S3.


mkdir ~/mnt
mount-s3 --cache CACHE_PATH amzn-s3-demo-bucket ~/mnt

Lorsque vous activez la mise en cache locale pendant le montage d’un compartiment Amazon S3, Mountpoint crée un sous-répertoire vide à l’emplacement du cache configuré si ce sous-répertoire n’existe pas déjà. Lorsque vous montez un compartiment pour la première fois et que vous le démontez, Mountpoint supprime le contenu du cache local.

Important

Si vous activez la mise en cache locale, Mountpoint conservera le contenu des objets non chiffrés du compartiment Amazon S3 que vous avez monté à l’emplacement du cache local fourni lors du montage. Afin de protéger vos données, vous devez restreindre l’accès à l’emplacement du cache de données en utilisant les mécanismes de contrôle d’accès du système de fichiers.

Cache partagé

Si vous lisez à plusieurs reprises de petits objets (jusqu’à 1 Mo) à partir de plusieurs instances de calcul ou si la taille du jeu de données que vous lisez à plusieurs reprises dépasse souvent la taille du cache local, vous devez utiliser un cache partagé dans S3 Express One Zone. Lorsque vous lisez les mêmes données à plusieurs reprises à partir de plusieurs instances, cela améliore la latence en évitant les demandes redondantes adressées au compartiment Amazon S3 que vous avez monté.

Une fois que vous avez activé le cache partagé, vous payez les données mises en cache dans le compartiment de répertoires de S3 Express One Zone. Vous payez également les demandes effectuées sur vos données dans le compartiments de répertoires de S3 Express One Zone. Pour plus d’informations, consultez Tarification Amazon S3. Mountpoint ne supprime jamais les objets mis en cache à partir des compartiments de répertoires. Pour gérer les coûts de stockage, définissez une politique de cycle de vie pour votre compartiment de répertoires afin qu’Amazon S3 fasse expirer les données mises en cache dans S3 Express One Zone après une période que vous spécifiez. Pour plus d’informations, consultez Configuration de la mise en cache de Mountpoint pour Amazon S3 (langue française non garantie) sur GitHub.

Pour activer la mise en cache dans S3 Express One Zone lorsque vous montez un compartiment Amazon S3 sur votre instance de calcul, utilisez l’indicateur --cache-xz et spécifiez un compartiment de répertoires comme emplacement du cache. Dans l'exemple suivant, remplacez leuser input placeholders.


mount-s3 amzn-s3-demo-bucket ~/mnt --cache-xz amzn-s3-demo-bucket--usw2-az1--x-s3

Cache local et cache partagé combinés

Si vous avez de l’espace inutilisé dans votre cache local, mais que vous souhaitez également un cache partagé entre plusieurs instances, vous pouvez activer à la fois un cache local et un cache partagé. Avec cette configuration de mise en cache, vous pouvez éviter les demandes de lecture redondantes provenant de la même instance vers le cache partagé dans le compartiment de répertoires lorsque les données requises sont mises en cache dans le stockage local. Cela peut réduire les coûts des demandes et améliorer les performances.

Pour activer à la fois un cache local et un cache partagé lorsque vous montez un compartiment Amazon S3, vous devez spécifier les deux emplacements du cache à l’aide des indicateurs --cache et --cache-xz. Pour utiliser l'exemple suivant pour activer à la fois un cache local et un cache partagé, remplacez leuser input placeholders.


mount -s3 amzn-s3-demo-bucket ~/mnt --cache /path/to/mountpoint/cache --cache -xz amzn-s3-demo-bucket--usw2-az1--x-s3

Pour plus d’informations, consultez Configuration de la mise en cache de Mountpoint pour Amazon S3 (langue française non garantie) sur GitHub.

Important

Si vous activez la mise en cache partagée, Mountpoint copie le contenu des objets de votre compartiment Amazon S3 monté dans le compartiment de répertoires S3 que vous indiquez comme emplacement du cache partagé. Il est ainsi accessible à tout appelant ayant accès à ce compartiment de répertoires S3. Pour protéger vos données mises en cache, conformez-vous aux Bonnes pratiques de sécurité pour Amazon S3 afin de vous assurer que vos compartiments utilisent les politiques appropriées et qu’ils ne sont pas accessibles publiquement. Utilisez un compartiment de répertoires dédié à la mise en cache partagée de Mountpoint et n’accordez l’accès qu’aux clients Mountpoint.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Installation de Mountpoint

Dépannage de Mountpoint

Configuration et utilisation de Mountpoint

Rubriques

Utilisation de Mountpoint pour Amazon S3

Note

Configuration de la mise en cache dans Mountpoint

Rubriques

Cache local

Important

Cache partagé

Cache local et cache partagé combinés

Important