Conditions préalables Création d'une tâche d'ingestion de vecteurs Surveillance des tâches d'optimisation Affichage des détails de la tâche Visualisation et compréhension des résultats Création d'un index à partir des recommandations

Utilisation de l'optimisation automatique dans la console

Vous pouvez utiliser la console Amazon OpenSearch Service pour créer des tâches d'ingestion de vecteurs, suivre leur progression, consulter les recommandations d'optimisation et créer des index en fonction de ces recommandations.

Conditions préalables

Avant de pouvoir utiliser l'optimisation automatique dans la console, vous devez disposer des éléments suivants :

Un AWS compte actif avec accès à la OpenSearch console.
Une collection OpenSearch Serverless existante de type recherche vectorielle ou OpenSearch domaine géré.
Autorisations IAM pour les actions suivantes :
- opensearch:SubmitAutoOptimizeJob
- opensearch:GetAutoOptimizeJob
- opensearch:DeleteAutoOptimizeJob
- opensearch:CancelAutoOptimizeJob
- opensearch:ListAutoOptimizeJobs
Note
Il s'agit de politiques basées sur l'identité. AWS ne prend pas en charge les politiques basées sur les ressources pour l'optimisation automatique des ressources.
Configurez votre session utilisateur fédérée pour que l'expiration des informations d'identification soit d'au moins 1 heure. Pour les ensembles de données très volumineux ou de grandes dimensions, envisagez d'augmenter la durée d'expiration jusqu'à 3 heures.

Création d'une tâche d'ingestion de vecteurs

Une tâche d'ingestion de vecteurs analyse vos données vectorielles et fournit des recommandations d'optimisation pour la configuration de l'index.

Pour créer une tâche d'ingestion de vecteurs

Connectez-vous à la console Amazon OpenSearch Service à l'adresse AWS Management Console.
Dans le volet de navigation, choisissez Auto-Optimize.
Choisissez Créer une tâche d'ingestion vectorielle.
Sous Détails de la tâche, entrez le nom de votre tâche d'ingestion de vecteurs. Ce nom vous permet d'identifier la tâche dans la console.
Sous Source de données, configurez les éléments suivants :
1. Pour l'URI Amazon S3, entrez l'URI Amazon S3 du dossier contenant vos fichiers Parquet. L'URI doit pointer vers le dossier qui le contient, et non vers des fichiers individuels. Par exemple, si votre fichier Parquet se trouve às3://my-bucket/my-folder/file1.parquet, entrezs3://my-bucket/my-folder/.
2. Pour Région, sélectionnez la AWS région dans laquelle se trouve votre compartiment Amazon S3. La région doit correspondre à l'emplacement du compartiment.
Sous OpenSearch domaine, sélectionnez un domaine ou une collection existant, ou choisissez Créer un nouveau pour en créer un.

Note
Vous pouvez spécifier un domaine OpenSearch géré ou une collection OpenSearch sans serveur sans serveur.
Sous Autorisations de source de données, spécifiez le rôle IAM autorisé à accéder à votre compartiment et à votre OpenSearch domaine ou collection Amazon S3. Le rôle doit disposer des autorisations nécessaires en fonction de la configuration de votre domaine ou de votre collection :
- Pour les OpenSearch domaines dotés d'une politique d'accès au domaine, accordez l'accès au rôle via cette politique.
- Pour les OpenSearch domaines dotés d'un contrôle d'accès précis, ajoutez le rôle en tant que rôle principal.
- Pour les collections OpenSearch sans serveur, ajoutez le rôle à la politique d'accès aux données.
Choisissez Suivant.
Sous Configurer l'index, spécifiez les éléments suivants :
1. Dans Nom du champ, entrez le nom de colonne de votre jeu de données Parquet contenant les données vectorielles.
2. Pour Type d'espace, sélectionnez la métrique de distance utilisée pour calculer la distance entre les vecteurs :
  - l2 - Distance euclidienne
  - cosinesimil - Similarité en cosinus
  - produit intérieur - Produit intérieur
3. Pour Dimension, entrez le nombre de valeurs à virgule flottante dans chaque vecteur.
Sous Exigences de performances, configurez les éléments suivants :
1. Pour Recall, spécifiez la qualité de recherche souhaitée sous la forme d'une valeur décimale comprise entre 0 et 1. Des valeurs de rappel plus élevées renvoient des résultats plus pertinents. Par exemple :
  - 0,95 indique qu'en moyenne 19 des 20 vecteurs de document les plus proches d'un vecteur de requête sont renvoyés
  - 0,9 indique 9 sur 10
  - 0,8 indique 8 sur 10
2. Pour les exigences de latence de recherche, sélectionnez votre tolérance de latence. Des exigences modestes permettent de réaliser des économies supplémentaires grâce à des méthodes de compression qui réduisent les besoins en mémoire.
Choisissez Suivant.
Vérifiez votre configuration et choisissez Create.

Le traitement de la tâche commence. Vous pouvez suivre sa progression dans le tableau des tâches d'ingestion vectorielle.

Surveillance des tâches d'optimisation

Vous pouvez surveiller l'état de vos tâches d'ingestion de vecteurs à partir de la page de destination d'optimisation automatique.

Pour surveiller les tâches d'optimisation

Connectez-vous à la console Amazon OpenSearch Service à la https://console.aws.amazon.com/aos/maison.
Dans le volet de navigation, choisissez Optimisation automatique.
Le tableau des tâches d'ingestion vectorielle affiche toutes les tâches avec leur statut actuel. Actualisez la page pour voir les informations d'état mises à jour.

Note
Il n'existe aucun mécanisme d'actualisation ou de notification automatique. Vous devez actualiser manuellement la console pour voir quand une tâche est terminée.

Comprendre l'état du statut professionnel

Les tâches d'optimisation automatique peuvent avoir les valeurs d'état suivantes :

En attente: La tâche est en file d'attente et attend de commencer.
En cours d’exécution: La tâche d'optimisation automatique consiste à analyser activement vos données et à générer des recommandations.
Terminé: La tâche d'optimisation automatique s'est terminée avec succès. Toutes les analyses, évaluations et recommandations sont complètes et consultables.
Échec: La tâche a rencontré une erreur. Consultez les détails de l'erreur sur la page des détails de la tâche pour en déterminer la cause.
Actif: Un index a été créé dans le cluster attaché et les données ont été ingérées.

La durée du job dépend principalement de la taille du jeu de données et de la charge de service actuelle. Les tâches typiques sont effectuées en 15 minutes à plusieurs heures.

Affichage des détails de la tâche

Vous pouvez consulter des informations détaillées sur une tâche d'optimisation spécifique, notamment sa configuration et son statut.

Pour consulter les détails du poste

Connectez-vous à la console Amazon OpenSearch Service à la https://console.aws.amazon.com/aos/maison.
Dans le volet de navigation, choisissez Auto-Optimize.
Dans le tableau des tâches d'ingestion vectorielle, choisissez le nom de la tâche.
La page des détails de la tâche affiche les informations suivantes :
- Nom et statut du job
- Configuration de la source de données (URI et région Amazon S3)
- OpenSearch domaine ou collection
- Configuration de l'index (nom du champ, type d'espace, dimension)
- Exigences de performance (rappel et latence)
- Messages d'erreur (en cas d'échec de la tâche)

Visualisation et compréhension des résultats

Une fois qu'une tâche est terminée avec succès, vous pouvez consulter les recommandations d'optimisation.

Pour afficher les résultats de l'optimisation

Connectez-vous à la console Amazon OpenSearch Service à la https://console.aws.amazon.com/aos/maison.
Dans le volet de navigation, choisissez Auto-Optimize.
Dans le tableau Tâches d'ingestion vectorielle, choisissez une tâche dont le statut est terminé.
La page de résultats contient les sections suivantes :
- Vue d'ensemble des résultats - Affiche le rappel de qualité de recherche estimé par rapport à vos besoins et l'empreinte mémoire de l'index par rapport à la configuration la plus recommandée.
- Recommandations : répertorie jusqu'à trois recommandations d'optimisation, classées selon la meilleure recommandation correspondant le mieux à votre configuration. Chaque recommandation inclut :
  - Paramètres de configuration de l'index
  - Paramètres de configuration de recherche
  - Indicateurs de performance attendus
  - Estimation de l'empreinte mémoire
Note
Bien que les recommandations soient classées par meilleure correspondance, vous pouvez sélectionner celle qui correspond le mieux à votre cas d'utilisation spécifique. Optimisez automatiquement les tentatives pour trouver les correspondances les plus proches des critères de rappel que vous avez choisis.

Création d'un index à partir des recommandations

Après avoir examiné les recommandations d'optimisation, vous pouvez soit créer manuellement un index à l'aide de la configuration recommandée, soit créer automatiquement un index avec la recommandation sélectionnée.

Pour créer un index automatiquement

Connectez-vous à la console Amazon OpenSearch Service à la https://console.aws.amazon.com/aos/maison.
Dans le volet de navigation, choisissez Auto-Optimize.
Dans le tableau Tâches d'ingestion vectorielle, choisissez une tâche dont le statut est terminé.
Passez en revue les recommandations et sélectionnez celle que vous souhaitez utiliser.
Choisissez Créer un index.
Le système crée automatiquement un index dans votre cluster en utilisant la recommandation sélectionnée et ingère les données vectorielles de votre jeu de données Parquet.

Pour créer un index manuellement

Connectez-vous à la console Amazon OpenSearch Service à la https://console.aws.amazon.com/aos/maison.
Dans le volet de navigation, choisissez Auto-Optimize.
Dans le tableau Tâches d'ingestion vectorielle, choisissez une tâche dont le statut est terminé.
Passez en revue les recommandations et notez la configuration de l'index et les paramètres de configuration de recherche pour la recommandation que vous avez choisie.
Utilisez l' OpenSearch API ou la console pour créer manuellement un index avec les paramètres recommandés.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Optimisation automatique

Accélération par GPU pour l'indexation vectorielle

Utilisation de l'optimisation automatique dans la console

Conditions préalables

Note

Création d'une tâche d'ingestion de vecteurs

Pour créer une tâche d'ingestion de vecteurs

Note

Surveillance des tâches d'optimisation

Pour surveiller les tâches d'optimisation

Note

Comprendre l'état du statut professionnel

Affichage des détails de la tâche

Pour consulter les détails du poste

Visualisation et compréhension des résultats

Pour afficher les résultats de l'optimisation

Note

Création d'un index à partir des recommandations

Pour créer un index automatiquement

Pour créer un index manuellement