Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Uso de la optimización automática en la consola
Puede utilizar la consola de Amazon OpenSearch Service para crear trabajos de ingestión de vectores, supervisar su progreso, ver las recomendaciones de optimización y crear índices basados en esas recomendaciones.
Requisitos previos
Para poder utilizar la optimización automática en la consola, debe disponer de lo siguiente:
-
Una AWS cuenta activa con acceso a la OpenSearch consola.
-
Una colección existente OpenSearch sin servidor de tipo búsqueda vectorial o OpenSearch dominio gestionado.
-
Permisos de IAM para las siguientes acciones:
opensearch:SubmitAutoOptimizeJobopensearch:GetAutoOptimizeJobopensearch:DeleteAutoOptimizeJobopensearch:CancelAutoOptimizeJobopensearch:ListAutoOptimizeJobs
nota
Se trata de políticas basadas en la identidad. AWS no admite políticas basadas en recursos para la optimización automática de los recursos.
-
Configure su sesión de usuario federado para que las credenciales caduquen como mínimo 1 hora. Para conjuntos de datos muy grandes o de dimensiones elevadas, considere la posibilidad de aumentar la duración de caducidad hasta 3 horas.
Crear un trabajo de ingestión de vectores
Un trabajo de ingestión de vectores analiza los datos vectoriales y proporciona recomendaciones de optimización para la configuración del índice.
Para crear un trabajo de ingestión de vectores
-
Inicia sesión en la consola OpenSearch de Amazon Service en Consola de administración de AWS
. -
En el panel de navegación, selecciona Optimización automática.
-
Seleccione Crear trabajo de ingestión de vectores.
-
En Detalles del trabajo, introduzca un nombre para su trabajo de ingestión de vectores. Este nombre le ayuda a identificar el trabajo en la consola.
-
En Fuente de datos, configure lo siguiente:
-
Para el URI de Amazon S3, introduzca el URI de Amazon S3 de la carpeta que contiene los archivos de Parquet. El URI debe apuntar a la carpeta adjunta, no a archivos individuales. Por ejemplo, si el archivo Parquet está en
s3://my-bucket/my-folder/file1.parquet, introduzcas3://my-bucket/my-folder/. -
En Región, selecciona la AWS región en la que se encuentra tu bucket de Amazon S3. La región debe coincidir con la ubicación del depósito.
-
-
En OpenSearch Dominio, selecciona un dominio o colección existente o selecciona Crear nuevo para crear uno.
nota
Puede especificar un dominio OpenSearch gestionado o una colección OpenSearch sin servidor y sin servidor.
-
En Permisos de fuente de datos, especifique el rol de IAM que tiene permisos para acceder a su bucket, OpenSearch dominio o colección de Amazon S3. El rol debe tener los permisos necesarios en función de la configuración de su dominio o colección:
-
En el OpenSearch caso de los dominios con una política de acceso al dominio, conceda acceso al rol mediante esa política.
-
En el OpenSearch caso de los dominios con un control de acceso detallado, añada la función como función de back-end.
-
En el caso de las colecciones OpenSearch sin servidor, añada la función a la política de acceso a los datos.
-
-
Elija Siguiente.
-
En Configurar índice, especifique lo siguiente:
-
En Nombre de campo, introduzca el nombre de la columna del conjunto de datos de Parquet que contiene los datos vectoriales.
-
En Tipo de espacio, seleccione la métrica de distancia utilizada para calcular la distancia entre los vectores:
l2: distancia euclidiana
cosinesimil - Similitud de coseno
producto interno - Producto interno
-
En Dimensión, introduzca el número de valores de punto flotante en cada vector.
-
-
En Requisitos de rendimiento, configure lo siguiente:
-
Para Recall, especifique la calidad de búsqueda deseada como un valor decimal entre 0 y 1. Los valores de recuperación más altos devuelven resultados más relevantes. Por ejemplo:
Un valor de 0,95 indica que, de media, se devuelven 19 de los 20 vectores de documento verdaderos más cercanos a un vector de consulta
0.9 indica 9 de cada 10
0.8 indica 8 de cada 10
-
Para conocer los requisitos de latencia de búsqueda, selecciona tu tolerancia de latencia. Los requisitos modestos permiten ahorrar más costes gracias a los métodos de compresión que reducen los requisitos de memoria.
-
-
Elija Siguiente.
-
Revise la configuración y seleccione Crear.
El trabajo comienza a procesarse. Puede supervisar su progreso en la tabla de trabajos de ingestión de vectores.
Supervisión de los trabajos de optimización
Puede supervisar el estado de sus trabajos de ingestión de vectores desde la página de destino de optimización automática.
Para supervisar los trabajos de optimización
-
Inicia sesión en la consola OpenSearch de Amazon Service desde https://console.aws.amazon.com/aos/casa
. -
En el panel de navegación, selecciona Optimización automática.
-
La tabla de trabajos de ingestión de vectores muestra todos los trabajos con su estado actual. Actualice la página para ver la información de estado actualizada.
nota
No hay ningún mecanismo automático de actualización o notificación. Debe actualizar manualmente la consola para ver cuándo se completa un trabajo.
Comprender los estados del estado del trabajo
Los trabajos de optimización automática pueden tener los siguientes valores de estado:
- Pending (Pendiente)
-
El trabajo está en cola y esperando para empezar.
- Ejecutar
-
El trabajo de optimización automática consiste en analizar activamente sus datos y generar recomendaciones.
- Completado
-
El trabajo de optimización automática ha finalizado correctamente. Todos los análisis, las evaluaciones y las recomendaciones están completos y están disponibles para su visualización.
- Con error
-
El trabajo detectó un error. Consulte los detalles del error en la página de detalles del trabajo para determinar la causa.
- Activo
-
Se ha creado un índice en el clúster adjunto y se han incorporado los datos.
La duración del trabajo depende principalmente del tamaño del conjunto de datos y de la carga de servicio actual. Los trabajos típicos se completan entre 15 minutos y varias horas.
Consultar detalles del trabajo
Puede ver información detallada sobre un trabajo de optimización específico, incluida su configuración y estado.
Para ver los detalles del trabajo
-
Inicia sesión en la consola OpenSearch de Amazon Service desde https://console.aws.amazon.com/aos/casa
. -
En el panel de navegación, selecciona Optimización automática.
-
En la tabla Trabajos de ingestión de vectores, elija el nombre del trabajo.
-
La página de detalles del trabajo muestra la siguiente información:
Nombre y estado del trabajo
Configuración de la fuente de datos (región y URI de Amazon S3)
OpenSearch dominio o colección
Configuración del índice (nombre de campo, tipo de espacio, dimensión)
Requisitos de rendimiento (recuperación y latencia)
Mensajes de error (si el trabajo ha fallado)
Visualización y comprensión de los resultados
Una vez que un trabajo se complete correctamente, podrá ver las recomendaciones de optimización.
Para ver los resultados de la optimización
-
Inicia sesión en la consola OpenSearch de Amazon Service desde https://console.aws.amazon.com/aos/casa
. -
En el panel de navegación, selecciona Optimización automática.
-
En la tabla Trabajos de ingestión de vectores, elija un trabajo con el estado Completado.
-
La página de resultados muestra las siguientes secciones:
-
Resumen de los resultados: muestra la calidad de búsqueda estimada en comparación con sus requisitos y el espacio de memoria del índice en comparación con la configuración más recomendada.
-
Recomendaciones: enumera hasta tres recomendaciones de optimización, ordenadas con la recomendación principal como la que mejor se adapte a su configuración. Cada recomendación incluye:
Parámetros de configuración del índice
Parámetros de configuración de búsqueda
Métricas de rendimiento esperadas
Estimaciones del espacio de memoria
nota
Si bien las recomendaciones se ordenan según la mejor opción, puedes seleccionar la que mejor se adapte a tu caso de uso específico. Optimice automáticamente los intentos para encontrar las que más coincidan con los criterios de recuperación que haya elegido.
-
Crear un índice a partir de las recomendaciones
Tras revisar las recomendaciones de optimización, puede crear un índice manualmente con la configuración recomendada o crear automáticamente un índice con la recomendación seleccionada.
Para crear un índice automáticamente
-
Inicia sesión en la consola OpenSearch de Amazon Service desde https://console.aws.amazon.com/aos/casa
. -
En el panel de navegación, selecciona Optimización automática.
-
En la tabla Trabajos de ingestión de vectores, elija un trabajo con el estado Completado.
-
Revise las recomendaciones y seleccione la que desee usar.
-
Elige Crear índice.
-
El sistema crea automáticamente un índice en el clúster según la recomendación seleccionada e ingiere los datos vectoriales del conjunto de datos de Parquet.
Para crear un índice manualmente
-
Inicia sesión en la consola OpenSearch de Amazon Service desde https://console.aws.amazon.com/aos/casa
. -
En el panel de navegación, selecciona Optimización automática.
-
En la tabla Trabajos de ingestión de vectores, elija un trabajo con el estado Completado.
-
Revise las recomendaciones y anote la configuración del índice y los parámetros de configuración de búsqueda de la recomendación que elija.
-
Utilice la OpenSearch API o la consola para crear manualmente un índice con los parámetros recomendados.