Requisitos previos Funcionamiento Precios de aceleración de GPU Operaciones de escritura y aceleración de la GPU Configuraciones de índice compatibles Compatible Regiones de AWS Prácticas recomendadas

Aceleración de GPU para indexación vectorial

La aceleración de la GPU le ayuda a crear bases de datos vectoriales a gran escala de forma más rápida y eficiente. Puede habilitar esta función en OpenSearch dominios y OpenSearch colecciones sin servidor nuevos o existentes. Esta función utiliza la aceleración de la GPU para reducir el tiempo necesario para indexar los datos en índices vectoriales.

Con la aceleración por GPU, puede aumentar la velocidad de indexación vectorial hasta 10 veces a una cuarta parte del costo de indexación.

Requisitos previos

La aceleración por GPU se admite en los OpenSearch dominios que ejecutan una versión o posterior y en las colecciones Serverless. OpenSearch 3.1 OpenSearch Para obtener más información, consulteActualización de los dominios OpenSearch de Amazon Service, y. UpdateDomainConfig UpdateCollection APIs

Funcionamiento

Los índices vectoriales requieren importantes recursos de cómputo para crear estructuras de datos, como los gráficos jerárquicos de mundos pequeños navegables (HNSW). Cuando habilita la aceleración por GPU en su dominio o colección, detecta OpenSearch automáticamente las oportunidades para acelerar la creación de índices y transfiere las compilaciones de índices a las instancias de GPU. OpenSearch El servicio administra las instancias de GPU en tu nombre y las asigna a tu dominio o colección cuando es necesario. Esto significa que no administras la utilización ni pagas por el tiempo de inactividad.

Solo paga por el procesamiento útil mediante unidades de cómputo (OCU): aceleración vectorial. Cada OCU de aceleración vectorial es una combinación de aproximadamente 8 GiB de memoria de CPU, 2 CPUs V y 6 GiB de memoria de GPU. Para obtener más información, consulte Precios de aceleración de GPU.

Para habilitar la aceleración por GPU en su dominio o colección, consulte. Habilitar la aceleración por GPU

Precios de aceleración de GPU

AWS le cobra cuando OpenSearch detecta oportunidades para acelerar las cargas de trabajo de creación de índices de su dominio o colección. Cada OCU de aceleración vectorial es una combinación de aproximadamente 8 GiB de memoria de CPU, 2 CPUs V y 6 GiB de memoria de GPU.

AWS factura a OCU con una granularidad de segundo nivel. En tu estado de cuenta, verás una entrada para calcular en OCU-hours.

Por ejemplo, si utilizas la aceleración de la GPU durante una hora para crear un índice con 2 vCPU y 1 GiB de memoria de GPU, se te facturará 1 OCU. Si utilizas 9 GiB de memoria de CPU mientras utilizas la aceleración de la GPU, se te facturarán 2 OCU.

OpenSearch Serverless añade más OCU OCUs en incrementos de 1 OCU en función de la potencia de cálculo y el almacenamiento necesarios para sus colecciones. Puede configurar un número máximo de OCUs para su cuenta a fin de controlar los costes.

nota

El número de OCUs aprovisionados en cualquier momento puede variar y no es exacto. Con el tiempo, el algoritmo que OpenSearch utiliza OpenSearch Serverless seguirá mejorando para minimizar mejor el uso del sistema.

Para obtener información completa sobre los precios, consulta los precios OpenSearch de Amazon Service.

Operaciones de escritura y aceleración de la GPU

La aceleración de la GPU se activa cuando la tasa de ingestión OpenSearch de vectores (MB/seg) está dentro de un rango. En OpenSearch los dominios, tiene la flexibilidad de configurar este rango mediante y. index.knn.remote_index_build.size.min index.knn.remote_index_build.size.max Por ejemplo, con el rango inferior predeterminado de 50 MB, escribir 15 000 vectores de precisión total con una dimensión de 768 entre los intervalos de actualización activará la aceleración de la GPU de forma predeterminada.

Los datos se escriben con las siguientes operaciones de API:

La aceleración de la GPU se activa con la combinación de segmentos automática y manual.

Configuraciones de índice compatibles

El motor Faiss admite la aceleración de la GPU.

Las siguientes configuraciones no admiten la aceleración por GPU:

Compatible Regiones de AWS

La aceleración por GPU está disponible en los siguientes casos: Regiones de AWS

Este de EE. UU. (Norte de Virginia)
Oeste de EE. UU. (Oregón)
Asia-Pacífico (Sídney)
Asia Pacífico (Tokio)
Europa (Irlanda)

Prácticas recomendadas

Siga estas prácticas recomendadas para maximizar los beneficios de la aceleración de la GPU para sus cargas de trabajo de búsqueda vectorial:

Aumente el número de clientes indexados: para aprovechar al máximo la GPUs creación del índice, aumente el número de clientes indexados en los que ingiere datos. OpenSearch Esto permite una mejor paralelización y utilización de los recursos de la GPU.
Ajuste el umbral aproximado: cambie la index.knn.advanced.approximate_threshold configuración para garantizar que no se generen índices de segmentos más pequeños, lo que mejora la velocidad general de ingesta. Un valor de 10 000 es un buen punto de partida. En el caso de las colecciones, debes especificar explícitamente un valor para esta configuración.
Optimice el tamaño de los fragmentos: intente crear fragmentos que tengan al menos 1 millón de documentos. Es posible que los fragmentos con menos de este número de documentos no se beneficien en general de la aceleración de la GPU.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Uso de la optimización automática en la consola

Habilitar la aceleración por GPU