Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Aceleración por GPU para la indexación vectorial
La aceleración de la GPU le ayuda a crear bases de datos vectoriales a gran escala de forma más rápida y eficiente. Puede habilitar esta función en OpenSearch dominios y OpenSearch colecciones sin servidor nuevos o existentes. Esta función utiliza la aceleración de la GPU para reducir el tiempo necesario para indexar los datos en índices vectoriales.
Con la aceleración por GPU, puede aumentar la velocidad de indexación vectorial hasta 10 veces a una cuarta parte del costo de indexación.
Requisitos previos
La aceleración por GPU se admite en los OpenSearch dominios que ejecutan una versión o posterior y en las colecciones Serverless. OpenSearch 3.1 OpenSearch Para obtener más información, consulteActualización de los dominios OpenSearch de Amazon Service, y. UpdateDomainConfigUpdateCollection APIs
Funcionamiento
Los índices vectoriales requieren importantes recursos de cómputo para crear estructuras de datos, como los gráficos jerárquicos de mundos pequeños navegables (HNSW). Cuando habilita la aceleración por GPU en su dominio o colección, detecta OpenSearch automáticamente las oportunidades para acelerar la creación de índices y transfiere las compilaciones de índices a las instancias de GPU. OpenSearch El servicio administra las instancias de GPU en tu nombre y las asigna a tu dominio o colección cuando es necesario. Esto significa que no administras la utilización ni pagas por el tiempo de inactividad.
Solo paga por el procesamiento útil mediante unidades de cómputo (OCU): aceleración vectorial. Cada OCU de aceleración vectorial es una combinación de aproximadamente 8 GiB de memoria de CPU, 2 CPUs V y 6 GiB de memoria de GPU. Para obtener más información, consulte Precios de aceleración de GPU.
Para habilitar la aceleración por GPU en su dominio o colección, consulte. Habilitar la aceleración de la GPU
Precios de aceleración de GPU
AWS le cobra cuando OpenSearch detecta oportunidades para acelerar las cargas de trabajo de creación de índices de su dominio o colección. Cada OCU de aceleración vectorial es una combinación de aproximadamente 8 GiB de memoria de CPU, 2 CPUs V y 6 GiB de memoria de GPU.
AWS factura a OCU con una granularidad de segundo nivel. En tu estado de cuenta, verás una entrada para calcular en OCU-hours.
Por ejemplo, si utilizas la aceleración de la GPU durante una hora para crear un índice con 2 vCPU y 1 GiB de memoria de GPU, se te facturará 1 OCU. Si utilizas 9 GiB de memoria de CPU mientras utilizas la aceleración de la GPU, se te facturarán 2 OCU.
OpenSearch Serverless añade más OCU OCUs en incrementos de 1 OCU en función de la potencia de cálculo y el almacenamiento necesarios para sus colecciones. Puede configurar un número máximo de OCUs para su cuenta a fin de controlar los costes.
nota
El número de OCUs aprovisionados en cualquier momento puede variar y no es exacto. Con el tiempo, el algoritmo que OpenSearch utiliza OpenSearch Serverless seguirá mejorando para minimizar mejor el uso del sistema.
Para obtener información completa sobre los precios, consulta los precios OpenSearch de Amazon Service
Operaciones de escritura y aceleración de la GPU
La aceleración de la GPU se activa cuando la tasa de ingestión OpenSearch de vectores (MB/seg) está dentro de un rango. En OpenSearch los dominios, tiene la flexibilidad de configurar este rango mediante y.index.knn.remote_index_build.size.min index.knn.remote_index_build.size.max Por ejemplo, con el rango inferior predeterminado de 50 MB, escribir 15 000 vectores de precisión total con una dimensión de 768 entre los intervalos de actualización activará la aceleración de la GPU de forma predeterminada.
Los datos se escriben con las siguientes operaciones de API:
La aceleración de la GPU se activa con la combinación de segmentos automática y manual
Configuraciones de índice compatibles
El motor Faiss
Las siguientes configuraciones no admiten la aceleración de la GPU:
Prácticas recomendadas
Siga estas prácticas recomendadas para maximizar los beneficios de la aceleración de la GPU para sus cargas de trabajo de búsqueda vectorial:
-
Aumente el número de clientes indexados: para aprovechar al máximo la GPUs creación del índice, aumente el número de clientes indexados en los que ingiere datos. OpenSearch Esto permite una mejor paralelización y utilización de los recursos de la GPU.
-
Ajuste el umbral aproximado: cambie la
index.knn.advanced.approximate_thresholdconfiguración para garantizar que no se generen índices de segmentos más pequeños, lo que mejora la velocidad general de ingesta. Un valor de 10 000 es un buen punto de partida. En el caso de las colecciones, debes especificar explícitamente un valor para esta configuración. -
Optimice el tamaño de los fragmentos: intente crear fragmentos que tengan al menos 1 millón de documentos. Es posible que los fragmentos con menos de este número de documentos no se beneficien en general de la aceleración de la GPU.