Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Se utiliza CloudFormation para configurar la inferencia remota para la búsqueda semántica
A partir de OpenSearch la versión 2.9, puede utilizar la inferencia remota con la búsqueda semántica
Con la inferencia remota, puede alojar sus inferencias de modelos de forma remota en servicios de aprendizaje automático, como Amazon SageMaker AI y Amazon Bedrock, y conectarlos a Amazon OpenSearch Service con conectores de aprendizaje automático.
Para facilitar la configuración de la inferencia remota, Amazon OpenSearch Service proporciona una AWS CloudFormationplantilla en la consola. CloudFormation es un Servicio de AWS lugar en el que puede aprovisionar AWS y administrar recursos de terceros tratando la infraestructura como código.
La OpenSearch CloudFormation plantilla automatiza el proceso de aprovisionamiento de modelos, de modo que puede crear fácilmente un modelo en su dominio de OpenSearch servicio y, a continuación, utilizar el ID del modelo para ingerir datos y ejecutar consultas de búsqueda neuronal.
Si utiliza codificadores neuronales dispersos con la versión 2.12 y posteriores del OpenSearch Servicio, le recomendamos que utilice el modelo de tokenizador de forma local en lugar de implementarlo de forma remota. Para obtener más información, consulte los modelos de codificación dispersa
Temas
Plantillas disponibles CloudFormation
Las siguientes plantillas AWS CloudFormation de aprendizaje automático (ML) están disponibles para su uso:
Plantillas de Amazon Bedrock
- Integración de incrustaciones de texto de Amazon Titan
-
Se conecta a los modelos de aprendizaje automático alojados de Amazon Bedrock, elimina la necesidad de implementar modelos independientes y utiliza puntos de enlace de Amazon Bedrock predeterminados. Para obtener más información, consulte Amazon Titan Text Embeddings en la Guía del usuario de Amazon Bedrock.
- Integración de Cohere Embed
-
Proporciona acceso a los modelos Cohere Embed y está optimizado para flujos de trabajo específicos de procesamiento de texto. Para obtener más información, consulte Embed en el sitio web
de documentos de Cohere. - Incrustaciones multimodales Amazon Titan
-
Admite incrustaciones de texto e imágenes y habilita capacidades de búsqueda multimodal. Para obtener más información, consulte Amazon Titan Multimodal Embeddings en la Guía del usuario de Amazon Bedrock.
Plantillas de integración de servidores MCP
- Integración de servidores MCP
-
Implementa un Amazon Bedrock AgentCore Runtime, proporciona un punto de enlace de agente, gestiona la autenticación entrante y saliente y admite OAuth la autenticación empresarial.
SageMaker Plantillas de Amazon
- Integración con modelos de incrustación de texto a través de Amazon SageMaker
-
Implementa modelos de incrustación de texto en Amazon SageMaker Runtime, crea funciones de IAM para el acceso a los artefactos del modelo y establece conectores de aprendizaje automático para la búsqueda semántica.
- Integración con codificadores dispersos mediante SageMaker
-
Configura modelos de codificación dispersos para la búsqueda neuronal, crea AWS Lambda funciones para la gestión de conectores y devuelve el modelo IDs para su uso inmediato.
Requisitos previos
Para usar una CloudFormation plantilla con OpenSearch Service, complete los siguientes requisitos previos.
Configure un dominio de OpenSearch servicio
Antes de poder usar una CloudFormation plantilla, debes configurar un dominio de Amazon OpenSearch Service con la versión 2.9 o posterior y un control de acceso detallado activado. Crea un rol OpenSearch de backend del servicio para dar permiso al plugin ML Commons para que cree tu conector por ti.
La CloudFormation plantilla crea una función de IAM de Lambda para usted con el nombre predeterminadoLambdaInvokeOpenSearchMLCommonsRole, que puede anular si desea elegir un nombre diferente. Una vez que la plantilla cree este rol de IAM, debe conceder permiso a la función Lambda para llamar a OpenSearch su dominio de servicio. Para ello, asigne la función nombrada ml_full_access a su función de backend del OpenSearch servicio siguiendo los siguientes pasos:
-
Navega hasta el complemento OpenSearch Dashboards de tu dominio de OpenSearch servicio. Puedes encontrar el punto de conexión de Dashboards en el panel de control de tu dominio, en la consola de OpenSearch servicio.
-
En el menú principal, seleccione Seguridad, Roles y seleccione el rol ml_full_access.
-
Seleccione Usuarios asignados, Administrar mapeo.
-
En Roles de backend, agregue el ARN del rol de Lambda que necesita permiso para llamar a su dominio.
arn:aws:iam::account-id:role/role-name -
Seleccione Asignar y confirme que el usuario o el rol aparecen en Usuarios asignados.
Una vez que haya asignado la función, vaya a la configuración de seguridad de su dominio y añada la función Lambda IAM a OpenSearch su política de acceso al servicio.
Habilite los permisos en su Cuenta de AWS
Cuenta de AWS Debe tener permiso para acceder CloudFormation a Lambda, junto con lo que Servicio de AWS elija para su plantilla, ya sea SageMaker Runtime o Amazon Bedrock.
Si utiliza Amazon Bedrock, también debe registrar su modelo. Consulte Acceso al modelo en la Guía del usuario de Amazon Bedrock para registrar su modelo.
Si utiliza su propio bucket de Amazon S3 para proporcionar artefactos modelo, debe añadir la función de CloudFormation IAM a su política de acceso a S3. Para más información, consulta Adición y eliminación de permisos de identidad de IAM en la Guía del usuario de IAM.
Inferencia remota para plantillas de resaltado semántico
El resaltado semántico es una función de búsqueda avanzada que mejora la relevancia de los resultados al analizar el significado y el contexto de las consultas en lugar de basarse únicamente en las coincidencias exactas de las palabras clave. Esta función utiliza modelos de aprendizaje automático para evaluar la similitud semántica entre las consultas de búsqueda y el contenido del documento, identificando y resaltando las frases o pasajes más relevantes desde el punto de vista contextual de los documentos. A diferencia de los métodos de resaltado tradicionales, que se centran en las coincidencias exactas de los términos, el resaltado semántico aprovecha los modelos de IA para evaluar cada oración utilizando información contextual tanto de la consulta como del texto circundante, lo que le permite mostrar información pertinente incluso cuando los términos de búsqueda exactos no estén presentes en los pasajes resaltados. Este enfoque es particularmente valioso para las implementaciones de búsqueda impulsadas por la IA, en las que los usuarios dan prioridad al significado semántico por encima de la coincidencia literal de palabras, lo que permite a los administradores de búsquedas ofrecer experiencias de búsqueda más inteligentes y contextualmente conscientes que destacan las extensiones de contenido significativas en lugar de solo las apariciones de palabras clave. Para obtener más información, consulte Uso del resaltado semántico.
Utilice el siguiente procedimiento para abrir y ejecutar una CloudFormation plantilla que configure automáticamente los SageMaker modelos de Amazon para el resaltado semántico.
Para usar la plantilla de resaltado semántico CloudFormation
-
Abre la consola OpenSearch de Amazon Service en https://console.aws.amazon.com/aos/casa
. -
En el panel de navegación izquierdo, seleccione Integraciones.
-
En Habilitar el resaltado semántico mediante SageMaker la integración de Amazon, selecciona Configurar dominio y Configurar dominio público.
-
Siga las instrucciones para configurar el modelo.
nota
OpenSearch El servicio también proporciona una plantilla independiente para configurar el dominio de VPC. Si usa esta plantilla, debe proporcionar el ID de VPC para la función de Lambda.