Se utiliza AWS CloudFormation para configurar la inferencia remota para la búsqueda semántica - OpenSearch Servicio Amazon

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Se utiliza AWS CloudFormation para configurar la inferencia remota para la búsqueda semántica

A partir de OpenSearch la versión 2.9, puede utilizar la inferencia remota con la búsqueda semántica para alojar sus propios modelos de aprendizaje automático (ML). La inferencia remota utiliza el complemento ML Commons.

Con la inferencia remota, puede alojar sus inferencias de modelos de forma remota en servicios de aprendizaje automático, como Amazon SageMaker AI y Amazon Bedrock, y conectarlos a Amazon OpenSearch Service con conectores de aprendizaje automático.

Para facilitar la configuración de la inferencia remota, Amazon OpenSearch Service proporciona una AWS CloudFormationplantilla en la consola. CloudFormation es un Servicio de AWS lugar en el que puede aprovisionar AWS y administrar recursos de terceros tratando la infraestructura como código.

La OpenSearch CloudFormation plantilla automatiza el proceso de aprovisionamiento de modelos, de modo que puede crear fácilmente un modelo en su dominio de OpenSearch servicio y, a continuación, utilizar el ID del modelo para ingerir datos y ejecutar consultas de búsqueda neuronal.

Si utiliza codificadores neuronales dispersos con la versión 2.12 y posteriores del OpenSearch Servicio, le recomendamos que utilice el modelo de tokenizador de forma local en lugar de implementarlo de forma remota. Para obtener más información, consulte los modelos de codificación dispersa en la documentación. OpenSearch

Plantillas disponibles AWS CloudFormation

Las siguientes plantillas AWS CloudFormation de aprendizaje automático (ML) están disponibles para su uso:

Plantillas de Amazon Bedrock
Integración de incrustaciones de texto de Amazon Titan

Se conecta a los modelos de aprendizaje automático alojados de Amazon Bedrock, elimina la necesidad de implementar modelos independientes y utiliza puntos de enlace de Amazon Bedrock predeterminados. Para obtener más información, consulte Amazon Titan Text Embeddings en la Guía del usuario de Amazon Bedrock.

Integración de Cohere Embed

Proporciona acceso a los modelos Cohere Embed y está optimizado para flujos de trabajo específicos de procesamiento de texto. Para obtener más información, consulte Embed en el sitio web de documentos de Cohere.

Incrustaciones multimodales Amazon Titan

Admite incrustaciones de texto e imágenes y habilita capacidades de búsqueda multimodal. Para obtener más información, consulte Amazon Titan Multimodal Embeddings en la Guía del usuario de Amazon Bedrock.

Plantillas de integración de servidores MCP
Integración de servidores MCP

Implementa un Amazon Bedrock AgentCore Runtime, proporciona un punto de enlace de agente, gestiona la autenticación entrante y saliente y admite OAuth la autenticación empresarial.

SageMaker Plantillas de Amazon
Integración con modelos de incrustación de texto a través de Amazon SageMaker

Implementa modelos de incrustación de texto en Amazon SageMaker Runtime, crea funciones de IAM para el acceso a los artefactos del modelo y establece conectores de aprendizaje automático para la búsqueda semántica.

Integración con codificadores dispersos mediante SageMaker

Configura modelos de codificación dispersos para la búsqueda neuronal, crea AWS Lambda funciones para la gestión de conectores y devuelve el modelo IDs para su uso inmediato.

Requisitos previos

Para usar una CloudFormation plantilla con OpenSearch Service, complete los siguientes requisitos previos.

Configure un dominio de OpenSearch servicio

Antes de poder usar una CloudFormation plantilla, debes configurar un dominio de Amazon OpenSearch Service con la versión 2.9 o posterior y un control de acceso detallado activado. Crea un rol OpenSearch de backend del servicio para dar permiso al plugin ML Commons para que cree tu conector por ti.

La CloudFormation plantilla crea una función de IAM de Lambda para usted con el nombre predeterminadoLambdaInvokeOpenSearchMLCommonsRole, que puede anular si desea elegir un nombre diferente. Una vez que la plantilla cree este rol de IAM, debe conceder permiso a la función Lambda para llamar a OpenSearch su dominio de servicio. Para ello, asigne la función nombrada ml_full_access a su función de backend del OpenSearch servicio siguiendo los siguientes pasos:

  1. Navega hasta el complemento OpenSearch Dashboards de tu dominio de OpenSearch servicio. Puedes encontrar el punto de conexión de Dashboards en el panel de control de tu dominio, en la consola de OpenSearch servicio.

  2. En el menú principal, seleccione Seguridad, Roles y seleccione el rol ml_full_access.

  3. Seleccione Usuarios asignados, Administrar mapeo.

  4. En Roles de backend, agregue el ARN del rol de Lambda que necesita permiso para llamar a su dominio.

    arn:aws:iam::account-id:role/role-name
  5. Seleccione Asignar y confirme que el usuario o el rol aparecen en Usuarios asignados.

Una vez que haya asignado la función, vaya a la configuración de seguridad de su dominio y añada la función Lambda IAM a OpenSearch su política de acceso al servicio.

Habilite los permisos en su Cuenta de AWS

Cuenta de AWS Debe tener permiso para acceder CloudFormation a Lambda, junto con lo que Servicio de AWS elija para su plantilla, ya sea SageMaker Runtime o Amazon Bedrock.

Si utiliza Amazon Bedrock, también debe registrar su modelo. Consulte Acceso al modelo en la Guía del usuario de Amazon Bedrock para registrar su modelo.

Si utiliza su propio bucket de Amazon S3 para proporcionar artefactos modelo, debe añadir la función de CloudFormation IAM a su política de acceso a S3. Para más información, consulta Adición y eliminación de permisos de identidad de IAM en la Guía del usuario de IAM.