Hacer cumplir el aislamiento de los inquilinos

El aislamiento de inquilinos es un concepto que se aplica a todos los entornos con varios inquilinos. Significa que sus políticas y estrategias garantizan que un inquilino no pueda acceder a los recursos de otros inquilinos. En el caso de los agentes con varios inquilinos, es posible que tengas que introducir conceptos y mecanismos que ayuden a hacer cumplir los requisitos de aislamiento de los inquilinos y a los agentes.

Aplicar el aislamiento de inquilinos es similar a otras estrategias que utilizan los sistemas multiarrendatarios tradicionales. Por lo general, cuando diseñe una arquitectura AAA, identifique cualquier área del sistema en la que una solicitud o acción pueda acceder a los recursos para determinar si la solicitud sobrepasa los límites de algún inquilino. Por ejemplo, los microservicios pueden depender de tablas de Amazon DynamoDB dedicadas por inquilino. Esto requiere que introduzca políticas que garanticen que otro inquilino no pueda acceder a la tabla de un inquilino.

En este caso, considere el aislamiento de los inquilinos desde la perspectiva de un agente y sus interacciones con cualquiera de sus recursos por inquilino. El siguiente diagrama muestra un ejemplo conceptual de cómo los agentes aplican las políticas de aislamiento de inquilinos para controlar el acceso a los recursos de los inquilinos.

Aplicar el aislamiento de inquilinos en los agentes.

En la parte derecha de este diagrama, el agente tiene información sobre cada inquilino almacenada en bases de datos vectoriales independientes. A medida que el agente procesa una solicitud, examina el contexto del inquilino que la presenta. En base a esto, el agente aplica una política de aislamiento adecuada para garantizar que los inquilinos no puedan acceder a los datos o recursos fuera de los límites designados.

Si su agente utiliza un protocolo de contexto modelo (MCP), también puede implementar su modelo de aislamiento de inquilinos. El siguiente diagrama muestra un ejemplo de cómo introducir el MCP y aplicar políticas de aislamiento.

El MCP es un protocolo estandarizado que un agente utiliza para integrarse con cualquier herramienta, dato y recurso. En este ejemplo, un cliente MCP y un servidor MCP interactúan con los conocimientos y las herramientas específicos del inquilino que se muestran en la parte derecha del diagrama. El contexto del inquilino fluye del cliente al servidor, y el servidor utiliza este contexto para adquirir las credenciales del servicio (IAM) relacionadas con el inquilino. AWS Identity and Access Management Las credenciales controlan el acceso a los recursos de cada inquilino, lo que garantiza que un inquilino pueda acceder a los recursos de otro inquilino.

A medida que los agentes incorporan la opción de arrendamiento múltiple, deben introducir mecanismos que apliquen políticas de aislamiento de inquilinos a medida que procesan las solicitudes. En algunos casos, la IAM puede ayudar a limitar el acceso a los recursos de los inquilinos. En otros casos, es posible que deba introducir otras herramientas o marcos para aplicar las políticas de aislamiento de los inquilinos.

Vecinos y agentes ruidosos

En un entorno AAA con varios inquilinos en el que varios inquilinos comparten un agente, piense dónde y cómo introducir políticas que eviten que los vecinos sean ruidosos. Las políticas pueden introducir restricciones de uso general que se apliquen a todos los tipos de consumo, o bien pueden tener políticas basadas en inquilinos o niveles que impongan restricciones en función de una persona determinada. Es posible que impongas mayores restricciones de consumo a los inquilinos del nivel básico que a los inquilinos del nivel premium.

Esta noción de limitación se puede aplicar en varios puntos de la arquitectura. El siguiente diagrama muestra un ejemplo de algunas áreas en las que es posible introducir políticas de vecindad ruidosa.

Introduciendo políticas de vecinos ruidosos.

En nuestra revisión previa de la implementación de varios agentes, examinamos los diferentes recursos que su agente puede utilizar y destacamos el potencial de recursos por inquilino dentro de un agente. Cada punto de contacto es un área potencial para introducir políticas de limitación, lo que ayuda a garantizar que los inquilinos no superen los límites de consumo de su sistema o las políticas de estratificación de un inquilino.

Los mejores lugares para introducir protecciones para los vecinos ruidosos son los puntos de la arquitectura en los que los inquilinos comparten recursos. Estos componentes compartidos o agrupados, como el procesamiento, la memoria y los modelos de lenguaje de gran tamaño, son los más susceptibles a la degradación del rendimiento si un solo inquilino consume de forma desproporcionada. APIs

Un lugar natural para aplicar la regulación es en el punto de entrada del agente, a veces denominado «borde exterior». Aquí puedes introducir límites globales o de tenant-tier-based tarifas antes de que el agente comience a procesar la solicitud. La limitación también se puede aplicar en una parte más profunda de la ruta de ejecución, por ejemplo, cuando el agente llama a un LLM, accede a la memoria o invoca herramientas compartidas.

Estas políticas lo ayudan a hacer cumplir el uso justo, a mantener la resiliencia de los agentes ante la presión y a preservar una experiencia coherente entre los inquilinos. En función de tus objetivos, puedes centrarte en la protección general del sistema (resiliencia) o en gestionar de forma pormenorizada la experiencia de los inquilinos (por ejemplo, con prestaciones por niveles).

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Empleo de planos de control en entornos de agentes

Datos, operaciones y pruebas