Rafforzare l'isolamento degli inquilini - AWS Guida prescrittiva

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Rafforzare l'isolamento degli inquilini

L'isolamento dei tenant è un concetto che si applica a tutte le impostazioni multi-tenant. Significa che le tue politiche e strategie garantiscono che un tenant non possa accedere alle risorse degli altri tenant. Per gli agenti multi-tenant, potrebbe essere necessario introdurre costrutti e meccanismi che aiutino a far rispettare i requisiti di isolamento dei tenant degli agenti.

L'applicazione dell'isolamento dei tenant è come altre strategie che utilizzano sistemi multi-tenant tradizionali. In genere, quando costruite un'architettura AaaS, identificate qualsiasi area del sistema in cui una richiesta o un'azione può accedere alle risorse per determinare se la richiesta oltrepassa i limiti dei tenant. Ad esempio, i microservizi possono avere dipendenze da tabelle Amazon DynamoDB dedicate per tenant. Ciò richiede l'introduzione di politiche che garantiscano che la tabella di un tenant non sia accessibile a un altro tenant.

In questo caso, prendete in considerazione l'isolamento del tenant attraverso la lente di un agente e le sue interazioni con una qualsiasi delle sue risorse relative al tenant. Il diagramma seguente mostra un esempio concettuale di come gli agenti applicano le politiche di isolamento dei tenant per controllare l'accesso alle risorse dei tenant.

Applicazione dell'isolamento dei tenant negli agenti.

Sul lato destro di questo diagramma, l'agente dispone di informazioni relative al tenant archiviate in database vettoriali separati. Quando l'agente elabora una richiesta, esamina il contesto del tenant che la effettua. Sulla base di ciò, l'agente applica una politica di isolamento appropriata per garantire che agli inquilini sia impedito l'accesso ai dati o alle risorse al di fuori dei confini designati.

Se l'agente utilizza un Model Context Protocol (MCP), può anche implementare il modello di isolamento dei tenant. Il diagramma seguente mostra un esempio di come introdurre MCP e applicare politiche di isolamento.

Isolamento degli inquilini con MCP.

MCP è un protocollo standardizzato che un agente utilizza per l'integrazione con qualsiasi strumento, dato e risorsa. In questo esempio, un client MCP e un server MCP interagiscono con le conoscenze e gli strumenti specifici del tenant mostrati sul lato destro del diagramma. Il contesto del tenant scorre dal client al server e il server utilizza questo contesto per acquisire credenziali con ambito tenant dal servizio (IAM). AWS Identity and Access Management Le credenziali controllano l'accesso alle risorse di ciascun tenant, garantendo che un tenant possa accedere alle risorse di un altro tenant.

Poiché gli agenti incorporano la multi-tenancy, devono introdurre meccanismi che applichino le politiche di isolamento dei tenant durante l'elaborazione delle richieste. In alcuni casi, IAM può aiutare a limitare l'accesso alle risorse dei tenant. In altri casi, potrebbe essere necessario introdurre altri strumenti o framework per applicare le politiche di isolamento dei tenant.

Vicini e agenti rumorosi

In un ambiente AaaS multi-tenant in cui più inquilini condividono un agente, pensate a dove e come introdurre politiche che prevengano condizioni rumorose nei vicini. Le politiche possono introdurre una limitazione generica che si applica a tutti i consumi, oppure puoi avere politiche basate sugli inquilini o sui livelli che applicano la limitazione in base a una determinata persona. Potresti imporre restrizioni di consumo maggiori agli inquilini di livello base rispetto agli inquilini di livello premium.

Questa nozione di limitazione può essere applicata a più punti dell'architettura. Il diagramma seguente mostra un esempio di alcune aree in cui è possibile introdurre politiche relative ai rumorosi vicini.

Presentazione di politiche relative ai vicini rumorosi.

Nella nostra precedente analisi dell'implementazione multiagente, abbiamo esaminato diverse risorse che l'agente può utilizzare, evidenziando il potenziale di risorse pertenant all'interno di un agente. Ogni punto di contatto è una potenziale area in cui introdurre politiche di limitazione, che aiutano a garantire che gli inquilini non superino i limiti di consumo del sistema o le politiche di suddivisione in più livelli del tenant.

I luoghi migliori per introdurre protezioni contro i rumorosi vicini sono i punti dell'architettura in cui gli inquilini condividono le risorse. Questi componenti condivisi o raggruppati, come elaborazione, memoria e modelli linguistici di grandi dimensioni, sono i più suscettibili al degrado delle prestazioni se un singolo tenant consuma in modo sproporzionato. APIs

Un luogo naturale in cui applicare la limitazione è il punto di ingresso dell'agente, a volte chiamato «bordo esterno». Qui puoi introdurre limiti globali o di tenant-tier-based velocità prima che l'agente inizi a elaborare la richiesta. Il throttling può anche essere applicato più in profondità nel percorso di esecuzione, ad esempio quando l'agente chiama un LLM, accede alla memoria o richiama strumenti condivisi.

Queste politiche aiutano a imporre un utilizzo equo, a mantenere la resilienza degli agenti sotto carico e a preservare un'esperienza coerente tra i tenant. A seconda dei tuoi obiettivi, potresti concentrarti sulla protezione generale del sistema (resilienza) o sulla gestione granulare dell'esperienza degli inquilini (ad esempio, con diritti basati su più livelli).