View a markdown version of this page

Agent Builder - Generativer KI-Anwendungsgenerator auf AWS

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Agent Builder

Der Agent Builder bietet eine Plattform für die Erstellung, Bereitstellung und Verwaltung produktionsbereiter KI-Agenten auf Amazon Bedrock. AgentCore In diesem Abschnitt werden die technischen Komponenten und Implementierungsdetails beschrieben.

AgentCore Integration

Agent Builder verwendet einen konfigurationsbasierten Bereitstellungsansatz mit vorgefertigten Agenten-Images, um schnelle, sichere und skalierbare Agentenbereitstellungen zu ermöglichen.

Vorgefertigte Agenten-Images

Container-Images für Agenten werden während der CI/CD Pipeline vom GAAB-Team erstellt und in einem öffentlichen ECR-Repository veröffentlicht. Jede Image-Version ist an die GAAB-Lösungsversion gebunden (z. B. v4.0.0 →:v4.0.0). gaab-strands-agent Bilder basieren auf dem Strands SDK und beinhalten:

  • Laufzeitumgebung für Agenten

  • MCP-Client-Integration

  • Funktionen zur Speicherverwaltung

  • OpenTelemetry Instrumentierung

ECR-Pull-Through-Cache

Die Lösung verwendet den ECR Pull-Through Cache, um Agenten-Images automatisch aus dem öffentlichen ECR-Repository an den privaten ECR des Kunden zu verteilen. Dieser von AWS verwaltete Service:

  • Zwischenspeichert Bilder beim ersten Abruf (2-5 Minuten Verzögerung)

  • Eliminiert die benutzerdefinierte Logik zum Kopieren von Bildern

  • Stellt lokale Image-Verfügbarkeit für nachfolgende Bereitstellungen bereit

  • Erstellt eindeutige Cache-Regeln pro Bereitstellung, um Konflikte zu vermeiden

Speicher für die Konfiguration

Agentenkonfigurationen werden zusammen mit bestehenden Anwendungsfallkonfigurationen in DynamoDB gespeichert. Jede Konfiguration umfasst:

  • Vorlage für die Systemaufforderung

  • Modellanbieter und Modell-ID

  • Modellparameter (Temperatur, max_tokens)

  • MCP-Serverreferenzen und Endpunkte

  • Speichereinstellungen (Umschalten zwischen Langzeitspeicher)

  • Metadaten für die Bereitstellung

Registrierung der Image-Version

Eine DynamoDB-Tabelle verfolgt die verfügbaren Agent-Image-Versionen und deren Cache URIs und ermöglicht so Versionsverwaltung und Abwärtskompatibilität.

Agentenkonfiguration

Systemaufforderungen

Systemaufforderungen definieren das Verhalten, die Persönlichkeit und die Fähigkeiten der Agenten. Admin-Benutzer können:

  • Die Standardvorlage über die Agent Builder-Benutzeroberfläche bearbeiten

  • Fügen Sie Anweisungen zur Verwendung des Tools und zur Formatierung von Antworten hinzu

  • Sie können jederzeit auf die Standardvorlage zurückgesetzt werden

Auswahl des Modells

Agent Builder unterstützt Amazon Bedrock-Modelle in Version 4.0.0:

  • Modellanbieter: Amazon Bedrock (einzige Option in v4.0.0)

  • Modellauswahl: Claude, Nova und andere Bedrock-Modelle

  • Modellparameter: Temperatur, max_tokens, top_p und modellspezifische Einstellungen

MCP-Serverintegration

Model Context Protocol-Server bieten Agenten Zugriff auf Unternehmenstools und Daten:

  • Servererkennung über den API-Endpunkt GET /mcp

  • Dynamische Konfiguration ohne Codeänderungen

  • Authentifizierung und Endpunktmanagement

  • Zugriff auf die Funktionen des Tools durch Agenten

Streaming und Verarbeitung

Streaming in Echtzeit

Agent Builder verwendet Server-Sent Events (SSE) von AgentCore Bridged bis hin zu WebSocket Response-Streaming in Echtzeit:

  • Lambda-Funktion stellt SSE-Verbindung zu AgentCore Runtime her

  • Streams werden zum API Gateway überbrückt WebSocket

  • Ermöglicht die Bereitstellung von token-by-token Antworten an Kunden

  • Hält die Verbindung für lang andauernde Anfragen aufrecht

Einschränkungen bei der Verarbeitung

Die Agentenverarbeitung in Version 4.0.0 ist auf das Timeout der Lambda-Ausführung beschränkt:

  • Maximale Verarbeitungszeit: 15 Minuten

  • Synchrones Verarbeitungsmodell

  • Geeignet für Konversationsagenten und moderate Arbeitsabläufe

  • Erweiterte asynchrone Unterstützung ist für Version 4.1 und höher geplant

Speicherverwaltung

Kurzzeitgedächtnis

Standardmäßig für alle Agenten aktiviert, die eine benutzerdefinierte Option verwenden MemoryHookProvider:

  • Erfasst Konversationsereignisse über die Callback-Handler von Strands

  • Organisiert nach ActorID und sessionId zur Kontextisolation

  • Behält den Konversationskontext innerhalb von Sitzungen bei

  • Automatische Integration mit AgentCore Memory

Langzeitgedächtnis

Optionale Funktion mit dem AgentCore Memory Tool von strands_tools:

  • Einfaches Umschalten in der Agent Builder-Benutzeroberfläche

  • Semantische Speicherstrategie mit Standardeinstellungen

  • Agentengesteuerter Zugriff durch natürlichen Toolaufruf

  • Speichert die gewonnenen Erkenntnisse sitzungsübergreifend

  • Verwendet ConversationID als sessionId

Beobachtbarkeit

OpenTelemetry AWS-Distribution (ADOT)

Agenten werden während der Container-Erstellung automatisch instrumentiert:

  • Automatische Trace-Generierung für Agentenoperationen

  • Verteilte Ablaufverfolgung über Dienstgrenzen hinweg

  • Strukturierte Protokollierung mit Korrelation IDs

  • Integration mit der CloudWatch Transaktionssuche

Ablauf der Authentifizierung

Benutzer authentifizieren sich über Amazon Cognito mit JWT-Token, die von benutzerdefinierten Lambda-Autorisierern validiert wurden, die basierend auf Benutzergruppen IAM-Richtlinien von DynamoDB abrufen.

Workflow-Builder

Workflow Builder ermöglicht die Orchestrierung mehrerer Agenten, indem ein Supervisor-Agent erstellt wird, der mehrere Agent Builder-Agenten mithilfe des Delegierungsmusters Agents as Tools koordiniert.

Workflow-Architektur

Die wichtigsten Komponenten

  • Supervisor Agent: Entrypoint-Agent, der Benutzeranfragen entgegennimmt und an spezialisierte Agenten delegiert

  • Spezialisierte Agenten: Agent Builder-Anwendungsfälle, die als Tools für den Supervisor registriert sind

  • Agentenregistrierung: DynamoDB-Tabelle, in der Agentenkonfigurationen und Metadaten gespeichert werden

  • Orchestrierungsebene: Strands SDK-Implementierung von Agenten als Tools-Muster

Instanziierung von Agenten

Erstellung eines lokalen Agenten

Alle spezialisierten Agenten werden lokal innerhalb derselben AgentCore Runtime instanziiert:

  1. Ruft Agentenkonfigurationen von DynamoDB ab

  2. Erzeugt lokale Instanzen jedes Agent Builder-Agenten

  3. Jeder Agent unterhält seine eigenen MCP-Serververbindungen

  4. Supervisor Agent registriert spezialisierte Agenten als Tools

  5. Das Strands SDK verwaltet die Auswahl und Delegierung von Agenten