Architektur Description Capabilities Häufige Anwendungsfälle Implementierung von Agenten mit erweitertem Speicher Implementierung von Eingabeaufforderungen mit integriertem Speicher Zusammenfassung

Agenten mit erweitertem Speicher

Agenten mit erweitertem Speicher sind nun in der Lage, das Kurz- und Langzeitgedächtnis zu speichern, abzurufen und zu analysieren. Auf diese Weise können sie den Kontext für mehrere Aufgaben, Sitzungen und Interaktionen aufrechterhalten, was zu kohärenteren, personalisierteren und strategischeren Antworten führt.

Im Gegensatz zu Agenten ohne Status passen sich Agenten mit erweitertem Speicher an, indem sie auf historische Daten zurückgreifen, aus früheren Ergebnissen lernen und Entscheidungen treffen, die den Zielen, Vorlieben und der Umgebung des Benutzers entsprechen.

Architektur

Ein Agent mit erweitertem Speicher ist in der folgenden Abbildung dargestellt:

Description

Empfängt Eingaben oder Ereignisse
- Der Agent empfängt eine Benutzerabfrage oder ein Systemereignis. Dies kann ein Text, ein API-Trigger oder eine Änderung der Umgebung sein.
Ruft Kurzzeitgedächtnis ab
- Der Agent ruft den aktuellen Gesprächsverlauf, den Aufgabenkontext oder den Systemstatus ab, der für die Sitzung oder den Workflow relevant ist.
Ruft das Langzeitgedächtnis ab
- Der Agent fragt das Langzeitgedächtnis (z. B. Vektordatenbanken und Schlüsselwertspeicher) ab, um historische Erkenntnisse wie die folgenden zu erhalten:
  - Benutzereinstellungen
  - Frühere Entscheidungen und Ergebnisse
  - Gelernte Konzepte, Zusammenfassungen oder Erfahrungen
Begründungen durch das LLM
- Der Speicherkontext ist in die LLM-Eingabeaufforderung eingebettet, sodass der Mitarbeiter sowohl auf der Grundlage aktueller Eingaben als auch auf Vorwissen seine Argumentation stützen kann.
Generiert Ausgaben
- Der Agent erstellt eine kontextsensitive Antwort, einen Plan oder eine Aktion, die entsprechend dem Aufgabenverlauf und den Eingaben des Benutzers personalisiert ist.
Aktualisiert den Speicher
- Neue Informationen wie aktualisierte Ziele, Erfolgs- und Fehlschlagssignale und strukturierte Antworten werden für future Aufgaben gespeichert.

Capabilities

Kontinuität der Sitzung über Konversationen oder Ereignisse hinweg
Beharrlichkeit des Ziels im Laufe der Zeit
Kontextuelles Bewusstsein auf der Grundlage eines sich entwickelnden Zustands
Anpassungsfähigkeit basiert auf früheren Erfolgen und Misserfolgen
Personalisierung, abgestimmt auf Benutzerpräferenzen und -historie

Häufige Anwendungsfälle

Konversations-Copiloten, die sich Benutzerpräferenzen merken
Codierungsagenten, die Änderungen an der Codebasis verfolgen
Workflow-Agenten, die sich je nach Aufgabenverlauf anpassen
Digitale Zwillinge, die sich aus Systemwissen entwickeln
Forschungsagenten, die redundante Abfragen vermeiden

Implementierung von Agenten mit erweitertem Speicher

Verwenden Sie die folgenden Tools und AWS-Services für Agenten mit erweitertem Speicher:

Speicherschicht	AWS-Service	Zweck
Kurzfristig	Amazon DynamoDB-, Redis- und Amazon Bedrock-Kontext	Schnelles Abrufen der letzten Interaktionsstatus
Langfristig (strukturiert)	Amazon Aurora, Amazon DynamoDB, Amazon Neptune	Fakten, Beziehungen und Protokolle
Langfristig (semantisch)	OpenSearch, PostgreSQL, Tannenzapfen	Auf Einbettung basierender Abruf (d. h. RAG)
Speicher	Amazon S3	Speichern von Transkripten, strukturierten Speichern und Dateien
Orchestrierung	AWS Lambda oder AWS Step Functions	Verwaltung der Speicherinjektion und des Aktualisierungszyklus
Reasoning	Amazon Bedrock	Anthropic Claude oder Mistral mit Erinnerungsaufforderungen

Implementierung von Eingabeaufforderungen mit integriertem Speicher

Um das Gedächtnis in die Argumentation der Agenten zu integrieren, verwenden Sie eine Kombination aus strukturiertem Zustand und abruf-erweiterter Kontexteinspeisung:

Beziehen Sie bei der Erstellung der Eingabeaufforderung für das Sprachmodell den aktuellen Status des Agenten und den Verlauf der letzten Dialoge als strukturierte Eingabe mit ein, sodass der Mitarbeiter mit vollständigem Kontext argumentieren kann.
Verwenden Sie Retrieval-Augmented Generation (RAG), um relevante Dokumente oder Fakten aus dem Langzeitgedächtnis abzurufen.
Fassen Sie frühere Pläne, Kontexte und Interaktionen zusammen, um sie zu komprimieren und relevant zu machen.
Fügen Sie während der Inferenz externe Speichermodule wie Vektorspeicher oder strukturierte Protokolle ein, um die Entscheidungsfindung zu unterstützen.

Zusammenfassung

Agenten mit erweitertem Gedächtnis sorgen für Kontinuität im Denken, indem sie aus Erfahrungen lernen und sich den Benutzerkontext merken. Diese Agenten übertreffen reaktive Intelligenz, indem sie auf langfristige Zusammenarbeit, Personalisierung und strategisches Denken setzen. In Bezug auf agentische KI ermöglicht das Gedächtnis den Agenten, sich eher wie adaptive digitale Gegenstücke und weniger wie zustandslose Tools zu verhalten.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Agenten für die Workflow-Orchestrierung

Agenten für Simulation und Testumgebung