Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Agenten mit erweitertem Speicher
Agenten mit erweitertem Speicher sind nun in der Lage, das Kurz- und Langzeitgedächtnis zu speichern, abzurufen und zu analysieren. Auf diese Weise können sie den Kontext für mehrere Aufgaben, Sitzungen und Interaktionen aufrechterhalten, was zu kohärenteren, personalisierteren und strategischeren Antworten führt.
Im Gegensatz zu Agenten ohne Status passen sich Agenten mit erweitertem Speicher an, indem sie auf historische Daten zurückgreifen, aus früheren Ergebnissen lernen und Entscheidungen treffen, die den Zielen, Vorlieben und der Umgebung des Benutzers entsprechen.
Architektur
Ein Agent mit erweitertem Speicher ist in der folgenden Abbildung dargestellt:
Description
-
Empfängt Eingaben oder Ereignisse
-
Der Agent empfängt eine Benutzerabfrage oder ein Systemereignis. Dies kann ein Text, ein API-Trigger oder eine Änderung der Umgebung sein.
-
-
Ruft Kurzzeitgedächtnis ab
-
Der Agent ruft den aktuellen Gesprächsverlauf, den Aufgabenkontext oder den Systemstatus ab, der für die Sitzung oder den Workflow relevant ist.
-
-
Ruft das Langzeitgedächtnis ab
-
Der Agent fragt das Langzeitgedächtnis (z. B. Vektordatenbanken und Schlüsselwertspeicher) ab, um historische Erkenntnisse wie die folgenden zu erhalten:
-
Benutzereinstellungen
-
Frühere Entscheidungen und Ergebnisse
-
Gelernte Konzepte, Zusammenfassungen oder Erfahrungen
-
-
-
Gründe durch das LLM
-
Der Speicherkontext ist in die LLM-Eingabeaufforderung eingebettet, sodass der Agent sowohl auf der Grundlage aktueller Eingaben als auch auf Vorkenntnissen argumentieren kann.
-
-
Generiert Ausgaben
-
Der Agent erstellt eine kontextsensitive Antwort, einen Plan oder eine Aktion, die entsprechend dem Aufgabenverlauf und den Eingaben des Benutzers personalisiert ist.
-
-
Aktualisiert den Speicher
-
Neue Informationen wie aktualisierte Ziele, Erfolgs- und Fehlschlagssignale und strukturierte Antworten werden für future Aufgaben gespeichert.
-
Capabilities
-
Kontinuität der Sitzung über Konversationen oder Ereignisse hinweg
-
Beharrlichkeit des Ziels im Laufe der Zeit
-
Kontextuelles Bewusstsein auf der Grundlage eines sich entwickelnden Zustands
-
Anpassungsfähigkeit basiert auf früheren Erfolgen und Misserfolgen
-
Personalisierung, abgestimmt auf Benutzerpräferenzen und -historie
Häufige Anwendungsfälle
-
Konversations-Copiloten, die sich Benutzerpräferenzen merken
-
Codierungsagenten, die Änderungen an der Codebasis verfolgen
-
Workflow-Agenten, die sich je nach Aufgabenverlauf anpassen
-
Digitale Zwillinge, die sich aus Systemwissen entwickeln
-
Forschungsagenten, die redundante Abfragen vermeiden
Implementierung von Agenten mit erweitertem Speicher
Verwenden Sie die folgenden Tools und AWS-Services für Agenten mit erweitertem Speicher:
Speicherschicht |
AWS-Service |
Zweck |
|---|---|---|
Kurzfristig |
Amazon DynamoDB-, Redis- und Amazon Bedrock-Kontext |
Schnelles Abrufen der letzten Interaktionsstatus |
Langfristig (strukturiert) |
Amazon Aurora, Amazon DynamoDB, Amazon Neptune |
Fakten, Beziehungen und Protokolle |
Langfristig (semantisch) |
OpenSearch, PostgreSQL, Tannenzapfen |
Auf Einbettung basierender Abruf (d. h. RAG) |
Speicher |
Amazon S3 |
Speichern von Transkripten, strukturierten Speichern und Dateien |
Orchestrierung |
AWS Lambda oder AWS Step Functions |
Verwaltung der Speicherinjektion und des Aktualisierungszyklus |
Reasoning |
Amazon Bedrock |
Anthropic Claude oder Mistral mit Erinnerungsaufforderungen |
Implementierung von Eingabeaufforderungen mit integriertem Speicher
Um das Gedächtnis in die Argumentation der Agenten zu integrieren, verwenden Sie eine Kombination aus strukturiertem Zustand und abruf-erweiterter Kontexteinspeisung:
-
Beziehen Sie bei der Erstellung der Eingabeaufforderung für das Sprachmodell den aktuellen Status des Agenten und den Verlauf der letzten Dialoge als strukturierte Eingabe mit ein, sodass der Mitarbeiter mit vollständigem Kontext argumentieren kann.
-
Verwenden Sie Retrieval-Augmented Generation (RAG), um relevante Dokumente oder Fakten aus dem Langzeitgedächtnis abzurufen.
-
Fassen Sie frühere Pläne, Kontexte und Interaktionen zusammen, um sie zu komprimieren und relevant zu machen.
-
Fügen Sie während der Inferenz externe Speichermodule wie Vektorspeicher oder strukturierte Protokolle ein, um die Entscheidungsfindung zu unterstützen.
Zusammenfassung
Agenten mit erweitertem Gedächtnis sorgen für Kontinuität im Denken, indem sie aus Erfahrungen lernen und sich den Benutzerkontext merken. Diese Agenten übertreffen reaktive Intelligenz, indem sie auf langfristige Zusammenarbeit, Personalisierung und strategisches Denken setzen. In Bezug auf agentische KI ermöglicht das Gedächtnis den Agenten, sich eher wie adaptive digitale Gegenstücke und weniger wie zustandslose Tools zu verhalten.