Agenten mit erweitertem Speicher - AWS Präskriptive Leitlinien

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Agenten mit erweitertem Speicher

Agenten mit erweitertem Speicher sind nun in der Lage, das Kurz- und Langzeitgedächtnis zu speichern, abzurufen und zu analysieren. Auf diese Weise können sie den Kontext für mehrere Aufgaben, Sitzungen und Interaktionen aufrechterhalten, was zu kohärenteren, personalisierteren und strategischeren Antworten führt.

Im Gegensatz zu Agenten ohne Status passen sich Agenten mit erweitertem Speicher an, indem sie auf historische Daten zurückgreifen, aus früheren Ergebnissen lernen und Entscheidungen treffen, die den Zielen, Vorlieben und der Umgebung des Benutzers entsprechen.

Architektur

Ein Agent mit erweitertem Speicher ist in der folgenden Abbildung dargestellt:

Agenten mit erweitertem Speicher.

Description

  1. Empfängt Eingaben oder Ereignisse

    • Der Agent empfängt eine Benutzerabfrage oder ein Systemereignis. Dies kann ein Text, ein API-Trigger oder eine Änderung der Umgebung sein.

  2. Ruft Kurzzeitgedächtnis ab

    • Der Agent ruft den aktuellen Gesprächsverlauf, den Aufgabenkontext oder den Systemstatus ab, der für die Sitzung oder den Workflow relevant ist.

  3. Ruft das Langzeitgedächtnis ab

    • Der Agent fragt das Langzeitgedächtnis (z. B. Vektordatenbanken und Schlüsselwertspeicher) ab, um historische Erkenntnisse wie die folgenden zu erhalten:

      • Benutzereinstellungen

      • Frühere Entscheidungen und Ergebnisse

      • Gelernte Konzepte, Zusammenfassungen oder Erfahrungen

  4. Gründe durch das LLM

    • Der Speicherkontext ist in die LLM-Eingabeaufforderung eingebettet, sodass der Agent sowohl auf der Grundlage aktueller Eingaben als auch auf Vorkenntnissen argumentieren kann.

  5. Generiert Ausgaben

    • Der Agent erstellt eine kontextsensitive Antwort, einen Plan oder eine Aktion, die entsprechend dem Aufgabenverlauf und den Eingaben des Benutzers personalisiert ist.

  6. Aktualisiert den Speicher

    • Neue Informationen wie aktualisierte Ziele, Erfolgs- und Fehlschlagssignale und strukturierte Antworten werden für future Aufgaben gespeichert.

Capabilities

  • Kontinuität der Sitzung über Konversationen oder Ereignisse hinweg

  • Beharrlichkeit des Ziels im Laufe der Zeit

  • Kontextuelles Bewusstsein auf der Grundlage eines sich entwickelnden Zustands

  • Anpassungsfähigkeit basiert auf früheren Erfolgen und Misserfolgen

  • Personalisierung, abgestimmt auf Benutzerpräferenzen und -historie

Häufige Anwendungsfälle

  • Konversations-Copiloten, die sich Benutzerpräferenzen merken

  • Codierungsagenten, die Änderungen an der Codebasis verfolgen

  • Workflow-Agenten, die sich je nach Aufgabenverlauf anpassen

  • Digitale Zwillinge, die sich aus Systemwissen entwickeln

  • Forschungsagenten, die redundante Abfragen vermeiden

Implementierung von Agenten mit erweitertem Speicher

Verwenden Sie die folgenden Tools und AWS-Services für Agenten mit erweitertem Speicher:

Speicherschicht

AWS-Service

Zweck

Kurzfristig

Amazon DynamoDB-, Redis- und Amazon Bedrock-Kontext

Schnelles Abrufen der letzten Interaktionsstatus

Langfristig (strukturiert)

Amazon Aurora, Amazon DynamoDB, Amazon Neptune

Fakten, Beziehungen und Protokolle

Langfristig (semantisch)

OpenSearch, PostgreSQL, Tannenzapfen

Auf Einbettung basierender Abruf (d. h. RAG)

Speicher

Amazon S3

Speichern von Transkripten, strukturierten Speichern und Dateien

Orchestrierung

AWS Lambda oder AWS Step Functions

Verwaltung der Speicherinjektion und des Aktualisierungszyklus

Reasoning

Amazon Bedrock

Anthropic Claude oder Mistral mit Erinnerungsaufforderungen

Implementierung von Eingabeaufforderungen mit integriertem Speicher

Um das Gedächtnis in die Argumentation der Agenten zu integrieren, verwenden Sie eine Kombination aus strukturiertem Zustand und abruf-erweiterter Kontexteinspeisung:

  • Beziehen Sie bei der Erstellung der Eingabeaufforderung für das Sprachmodell den aktuellen Status des Agenten und den Verlauf der letzten Dialoge als strukturierte Eingabe mit ein, sodass der Mitarbeiter mit vollständigem Kontext argumentieren kann.

  • Verwenden Sie Retrieval-Augmented Generation (RAG), um relevante Dokumente oder Fakten aus dem Langzeitgedächtnis abzurufen.

  • Fassen Sie frühere Pläne, Kontexte und Interaktionen zusammen, um sie zu komprimieren und relevant zu machen.

  • Fügen Sie während der Inferenz externe Speichermodule wie Vektorspeicher oder strukturierte Protokolle ein, um die Entscheidungsfindung zu unterstützen.

Zusammenfassung

Agenten mit erweitertem Gedächtnis sorgen für Kontinuität im Denken, indem sie aus Erfahrungen lernen und sich den Benutzerkontext merken. Diese Agenten übertreffen reaktive Intelligenz, indem sie auf langfristige Zusammenarbeit, Personalisierung und strategisches Denken setzen. In Bezug auf agentische KI ermöglicht das Gedächtnis den Agenten, sich eher wie adaptive digitale Gegenstücke und weniger wie zustandslose Tools zu verhalten.