기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
메모리 증강 에이전트
단기 및 장기 메모리를 사용하여 저장, 검색 및 추론할 수 있는 기능으로 메모리 증강 에이전트가 향상됩니다. 이를 통해 여러 작업, 세션 및 상호 작용에서 컨텍스트를 유지할 수 있으므로 보다 일관성 있고 개인화된 전략적 응답을 얻을 수 있습니다.
상태 비저장 에이전트와 달리 메모리 증강 에이전트는 과거 데이터를 참조하여 적응하고, 이전 결과에서 학습하고, 사용자의 목표, 기본 설정 및 환경에 맞는 결정을 내립니다.
Architecture
메모리 증강 에이전트는 다음 다이어그램에 나와 있습니다.
설명
-
입력 또는 이벤트를 수신합니다.
-
에이전트는 사용자 쿼리 또는 시스템 이벤트를 수신합니다. 텍스트, API 트리거 또는 환경 변경일 수 있습니다.
-
-
단기 메모리를 검색합니다.
-
에이전트는 세션 또는 워크플로와 관련된 최근 대화 기록, 작업 컨텍스트 또는 시스템 상태를 검색합니다.
-
-
장기 메모리를 검색합니다.
-
에이전트는 장기 메모리(예: 벡터 데이터베이스 및 키-값 저장소)를 쿼리하여 다음과 같은 과거 인사이트를 확인합니다.
-
사용자 기본 설정
-
과거 결정 및 결과
-
학습한 개념, 요약 또는 경험
-
-
-
LLM을 통한 이유
-
메모리 컨텍스트는 LLM 프롬프트에 내장되어 에이전트가 현재 입력과 이전 지식을 모두 기반으로 추론할 수 있습니다.
-
-
출력을 생성합니다.
-
에이전트는 작업 기록 및 사용자의 입력에 따라 개인화된 컨텍스트 인식 응답, 계획 또는 작업을 생성합니다.
-
-
메모리 업데이트
-
업데이트된 목표, 성공 및 실패 신호, 구조화된 응답과 같은 새로운 정보는 향후 작업을 위해 저장됩니다.
-
기능
-
대화 또는 이벤트 간 세션 연속성
-
시간 경과에 따른 목표 지속성
-
진화하는 상태에 따른 상황 인식
-
이전 성공 및 실패로 인한 적응성
-
사용자 기본 설정 및 기록과 일치하는 개인화
일반 사용 사례
-
사용자 기본 설정을 기억하는 대화식 코파일럿
-
코드베이스 변경 사항을 추적하는 코딩 에이전트
-
작업 기록에 따라 조정되는 워크플로 에이전트
-
시스템 지식에서 발전하는 디지털 트윈
-
중복 검색을 방지하는 에이전트 조사
메모리 증강 에이전트 구현
메모리 증강 에이전트에는 다음 도구 및 AWS 서비스 를 사용합니다.
메모리 계층 |
AWS 서비스 |
용도 |
|---|---|---|
단기 |
Amazon DynamoDB, Redis, Amazon Bedrock 컨텍스트 |
최근 상호 작용 상태의 빠른 검색 |
장기(정형) |
Amazon Aurora, Amazon DynamoDB, Amazon Neptune |
팩트, 관계 및 로그 |
장기(시맨틱) |
OpenSearch, PostgreSQL, Pinecone |
임베딩 기반 검색(즉, RAG) |
스토리지 |
Amazon S3 |
트랜스크립트, 구조화된 메모리 및 파일 저장 |
오케스트레이션 |
AWS Lambda 또는 AWS Step Functions |
메모리 주입 및 업데이트 수명 주기 관리 |
추론 |
Amazon Bedrock |
메모리 프롬프트가 있는 Anthropic Claude 또는 Mistral |
메모리 주입 프롬프트 구현
메모리를 에이전트 추론에 통합하려면 구조화된 상태와 검색 증강 컨텍스트 주입의 조합을 사용합니다.
-
언어 모델에 대한 프롬프트를 구성할 때 최신 에이전트 상태 및 최근 대화 기록을 구조화된 입력으로 포함시켜 전체 컨텍스트로 추론할 수 있도록 합니다.
-
검색 증강 생성(RAG)을 사용하여 장기 메모리에서 관련 문서 또는 사실을 가져옵니다.
-
압축 및 관련성에 대한 이전 계획, 컨텍스트 및 상호 작용을 요약합니다.
-
추론 중에 벡터 저장소 또는 구조화된 로그와 같은 외부 메모리 모듈을 주입하여 의사 결정을 안내합니다.
요약
메모리 증강 에이전트는 경험을 통해 배우고 사용자 컨텍스트를 기억하여 사고 연속성을 유지합니다. 이러한 에이전트는 장기 협업, 개인화 및 전략적 추론을 사용하여 사후 대응 인텔리전스를 능가합니다. 에이전트 AI 측면에서 메모리를 사용하면 에이전트가 적응형 디지털 대응 도구처럼 동작하고 상태 비저장 도구처럼 동작하지 않을 수 있습니다.