기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
생성형 AI 에이전트: 심볼 로직LLMs으로 대체
다음 다이어그램은 대규모 언어 모델(LLMs)이 이제 소프트웨어 에이전트를 위한 유연하고 지능적인 인지 코어 역할을 하는 방법을 보여줍니다. 정적 계획 라이브러리 및 수동 코딩 규칙에 의존하는 기존의 심볼 로직 시스템과 달리 LLMs 적응형 추론, 컨텍스트 계획 및 동적 도구 사용을 지원하여 에이전트가 인식, 추론 및 행동하는 방식을 변화시킵니다.
주요 개선 사항
이 아키텍처는 다음과 같이 기존 에이전트 아키텍처를 개선합니다.
-
인지 엔진으로서LLMs: 목표, 계획 및 쿼리는 프롬프트 컨텍스트로 모델에 전달됩니다. LLM은 추론 경로(예: 사고 체인)를 생성하고, 작업을 하위 목표로 분해하고, 다음 작업을 결정합니다.
-
프롬프트를 통한 도구 사용: 도구 사용 에이전트 또는 APIs 및 행동(ReAct) 프롬프트를 통해 LLMs을 지시할 수 있습니다.
-
컨텍스트 인식 계획: 에이전트는 하드 코딩된 계획 라이브러리 없이 에이전트의 현재 목표, 입력 환경 및 피드백을 기반으로 계획을 동적으로 생성하거나 수정합니다.
-
프롬프트 컨텍스트를 메모리로: 에이전트는 심볼 지식 기반을 사용하는 대신 메모리, 계획 및 목표를 모델에 전달되는 프롬프트 토큰으로 인코딩합니다.
-
단 몇 번의 컨텍스트 내 학습을 통한 학습: LLMs 프롬프트 엔지니어링을 통해 동작을 조정하므로 명시적 재훈련 또는 엄격한 계획 라이브러리의 필요성이 줄어듭니다.
LLM 기반 에이전트에서 장기 메모리 확보
구조화된 지식 기반에 장기 메모리를 저장한 기존 에이전트와 달리 생성형 AI 에이전트는 LLMs의 컨텍스트 기간 제한 내에서 작동해야 합니다. 메모리를 확장하고 지속적인 인텔리전스를 지원하기 위해 생성형 AI 에이전트는 에이전트 스토어, 검색 증강 생성(RAG), 컨텍스트 내 학습 및 프롬프트 체인, 사전 훈련 등 여러 보완 기법을 사용합니다.
에이전트 스토어: 외부 장기 메모리
에이전트 상태, 사용자 기록, 결정 및 결과는 장기 에이전트 메모리 스토어(예: 벡터 데이터베이스, 객체 스토어 또는 문서 스토어)에 저장됩니다. 관련 메모리는 온디맨드 방식으로 검색되고 런타임 시 LLM 프롬프트 컨텍스트에 주입됩니다. 이렇게 하면 에이전트가 세션, 작업 또는 상호 작용 전반에 걸쳐 연속성을 유지하는 영구 메모리 루프가 생성됩니다.
RAG
RAG는 검색된 지식과 생성형 기능을 결합하여 LLM 성능을 향상시킵니다. 목표 또는 쿼리가 실행되면 에이전트는 검색 인덱스를 검색합니다(예: 문서 의미 체계 검색, 이전 대화 또는 구조화된 지식을 통해). 검색된 결과는 LLM 프롬프트에 추가되며, 이는 외부 사실 또는 개인화된 컨텍스트에서 생성을 기반으로 합니다. 이 방법은 에이전트의 유효 메모리를 확장하고 신뢰성과 사실적 정확성을 개선합니다.
컨텍스트 내 학습 및 프롬프트 체인
에이전트는 세션 내 토큰 컨텍스트와 구조화된 프롬프트 체인을 사용하여 단기 메모리를 유지합니다. 현재 계획, 이전 작업 결과, 에이전트 상태와 같은 컨텍스트 요소는 행동 안내를 위한 호출 간에 전달됩니다.
지속적인 사전 훈련 및 미세 조정
도메인별 에이전트의 경우 로그, LLMs을 계속 사전 훈련할 수 있습니다. 또는 인적 피드백(RLHF)을 통한 지침 미세 조정 또는 강화 학습을 통해 에이전트와 유사한 동작을 모델에 직접 포함할 수 있습니다. 이렇게 하면 추론 패턴이 프롬프트 시간 로직에서 모델의 내부 표현으로 전환되고 프롬프트 길이가 줄어들며 효율성이 향상됩니다.
에이전트 AI의 결합된 이점
이러한 기술을 함께 사용하면 생성형 AI 에이전트가 다음을 수행할 수 있습니다.
-
시간이 지남에 따라 상황 인식을 유지합니다.
-
사용자 기록 또는 기본 설정에 따라 동작을 조정합니다.
-
up-to-date, 사실적 또는 비공개 지식을 사용하여 결정을 내립니다.
-
지속적이고 규정을 준수하며 설명 가능한 동작을 통해 엔터프라이즈 사용 사례로 확장합니다.
외부 메모리, 검색 계층 및 지속적인 훈련으로 LLMs을 보강하면 에이전트는 심볼 시스템만으로는 이전에는 달성할 수 없었던 수준의 인지 연속성과 목적을 달성할 수 있습니다.