소프트웨어 에이전트의 핵심 구성 요소

다음 다이어그램은 대부분의 지능형 에이전트에서 찾을 수 있는 주요 기능 모듈을 보여줍니다. 각 구성 요소는 복잡한 환경에서 에이전트가 자율적으로 운영할 수 있는 능력에 기여합니다.

인식, 이유, 행동 루프의 맥락에서 에이전트의 추론 기능은 인지 및 학습 모듈 모두에 분산됩니다. 에이전트는 메모리와 학습의 통합을 통해 과거 경험을 기반으로 적응형 추론을 개발합니다. 에이전트는 환경 내에서 행동할 때 새로운 피드백 루프를 생성합니다. 각 작업은 향후 지각에 영향을 미치며, 그 결과로 얻은 경험은 학습 모듈을 통해 메모리 및 내부 모델에 통합됩니다. 이러한 지속적인 지각, 추론 및 행동 루프를 통해 에이전트는 시간이 지남에 따라 개선되고 전체 지각, 이유, 행동 주기를 완료할 수 있습니다.

인식 모듈

지각 모듈을 사용하면 에이전트가 텍스트, 오디오 및 센서와 같은 다양한 입력 양식을 통해 환경과 인터페이스할 수 있습니다. 이러한 입력은 모든 추론 및 작업이 기반으로 하는 원시 데이터를 형성합니다. 텍스트 입력에는 자연어 프롬프트, 구조화된 명령 또는 문서가 포함될 수 있습니다. 오디오 입력에는 음성 지침 또는 환경 사운드가 포함됩니다. 센서 입력에는 시각적 피드, 모션 신호 또는 GPS 좌표와 같은 물리적 데이터가 포함됩니다. 지각의 핵심 기능은이 원시 데이터에서 의미 있는 특징과 표현을 추출하는 것입니다. 이를 통해 에이전트는 현재 컨텍스트를 정확하고 실행 가능하게 이해할 수 있습니다. 이 프로세스에는 특성 추출, 객체 또는 이벤트 인식, 의미 해석이 포함될 수 있으며 인식, 이유, 행동 루프의 중요한 첫 번째 단계를 구성합니다. 효과적인 지각은 다운스트림 추론 및 의사 결정이 관련성 있는 up-to-date 상황 인식을 기반으로 하도록 합니다.

인지 모듈

인지 모듈은 소프트웨어 에이전트의 의도적인 코어 역할을 합니다. 이는 지각을 해석하고, 의도를 형성하고, 목표 기반 계획 및 의사 결정을 통해 목적 있는 행동을 안내하는 역할을 합니다. 이 모듈은 입력을 구조화된 추론 프로세스로 변환하므로 에이전트가 사후 대응보다는 의도적으로 작동할 수 있습니다. 이러한 프로세스는 목표, 계획 및 의사 결정이라는 세 가지 주요 하위 모듈을 통해 관리됩니다.

목표 하위 모듈

목표 하위 모듈은 에이전트의 의도와 방향을 정의합니다. 목표는 명시적(예: "위치로 이동" 또는 "보고서 제출")이거나 암시적(예: "사용자 참여 극대화" 또는 "지연 시간 최소화")일 수 있습니다. 에이전트의 추론 주기의 핵심이며 계획 및 결정을 위한 대상 상태를 제공합니다.

에이전트는 목표에 대한 진행 상황을 지속적으로 평가하고 새로운 인식 또는 학습을 기반으로 목표의 우선순위를 다시 지정하거나 다시 생성할 수 있습니다. 이 목표 인식은 동적 환경에서 에이전트의 적응성을 유지합니다.

하위 모듈 계획

계획 하위 모듈은 에이전트의 현재 목표를 달성하기 위한 전략을 구성합니다. 작업 시퀀스를 생성하고, 작업을 계층적으로 분해하고, 사전 정의되거나 동적으로 생성된 계획 중에서 선택합니다.

비결정적이거나 변화하는 환경에서 효과적으로 운영하기 위해 계획은 정적이지 않습니다. 현대 에이전트는 chain-of-thought 시퀀스를 생성하고, 하위 목표를 중간 단계로 도입하고, 조건이 변경될 때 실시간으로 계획을 수정할 수 있습니다.

이 하위 모듈은 메모리 및 학습과 밀접하게 연결되며 에이전트는 과거 결과를 기반으로 시간 경과에 따른 계획을 세분화할 수 있습니다.

의사 결정 하위 모듈

의사 결정 하위 모듈은 사용 가능한 계획과 작업을 평가하여 가장 적합한 다음 단계를 선택합니다. 지각, 현재 계획, 에이전트의 목표 및 환경 컨텍스트의 입력을 통합합니다.

의사 결정 계정:

충돌하는 목표 간의 절충
신뢰도 임계값(예: 지각의 불확실성)
작업의 결과
에이전트의 학습된 경험

아키텍처에 따라 에이전트는 심볼 추론, 휴리스틱, 강화 학습 또는 언어 모델(LLMs)에 의존하여 정보에 입각한 결정을 내릴 수 있습니다. 이 프로세스를 통해 에이전트의 동작 컨텍스트 인식, 목표 정렬 및 적응을 유지할 수 있습니다.

작업 모듈

작업 모듈은 에이전트가 선택한 결정을 실행하고 외부 세계 또는 내부 시스템과 상호 작용하여 의미 있는 효과를 생성하는 역할을 합니다. 의도가 행동으로 변환되는 지각, 이유, 행동 루프의 행동 단계를 나타냅니다.

인지 모듈이 작업을 선택하면 작업 모듈은 특수 하위 모듈을 통해 실행을 조정합니다. 여기서 각 하위 모듈은 에이전트의 통합 환경에 맞게 조정됩니다.

물리적 작동: 로봇 시스템 또는 IoT 디바이스에 포함된 에이전트의 경우이 하위 모듈은 결정을 실제 물리적 이동 또는 하드웨어 수준 지침으로 변환합니다.

예: 로봇 조향, 밸브 트리거, 센서 켜기.
통합 상호 작용:이 하위 모듈은 소프트웨어 시스템, 플랫폼 또는 APIs와의 상호 작용과 같은 비물리적이지만 외부에서 볼 수 있는 작업을 처리합니다.

예: 클라우드 서비스에 명령 전송, 데이터베이스 업데이트, API를 호출하여 보고서 제출.
도구 호출: 에이전트는 특수 도구를 사용하여 다음과 같은 하위 작업을 수행하여 기능을 확장하는 경우가 많습니다.
- 검색: 정형 또는 비정형 지식 소스 쿼리
- 요약: 대규모 텍스트 입력을 상위 수준 개요로 압축
- 계산: 논리적, 수치적 또는 심볼 계산 수행
도구 호출은 모듈식의 호출 가능한 기술을 통해 복잡한 동작 구성을 가능하게 합니다.

학습 모듈

학습 모듈을 통해 에이전트는 경험을 기반으로 시간이 지남에 따라 적응, 일반화 및 개선할 수 있습니다. 인식 및 조치의 피드백을 사용하여 에이전트의 내부 모델, 전략 및 결정 정책을 지속적으로 개선하여 추론 프로세스를 지원합니다.

이 모듈은 단기 및 장기 메모리와 함께 작동합니다.

단기 메모리: 대화 상태, 현재 작업 정보 및 최근 관측치와 같은 일시적인 컨텍스트를 저장합니다. 에이전트가 상호 작용 및 작업 내에서 연속성을 유지하는 데 도움이 됩니다.
장기 메모리: 이전에 발견한 목표, 행동 결과 및 환경 상태를 포함하여 과거 경험의 지속적인 지식을 인코딩합니다. 장기 메모리를 사용하면 에이전트가 패턴을 인식하고, 전략을 재사용하고, 실수가 반복되지 않도록 할 수 있습니다.

학습 모드

학습 모듈은 다양한 환경과 에이전트 역할을 지원하는 지도 학습, 비지도 학습, 강화 학습과 같은 다양한 패러다임을 지원합니다.

지도 학습: 레이블이 지정된 예제를 기반으로 내부 모델을 업데이트합니다. 종종 인적 피드백 또는 훈련 데이터 세트에서 업데이트합니다.

예: 이전 대화를 기반으로 사용자 의도를 분류하는 방법을 알아봅니다.
비지도 학습: 명시적 레이블 없이 데이터에서 숨겨진 패턴 또는 구조를 식별합니다.

예: 환경 신호를 클러스터링하여 이상을 감지합니다.
강화 학습: 대화형 환경에서 누적 보상을 극대화하여 시도 및 오류를 통해 동작을 최적화합니다.

예: 어떤 전략이 가장 빠른 작업 완료로 이어지는지 학습합니다.

학습은 에이전트의 인지 모듈과 긴밀하게 통합됩니다. 과거 결과를 기반으로 계획 전략을 구체화하고, 과거 성공 평가를 통해 의사 결정을 개선하며, 지각과 행동 간의 매핑을 지속적으로 개선합니다. 이 닫힌 학습 및 피드백 루프를 통해 에이전트는 사후 대응 실행을 넘어 시간이 지남에 따라 새로운 목표, 조건 및 컨텍스트에 적응할 수 있는 자체 개선 시스템으로 발전합니다.

javascript가 브라우저에서 비활성화되거나 사용이 불가합니다.

AWS 설명서를 사용하려면 Javascript가 활성화되어야 합니다. 지침을 보려면 브라우저의 도움말 페이지를 참조하십시오.

문서 규칙

에이전트 AI에 대한 소프트웨어 에이전트

기존 에이전트 아키텍처: 인지, 이유, 행동