생성형 AI 애플리케이션을 위한 데이터 보안, 수명 주기 및 전략 - AWS 권장 가이드

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

생성형 AI 애플리케이션을 위한 데이터 보안, 수명 주기 및 전략

Romain Vivier, Amazon Web Services

2025년 7월(문서 기록)

생성형 AI는 엔터프라이즈 환경을 변화시키고 있습니다. 이를 통해 전례 없는 수준의 혁신, 자동화 및 경쟁 차별화가 가능합니다. 그러나 잠재력을 최대한 실현하는 기능은 강력한 모델뿐만 아니라 강력하고 목적 지향적인 데이터 전략에 따라 달라집니다. 이 가이드에서는 생성형 AI 이니셔티브에서 발생하는 데이터별 문제를 설명하고 이를 극복하고 의미 있는 비즈니스 성과를 달성하는 방법에 대한 명확한 방향을 제공합니다.

생성형 AI가 가져오는 가장 기본적인 전환 중 하나는 대량의 비정형 및 멀티모달 데이터에 의존하는 것입니다. 기존 기계 학습은 일반적으로 정형화되고 레이블이 지정된 데이터 세트에 따라 달라집니다. 그러나 생성형 AI 시스템은 종종 레이블이 지정되지 않고 매우 가변적인 텍스트, 이미지, 오디오, 코드 및 비디오에서 학습합니다. 따라서 조직은 이러한 새로운 데이터 유형을 포함하도록 기존 데이터 전략을 재평가하고 확장해야 합니다. 이렇게 하면 수동 입력에 대한 의존도를 줄이면서 컨텍스트 인식 애플리케이션을 더 많이 생성하고, 사용자 경험을 개선하고, 생산성을 높이고, 콘텐츠 생성을 가속화할 수 있습니다.

이 가이드에서는 효과적인 생성형 AI 배포를 지원하는 전체 데이터 수명 주기를 간략하게 설명합니다. 여기에는 대규모 데이터 세트 준비 및 정리, 모델의 컨텍스트를 최신 상태로 유지하기 위한 검색 증강 생성(RAG) 파이프라인 구현, 도메인별 데이터에 대한 미세 조정 수행, 지속적인 피드백 루프 설정이 포함됩니다. 올바르게 완료되면 이러한 활동이 모델 성능과 관련성을 향상시킵니다. 또한 AI 사용 사례의 더 빠른 제공, 의사 결정 지원 개선, 운영 효율성 향상을 통해 실질적인 비즈니스 가치를 제공합니다.

보안 및 거버넌스는 성공의 중요한 원칙으로 제시됩니다. 이 가이드에서는 민감한 정보를 보호하고, 액세스 제어를 적용하고, 위험(예: 할루시네이션, 데이터 중독 및 적대적 공격)을 해결하는 방법을 설명합니다. 생성형 AI 워크플로에 강력한 거버넌스 및 모니터링 관행을 포함하면 규정 준수 요구 사항을 지원하고, 기업의 평판을 보호하는 데 도움이 되며, AI 시스템에 대한 내부 및 외부 신뢰를 구축할 수 있습니다. 또한 데이터와 관련된 에이전트 AI 문제에 대해 설명하고 에이전트 기반 시스템에서 ID 관리, 추적성 및 강력한 보안의 필요성을 강조합니다.

또한이 가이드는 데이터 전략을 구상, 실험, 시작 및 확장과 같은 생성형 AI 채택의 각 단계에 연결합니다. 이 모델에 대한 자세한 내용은 생성형 AI 채택을 위한 성숙도 모델을 참조하세요 AWS. 각 단계에서 조직은 데이터 인프라, 거버넌스 모델 및 운영 준비 상태를 비즈니스 목표에 맞춰 조정해야 합니다. 이러한 조정을 통해 프로덕션으로 가는 경로를 단축하고, 위험을 완화하며, 생성형 AI 솔루션이 기업 전체에서 책임감 있고 지속 가능하게 확장될 수 있습니다.

요약하면 강력한 데이터 전략은 생성형 AI 성공을 위한 전제 조건입니다. 데이터를 전략적 자산으로 취급하고 거버넌스, 품질 및 보안에 투자하는 조직은 생성형 AI를 자신 있게 배포할 수 있는 더 나은 위치에 있습니다. 실험에서 전사적 혁신으로 더 빠르게 전환하고 향상된 고객 경험, 운영 효율성, 장기적인 경쟁 우위와 같은 측정 가능한 결과를 달성할 수 있습니다.

대상 독자

이 가이드는 생성형 AI를 위한 강력하고 확장 가능한 데이터 전략을 구축하고 운영하려는 엔터프라이즈 리더, 데이터 전문가 및 기술 의사 결정자를 대상으로 합니다.  이 가이드의 권장 사항은 생성형 AI 여정을 시작하거나 발전시키는 기업에 적합합니다. 이를 통해 데이터 전략, 거버넌스 및 보안 프레임워크를 조정하여 생성형 AI의 비즈니스 가치와 이점을 극대화할 수 있습니다. 이 가이드의 개념과 권장 사항을 이해하려면 기본 AI 및 데이터 개념을 숙지하고 엔터프라이즈 IT 거버넌스 및 규정 준수의 기본 사항을 숙지해야 합니다.

목표

이 가이드의 권장 사항에 따라 데이터 전략을 수정하면 다음과 같은 이점이 있을 수 있습니다.

  • 기존 ML과 생성형 AI 간에 데이터 요구 사항과 관행이 어떻게 다른지 이해하고 이러한 차이가 엔터프라이즈 데이터 전략에 어떤 의미가 있는지 이해합니다.

  • 기존 ML의 레이블이 지정된 정형 데이터와 생성형 AI를 촉진하는 비정형 멀티모달 데이터의 차이점을 이해합니다.

  • 확립된 ML 사례 외에도 생성형 AI 모델에 데이터 준비, 통합 및 거버넌스에 대한 새로운 접근 방식이 필요한 이유를 이해합니다.

  • 생성형 AI를 통한 데이터 합성이 보다 전통적인 ML 사용 사례를 가속화하는 방법을 알아봅니다.