View a markdown version of this page

데이터 전략 - AWS 권장 가이드

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

데이터 전략

생성형 AI를 성공적으로 채택하려면 잘 정의된 데이터 전략이 필수적입니다. 이 섹션에서는 생성형 AI 채택 여정의 각 단계에서 데이터 전략이 어떻게 중요한 역할을 하는지 살펴봅니다. 또한 구현의 다양한 차원에서 주요 고려 사항을 간략하게 설명합니다. 생성형 AI 여정의 단계에 대한 자세한 내용은 AWS 권장 가이드의 에서 생성형 AI를 채택하기 위한 성숙도 모델을 AWS 참조하세요.

생성형 AI 채택 여정은 네 가지 주요 단계를 통한 구조화된 진행입니다.

  • 구상 - 조직은 생성형 AI 개념을 탐색하고, 인식을 구축하고, 잠재적 사용 사례를 식별합니다.

  • 실험 - 조직은 구조화된 파일럿 프로젝트와 개념 증명을 통해 생성형 AI의 잠재력을 검증하는 동시에 구현을 위한 핵심 기술 역량과 기본 프레임워크를 구축합니다.

  • 출시 - 조직은 보안 및 규정 준수 표준을 유지하면서 일관된 가치와 운영 우수성을 제공하기 위해 강력한 거버넌스, 모니터링 및 지원 메커니즘을 갖춘 프로덕션 지원 생성형 AI 솔루션을 체계적으로 배포합니다.

  • 규모 조정 - 조직은 재사용 가능한 구성 요소, 표준화된 패턴 및 셀프 서비스 플랫폼을 통해 전사적 생성형 AI 기능을 구축하여 자동화된 거버넌스를 유지하고 혁신을 촉진하면서 채택을 가속화합니다.

모든 단계에서는 인프라 투자, 거버넌스 정책, 보안 프레임워크 및 운영 모범 사례에 맞게 전략을 조정하여 책임감 있고 확장 가능한 AI 배포를 촉진함으로써 전체적인 접근 방식을 AWS 강조합니다. 각 단계에서는 비즈니스, 인력, 거버넌스, 플랫폼, 보안 및 운영이라는 6가지 기본 채택 원칙을 조율해야 합니다. 이러한 원칙은 생성형 AI 요구 사항을 해결하기 위해 AWS Cloud Adoption Framework(AWS CAF)와 일치하고 이를 확장합니다.

이 섹션에서는 다음 성숙도 모델 단계에 대해 자세히 설명합니다.

레벨 1: 구상

구상 단계에서 조직은 적절한 사용 사례를 식별하고, 구현에 필요한 데이터 소스를 매핑하고, 향후 실험 단계에 대한 기본 보안 및 데이터 액세스 요구 사항을 설정하여 계획을 세우는 데 중점을 둡니다.

이 단계에서는 채택 원칙에 대한 정렬 기준이 다음과 같습니다.

  • 비즈니스 - 엔터프라이즈 목표에 맞는 생성형 AI의 전략적 사용 사례를 식별합니다. 고가치 데이터가 있는 위치와 접근성을 평가합니다.

  • 사람 - 생성형 AI 채택에서 데이터의 중요성에 대해 리더십과 이해관계자를 교육하여 데이터 기반 문화를 조성합니다.

  • 거버넌스 - 초기 데이터 감사를 수행하여 규정 준수, 개인 정보 보호 문제 및 잠재적 윤리적 위험을 평가합니다. AI 투명성 및 책임에 대한 초기 정책을 개발합니다.

  • 플랫폼 - 기존 데이터 인프라를 평가하고, 내부 및 외부 데이터 소스를 카탈로그화하고, 생성형 AI 실행 가능성을 위해 데이터 품질을 평가합니다.

  • 보안 - 데이터 액세스를 위한 액세스 제어 및 최소 권한 원칙 구현을 시작합니다. 생성형 AI 모델이 사용자에게 액세스 권한이 부여된 정보만 검색할 수 있는지 확인합니다.

  • 운영 - 생성형 AI 실험을 위한 데이터 수집, 정리 및 레이블 지정에 대한 구조화된 접근 방식을 정의합니다. 데이터 모니터링을 위한 초기 피드백 루프를 설정합니다.

레벨 2: 실험

실험 단계에서 조직은 식별된 사용 사례의 구현을 지원하기 위해 필요한 데이터의 가용성과 적합성을 검증합니다. 동시에 개념 증명에서 실제 데이터의 사용을 지원하는 최소한의 실행 가능한 데이터 거버넌스 프레임워크를 설정합니다. 선택한 파운데이션 모델을 미세 조정하거나 검색 증강 생성(RAG) 접근 방식과 함께 off-the-shelf 모델을 사용할 수 있습니다.

이 단계에서는 채택 원칙에 대한 정렬 기준이 다음과 같습니다.

  • 비즈니스 - 파일럿 프로젝트의 명확한 성공 기준을 정의하고 데이터 가용성이 각 사용 사례의 요구 사항을 충족하는지 확인합니다.

  • 사람 - 데이터 엔지니어, AI 전문가 및 도메인 전문가로 구성된 부서 간 팀을 구성합니다. 이 팀은 데이터 품질을 검증하고 비즈니스 요구 사항에 맞게 모델을 조정할 책임이 있습니다.

  • 거버넌스 - 생성형 AI 데이터 거버넌스를 위한 프레임워크의 초안을 작성합니다. 프레임워크는 최소한 규정 준수 및 책임 있는 AI 지침에 대해 논의해야 합니다.

  • 플랫폼 - 정형 및 비정형 데이터 파이프라인을 포함한 초기 단계 데이터 통합 작업을 구현합니다. RAG 실험을 위한 벡터 데이터베이스를 설정합니다.

  • 보안 - 엄격한 데이터 권한 및 규정 준수 검사를 적용합니다. 모델 훈련 전에 PII 또는 기타 민감한 정보를 마스킹하거나 익명화해야 합니다.

  • 운영 - 프로덕션 릴리스를 준비하려면 품질 지표를 설정하여 격차를 식별합니다.

레벨 3: 시작

시작 단계에서 생성형 AI 솔루션은 실험에서 전체 규모 배포로 이동합니다. 이 시점에서 통합이 완전히 구현되고 성능, 모델 동작 및 데이터 품질을 추적하기 위한 강력한 모니터링 프레임워크가 설정됩니다. 데이터 프라이버시, 안전 및 규정 준수를 지원하기 위해 포괄적인 보안 및 규정 준수 조치가 시행됩니다.

이 단계에서는 채택 원칙에 대한 정렬 기준이 다음과 같습니다.

  • 비즈니스 - 운영 효율성과 비즈니스 가치를 측정합니다. 운영 비용 및 리소스 사용을 최적화합니다.

  • 사람 - 생성형 AI 모델 관리 및 모니터링에 대해 운영 팀을 교육합니다. 적절한 데이터 큐레이션 프로세스를 사용합니다.

  • 거버넌스 - 생성형 AI 데이터 거버넌스를 위한 프레임워크를 구체화합니다. 규정 준수, 모델 편향 및 책임 있는 AI 지침을 해결합니다. 진화하는 규정 준수를 검증하기 위해 생성형 AI 데이터 파이프라인에 대한 지속적인 감사를 수립합니다.

  • 플랫폼 - 필요에 따라 실시간 데이터 수집, 벡터 검색 및 미세 조정을 지원하도록 확장 가능한 인프라를 최적화합니다.

  • 보안 - 암호화, 역할 기반 액세스 제어(RBAC) 및 최소 권한 액세스 모델을 배포합니다. Amazon Q Business를 사용하여 데이터 액세스를 제어하고 생성형 AI 솔루션이 사용자에게 액세스 권한이 부여된 데이터만 검색하도록 할 수 있습니다.

  • 운영 - 데이터 관찰성 사례를 수립합니다. 데이터 계보, 출처 및 품질 지표를 추적하여 조정 전에 격차를 식별합니다.

레벨 4: 규모 조정

규모 조정 단계에서는 포커스가 자동화, 표준화 및 전사적 채택으로 전환됩니다. 조직은 재사용 가능한 데이터 파이프라인을 설정하고, 확장 가능한 거버넌스 프레임워크를 구현하고, 강력한 정책을 적용하여 데이터 접근성, 보안 및 규정 준수를 지원합니다. 이 단계는 데이터 제품을 대중화합니다. 이를 통해 조직 전체의 팀이 일관성, 품질 및 제어를 유지하면서 새로운 생성형 AI 솔루션을 원활하게 개발하고 배포할 수 있습니다.

이 단계에서는 채택 원칙에 대한 정렬 기준이 다음과 같습니다.

  • 비즈니스 - 생성형 AI 프로젝트를 장기적인 비즈니스 목표에 맞게 조정합니다. 수익 증가, 비용 절감 및 고객 만족도에 집중합니다.

  • 사람 - AI CoEs of Excellence)를 통해 전사적 AI 리터러시 프로그램을 개발하고 비즈니스 기능 내에 AI 채택을 포함합니다.

  • 거버넌스 - 부서 간 AI 거버넌스 정책을 표준화하여 AI 의사 결정의 일관성을 높입니다.

  • 플랫폼 - 페더레이션 데이터 액세스 및 처리를 위해 클라우드 네이티브 솔루션을 사용하는 확장 가능한 AI 데이터 플랫폼에 투자합니다.

  • 보안 - 자동화된 규정 준수 모니터링, 강력한 데이터 손실 방지(DLP) 및 지속적인 위협 평가를 구현합니다.

  • 운영 - AI 관찰성 프레임워크를 설정합니다. 피드백 루프, 이상 탐지 및 모델 성능 분석을 대규모로 통합합니다.