Amazon SageMaker AI를 사용하여 모델 사용자 지정 - Amazon SageMaker AI

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

Amazon SageMaker AI를 사용하여 모델 사용자 지정

Amazon SageMaker AI 모델 사용자 지정은 AI 모델을 사용자 지정하는 기존의 복잡하고 시간이 많이 걸리는 프로세스를 몇 달 동안의 노력에서 며칠 만에 완료할 수 있는 간소화된 워크플로로 변환하는 기능입니다. 이 기능은 고도로 차별화된 고객 경험을 생성하기 위해 독점 데이터로 파운데이션 모델을 사용자 지정해야 하는 AI 개발자가 직면한 중요한 문제를 해결합니다. step-by-step 가이드 및 고급 구성 옵션을 포함한 자세한 사용자 지정 설명서는이 SageMaker AI 가이드에 나와 있습니다. Nova 모델 사용자 지정에 대한 간략한 개요는 Amazon Nova 사용 설명서의 SageMaker로 사용자 지정 및 미세 조정을 참조하세요.

이 기능에는 컴퓨팅 리소스 관리의 운영 오버헤드를 없애는 서버리스 인프라로 구동되는 포괄적인 고급 모델 사용자 지정 기술 제품군과 함께 자연어 요구 사항을 이해하는 새로운 가이드 사용자 인터페이스가 포함되어 있습니다. 법률 연구 애플리케이션을 구축하든, 고객 서비스 챗봇을 개선하든, 도메인별 AI 에이전트를 개발하든이 기능은 proof-of-concept에서 프로덕션 배포까지 경로를 가속화합니다.

Amazon Bedrock Evaluations로 구동되는 모델 사용자 지정의 기능은 처리를 위해 지리 AWS 리전 내에서 데이터를 안전하게 전송할 수 있습니다. 자세한 내용은 Amazon Bedrock Evaluations 설명서를 참조하세요.

주요 개념

서버리스 훈련

모든 인프라 복잡성을 추상화하여 모델 개발에 전적으로 집중할 수 있는 완전관리형 컴퓨팅 인프라입니다. 여기에는 모델 크기 및 훈련 요구 사항에 따른 GPU 인스턴스(P5, P4de, P4d, G5)의 자동 프로비저닝, 각 사용자 지정 기법에 대한 모범 사례를 통합하는 사전 최적화된 훈련 레시피, UI를 통해 액세스할 수 있는 라이브 지표 및 로그를 사용한 실시간 모니터링, 비용 최적화를 위한 훈련 완료 후 리소스 자동 정리가 포함됩니다.

모델 사용자 지정 기법

지도 미세 조정(SFT), 직접 선호도 최적화(DPO), 검증 가능한 보상을 통한 강화 학습(RLVR), AI 피드백을 통한 강화 학습(RLAIF)을 포함한 포괄적인 고급 방법 세트입니다.

사용자 지정 모델

자체 데이터로 훈련하여 특정 사용 사례에 맞게 조정된 기본 파운데이션 모델의 특수 버전은 원래 파운데이션 모델의 일반적인 기능을 유지하면서 요구 사항에 맞는 도메인별 지식, 용어, 스타일 또는 동작을 추가하는 AI 모델을 생성합니다.

AI 모델 사용자 지정 자산

모델 사용자 지정 프로세스 중에 사용자 지정 모델을 훈련, 개선 및 평가하는 데 사용되는 리소스 및 아티팩트입니다. 이러한 자산에는 데이터 세트, 훈련 예제 모음(프롬프트-응답 페어, 도메인별 텍스트 또는 레이블이 지정된 데이터)를 사용하여 파운데이션 모델을 미세 조정하여 특정 동작을 학습합니다. 지식, 또는 스타일 및 평가자, 보상 함수(특정 기준에 따라 모델 출력을 채점하는 코드 기반 로직, RLVR 훈련 및 사용자 지정 득점자 평가에 사용) 또는 보상 프롬프트(LLM이 모델 응답의 품질을 판단하도록 안내하는 자연어 지침, RLAIF 훈련 및 LLM-as-a-judge 평가에 사용됨).

모델 패키지 그룹

훈련 작업에서 로깅된 모든 모델을 추적하여 모델 버전 및 계보에 대한 중앙 위치를 제공하는 수집 컨테이너입니다.

로깅된 모델

서버리스 훈련 작업을 실행할 때 SageMaker AI에서 생성한 출력입니다. 이는 미세 조정된 모델(성공적인 작업), 체크포인트(포인트가 있는 실패한 작업) 또는 연결된 메타데이터(포인트가 없는 실패한 작업)일 수 있습니다.

등록된 모델

공식 추적 및 거버넌스 목적으로 표시된 로깅된 모델로, 전체 계보 및 수명 주기 관리를 지원합니다.

계보

는 SageMaker AI 및 Amazon Bedrock 전반에서 훈련 작업, 입력 데이터세트, 출력 모델, 평가 작업 및 배포 간의 관계를 자동으로 캡처했습니다.

교차 계정 공유

전체 계보 가시성을 유지하면서 Resource Access Manager(RAM)를 사용하여 AWS AWS 계정 간에 모델, 데이터 세트 및 평가자를 공유하는 기능입니다.