파운데이션 모델 및 사용자 지정 미세 조정 모델 배포 - Amazon SageMaker AI

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

파운데이션 모델 및 사용자 지정 미세 조정 모델 배포

Amazon SageMaker JumpStart에서 사전 훈련된 파운데이션 오픈 가중치 또는 게이트 모델을 배포하든 Amazon S3 또는 Amazon FSx에 저장된 자체 사용자 지정 또는 미세 조정 모델을 배포하든 관계없이 SageMaker HyperPod는 프로덕션 추론 워크로드에 필요한 유연하고 확장 가능한 인프라를 제공합니다.

JumpStart에서 개방형 가중치 및 게이트 파운데이션 모델 배포 Amazon S3 및 Amazon FSx에서 사용자 지정 및 미세 조정된 모델 배포
설명

각 모델 패밀리에 맞게 조정된 자동 최적화 및 조정 정책을 사용하여 사전 훈련된 파운데이션 모델의 포괄적인 카탈로그에서 배포합니다.

자체 사용자 지정 및 미세 조정된 모델을 가져오고 프로덕션 규모의 추론을 위해 SageMaker HyperPod의 엔터프라이즈 인프라를 활용합니다. Amazon S3를 사용하는 비용 효율적인 스토리지 또는 Amazon FSx를 사용하는 고성능 파일 시스템 중에서 선택합니다.
주요 이점
  • Amazon SageMaker Studio UI를 통한 원클릭 배포

  • 수신 요청에 따른 자동 크기 조정이 자동으로 활성화됨

  • 각 모델 패밀리에 대해 사전 최적화된 컨테이너 및 구성

  • 게이트 모델의 EULA 처리

  • 여러 스토리지 백엔드 지원: Amazon S3, Amazon FSx

  • 유연한 컨테이너 및 프레임워크 지원

  • 모델 특성에 따른 사용자 지정 조정 정책

배포 옵션
  • 시각적 배포를 위한 Amazon SageMaker Studio

  • Kubernetes 네이티브 작업을 위한 kubectl

  • 프로그래밍 방식의 통합을 위한 Python SDK

  • 명령줄 자동화를 위한 HyperPod CLI

  • Kubernetes 네이티브 작업을 위한 kubectl

  • 프로그래밍 방식의 통합을 위한 Python SDK

  • 명령줄 자동화를 위한 HyperPod CLI

다음 섹션에서는 Amazon SageMaker JumpStart와 Amazon S3 및 Amazon FSx에서 모델을 배포하는 방법을 안내합니다.