이 페이지 개선에 도움 주기
이 사용자 가이드에 기여하려면 모든 페이지의 오른쪽 창에 있는 GitHub에서 이 페이지 편집 링크를 선택합니다.
Amazon EKS에서 실시간 온라인 추론 워크로드 실행
작은 정보
향후 예정된 Amazon EKS AI/ML 워크숍에 등록
이 섹션은 Amazon EKS(Elastic Kubernetes Service)에서 실시간 온라인 추론 워크로드를 배포하고 운영하는 데 도움이 되도록 설계되었습니다. GPU 가속 노드로 최적화된 클러스터 빌드, 스토리지 및 오토 스케일링을 위한 AWS 서비스 통합, 검증을 위한 샘플 모델 배포, CPU 및 GPU 작업 분리, 적절한 AMI 및 인스턴스 유형 선택, 추론 엔드포인트의 짧은 지연 시간 노출 보장 등 주요 아키텍처 고려 사항에 대한 안내를 확인할 수 있습니다.