교차 리전 추론을 통한 처리량 증가 - Amazon Bedrock

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

교차 리전 추론을 통한 처리량 증가

리전 간 추론은 지리 AWS 리전 내에서 최적의를 자동으로 선택하여 추론 요청을 처리합니다. 이렇게 하면 사용 가능한 리소스와 모델 가용성을 극대화하여 고객 경험이 향상됩니다.

온디맨드 모드에서 모델 추론을 실행할 때 서비스 할당량에 의해 또는 사용량이 가장 많은 시간에 요청이 제한될 수 있습니다. 리전 간 추론을 사용하면 다양한 컴퓨팅을 활용하여 계획되지 않은 트래픽 버스트를 원활하게 관리할 수 있습니다 AWS 리전. 리전 간 추론을 사용하면 트래픽을 여러에 분산 AWS 리전하여 처리량을 높일 수 있습니다.

프로비저닝된 처리량을 구매하여 모델의 처리량을 늘릴 수도 있습니다. 추론 프로파일은 현재 프로비저닝된 처리량을 지원하지 않습니다.

추론 프로파일을 사용하여 리전 간 추론을 실행할 수 있는 리전 및 모델을 보려면 섹션을 참조하세요추론 프로파일에 지원되는 리전 및 모델.

교차 리전(시스템 정의) 추론 프로파일은 지원하는 모델의 이름을 따서 이름이 지정되고 지원하는 리전에서 정의됩니다. 리전 간 추론 프로파일이 요청을 처리하는 방법을 이해하려면 다음 정의를 검토하세요.

  • 소스 리전 - 추론 프로파일을 지정하는 API 요청을 수행하는 리전입니다.

  • 대상 리전 - Amazon Bedrock 서비스가 소스 리전에서 요청을 라우팅할 수 있는 리전입니다.

소스 리전에서 리전 간 추론 프로파일을 호출하면 Amazon Bedrock 서비스가 추론 프로파일에 정의된 대상 리전으로 요청을 라우팅합니다.

참고

일부 추론 프로필은 호출하는 소스 리전에 따라 다른 대상 리전으로 라우팅됩니다. 예를 들어 미국 동부(오하이오)us.anthropic.claude-3-haiku-20240307-v1:0에서를 호출하면 요청을 us-east-1, us-east-2또는 로 라우팅할 수 us-west-2있지만 미국 서부(오레곤)에서 호출하면 요청을 us-east-1 및 로만 라우팅할 수 있습니다us-west-2.

소스 및 대상 리전에서 추론 프로파일을 확인하려면 다음 중 하나를 수행할 수 있습니다.

참고

추론 프로필은 변경할 수 없습니다. 즉, 기존 추론 프로필에 새 리전을 추가하지 않습니다. 그러나 새 리전을 통합하는 새 추론 프로파일을 생성할 수 있습니다. 설정의 IDs를 새 ID로 변경하여 이러한 추론 프로파일을 사용하도록 시스템을 업데이트할 수 있습니다.

리전 간 추론에 대한 다음 정보를 참고하세요.

  • 교차 리전 추론을 사용하는 데 드는 추가 라우팅 비용은 없습니다. 요금은 추론 프로파일을 호출하는 리전을 기준으로 계산됩니다. 요금에 대한 자세한 내용은 Amazon Bedrock 요금을 참조하세요.

  • 교차 리전 추론을 사용하는 경우 처리량은 단일 리전에서 모델을 호출하는 것보다 높습니다. 리전 간 처리량에 대한 기본 할당량을 보려면의 Amazon Bedrock 서비스 할당량에서 리전 간 모델 분당 InvokeModel 요청분당 리전 간 InvokeModel 토큰 값을 참조하세요 AWS 일반 참조.

  • 교차 리전 추론 요청은 데이터가 원래 상주 AWS 리전하는 리전의 일부인 내에 보관됩니다. 예를 들어 미국 내에서 이루어진 요청은 AWS 리전미국의 내에서 유지됩니다. 데이터는 소스 리전에만 저장되지만 교차 리전 추론 중에 입력 프롬프트와 출력 결과가 소스 리전 외부로 이동할 수 있습니다. 모든 데이터는 Amazon의 보안 네트워크를 통해 암호화되어 전송됩니다.

교차 리전(시스템 정의) 추론 프로파일 사용

교차 리전 추론을 사용하려면 다음과 같은 방법으로 모델 추론을 실행할 때 추론 프로파일을 포함합니다.

추론 프로파일을 사용하여 리전 간에 모델 호출 요청을 보내는 방법을 알아보려면 섹션을 참조하세요모델 간접 호출에 추론 프로파일 사용.

리전 간 추론에 대한 자세한 내용은 Amazon Bedrock에서 리전 간 추론 시작하기를 참조하세요.