지원되는 리전 및 엔드포인트 사전 조건 모델 API 응답 API 채팅 완료 API

OpenAI APIs 사용하여 응답 생성

Amazon Bedrock은 대규모 기계 학습 모델 제공을 위한 분산 추론 엔진인 Mantle로 구동되는 모델 추론을 위한 OpenAI 호환 가능한 API 엔드포인트를 제공합니다. 이러한 엔드포인트를 사용하면 Amazon Bedrock 모델과 함께 익숙한 OpenAI SDKs 및 도구를 사용할 수 있으므로 코드 변경을 최소화하면서 기존 애플리케이션을 마이그레이션할 수 있습니다. 기본 URL 및 API 키를 간단히 업데이트하면 됩니다.

주요 이점은 다음과 같습니다.

비동기 추론 - 응답 API를 통해 장기 실행 추론 워크로드 지원
상태 저장 대화 관리 - 각 요청과 함께 대화 기록을 수동으로 전달하지 않고 컨텍스트를 자동으로 재구축합니다.
간소화된 도구 사용 - 에이전트 워크플로를 위한 간소화된 통합
유연한 응답 모드 - 스트리밍 응답과 비스트리밍 응답 모두 지원
간편한 마이그레이션 - 기존 OpenAI SDK 코드베이스와 호환

지원되는 리전 및 엔드포인트

Amazon Bedrock은 다음 AWS리전에서 사용할 수 있습니다.

리전 이름	리전	엔드포인트
미국 동부(오하이오)	us-east-2	bedrock-mantle.us-east-2.api.aws
미국 동부(버지니아 북부)	us-east-1	bedrock-mantle.us-east-1.api.aws
미국 서부(오리건)	us-west-2	bedrock-mantle.us-west-2.api.aws
아시아 태평양(자카르타)	ap-southeast-3	bedrock-mantle.ap-southeast-3.api.aws
아시아 태평양(뭄바이)	ap-south-1	bedrock-mantle.ap-south-1.api.aws
아시아 태평양(도쿄)	ap-northeast-1	bedrock-mantle.ap-northeast-1.api.aws
유럽(프랑크푸르트)	eu-central-1	bedrock-mantle.eu-central-1.api.aws
유럽(아일랜드)	eu-west-1	bedrock-mantle.eu-west-1.api.aws
Europe (London)	eu-west-2	bedrock-mantle.eu-west-2.api.aws
Europe (Milan)	eu-south-1	bedrock-mantle.eu-south-1.api.aws
유럽(스톡홀름)	eu-north-1	bedrock-mantle.eu-north-1.api.aws
남아메리카(상파울루)	sa-east-1	bedrock-mantle.sa-east-1.api.aws

사전 조건

OpenAI APIs 사용하기 전에 다음이 있는지 확인합니다.

인증 - 다음을 사용하여 인증할 수 있습니다.
- Amazon Bedrock API 키(OpenAISDK에 필요)
- AWS자격 증명(HTTP 요청에 지원됨)
OpenAI SDK(선택 사항) - SDK 기반 요청을 사용하는 경우 OpenAI Python SDK를 설치합니다.
환경 변수 - 다음 환경 변수를 설정합니다.
- OPENAI_API_KEY - Amazon Bedrock API 키로 설정
- OPENAI_BASE_URL - 해당 리전의 Amazon Bedrock 엔드포인트로 설정(예: https://bedrock-mantle.us-east-1.api.aws/v1)

모델 API

모델 API를 사용하면 Mantle로 구동되는 Amazon Bedrock에서 사용 가능한 모델을 검색할 수 있습니다. 이 API를 사용하여 응답 API 및 채팅 완료 API와 함께 사용할 수 있는 모델 목록을 검색합니다. 전체 API 세부 정보는 OpenAI 모델 설명서를 참조하세요.

사용 가능한 모델 나열

사용 가능한 모델을 나열하려면 원하는 방법의 탭을 선택한 다음 다음 단계를 따릅니다.

응답 API

응답 API는 스트리밍, 백그라운드 처리 및 멀티턴 상호 작용을 지원하여 상태 저장 대화 관리를 제공합니다. 전체 API 세부 정보는 OpenAI 응답 설명서를 참조하세요.

기본 요청

응답을 생성하려면 원하는 방법의 탭을 선택한 다음 다음 단계를 따릅니다.

스트림 응답

응답 이벤트를 점진적으로 수신하려면 원하는 방법의 탭을 선택한 다음 다음 단계를 따릅니다.

채팅 완료 API

채팅 완료 API는 대화 응답을 생성합니다. 전체 API 세부 정보는 OpenAI 채팅 완료 설명서를 참조하세요.

Chat Completions 생성

채팅 완료를 생성하려면 원하는 방법의 탭을 선택한 다음 다음 단계를 따릅니다.

스트리밍 활성화

응답을 점진적으로 수신하려면 원하는 방법의 탭을 선택한 다음 다음 단계를 따릅니다.

javascript가 브라우저에서 비활성화되거나 사용이 불가합니다.

AWS 설명서를 사용하려면 Javascript가 활성화되어야 합니다. 지침을 보려면 브라우저의 도움말 페이지를 참조하십시오.

문서 규칙

프롬프트 캐싱

배치 추론: 여러 프롬프트 처리