View a markdown version of this page

고급 프롬프트 최적화 작동 방식 - Amazon Bedrock

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

고급 프롬프트 최적화 작동 방식

개요

고급 프롬프트 최적화는 프롬프트 템플릿, 평가 샘플 및 평가 방법을 가져온 다음 반복 추론, 평가 및 재작성 루프를 실행합니다. 각 대상 모델에 대한 평가 지표와 함께 최적화된 프롬프트를 출력합니다. png, jpg 및 PDF 파일을 포함한 멀티모달 입력을 지원합니다.

최적화 루프 작동 방식

평가 샘플은 프롬프트 템플릿의 자리 표시자 변수에 삽입된 다음 대상 모델(들)로 추론을 위해 전송됩니다. 멀티모달 입력(이미지 및 PDFs)은 프롬프트와 함께 페이로드에서 모델로 전송되지만 이중 중괄호 {{placeholder}} 변수에서 참조해서는 안 됩니다. 응답은 평가 방법에 따라 등급이 지정됩니다. 서비스는 평가 결과를 분석하고 프롬프트를 자동으로 다시 작성한 다음 모델로 다시 보냅니다. 이 피드백 루프는 독점 내부 최적화 파라미터에 따라 반복되고 완료됩니다.

평가는 프롬프트 최적화를 주도하므로 평가 방법과 기준을 최대한 정확하게 정의하는 것이 중요합니다.

수신한 내용

최적화 작업이 끝나면 다음을 받게 됩니다.

  • 최적화 전후의 프롬프트 템플릿

  • 각 평가 샘플의 평가 점수

  • 각 모델의 지연 시간(첫 번째 토큰까지의 시간 또는 TTFT)

  • 각 모델의 예상 비용

비용

모든 추론 및 Lambda 함수 호출은 AWS 계정에서 실행됩니다. Lambda 작업에는 Lambda의 공개 요금이 부과됩니다. 추론 요금(LLM-as-a-judge 평가 포함)은 온디맨드 추론에 대한 Bedrock의 공개 요금에 따라 청구됩니다. 추론 비용 외에 별도의 고급 프롬프트 최적화 서비스 요금은 없습니다. 현재 기본 LLM-as-a-judge 모델은 사용자 지정 LLMJ 프롬프트에 대해 다른 모델을 선택하지 않는 한 Anthropic Claude Sonnet 4.6입니다.

최적화 실행 비용을 추정하려면 프롬프트 최적화의 Bedrock 공개 요금 페이지와 계산 방법에 대한 고급 프롬프트 최적화를 참조하세요.

예상 기간

평가 샘플이 몇 개뿐인 단일 프롬프트의 경우 작업을 15~20분 동안 실행할 수 있습니다. 각각 평가 샘플이 많은 많은 많은 프롬프트의 경우 작업은 1시간 이상, 잠재적으로 여러 시간 동안 실행될 수 있습니다. 각 프롬프트 템플릿은 사용자가 제공하는 모든 평가 샘플 레코드를 기반으로 여러 단계의 추론, 평가 및 재작성 루프를 거치기 때문입니다.