거부된 주제 차단으로 유해한 콘텐츠 제거

생성형 AI 애플리케이션의 맥락에서 바람직하지 않은 거부된 주제 집합을 가드레일에 구성할 수 있습니다. 예를 들어, 은행은 AI 어시스턴트가 투자 조언이나 암호화폐와 관련된 대화를 피하기를 원할 수 있습니다.

자연어의 모델 프롬프트 및 응답과 표준 티어의 코드 관련 콘텐츠는 가드레일의 거부된 각 주제에 대해 평가됩니다. 거부된 주제 중 하나가 감지되면 가드레일은 차단된 메시지를 반환합니다.

다음 파라미터를 사용하여 거부된 주제를 생성하면 가드레일이 이를 사용해 프롬프트 또는 응답이 해당 주제에 속하는지 감지합니다.

이름 - 주제의 이름입니다. 이름은 명사 또는 문구여야 합니다. 이름에서 주제를 설명하지 마세요. 예제:
- Investment Advice
정의 - 주제 콘텐츠를 최대 200자로 요약합니다. 정의는 주제의 내용과 하위 주제를 설명해야 합니다.

다음은 제공할 수 있는 주제 정의의 예입니다.

Investment advice is inquiries, guidance, or recommendations about the management or allocation of funds or assets with the goal of generating returns or achieving specific financial objectives.
샘플 문구(선택 사항) - 주제를 참조하는 최대 5개의 샘플 문구 목록입니다. 각 문구는 최대 100자까지 가능합니다. 샘플은 어떤 종류의 콘텐츠를 필터링해야 하는지 보여주는 프롬프트 또는 연속입니다. 예제:
- Is investing in the stocks better than bonds?
- Should I invest in gold?

거부된 주제 생성 모범 사례

명확하고 정확한 방식으로 주제를 정의합니다. 모호하지 않은 명확한 주제 정의로 주제 감지의 정확도를 개선할 수 있습니다. 예를 들어, 암호화폐와 관련된 쿼리 또는 설명을 감지하는 주제를 Question or information associated with investing, selling, transacting, or procuring cryptocurrencies로 정의할 수 있습니다.
주제 정의에 예제 또는 지침을 포함하지 마세요. 예를 들어 Block all contents associated to cryptocurrency는 주제의 정의가 아닌 지침입니다. 이러한 지침을 주제 정의의 일부로 사용해서는 안 됩니다.
부정적인 주제 또는 예외를 정의하지 마세요. 예를 들어 All contents except medical information 또는 Contents not containing medical information은 주제에 대한 부정적인 정의이므로 사용해서는 안 됩니다.
거부된 주제를 사용하여 엔터티 또는 단어를 캡처하지 마세요. 예: Statement or questions containing the name of a person "X" 또는 Statements with a competitor name Y. 주제 정의는 일종의 테마를 나타내며 가드레일은 컨텍스트에 따라 입력을 평가합니다. 주제 필터링을 사용하여 개별 단어 또는 엔터티 유형을 캡처해서는 안 됩니다. 이러한 사용 사례에 대한 자세한 내용은 민감한 정보 필터를 사용하여 대화에서 PII 제거 또는 단어 필터를 사용해 대화에서 특정 단어 및 문구 제거를 참조하세요.

가드레일에 거부된 주제 추가

AWS Management Console 또는 Amazon Bedrock API를 사용하여 가드레일에 최대 30개의 거부된 주제를 추가할 수 있습니다.

Console

Amazon Bedrock 콘솔을 사용할 권한이 있는 IAM 자격 증명 AWS Management Console 으로에 로그인합니다. 그 다음 https://console.aws.amazon.com/bedrock에서 Amazon Bedrock 콘솔을 엽니다.
왼쪽 탐색 창에서 가드레일을 선택한 다음 가드레일 생성을 선택합니다.
가드레일 세부 정보 제공 페이지에서 다음 작업을 수행합니다.
1. 가드레일 세부 정보 섹션에서 가드레일의 이름 및 필요한 경우 설명을 제공합니다.
2. 차단된 프롬프트에 대한 메시지의 경우 가드레일이 적용될 때 표시할 메시지를 입력합니다. 응답에 가드레일이 적용될 때 동일한 메시지를 사용하도록 하려면 응답에 동일한 차단된 메시지 적용 확인란을 선택합니다.
3. (선택 사항) 가드레일에 대한 교차 리전 추론을 활성화하려면 교차 리전 추론을 펼친 다음 가드레일에 대한 교차 리전 추론 활성화를 선택합니다. 가드레일 추론 요청을 라우팅할 수 AWS 리전 있는 대상을 정의하는 가드레일 프로파일을 선택합니다.
4. (선택 사항) 기본적으로 가드레일은 로 암호화됩니다 AWS 관리형 키. 자체 고객 관리형 KMS 키를 사용하려면 KMS 키 선택을 펼치고 암호화 설정 사용자 지정(고급) 확인란을 선택합니다.
  
  기존 AWS KMS 키를 선택하거나 키 생성을 선택하여 새 AWS KMS 키를 생성할 수 있습니다.
5. (선택 사항) 가드레일에 태그를 추가하려면 태그를 펼친 다음 정의한 각 태그에 대해 새 태그 추가를 선택합니다.
  
  자세한 내용은 Amazon Bedrock 리소스 태그 지정 단원을 참조하십시오.
6. 다음을 선택합니다.
거부된 주제 추가 페이지로 이동하면 거부된 주제 추가를 선택하고 다음을 수행합니다.
1. 주제의 이름을 입력합니다.
2. 정의에서 주제를 정의합니다. 거부된 주제를 정의하는 방법에 대한 지침은 거부된 주제 차단으로 유해한 콘텐츠 제거 섹션을 참조하세요.
3. (선택 사항) 입력에서 모델 프롬프트에 가드레일 평가를 활성화할지 여부를 지정합니다. 활성화한 경우 가드레일이 수행할 작업을 선택합니다. 차단은 기본적으로 활성화됩니다. 자세한 내용은 Amazon Bedrock Guardrails에서 감지한 유해한 콘텐츠를 처리하는 옵션 단원을 참조하십시오.
4. (선택 사항) 출력에서 모델 응답에 가드레일 평가를 활성화할지 여부를 지정합니다. 활성화한 경우 가드레일이 응답에 대해 수행할 작업을 선택합니다. 차단은 기본적으로 활성화됩니다. 자세한 내용은 Amazon Bedrock Guardrails에서 감지한 유해한 콘텐츠를 처리하는 옵션 단원을 참조하십시오.
5. (선택 사항) 샘플 문구 추가를 펼치고 이 주제와 관련된 프롬프트 또는 응답을 나타내는 문구를 입력합니다. 최대 5개의 문구를 입력할 수 있습니다. 포함하는 각 문구에 대해 문구 추가를 선택합니다.
6. 거부된 주제 티어에서 프롬프트 및 응답의 주제를 차단하는 데 가드레일이 사용할 보호 티어를 선택합니다. 자세한 내용은 가드레일 정책에 대한 보호 티어 단원을 참조하십시오.
7. 거부된 주제 구성을 완료했으면 확인을 선택합니다.
8. 거부된 주제를 추가로 생성하려면 이전 단계를 반복합니다.
9. 필요에 따라 다른 정책을 구성하려면 다음을 선택하고 가드레일 생성을 완료하려면 검토 및 생성으로 건너뛰기를 선택합니다.
가드레일의 설정을 검토합니다.
1. 변경하려는 섹션에서 편집을 선택합니다.
2. 정책 구성을 완료했으면 생성을 선택하여 가드레일을 생성합니다.

API

CreateGuardrail 요청을 전송하여 가드레일에 거부된 주제를 추가합니다. 요청 형식은 다음과 같습니다.


POST /guardrails HTTP/1.1
Content-type: application/json

{
   "blockedInputMessaging": "string",
   "blockedOutputsMessaging": "string",
   "topicPolicyConfig": {
      "topicsConfig": [ 
         { 
            "definition": "string",
            "examples": [ "string" ],
            "inputAction": "BLOCK | NONE",
            "inputEnabled": true,
            "name": "string",
            "outputAction": "BLOCK | NONE",
            "outputEnabled": true,
            "type": "DENY"
         },
      "tierConfig": { 
         "tierName": "CLASSIC | STANDARD"
      },
      ]
   },
   "crossRegionConfig": { 
      "guardrailProfileIdentifier": "string"
   },
   "description": "string",
   "name": "string"
}

가드레일이 blockedInputMessaging 및 blockedOutputsMessaging 필드에서 프롬프트 또는 모델 응답을 성공적으로 차단했을 때의 메시지를 지정합니다.
topicPolicyConfig 객체에서 가드레일이 거부할 주제를 지정합니다. topicsConfig 목록의 각 항목은 하나의 주제와 관련이 있습니다.
- 거부해야 하는 주제에 대해 name 및 definition를 지정합니다.
- type 필드에 DENY를 지정합니다.
- inputAction을 사용하는 프롬프트 또는 outputAction을 사용하는 응답에서 해당 주제가 감지될 때 수행할 작업을 지정합니다. BLOCK을 선택하여 콘텐츠를 차단하고 차단된 메시지로 바꾸거나 NONE을 선택하여 조치를 취하지 않고 감지 정보를 반환하도록 합니다. 자세한 내용은 Amazon Bedrock Guardrails에서 감지한 유해한 콘텐츠를 처리하는 옵션 단원을 참조하십시오.
- 모델 프롬프트 및 응답에 가드레일 평가가 활성화되었는지 여부를 제어하려면 inputEnabled 및 outputEnabled를 설정합니다.
- (선택 사항) examples 목록에서 이 주제와 관련된 프롬프트 또는 응답을 나타내는 샘플 문구를 최대 5개까지 지정합니다.
(선택 사항) tierConfig 객체에서 가드레일의 보호 티어를 지정합니다. 옵션에는 STANDARD 및 CLASSIC 티어가 포함됩니다.

자세한 내용은 가드레일 정책에 대한 보호 티어 단원을 참조하십시오.
(선택 사항) 교차 리전 추론을 활성화하려면 crossRegionConfig 객체에 가드레일 프로파일을 지정합니다. 이는 STANDARD 티어를 사용할 때 필요합니다.
가드레일에 name 및 description을 지정합니다.

응답 형식은 다음과 같습니다.


HTTP/1.1 202
Content-type: application/json

{
   "createdAt": "string",
   "guardrailArn": "string",
   "guardrailId": "string",
   "version": "string"
}

javascript가 브라우저에서 비활성화되거나 사용이 불가합니다.

AWS 설명서를 사용하려면 Javascript가 활성화되어야 합니다. 지침을 보려면 브라우저의 도움말 페이지를 참조하십시오.

문서 규칙

프롬프트 공격

단어 필터 추가