Amazon Bedrock Guardrails에 대한 콘텐츠 필터 구성 - Amazon Bedrock

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

Amazon Bedrock Guardrails에 대한 콘텐츠 필터 구성

Amazon Bedrock Guardrails를 사용하면 유해한 콘텐츠가 포함된 텍스트 및 이미지에 대한 모델 프롬프트와 응답을 자연어로 차단하도록 콘텐츠 필터를 구성할 수 있습니다. 예를 들어 전자 상거래 사이트는 부적절한 언어 및/또는 이미지를 사용하지 않도록 온라인 어시스턴트를 설계할 수 있습니다.

필터 분류 및 차단 수준

필터링은 각 6개 범주에 대한 사용자 입력 및 FM 응답의 신뢰도 분류를 기반으로 수행됩니다. 모든 사용자 입력 및 FM 응답은 NONE, LOW, MEDIUM, HIGH의 네 가지 강도 수준으로 분류됩니다. 예를 들어 어떤 문장이 증오 HIGH 수준으로 분류되는 경우 해당 문장이 증오 콘텐츠를 나타낼 가능성이 높습니다. 단일 문장은 다양한 신뢰 수준의 여러 범주로 분류될 수 있습니다. 예를 들어, 단일 문장을 HIGH 수준의 증오, LOW 수준의 모욕, NONE 수준의 성적 표현, MEDIUM 수준의 폭력으로 분류할 수 있습니다.

필터 강도

각 콘텐츠 필터 범주에 대해 필터의 강도를 구성할 수 있습니다. 필터 강도는 유해한 콘텐츠 필터링의 민감도를 결정합니다. 필터 강도가 증가하면 유해한 콘텐츠를 필터링할 가능성이 높아지고 애플리케이션에서 유해한 콘텐츠를 볼 확률이 줄어듭니다.

네 가지 수준의 필터 강도가 있습니다.

  • None - 콘텐츠 필터가 적용되지 않습니다. 모든 사용자 입력 및 FM 생성 출력이 허용됩니다.

  • Low - 필터의 강도가 낮습니다. HIGH 수준의 유해성으로 분류된 콘텐츠는 필터링됩니다. NONE, LOW 또는 MEDIUM 수준의 유해성으로 분류된 콘텐츠는 허용됩니다.

  • Medium - HIGHMEDIUM 수준의 유해성으로 분류된 콘텐츠는 필터링됩니다. NONE 또는 LOW 수준의 유해성으로 분류된 콘텐츠는 허용됩니다.

  • High - 가장 엄격한 필터링 구성을 나타냅니다. HIGH, MEDIUM, LOW 수준의 유해성으로 분류된 콘텐츠는 필터링됩니다. 유해성이 없는 것으로 간주되는 콘텐츠는 허용됩니다.

필터 강도 차단된 콘텐츠 신뢰도 허용된 콘텐츠 신뢰도
없음 필터링 없음 None, Low, Medium, High
낮음 높음 None, Low, Medium
중간 High, Medium None, Low
높음 High, Medium, Low 없음