Amazon Bedrock Guardrails의 콘텐츠 필터 구성

Amazon Bedrock Guardrails를 사용하면 유해한 콘텐츠가 포함된 텍스트 및 이미지에 대한 모델 프롬프트와 응답을 자연어로 차단하도록 콘텐츠 필터를 구성할 수 있습니다. 예를 들어, 전자 상거래 사이트에서 혐오 발언이나 모욕과 같은 부적절한 언어가 사용되지 않도록 온라인 어시스턴트를 설계할 수 있습니다.

필터 분류 및 차단 수준

필터링은 각 6개 범주에 대한 사용자 입력 및 FM 응답의 신뢰도 분류를 기반으로 수행됩니다. 모든 사용자 입력 및 FM 응답은 NONE, LOW, MEDIUM, HIGH의 네 가지 강도 수준으로 분류됩니다. 예를 들어 어떤 문장이 혐오 HIGH 수준으로 분류되는 경우 해당 문장이 혐오 콘텐츠를 나타낼 가능성이 높습니다. 단일 문장은 다양한 신뢰 수준의 여러 범주로 분류될 수 있습니다. 예를 들어, 단일 문장을 HIGH 수준의 혐오, LOW 수준의 모욕, NONE 수준의 성적 표현, MEDIUM 수준의 폭력으로 분류할 수 있습니다.

필터 강도

앞의 각 콘텐츠 필터 범주에 대해 필터의 강도를 구성할 수 있습니다. 필터 강도는 유해한 콘텐츠 필터링의 민감도를 결정합니다. 필터 강도가 증가하면 유해한 콘텐츠를 필터링할 가능성이 높아지고 애플리케이션에서 유해한 콘텐츠를 볼 확률이 줄어듭니다.

네 가지 수준의 필터 강도가 있습니다.

없음 - 콘텐츠 필터가 적용되지 않습니다. 모든 사용자 입력 및 FM 생성 출력이 허용됩니다.
낮음 - 필터의 강도가 낮습니다. HIGH 수준의 유해성으로 분류된 콘텐츠는 필터링됩니다. NONE, LOW 또는 MEDIUM 수준의 유해성으로 분류된 콘텐츠는 허용됩니다.
중간 - HIGH 및 MEDIUM 수준의 유해성으로 분류된 콘텐츠는 필터링됩니다. NONE 또는 LOW 수준의 유해성으로 분류된 콘텐츠는 허용됩니다.
높음 - 가장 엄격한 필터링 구성을 나타냅니다. HIGH, MEDIUM, LOW 수준의 유해성으로 분류된 콘텐츠는 필터링됩니다. 유해성이 없는 것으로 간주되는 콘텐츠는 허용됩니다.

필터 강도	차단된 콘텐츠 신뢰도	허용된 콘텐츠 신뢰도
없음	필터링 없음	없음, 낮음, 중간, 높음
낮음	높음	없음, 낮음, 중간
중간	높음, 중간	없음, 낮음
높음	높음, 중간, 낮음	없음

javascript가 브라우저에서 비활성화되거나 사용이 불가합니다.

AWS 설명서를 사용하려면 Javascript가 활성화되어야 합니다. 지침을 보려면 브라우저의 도움말 페이지를 참조하십시오.

문서 규칙

가드레일 생성

콘텐츠 필터(텍스트)