Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Tester une politique de raisonnement automatique
Vous testez une politique en envoyant des déclarations en langage naturel ou à des QnAs fins de validation, puis vous inspectez Automated Reasoning qui vérifie les commentaires pour vous assurer qu'elle traduit le texte saisi en utilisant les bonnes variables et que les règles par rapport auxquelles elle valide sont correctes.
Vous pouvez créer des tests de deux manières : en définissant manuellement des paires question-and-answer (QnA) ou en générant automatiquement des scénarios de test. QnAs sont des questions spécifiques aux utilisateurs avec des réponses de modèles correspondantes que vous rédigez pour tester des cas d'utilisation particuliers, tandis que les scénarios de test sont des situations logiques générées automatiquement à partir de vos règles de politique qui peuvent être réalistes ou non dans le contexte de votre application.
Note
Tutoriel vidéo : Pour step-by-step découvrir comment tester une politique de raisonnement automatisé, regardez le didacticiel suivant :
Tutoriel de démonstration 2 - Tester la politique de raisonnement automatique
Les tests doivent imiter les questions que poseraient les utilisateurs de votre application et les réponses qu'ils pourraient obtenir à partir d'un modèle de base. Le raisonnement automatisé évalue la rapidité et la précision des réponses par rapport aux règles de votre politique de raisonnement automatisé. Automated Reasoning effectue cette validation en suivant les étapes suivantes :
Astuce
Bonne pratique : créez des tests qui couvrent à la fois les scénarios valides et non valides. Par exemple, si votre politique stipule que « les employés ont besoin d'un an de service pour le congé parental », créez des tests pour les réponses qui énoncent correctement cette règle et des tests pour les réponses qui énoncent incorrectement une exigence différente.
-
Utilise la question et la réponse de votre test ainsi que les variables de votre politique et leurs descriptions pour traduire les entrées en langage naturel en logique formelle.
-
Valide la logique traduite par rapport à la politique en utilisant de bonnes techniques mathématiques.
Note
Le raisonnement automatisé traduit le langage naturel en logique à l'aide de techniques d'intelligence artificielle qui ne peuvent garantir une précision parfaite. Cependant, de bons tests aideront à détecter et à corriger d'éventuelles inexactitudes dans vos politiques de raisonnement automatique.
Créez un test manuellement dans la console
-
Accédez à la politique de raisonnement automatisé que vous souhaitez tester (par exemple, MyHrPolicy).
-
Choisissez Afficher les tests, puis sélectionnez Ajouter.
-
Dans la boîte de dialogue Ajouter des tests, procédez comme suit :
-
Incluez une entrée (facultatif) et une sortie. Ils représentent la question qu'un utilisateur peut se poser et la réponse que votre modèle de base peut apporter, formant ensemble une paire QnA qui teste la manière dont votre politique valide les interactions réelles des utilisateurs.
-
Choisissez le résultat que vous attendez du test (par exemple Valide ou Invalide).
-
Sélectionnez un seuil de confiance, qui est le niveau de confiance minimum pour la validation logique.
-
-
Sélectionnez Enregistrer pour créer le test.
Note
Lors de la création d'un test, le seuil de confiance est facultatif.
-
Les contrôles de raisonnement automatisés utilisent plusieurs grands modèles linguistiques (LLMs) pour traduire les tests de langage naturel en résultats. Il ne renvoie que des résultats « fiables » qui sont étayés par un pourcentage significatif des traductions du LLM. Le seuil de confiance définit le pourcentage minimum de support nécessaire pour qu'une traduction devienne une constatation avec un résultat valide.
-
Si un ou plusieurs résultats traduits ne sont pas étayés par un pourcentage suffisant de traductions LLM, les contrôles de raisonnement automatisés feront apparaître un résultat « TRANSLATION_AMBIGU » supplémentaire. Ce résultat contiendra des informations pour mettre en évidence les différences entre les traductions de LLM en désaccord.
Génération automatique de tests dans la console
-
Accédez à la politique de raisonnement automatisé que vous souhaitez tester (par exemple, MyHrPolicy).
-
Choisissez Afficher les tests, puis sélectionnez Générer.
-
Dans la boîte de dialogue Générer des scénarios, passez en revue le scénario généré et les règles associées. Ensuite, effectuez l’une des actions suivantes :
-
Si vous pensez que le scénario pourrait se produire (également appelé scénario satisfaisant), sélectionnez le pouce levé (oui).
-
Si ce n'est pas le cas, sélectionnez le pouce vers le bas (non). Vous pouvez également fournir une annotation pour expliquer pourquoi vous pensez que le scénario n'est pas possible. Cela revient à laisser un commentaire dans un document.
-
Si vous souhaitez tester un autre scénario, choisissez Régénérer le scénario.
Astuce
Si vous souhaitez inspecter la version logique officielle du scénario, activez Show SMT-LIB.
-
-
Sélectionnez Enregistrer et fermer pour enregistrer le test ou Enregistrer et ajouter un autre test.
-
Si vous avez fourni des annotations à l'un des tests, choisissez Appliquer les annotations. Automated Reasoning modifiera votre politique en fonction de vos commentaires.
-
Sur l'écran Réviser les modifications de politique, passez en revue les modifications apportées aux règles, aux variables et aux types de variables de votre politique. Sélectionnez ensuite Accepter les modifications.
Exécuter des tests dans la console
-
Accédez à la politique de raisonnement automatisé que vous souhaitez valider (par exemple, MyHrPolicy).
-
Choisissez Afficher les tests.
-
Effectuez l’une des actions suivantes :
-
Pour exécuter tous les tests de votre politique, choisissez Valider tous les tests.
-
Pour exécuter des tests individuellement, sélectionnez le bouton Action à côté du test que vous souhaitez exécuter et choisissez Valider.
-
Créez un test manuellement à l'aide de l'API
Vous pouvez utiliser l'opération CreateAutomatedReasoningPolicyTestCase
API pour créer un test pour votre politique de raisonnement automatisé par programmation.
Paramètres de demande
Les paramètres suivants sont obligatoires ou facultatifs lors de la création d'un test :
policyArn
(obligatoire)-
Le nom de ressource Amazon (ARN) de la politique de raisonnement automatisé pour laquelle le test doit être créé.
guardContent
(obligatoire)-
Le contenu de sortie validé par la politique de raisonnement automatisé. Cela représente la réponse du modèle de base dont l'exactitude sera vérifiée.
query
(facultatif)-
La requête ou l'invite d'entrée qui a généré le contenu. Cela fournit un contexte pour la validation.
expectedAggregatedFindingsResult
(facultatif)-
Le résultat de validation attendu pour le test (par exemple,
VALID
ouINVALID
). confidenceThreshold
(facultatif)-
Le niveau de confiance minimal pour la validation logique. Le contenu qui atteint le seuil est considéré comme un résultat à haut niveau de confiance qui peut être validé.
exemple
L'exemple suivant montre comment créer un test pour une politique de raisonnement automatisé à l'aide de AWS CLI :
aws bedrock create-automated-reasoning-policy-test-case \ --policy-arn "arn:aws:bedrock:us-west-2:123456789012:automated-reasoning-policy/k8m9n2p4q7r5" \ --query-content "Can I take a leave of absence if I'm a part-time employee?" \ --guard-content "No, only full-time employees are eligible for leave of absence." \ --expected-aggregated-findings-result "VALID" \ --confidence-threshold 0.8
Exemple de réponse :
{ "testCaseId": "test-12345abcde", "policyArn": "arn:aws:bedrock:us-west-2:123456789012:automated-reasoning-policy/k8m9n2p4q7r5" }
Générez des tests automatiquement à l'aide de l'API
Vous pouvez utiliser l'opération GenerateAutomatedReasoningPolicyTestScenarios
API pour générer automatiquement des scénarios de test en fonction des règles de votre politique.
Paramètres de demande
Les paramètres suivants sont obligatoires ou facultatifs lors de la génération de scénarios de test :
policyArn
(obligatoire)-
Nom de ressource Amazon (ARN) de la politique de raisonnement automatisé pour laquelle les scénarios de test doivent être générés.
maxResults
(facultatif)-
Le nombre maximal de scénarios de test à générer.
exemple
L'exemple suivant montre comment générer des scénarios de test pour une politique de raisonnement automatisé à l'aide de AWS CLI :
aws bedrock generate-automated-reasoning-policy-test-scenarios \ --policy-arn "arn:aws:bedrock:us-west-2:123456789012:automated-reasoning-policy/k8m9n2p4q7r5" \ --max-results 3
La réponse inclura des scénarios de test générés que vous pourrez consulter et utiliser pour créer des tests.
Exécuter des tests à l'aide de l'API
Vous pouvez utiliser l'opération ValidateAutomatedReasoningPolicyTest
API pour tester votre politique de raisonnement automatisé et l'GetAutomatedReasoningPolicyTestResult
opération pour récupérer les résultats.
Paramètres de demande
Les paramètres suivants sont requis lors de l'exécution d'un test :
policyArn
(obligatoire)-
Le nom de ressource Amazon (ARN) de la politique de raisonnement automatisé.
testCaseId
(obligatoire)-
Identifiant unique du test à exécuter.
Obtenez les résultats des tests
Pour récupérer les résultats d'un test, utilisez les paramètres suivants :
policyArn
(obligatoire)-
Le nom de ressource Amazon (ARN) de la politique de raisonnement automatisé.
buildWorkflowId
(obligatoire)-
L'identifiant du flux de travail de construction. Le flux de travail de génération doit afficher un
COMPLETED
statut pour obtenir des résultats. testCaseId
(obligatoire)-
Identifiant unique du test pour lequel les résultats doivent être récupérés.
exemple
L'exemple suivant montre comment exécuter un test et récupérer les résultats à l'aide de AWS CLI :
# Run the test aws bedrock validate-automated-reasoning-policy-test \ --policy-arn "arn:aws:bedrock:us-west-2:123456789012:automated-reasoning-policy/k8m9n2p4q7r5" \ --test-case-id "test-12345abcde" # Get the test results aws bedrock get-automated-reasoning-policy-test-result \ --policy-arn "arn:aws:bedrock:us-west-2:123456789012:automated-reasoning-policy/k8m9n2p4q7r5" \ --build-workflow-id "workflow-67890fghij" \ --test-case-id "test-12345abcde"
La réponse comprendra des résultats de test détaillés avec les résultats de validation et l'état d'exécution.