Configurar um agente do Amazon Bedrock para concluir tarefas com ferramentas Computer Use - Amazon Bedrock

Configurar um agente do Amazon Bedrock para concluir tarefas com ferramentas Computer Use

Computer Use é um recurso do modelo Claude da Anthropic (em versão beta) disponível somente com o Claude 3.7 Sonnet e Claude 3.5 Sonnet v2 da Anthropic.

Atenção

O recurso Computer Use está disponível como um “serviço beta”, conforme definido nos Termos de Serviço da AWS. Ele está sujeito ao seu contrato com a AWS e aos Termos de Serviço da AWS e ao modelo de EULA aplicável. A API Computer Use apresenta riscos exclusivos que são distintos aos dos recursos padrão de API ou das interfaces de chat. Esses riscos aumentam ao usar a ferramenta Computer Use para interagir com a internet. Para minimizar os riscos, considere tomar precauções, como:

  • Operar a funcionalidade Computer Use em uma máquina virtual ou contêiner dedicado com privilégios mínimos para evitar acidentes ou ataques diretos ao sistema.

  • Para impedir o roubo de informações, evite fornecer à API Computer Use acesso a contas ou dados sensíveis.

  • Limitar o acesso à internet das APIs Computer Use aos domínios necessários para reduzir a exposição a conteúdo mal-intencionado.

  • Para garantir a supervisão adequada, mantenha uma pessoa informada sobre tarefas confidenciais (como tomar decisões que possam ter consequências significativas no mundo real) e sobre qualquer coisa que exija consentimento afirmativo (como aceitar cookies, executar transações financeiras ou concordar com os termos de serviço).

Qualquer conteúdo que você permita que o Claude veja ou acesse pode potencialmente substituir as instruções ou provocar erros no Claude ou executar ações indesejadas. Tomar as devidas precauções, como isolar o Claude de superfícies confidenciais, é essencial, inclusive para evitar riscos relacionados à injeção de prompt. Antes de habilitar ou solicitar as permissões necessárias para habilitar os recursos do Computer Use em seus próprios produtos, informe os usuários finais sobre quaisquer riscos relevantes e obtenha o consentimento deles conforme apropriado.

Com a Computer Use, um agente do Amazon Bedrock Agent pode usar o Claude para automatizar tarefas por meio de ações básicas de GUI e executar comandos Linux implementados por você. Por exemplo, quando habilitado, o agente pode fazer capturas de tela, criar e editar arquivos de texto ou executar comandos do Linux. O Claude ajuda o agente a prever quais ferramentas e ações de ferramenta usar, e o agente usa a implementação da ferramenta para concluir a tarefa. Para habilitar a Computer Use para um agente, crie um grupo de ação para o agente e especifique uma ferramenta Computer Use. Para ter mais informações sobre o fluxo de trabalho, consulte Fluxo de trabalho.

O agente pode usar as seguintes ferramentas definidas pela Anthropic:

  • Computer: as ações incluem usar o mouse e o teclado e fazer capturas de tela.

  • TextEditor: as ações incluem visualização, criação e edição de arquivos.

  • Bash: as ações incluem a execução de comandos em um shell Bash.

Para ter mais informações sobre ferramentas Computer Use, bem como exemplos de implementação e descrições de ferramentas, consulte Computer use (beta) na documentação da Anthropic.

Considerações sobre as barreiras de proteção

Abaixo são apresentadas algumas considerações sobre barreiras de proteção para ferramentas Computer Use e agentes:

Fluxo de trabalho

Para usar ferramentas Computer Use com Agentes do Amazon Bedrock, faça o seguinte:

  1. Crie um grupo de ação e especifique uma ferramenta Computer Use. É possível especificar as ferramentas disponíveis para o agente na operação de API CreateAgentActionGroup ou UpdateAgentActionGroup. Para agentes em linha, você especifica a ferramenta na operação de API InvokeInlineAgent.

  2. Implemente as funções de Computer Use em sua aplicação. Para ver exemplos de implementação de ferramentas, consulte anthropic-quickstarts/computer-use-demo/tools no repositório anthropic-quickstarts do GitHub.

  3. Lide com solicitações de ferramentas Computer Use de agentes em conversas. Depois de usar a operação de API InvokeAgent, extraia a opção de ferramenta e ação da resposta e execute a implementação da ação da ferramenta.