Computer Use ツールを使用してタスクを完了するように Amazon Bedrock エージェントを設定する - Amazon Bedrock

Computer Use ツールを使用してタスクを完了するように Amazon Bedrock エージェントを設定する

Computer Use は、Anthropic Claude 3.7 Sonnet および Claude 3.5 Sonnet v2 でのみ利用可能な Anthropic Claude モデル機能 (ベータ版) です。

警告

Computer Use 機能は、AWS サービス規約で定義されている「ベータサービス」として利用できます。これは、AWS との契約、AWS サービス規約、および該当するモデル EULA の対象となります。Computer Use には、標準の API 機能やチャットインターフェイスとは異なる固有のリスクがあります。これらのリスクは、Computer Use ツールを使用してインターネットと通信するときに高くなります。リスクを最小限に抑えるには、次のような予防策を検討します。

  • Computer Use 機能は、システムへの直接攻撃や事故を防ぐために、最小限の権限で専用の仮想マシンまたはコンテナで操作します。

  • 情報の盗難を防ぐため、Computer Use API に機密アカウントまたはデータへのアクセスを許可しないでください。

  • Computer Use API のインターネットアクセスを必要なドメインに制限すると、悪意のあるコンテンツにさらされる状況を軽減できます。

  • 適切な監視を行うには、機密タスク (現実の世界に重大な結果を与える意思決定など) や、肯定的合意が必要なもの (Cookie の承諾、金融取引の実行または利用規約への同意など) のループに人間を関与させます。

Claude が閲覧またはアクセスできるようにしたコンテンツは、指示をオーバーライドしたり、Claude による間違いを招いたり、意図しない動作を引き起こす場合があります。Claude を機密事項から隔離するなど、適切な予防措置を講じることは、プロンプトインジェクション関連のリスクを回避するためにも不可欠です。独自の製品で Computer Use 機能に必要なアクセス許可を有効化またはリクエストする前に、エンドユーザーに関連するリスクを通知したり、必要に応じて、エンドユーザーから合意を得ます。

Computer Use により、Amazon Bedrock エージェントは Claude を使用して、基本的な GUI アクションでタスクを自動化し、実装されている Linux コマンドを実行することができます。例えば、Computer Use が有効な場合、エージェントでは、画面キャプチャの取得、テキストファイルの作成と編集、Linux コマンドの実行が可能になります。Claude は、エージェントが使用するツールとツールアクションを予測するのに役立ち、エージェントはツールの実装を使用してタスクを完了します。エージェントで Computer Use を使用できるようにするには、エージェントのアクショングループを作成し、Computer Use ツールを指定します。ワークフローの詳細については、「ワークフロー」を参照してください。

エージェントは、Anthropic で定義された次のツールを使用できます。

  • コンピュータ – アクションには、マウスとキーボードの使用、スクリーンショットの取得が含まれます。

  • TextEditor – アクションには、ファイルの表示、作成、編集が含まれます。

  • Bash – アクションには、Bash シェルでのコマンドの実行が含まれます。

実装例やツールの説明など、Computer Use ツールの詳細については、Anthropic ドキュメントの Computer Use (ベータ版) に関するページを参照してください。

ガードレールの考慮事項

Computer Use ツールとエージェントに関するガードレールの考慮事項を次に示します。

ワークフロー

Amazon Bedrock エージェントで Computer Use ツールを使用するには、次の手順を実行します。

  1. アクショングループを作成し、Computer Use ツールを指定します。CreateAgentActionGroup または UpdateAgentActionGroup API オペレーションで、エージェントが使用できるツールを指定します。インラインエージェントの場合は、InvokeInlineAgent API オペレーションでツールを指定します。

  2. アプリケーションに Computer Use 関数を実装します。ツールの実装例については、anthropic-quickstarts GitHub リポジトリの「anthropic-quickstarts/computer-use-demo/tools」を参照してください。

  3. 会話の中でエージェントからの Computer Use ツールリクエストを処理します。InvokeAgent API オペレーションを使用した後、レスポンスからツールとアクションの選択を抽出し、ツールアクションの実装を実行します。