チュートリアル: Amazon A2I コンソールの使用を開始する - Amazon SageMaker AI

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

チュートリアル: Amazon A2I コンソールの使用を開始する

次のチュートリアルは、Amazon A2I コンソールで Amazon A2I の使用を開始する方法を示しています。

このチュートリアルでは、ドキュメントレビューに Amazon Textract で Augmented AI を使用するか、イメージコンテンツのレビューに Amazon Rekognition を使用するオプションが用意されています。

前提条件

Amazon A2I の使用を開始するには、次の前提条件を満たしてください。

  • Amazon S3 バケットを入出力データのワークフロー同じ AWS リージョンに作成します。例えば、us-east-1 で Amazon A2I を Amazon Textract と使用している場合、us-east-1 でバケットを作成します。バケットを作成するには、Amazon Simple Storage Service コンソールユーザーガイドの「バケットの作成」の手順に従います。

  • 次のいずれかを行います:

    • Amazon Textract を使用してチュートリアルを実施する場合は、以下のイメージをダウンロードして Amazon S3 バケットに配置します。

      簡単な雇用申請書
    • Amazon Rekognition を使用してチュートリアルを実施する場合は、以下のイメージをダウンロードして Amazon S3 バケットに配置します。

      ビーチでヨガをしているビキニ姿の女性
注記

Amazon A2I コンソールは SageMaker AI コンソールに埋め込まれています。

ステップ 1: ワークチームを作成する

まず、Amazon A2I コンソールでワークチームを作成し、ワーカーレビュータスクをプレビューできるようにワーカーとして自分自身を追加します。

重要

このチュートリアルでは、プライベートワークチームを使用します。Amazon A2I プライベートワークフォースは SageMaker AI コンソールの Ground Truth 領域で設定され、Amazon A2I と Ground Truth 間で共有されます。

ワーカーの E メールを使用してプライベートワークフォースを作成するには
  1. SageMaker AI コンソール (https://console.aws.amazon.com/sagemaker/) を開きます。

  2. ナビゲーションペインで、[Ground Truth] にある [Labeling workforces] (ラベリングワークフォース) を選択します。

  3. [Private] (プライベート)、[Create private team] (プライベートチームの作成) の順に選択します。

  4. [Invite new workers by email] (E メールで新しいワーカーを招待する) を選択します。

  5. このチュートリアルでは、E メールや、ヒューマンタスク UI をプレビュー可能にするその他の要素を入力します。最大 50 のメールアドレスが含まれるカンマ区切りの E メールアドレスリストを E メールアドレスボックスに貼り付けるか、入力できます。

  6. 組織名と連絡先メールアドレスを入力します。

  7. 必要に応じて、新しい Ground Truth ラベリングジョブが利用可能になったときに、ワーカーに E メールで通知されるように、チームをサブスクライブする Amazon SNS トピックを選択します。Amazon SNS 通知は Ground Truth でサポートされていますが、Augmented AI ではサポートされていません。Amazon SNS 通知を受信するようワーカーをサブスクライブすると、Ground Truth ラベリングジョブに関する通知のみがワーカーに届きます。Augmented AI タスクに関する通知は届きません。

  8. [Create private team] (プライベートチームを作成) を選択します。

プライベートワークチームに自分自身を追加すると、ログイン情報が含まれる E メールが no-reply@verificationemail.com から届きます。この E メールのリンクを使用してパスワードをリセットし、ワーカーポータルにログインします。ヒューマンループの作成時に、人間によるレビュータスクはここに表示されます。

ステップ 2: 人間によるレビューワークフローを作成する

このステップでは、人間によるレビューワークフローを作成します。人間によるレビューワークフローは特定のタスクタイプごとに作成されます。このチュートリアルでは、組み込みタスクタイプ (Amazon Rekognition と Amazon Textract) のいずれかを選択できます。

人間によるレビューワークフローを作成するには、次の手順を実行します。
  1. Augmented AI コンソール (https://console.aws.amazon.com/a2i) を開き、[Human review workflows] (人間によるレビューワークフロー) ページにアクセスします。

  2. [Create human review workflow] (人間によるレビューワークフローを作成) を選択します。

  3. [Workflow settings] (ワークフロー設定)で、ワークフローの [Name] (名前)、[S3 bucket] (S3 バケット)、AWS 管理ポリシー AmazonAugmentedAIIntegratedAPIAccess がアタッチされているこのチュートリアル用に作成した [IAM role] (IAM ロール) を入力します。

  4. [Task type] (タスクタイプ) に対して、[Textract – Key-value pair extraction] (Textract - キーと値のペアの抽出) または [Rekognition – Image moderation] (Rekognition - イメージモデレーション) を選択します。

  5. 次の表から選択したタスクタイプを選択し、そのタスクタイプの手順を確認します。

    Amazon Textract – Key-value pair extraction

    1. [Trigger a human review for specific form keys based on the form key confidence score or when specific form keys are missing] (フォームキーの信頼性スコアに基づいて、または特定のフォームキーが見つからない場合、特定のフォームキーに対して人間によるレビューをトリガー) を選択します。

    2. [Key name] (キー名) で Mail Address を入力します。

    3. 0 から 99 までの識別信頼度しきい値を設定します。

    4. 0 から 99 までの資格信頼度しきい値を設定します。

    5. [指定された範囲の信頼性スコアであると Amazon Textract によって識別されたすべてのフォームキーに対して、人間によるレビューをトリガー] を選択します。

    6. 0 から 90 までの識別信頼度しきい値を設定します。

    7. 0 から 90 までの資格信頼度しきい値を設定します。

    この結果、Amazon Textract が Mail Address とそのキーに対して 99 未満の信頼スコアを返すか、ドキュメントで検出された任意のキーと値のペアに対して 90 未満の信頼スコアを返す場合、人間によるレビューが開始されます。

    次の図は、Amazon A2I コンソールの [Amazon Textract form extraction - Conditions for invoking human review ] (Amazon Textract フォームの抽出 - 人間によるレビューを呼び出す条件) セクションを示しています。この図では、前の段落で説明した 2 つのタイプのトリガーのチェックボックスがオンになっており、Mail Address は最初のトリガーの [Key name] (キー名) として使われています。識別信頼しきい値は、フォーム内で検出されるキーと値のペアの信頼度スコアを使用して定義され、0 ~ 99 の間で設定されます。資格信頼度しきい値は、フォーム内のキーと値に含まれるテキストの信頼度スコアを使用して定義され、0 ~ 99 の間で設定されます。

    Amazon A2I コンソールの、人間によるレビューを呼び出す条件のセクション。
    Amazon Rekognition – Image moderation

    1. [ラベルの信頼性スコアに基づいて Amazon Rekognition によって識別されたラベルに対して人間によるレビューをトリガー] を選択します。

    2. 0 から 98[Threshold] (しきい値) を設定します。

    Amazon Rekognition がイメージモデレーションジョブに対して 98 未満の信頼度スコアを返す場合、人間によるレビューが開始されます。

    次の図は、[Trigger human review for labels identified by Amazon Rekognition based on label confidence score] (ラベルの信頼性スコアに基づいて Amazon Rekognition によって識別されたラベルに対して人間によるレビューをトリガー) オプションを選択し、Amazon A2I コンソールで 0 ~ 98 の [Threshold] (しきい値) を入力する方法を示しています。

    Amazon A2I コンソールの、人間によるレビューを呼び出す条件のセクション。
  6. [Worker task template creation] (ワーカータスクテンプレートを作成) で、[Create from a default template] (既定のテンプレートから作成) を選択します。

  7. [Template name] (テンプレート名) を入力します。

  8. [Task description] (タスクの説明) フィールドに、次のテキストを入力します。

    Read the instructions carefully and complete the task.

  9. [Workers] (ワーカー) で、[Private] (プライベート) を選択します。

  10. 作成したプライベートチームを選択します。

  11. [作成] を選択します。

人間によるレビューワークフローが作成されると、そのワークフローは、[Human review workflows] (人間によるレビューワークフロー) ページに表示されます。[Status] (ステータス) が Active の場合、ワークフロー ARN をコピーして保存します。これは次の手順で必要になります。

ステップ 3: ヒューマンループを開始する

ヒューマンループを開始するには、API オペレーションを使用する必要があります。これらの API オペレーションの操作には言語固有のさまざまな SDK を使用できます。これらの SDK の各ドキュメントについては、次の図に示すように、API ドキュメントの「以下の資料も参照してください」を参照してください。

Amazon Textract API ドキュメントの [See Also] セクションのスクリーンショット

このチュートリアルでは、次の API のいずれかを使用します。

  • Amazon Textract タスクタイプを選択した場合、AnalyzeDocument オペレーションを使用します。

  • Amazon Rekognition タスクタイプを選択した場合、DetectModerationLabels オペレーションを使用します。

これらの API は、SageMaker ノートブックインスタンス (新規ユーザーに推奨) または AWS Command Line Interface (AWS CLI) を使用して操作できます。これらのオプションの詳細について、次のいずれかを選択して参照します。

AWS SDK for Python (Boto3) を使用した Amazon Textract および Amazon Rekognition のリクエスト例については、次の表からタスクタイプを選択して参照してください。

Amazon Textract – Key-value pair extraction

次の例では、AWS SDK for Python (Boto3) を使用して us-west-2 で analyze_document を呼び出します。斜体の赤いテキストはリソースに置き換えます。Amazon Mechanical Turk ワークフォースを使用している場合は、DataAttributes パラメータを含めます。詳細については、AWS SDK for Python (Boto) API リファレンスの「analyze_document」のドキュメントを参照してください。

response = client.analyze_document( Document={ "S3Object": { "Bucket": "amzn-s3-demo-bucket", "Name": "document-name.pdf" } }, HumanLoopConfig={ "FlowDefinitionArn":"arn:aws:sagemaker:us-west-2:111122223333:flow-definition/flow-definition-name", "HumanLoopName":"human-loop-name", "DataAttributes" : { "ContentClassifiers":["FreeOfPersonallyIdentifiableInformation","FreeOfAdultContent"] } }, FeatureTypes=["TABLES", "FORMS"])
Amazon Rekognition – Image moderation

次の例では、AWS SDK for Python (Boto3) を使用して us-west-2 で detect_moderation_labels を呼び出します。斜体の赤いテキストはリソースに置き換えます。Amazon Mechanical Turk ワークフォースを使用している場合は、DataAttributes パラメータを含めます。詳細については、AWS SDK for Python (Boto) API リファレンスの「detect_moderation_labels」のドキュメントを参照してください。

response = client.detect_moderation_labels( Image={ "S3Object":{ "Bucket": "amzn-s3-demo-bucket", "Name": "image-name.png" } }, HumanLoopConfig={ "FlowDefinitionArn":"arn:aws:sagemaker:us-west-2:111122223333:flow-definition/flow-definition-name", "HumanLoopName":"human-loop-name", "DataAttributes":{ ContentClassifiers:["FreeOfPersonallyIdentifiableInformation"|"FreeOfAdultContent"] } })

ステップ 4: コンソールでヒューマンループステータスを表示する

ヒューマンループを開始すると、Amazon A2I コンソールでそのステータスを表示できます。

ヒューマンループステータスを表示するには
  1. Augmented AI コンソール (https://console.aws.amazon.com/a2i) を開き、[Human review workflows] (人間によるレビューワークフロー) ページにアクセスします。

  2. ヒューマンループの開始に使用した人間によるレビューワークフローを選択します。

  3. [Human loops] (ヒューマンループ) セクションで、ヒューマンループを確認できます。そのステータスを [Status] (ステータス) 列で確認します。

ステップ 5: 出力データをダウンロードする

出力データは、人間によるレビューワークフローの作成時に指定した Amazon S3 バケットに保存されます。

Amazon A2I 出力データを表示するには
  1. Amazon S3 コンソールを開きます。

  2. この例のステップ 2 で人間によるレビューワークフローの作成時に指定した Amazon S3 バケットを選択します。

  3. 人間によるレビューワークフローと同じ名前のフォルダから開始し、次の命名規則でフォルダを選択して出力データに移動します。

    s3://output-bucket-specified-in-human-review-workflow/human-review-workflow-name/YYYY/MM/DD/hh/mm/ss/human-loop-name/output.json
  4. output.json を選択し、[Download] (ダウンロード) を選択します。