Iniciar la detección de texto asíncrona con Amazon Textract Texact y unAWSSDK - Amazon Textract

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Iniciar la detección de texto asíncrona con Amazon Textract Texact y unAWSSDK

El siguiente ejemplo de código muestra cómo iniciar la detección de texto asíncrono en un documento mediante Amazon Textract.

Python
SDK para Python (Boto3)

Iniciar un trabajo asíncrono para detectar texto en un documento.

class TextractWrapper: """Encapsulates Textract functions.""" def __init__(self, textract_client, s3_resource, sqs_resource): """ :param textract_client: A Boto3 Textract client. :param s3_resource: A Boto3 Amazon S3 resource. :param sqs_resource: A Boto3 Amazon SQS resource. """ self.textract_client = textract_client self.s3_resource = s3_resource self.sqs_resource = sqs_resource def start_detection_job( self, bucket_name, document_file_name, sns_topic_arn, sns_role_arn): """ Starts an asynchronous job to detect text elements in an image stored in an Amazon S3 bucket. Textract publishes a notification to the specified Amazon SNS topic when the job completes. The image must be in PNG, JPG, or PDF format. :param bucket_name: The name of the Amazon S3 bucket that contains the image. :param document_file_name: The name of the document image stored in Amazon S3. :param sns_topic_arn: The Amazon Resource Name (ARN) of an Amazon SNS topic where the job completion notification is published. :param sns_role_arn: The ARN of an AWS Identity and Access Management (IAM) role that can be assumed by Textract and grants permission to publish to the Amazon SNS topic. :return: The ID of the job. """ try: response = self.textract_client.start_document_text_detection( DocumentLocation={ 'S3Object': {'Bucket': bucket_name, 'Name': document_file_name}}, NotificationChannel={ 'SNSTopicArn': sns_topic_arn, 'RoleArn': sns_role_arn}) job_id = response['JobId'] logger.info( "Started text detection job %s on %s.", job_id, document_file_name) except ClientError: logger.exception("Couldn't detect text in %s.", document_file_name) raise else: return job_id
  • Encuentre instrucciones y más código en GitHub.

  • Para obtener más información sobre la API, consulteStartDocumentTextDetectionenAWSReferencia de API de SDK for Python (Boto3).

Para obtener una lista completa deAWSGuías para desarrolladores de SDK y ejemplos de código, consulteUso de Amazon Textract con unAWSSDK. En este tema también se incluye información sobre cómo empezar y detalles sobre versiones anteriores del SDK.