Démarrez la détection de texte asynchrone à l'aide d'Amazon Textract et d'unAWSKIT DE DÉVELOPPEMENT LOGICIEL - Amazon Textract

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Démarrez la détection de texte asynchrone à l'aide d'Amazon Textract et d'unAWSKIT DE DÉVELOPPEMENT LOGICIEL

L'exemple de code suivant montre comment démarrer la détection de texte asynchrone dans un document à l'aide d'Amazon Textract.

Python
SDK pour Python (Boto3)

Démarre une tâche asynchrone pour détecter du texte dans un document.

class TextractWrapper: """Encapsulates Textract functions.""" def __init__(self, textract_client, s3_resource, sqs_resource): """ :param textract_client: A Boto3 Textract client. :param s3_resource: A Boto3 Amazon S3 resource. :param sqs_resource: A Boto3 Amazon SQS resource. """ self.textract_client = textract_client self.s3_resource = s3_resource self.sqs_resource = sqs_resource def start_detection_job( self, bucket_name, document_file_name, sns_topic_arn, sns_role_arn): """ Starts an asynchronous job to detect text elements in an image stored in an Amazon S3 bucket. Textract publishes a notification to the specified Amazon SNS topic when the job completes. The image must be in PNG, JPG, or PDF format. :param bucket_name: The name of the Amazon S3 bucket that contains the image. :param document_file_name: The name of the document image stored in Amazon S3. :param sns_topic_arn: The Amazon Resource Name (ARN) of an Amazon SNS topic where the job completion notification is published. :param sns_role_arn: The ARN of an AWS Identity and Access Management (IAM) role that can be assumed by Textract and grants permission to publish to the Amazon SNS topic. :return: The ID of the job. """ try: response = self.textract_client.start_document_text_detection( DocumentLocation={ 'S3Object': {'Bucket': bucket_name, 'Name': document_file_name}}, NotificationChannel={ 'SNSTopicArn': sns_topic_arn, 'RoleArn': sns_role_arn}) job_id = response['JobId'] logger.info( "Started text detection job %s on %s.", job_id, document_file_name) except ClientError: logger.exception("Couldn't detect text in %s.", document_file_name) raise else: return job_id
  • Trouvez des instructions et plus de code sur GitHub.

  • Pour plus d'informations sur l'API, consultezStartDocumentTextDetectiondansAWSRéférence d'API SDK for Python (Boto3).

Pour obtenir la liste complète desAWSGuides de développement SDK et exemples de code, voirUtilisation d'Amazon Textract avec unAWSKIT DE DÉVELOPPEMENT LOGICIEL. Cette rubrique inclut également des informations sur le démarrage et des détails sur les versions précédentes du SDK.