Creación de un origen de datos de Amazon S3 - Amazon Kendra

Creación de un origen de datos de Amazon S3

Los siguientes ejemplos muestran la creación de un origen de datos de Amazon S3. En los ejemplos se supone que ya ha creado un índice y un rol de IAM con permiso para leer los datos del índice. Para obtener más información sobre el rol de IAM, consulte Roles de acceso de IAM. Para obtener más información acerca de cómo crear un índice, consulte Creación de un índice.

CLI
aws kendra create-data-source \ --index-id index ID \ --name example-data-source \ --type S3 \ --configuration '{"S3Configuration":{"BucketName":"bucket name"}}' --role-arn 'arn:aws:iam::account id:role:/role name
Python

El siguiente fragmento de código Python crea un origen de datos de Amazon S3. Para ver el ejemplo completo, consulte Introducción a (AWS SDK para Python (Boto3)).

print("Create an Amazon S3 data source.") # Provide a name for the data source name = "getting-started-data-source" # Provide an optional description for the data source description = "Getting started data source." # Provide the IAM role ARN required for data sources role_arn = "arn:aws:iam::${accountID}:role/${roleName}" # Provide the data soource connection information s3_bucket_name = "S3-bucket-name" type = "S3" # Configure the data source configuration = {"S3DataSourceConfiguration": { "BucketName": s3_bucket_name } } data_source_response = kendra.create_data_source( Configuration = configuration, Name = name, Description = description, RoleArn = role_arn, Type = type, IndexId = index_id )

La creación del origen de datos puede tardar algún tiempo. Puede monitorizar el progreso con la API DescribeDataSource. Cuando el estado del origen de datos es ACTIVE, está listo para usarse.

Los siguientes ejemplos muestran cómo obtener el estado de un origen de datos.

CLI
aws kendra describe-data-source \ --index-id index ID \ --id data source ID
Python

El siguiente fragmento de código Python obtiene información sobre un origen de datos de S3. Para ver el ejemplo completo, consulte Introducción a (AWS SDK para Python (Boto3)).

print("Wait for Amazon Kendra to create the data source.") while True: data_source_description = kendra.describe_data_source( Id = "data-source-id", IndexId = "index-id" ) status = data_source_description["Status"] print(" Creating data source. Status: "+status) time.sleep(60) if status != "CREATING": break

Este origen de datos no tiene una programación, por lo que no se ejecuta automáticamente. Para indexar el origen de datos, llame a StartDataSourceSyncJob para sincronizar el índice con el origen de datos.

Los siguientes ejemplos muestran la sincronización de un origen de datos.

CLI
aws kendra start-data-source-sync-job \ --index-id index ID \ --id data source ID
Python

El siguiente fragmento de código Python sincroniza un origen de datos de Amazon S3. Para ver el ejemplo completo, consulte Introducción a (AWS SDK para Python (Boto3)).

print("Synchronize the data source.") sync_response = kendra.start_data_source_sync_job( Id = "data-source-id", IndexId = "index-id" )