기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
Amazon S3 데이터 소스 생성
다음 예제에서는 Amazon S3 데이터 소스 생성을 보여줍니다. 이 예제에서는 인덱스와 인덱스에서 데이터를 읽을 권한이 있는 IAM 역할을 이미 생성했다고 가정합니다. IAM 역할에 대한 자세한 내용은 IAM 액세스 역할을 참조하세요. 인덱스 생성에 대한 자세한 내용은 인덱스 생성을 참조하세요.
            - CLI
 - 
                    
aws kendra create-data-source \
 --index-id index ID \
 --name example-data-source \
 --type S3 \
 --configuration '{"S3Configuration":{"BucketName":"bucket name"}}' 
 --role-arn 'arn:aws:iam::account id:role:/role name
                 
            - Python
 - 
                    
다음 Python 코드 조각은 Amazon S3 데이터 소스를 생성합니다. 전체 예제는 시작하기(AWS SDK for Python (Boto3)) 섹션을 참조하세요.
                    print("Create an Amazon S3 data source.")
    
    # Provide a name for the data source
    name = "getting-started-data-source"
    # Provide an optional description for the data source
    description = "Getting started data source."
    # Provide the IAM role ARN required for data sources
    role_arn = "arn:aws:iam::${accountID}:role/${roleName}"
    # Provide the data soource connection information
    s3_bucket_name = "S3-bucket-name"
    type = "S3"
    # Configure the data source
    configuration = {"S3DataSourceConfiguration":
        {
            "BucketName": s3_bucket_name
        }
    }
    data_source_response = kendra.create_data_source(
        Configuration = configuration,
        Name = name,
        Description = description,
        RoleArn = role_arn,
        Type = type,
        IndexId = index_id
    )
                 
        
데이터 소스를 생성하는 데 시간이 조금 걸릴 수 있습니다. DescribeDataSource API를 사용하여 진행 상황을 모니터링할 수 있습니다. 데이터 소스 상태가 ACTIVE가 되면 데이터 소스를 사용할 준비가 된 것입니다.
다음 예제는 데이터 소스의 상태를 가져오는 방법을 보여줍니다.
            - CLI
 - 
                    
aws kendra describe-data-source \
 --index-id index ID \
 --id data source ID
                 
            - Python
 - 
                    
다음 Python 코드 스니펫은 S3 데이터 소스에 대한 정보를 가져옵니다. 전체 예제는 시작하기(AWS SDK for Python (Boto3)) 섹션을 참조하세요.
                    print("Wait for Amazon Kendra to create the data source.")
    while True:
        data_source_description = kendra.describe_data_source(
            Id = "data-source-id",
            IndexId = "index-id"
        )
        status = data_source_description["Status"]
        print(" Creating data source. Status: "+status)
        time.sleep(60)
        if status != "CREATING":
            break
                 
        
이 데이터 소스에는 일정이 없으므로 자동으로 실행되지 않습니다. 데이터 소스를 인덱싱하려면 StartDataSourceSyncJob을 호출하여 인덱스를 데이터 소스와 동기화합니다.
다음 예는 데이터 소스 동기화를 보여줍니다.
            - CLI
 - 
                    
aws kendra start-data-source-sync-job \
 --index-id index ID \
 --id data source ID
                 
            - Python
 - 
                    
다음 Python 코드 스니펫은 Amazon S3
데이터 소스를 동기화합니다. 전체 예제는 시작하기(AWS SDK for Python (Boto3)) 섹션을 참조하세요.
                    print("Synchronize the data source.")
    sync_response = kendra.start_data_source_sync_job(
        Id = "data-source-id",
        IndexId = "index-id"
    )