Uso de Amazon VPC con un origen de datos de Amazon S3 - Amazon Kendra

Uso de Amazon VPC con un origen de datos de Amazon S3

En este tema se proporciona un ejemplo paso a paso que muestra cómo conectarse a un bucket de Amazon S3 mediante un conector de Amazon S3 a través de Amazon VPC. En el ejemplo se supone que parte de un bucket de S3 existente. Le recomendamos que cargue solo algunos documentos en su bucket de S3 para probar el ejemplo.

Puede conectar Amazon Kendra a su bucket de Amazon S3 a través de Amazon VPC. Para ello, debe especificar la subred de Amazon VPC y los grupos de seguridad de Amazon VPC al crear el conector del origen de datos de Amazon S3.

importante

Para que un conector de Amazon Kendra de Amazon S3 pueda acceder a su bucket de Amazon S3, asegúrese de haber asignado un punto de conexión de Amazon S3 a su nube privada virtual (VPC).

Para que Amazon Kendra sincronice los documentos de su bucket de Amazon S3 a través de Amazon VPC, debe completar los siguientes pasos:

Paso 1: configurar una Amazon VPC

Cree una red de VPC que incluya una subred privada con un punto de conexión de puerta de enlace de Amazon S3 y un grupo de seguridad para que Amazon Kendra los utilice más adelante.

Cómo configurar una VPC con una subred privada, un punto de conexión de S3 y un grupo de seguridad
  1. Inicie sesión en la Consola de administración de AWS y abra la consola de Amazon VPC en https://console.aws.amazon.com/vpc/.

  2. Cree una VPC con una subred privada y un punto de conexión de S3 para que Amazon Kendra los utilice:

    En el panel de navegación, elija Sus VPC y, a continuación, elija Crear VPC.

    1. En Recursos para crear, elija VPC y más.

    2. En Etiqueta de nombre, habilite Generación automática y, a continuación, introduzca kendra-s3-example.

    3. En Bloque de CIDR IPv4/IPv6, deje los valores predeterminados.

    4. Para Número de zonas de disponibilidad (AZ), elija el número 1.

    5. Seleccione Personalizar las AZ y, a continuación, seleccione una zona de disponibilidad de la lista Primera zona de disponibilidad.

      Amazon Kendra solo admite un conjunto específico de zonas de disponibilidad.

    6. Para Número de subredes públicas, elija el número 0.

    7. Para Número de subredes privadas, elija el número 1.

    8. Para NAT gateways (puertas de enlace NAT), elija None (Ninguna).

    9. Para los puntos de conexión de VPC, elija Puerta de enlace de Amazon S3.

    10. Deje el resto de los ajustes con sus valores predeterminados.

    11. Seleccione Create VPC (Crear VPC).

      Espere a que finalice el flujo de trabajo de Crear VPC. A continuación, elija Ver VPC para comprobar la VPC que acaba de crear.

    Ahora ha creado una red de VPC con una subred privada que no tiene acceso a la internet pública.

  3. Copie el ID de punto de conexión de VPC de su punto de conexión de Amazon S:

    1. En el panel de navegación, elija Puntos de conexión.

    2. En la lista Puntos de conexión, busque el punto de conexión de Amazon S3 kendra-s3-example-vpce-s3 que acaba de crear junto con su VPC.

    3. Anote el ID del punto de conexión de VPC.

    Ya ha creado un punto de conexión de puerta de enlace de Amazon S3 para acceder a su bucket de Amazon S3 a través de una subred.

  4. Cree un grupo de seguridad para que Amazon Kendra lo utilice:

    1. En el panel de navegación, elija Grupos de seguridad y, a continuación, elija Crear un grupo de seguridad.

    2. En Nombre del grupo de seguridad, introduzca s3-data-source-security-group.

    3. Elija su VPC en la lista de Amazon VPC.

    4. Deje las reglas de entrada y las reglas de salida como predeterminadas.

    5. Elija Creación de grupo de seguridad.

    Ya ha creado un grupo de seguridad de VPC.

Debe asignar la subred y el grupo de seguridad que ha creado para su conector de origen de datos de Amazon S3 Amazon Kendra durante el proceso de configuración del conector.

(Opcional) Paso 2: configurar la política de buckets de Amazon S3

En este paso opcional, aprenda a configurar una política de bucket de Amazon S3 para que solo se pueda acceder a su bucket de Amazon S3 desde la VPC que asigne a Amazon Kendra.

Amazon Kendra utiliza roles de IAM para acceder a su bucket de Amazon S3 y no requiere que configure una política de bucket de Amazon S3. Sin embargo, puede resultarle útil crear una política de buckets si quiere configurar un conector de Amazon S3 mediante un bucket de Amazon S3 que tenga políticas existentes que restrinjan el acceso a él desde la internet pública.

Para configurar su política de buckets de Amazon S3
  1. Abra la consola de Amazon S3 en https://console.aws.amazon.com/s3/.

  2. En el panel de navegación, elija Buckets.

  3. Elija el nombre del bucket de Amazon S3 que desea sincronizar con Amazon Kendra.

  4. Seleccione la pestaña Permisos, desplácese hacia abajo hasta Política de buckets y, a continuación, haga clic en Editar.

  5. Agregue o modifique su política de buckets para permitir el acceso solo desde el punto de conexión de VPC que creó.

    A continuación se muestra un ejemplo de política de bucket. Sustituya bucket-name y vpce-id por el nombre de su bucket de Amazon S3 y el ID del punto de conexión de Amazon S3 que indicó anteriormente.

  6. Seleccione Guardar cambios.

Ahora solo se puede acceder a su bucket de S3 desde la VPC específica que creó.

Paso 3: crear un conector de origen de datos de Amazon S3 de prueba

Para probar la configuración de Amazon VPC, cree un conector de Amazon S3. A continuación, configúrelo con la VPC que creó siguiendo los pasos descritos en Amazon S3.

Para los valores de configuración de Amazon VPC, elija los valores que creó en este ejemplo:

  • Amazon VPC(VPC)kendra-s3-example-vpc

  • Subredeskendra-s3-example-subnet-private1-[availability zone]

  • Grupos de seguridads3-data-source-security-group

Espere a que termine de crearse el conector. Una vez creado el conector de Amazon S3, seleccione Sincronizar ahora para iniciar una sincronización.

La sincronización puede tardar entre varios minutos y varias horas, según el número de documentos que haya en el bucket de Amazon S3. Para probar el ejemplo, le recomendamos que cargue solo algunos documentos en su bucket de S3. Si la configuración es correcta, en algún momento debería aparecer el Estado de sincronización como Completado.

Si encuentra algún error, consulte Troubleshooting Amazon VPC connection.