

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

# Creación de un conector de origen de datos


Puede crear un conector de fuente de datos para conectarse Amazon Kendra a sus documentos e indexarlos. Amazon Kendra puede conectarse a Microsoft SharePoint, Google Drive y muchos otros proveedores. Al crear un conector de fuente de datos, proporciona Amazon Kendra la información de configuración necesaria para conectarse al repositorio de fuentes. A diferencia de añadir documentos directamente a un índice, puede escanear periódicamente el origen de datos para actualizar el índice.

Por ejemplo, supongamos que tiene un repositorio de documentos fiscales almacenado en un Amazon S3 depósito. Ocasionalmente, los documentos existentes se modifican y se añaden nuevos documentos al repositorio. Si agrega el repositorio Amazon Kendra como fuente de datos, puede mantener el índice actualizado configurando sincronizaciones periódicas entre la fuente de datos y el índice.

Puede optar por actualizar un índice manualmente mediante la consola o la [StartDataSourceSyncJob](https://docs.aws.amazon.com/kendra/latest/APIReference/API_StartDataSourceSyncJob.html)API. De lo contrario, puede configurar una programación para actualizar un índice y sincronizarlo con su origen de datos.

Un índice puede tener más de un origen de datos. Cada origen de datos puede tener su propia programación de actualizaciones. Por ejemplo, puede actualizar el índice de sus documentos de trabajo a diario, o incluso cada hora, y actualizar los documentos archivados manualmente cada vez que cambie el archivo.

Si desea modificar los metadatos o atributos del documento y el contenido durante el proceso de ingesta de documentos, consulte [Custom Document Enrichment de Amazon Kendra](https://docs.aws.amazon.com/kendra/latest/dg/custom-document-enrichment.html).

**nota**  
Cada ID de documento debe ser único por índice. No puede crear una fuente de datos para indexar sus documentos con sus características únicas IDs y, a continuación, utilizar la `BatchPutDocument` API para indexar los mismos documentos o viceversa. No se puede crear un origen de datos para indexar los documentos con sus ID exclusivos y, a continuación, utilizar la API `BatchPutDocument` para indexar los mismos documentos o viceversa. El uso de un conector de fuente de Amazon Kendra datos `BatchPutDocument` y `BatchDeleteDocument` APIs en combinación con él para el mismo conjunto de documentos podría provocar incoherencias con los datos. En su lugar, recomendamos utilizar el [Amazon Kendra conector de origen de datos personalizado](https://docs.aws.amazon.com/kendra/latest/dg/data-source-custom.html).

**nota**  
Los archivos añadidos al índice deben estar en un flujo de bytes codificado en UTF-8. [Para obtener más información sobre los documentos incluidos Amazon Kendra, consulte Documentos.](https://docs.aws.amazon.com/kendra/latest/dg/hiw-documents.html)

## Establecimiento de un programa de actualizaciones


Configure el origen de datos para que se actualice periódicamente con la consola o mediante el parámetro `Schedule` al crear o actualizar un origen de datos. El contenido del parámetro es una cadena que contiene una cadena de programación en formato `cron` o una cadena vacía para indicar que el índice se actualiza a petición. Para conocer el formato de una expresión cron, consulte [Programar expresiones para reglas](https://docs.aws.amazon.com/AmazonCloudWatch/latest/events/ScheduledEvents.html) en la *Guía del Amazon CloudWatch Events usuario*. Amazon Kendra solo admite expresiones cron. No admite expresiones de frecuencia.

## Configuración del idioma


Puede indexar todos los documentos en un origen de datos en un idioma compatible. Al llamar [CreateDataSource](https://docs.aws.amazon.com/kendra/latest/APIReference/API_CreateDataSource.html), debe especificar el código de idioma de todos los documentos en la fuente de datos. Si un documento no contiene un código de idioma especificado en un campo de metadatos, el documento se indexa utilizando el código de idioma especificado para todos los documentos en el nivel de origen de datos. Si no especifica un idioma, Amazon Kendra indexa los documentos de un origen de datos en inglés de forma predeterminada. Para obtener más información acerca de los idiomas admitidos, incluidos sus códigos, consulte [Adición de documentos en idiomas distintos del inglés](https://docs.aws.amazon.com/kendra/latest/dg/in-adding-languages.html).

Todos los documentos de un origen de datos en un idioma compatible se indexan mediante la consola. Vaya a **Orígenes de datos** y edite su origen de datos o a **Agregar origen de datos** si va a agregar un nuevo origen de datos. En la página **Especificar detalles del origen de datos**, seleccione un idioma en el menú desplegable **Idioma**. Seleccione **Actualizar** o continúe introduciendo la información de configuración para conectarse a su origen de datos.

# Conectores de origen de datos


En esta sección se muestra cómo conectarse Amazon Kendra a bases de datos y repositorios de fuentes de datos compatibles utilizando Amazon Kendra el Consola de administración de AWS y el Amazon Kendra APIs.

**Topics**
+ [

# Esquemas de plantillas de origen de datos
](ds-schemas.md)
+ [

# Adobe Experience Manager
](data-source-aem.md)
+ [

# Alfresco
](data-source-alfresco.md)
+ [

# Aurora(MySQL)
](data-source-aurora-mysql.md)
+ [

# Aurora(PostgreSQL)
](data-source-aurora-postgresql.md)
+ [

# Amazon FSx(Windows)
](data-source-fsx.md)
+ [

# Amazon FSx(NetApp DISPONIBLE)
](data-source-fsx-ontap.md)
+ [

# Amazon RDS/Aurora
](data-source-database.md)
+ [

# Amazon RDS(Microsoft SQL Server)
](data-source-rds-ms-sql-server.md)
+ [

# Amazon RDS(MySQL)
](data-source-rds-mysql.md)
+ [

# Amazon RDS(Oracle)
](data-source-rds-oracle.md)
+ [

# Amazon RDS(PostgreSQL)
](data-source-rds-postgresql.md)
+ [

# Amazon S3
](data-source-s3.md)
+ [

# Amazon Kendra Rastreador web
](data-source-web-crawler.md)
+ [

# Box
](data-source-box.md)
+ [

# Confluence
](data-source-confluence.md)
+ [

# Conector de orígenes de datos personalizados
](data-source-custom.md)
+ [

# Dropbox
](data-source-dropbox.md)
+ [

# Drupal
](data-source-drupal.md)
+ [

# GitHub
](data-source-github.md)
+ [

# Gmail
](data-source-gmail.md)
+ [

# Google Drive
](data-source-google-drive.md)
+ [

# IBM DB2
](data-source-ibm-db2.md)
+ [

# Jira
](data-source-jira.md)
+ [

# Microsoft Exchange
](data-source-exchange.md)
+ [

# Microsoft OneDrive
](data-source-onedrive.md)
+ [

# Microsoft SharePoint
](data-source-sharepoint.md)
+ [

# Microsoft SQL Server
](data-source-ms-sql-server.md)
+ [

# Microsoft Teams
](data-source-teams.md)
+ [

# Microsoft Yammer
](data-source-yammer.md)
+ [

# MySQL
](data-source-mysql.md)
+ [

# Oracle Database
](data-source-oracle-database.md)
+ [

# PostgreSQL
](data-source-postgresql.md)
+ [

# Quip
](data-source-quip.md)
+ [

# Salesforce
](data-source-salesforce.md)
+ [

# ServiceNow
](data-source-servicenow.md)
+ [

# Slack
](data-source-slack.md)
+ [

# Zendesk
](data-source-zendesk.md)

# Esquemas de plantillas de origen de datos


Los siguientes son esquemas de plantillas para orígenes de datos en los que se admiten plantillas.

**Topics**
+ [

## Esquema de plantilla de Adobe Experience Manager
](#ds-aem-schema)
+ [

## Amazon FSx Esquema de plantillas (Windows)
](#ds-fsx-windows-schema)
+ [

## Amazon FSx Esquema de plantillas (NetApp ONTAP)
](#ds-fsx-ontap-schema)
+ [

## Esquema de plantilla de Alfresco
](#ds-alfresco-schema)
+ [

## Aurora Esquema de plantillas (MySQL)
](#ds-aurora-mysql-schema)
+ [

## Aurora Esquema de plantillas (PostgreSQL)
](#ds-aurora-postgresql-schema)
+ [

## Amazon RDS Esquema de plantillas (Microsoft SQL Server)
](#ds-rds-ms-sql-server-schema)
+ [

## Amazon RDS Esquema de plantillas (MySQL)
](#ds-rds-mysql-schema)
+ [

## Amazon RDS Esquema de plantillas (Oracle)
](#ds-rds-oracle-schema)
+ [

## Amazon RDS Esquema de plantillas (PostgreSQL)
](#ds-rds-postgresql-schema)
+ [

## Amazon S3 esquema de plantilla
](#ds-s3-schema)
+ [

## Amazon Kendra Esquema de plantillas de Web Crawler
](#ds-schema-web-crawler)
+ [

## Esquema de plantilla de Confluence
](#ds-confluence-schema)
+ [

## Esquema de plantilla de Dropbox
](#ds-dropbox-schema)
+ [

## Esquema de plantilla de Drupal
](#ds-drupal-schema)
+ [

## GitHub esquema de plantilla
](#ds-github-schema)
+ [

## Esquema de plantilla de Gmail
](#ds-gmail-schema)
+ [

## Esquema de plantilla de Google Drive
](#ds-googledrive-schema)
+ [

## Esquema DB2 de plantillas de IBM
](#ds-ibm-db2-schema)
+ [

## Esquema de plantilla de Microsoft Exchange
](#ds-msexchange-schema)
+ [

## Esquema OneDrive de plantillas de Microsoft
](#ds-onedrive-schema)
+ [

## Esquema SharePoint de plantillas de Microsoft
](#ds-schema-sharepoint)
+ [

## Esquema de plantilla de Microsoft SQL Server
](#ds-ms-sql-server-schema)
+ [

## Esquema de plantilla de Microsoft Teams
](#ds-msteams-schema)
+ [

## Esquema de plantilla de Microsoft Yammer
](#ds-schema-yammer)
+ [

## Esquema de plantilla de MySQL
](#ds-mysql-schema)
+ [

## Esquema de plantilla de Oracle Database
](#ds-oracle-database-schema)
+ [

## Esquema de plantilla de PostgreSQL
](#ds-postgresql-schema)
+ [

## Esquema de plantilla de Salesforce
](#ds-salesforce-schema)
+ [

## ServiceNow esquema de plantilla
](#ds-servicenow-schema)
+ [

## Esquema de plantilla de Slack
](#ds-schema-slack)
+ [

## Esquema de plantilla de Zendesk
](#ds-schema-zendesk)

## Esquema de plantilla de Adobe Experience Manager


Incluye un JSON que contiene el esquema del origen de datos como parte del objeto [https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html](https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html). Debe proporcionar la URL del host de Adobe Experience Manager, el tipo de autenticación y si utiliza Adobe Experience Manager (AEM) as a Cloud Service o AEM On-Premise como parte de la configuración de la conexión o de los detalles del punto de conexión del repositorio. Además, especifique el tipo de origen de datos como `AEM`, un secreto para sus credenciales de autenticación y otras configuraciones necesarias. A continuación, especifique `TEMPLATE` como el `Type` cuando llame a [https://docs.aws.amazon.com/kendra/latest/dg/API_CreateDataSource.html](https://docs.aws.amazon.com/kendra/latest/dg/API_CreateDataSource.html).

Puede usar la plantilla que se proporciona en esta guía para desarrolladores. Para obtener más información, consulte [Esquema JSON de Adobe Experience Manager](#aem-json).

En la tabla siguiente se describen los parámetros de un esquema JSON de AEM.


| Configuración | Description (Descripción) | 
| --- | --- | 
| connectionConfiguration | Información de configuración para el punto de conexión para el origen de datos. | 
| repositoryEndpointMetadata | La información del punto de conexión para el origen de datos. | 
| aemUrl | La URL del host de Adobe Experience Manager. Por ejemplo, si utiliza AEM On-Premise, debe incluir el nombre de host y el puerto: https://hostname:port. O bien, si usa AEM as a Cloud Service, puede usar la URL del autor: https://author-xxxxxx-xxxxxxx.adobeaemcloud.com. | 
| authType | El tipo de autenticación que utiliza, ya sea Basic o OAuth2. | 
| deploymentType | El tipo de Adobe Experience Manager que utiliza, ya sea CLOUD o ON\$1PREMISE. | 
| repositoryConfigurations | Información de configuración del contenido del origen de datos. Por ejemplo, configurar tipos específicos de contenido y asignaciones de campos. | 
|  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | Una lista de objetos que asignan los atributos o los nombres de campo de Adobe Experience Manager las páginas y los activos para Amazon Kendra indexar los nombres de los campos. Para obtener más información, consulte [Asignación de campos de origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/field-mapping.html). | 
| additionalProperties | Opciones de configuración adicionales para el contenido del origen de datos. | 
| timeZoneId |  Si utiliza AEM On-Premise y la zona horaria del servidor es diferente a la zona horaria del conector o índice de Amazon Kendra AEM, puede especificar la zona horaria del servidor para alinearla con el conector o índice de AEM. La zona horaria predeterminada de AEM On-Premise es la zona horaria del conector o índice de AEM. Amazon Kendra La zona horaria predeterminada de AEM as a Cloud Service es la hora media de Greenwich.  | 
|  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | Una lista de rutas raíz para páginas y recursos. Por ejemplo, la ruta raíz de una página podría ser /content/sub y la ruta raíz de un activo podría ser/1. content/sub/asset | 
| crawlAssets | true para rastrear recursos. | 
| crawlPages | true para rastrear páginas. | 
|  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | Una lista de patrones de expresión regular para incluir determinadas páginas y recursos en su origen de datos de Adobe Experience Manager. Las páginas y recursos que coinciden con los patrones se incluyen en el índice. Las páginas y recursos que no coinciden con los patrones se excluyen del índice. Si una página o recurso coinciden con un patrón de inclusión y de exclusión, el patrón de exclusión tiene prioridad y el contenido no se incluye en el índice. | 
|  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | Una lista de patrones de expresión regular para excluir determinadas páginas y recursos de su origen de datos de Adobe Experience Manager. Las páginas y recursos que coinciden con los patrones se excluyen del índice. Las páginas y recursos que no coinciden con los patrones se incluyen en el índice. Si una página o recurso coinciden con un patrón de inclusión y de exclusión, el patrón de exclusión tiene prioridad y el contenido no se incluye en el índice. | 
| pageComponents | Una lista de nombres de componentes de página específicos que desea indexar. | 
| contentFragmentVariations | Una lista de nombres para las variantes guardadas específicas de los fragmentos de contenido de Adobe Experience Manager que desea indexar. | 
| type | El tipo del origen de datos. Especifica AEM como el tipo de origen de datos. | 
| syncMode |  Especifique cómo Amazon Kendra debe actualizarse el índice cuando cambie el contenido de la fuente de datos. Puede elegir entre las siguientes opciones: [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | 
| secretArn | El nombre de recurso de Amazon (ARN) de un AWS Secrets Manager secreto que contiene los pares clave-valor necesarios para conectarse a Adobe Experience Manager. Para obtener información sobre estos pares clave-valor, consulte [Instrucciones de conexión de Adobe Experience Manager](https://docs.aws.amazon.com/kendra/latest/dg/data-source-aem.html#data-source-procedure-aem). | 
| versión | La versión de esta plantilla que se admite actualmente. | 

### Esquema JSON de Adobe Experience Manager


```
{
  "$schema": "http://json-schema.org/draft-04/schema#",
  "type": "object",
  "properties":
  {
    "connectionConfiguration": {
      "type": "object",
      "properties":
      {
        "repositoryEndpointMetadata":
        {
          "type": "object",
          "properties":
          {
            "aemUrl":
            {
              "type": "string",
              "pattern": "https:.*"
            },
            "authType": {
              "type": "string",
              "enum": ["Basic", "OAuth2"]
            },
            "deploymentType": {
              "type": "string",
              "enum": ["CLOUD","ON_PREMISE"]
            }
          },
          "required":
          [
            "aemUrl",
            "authType",
            "deploymentType"
          ]
        }
      },
      "required":
      [
        "repositoryEndpointMetadata"
      ]
    },
    "repositoryConfigurations": {
      "type": "object",
      "properties":
      {
        "page":
        {
          "type": "object",
          "properties":
          {
            "fieldMappings":
            {
              "type": "array",
              "items":
              [
                {
                  "type": "object",
                  "properties":
                  {
                    "indexFieldName":
                    {
                      "type": "string"
                    },
                    "indexFieldType":
                    {
                      "type": "string",
                      "enum":
                      [
                        "STRING",
                        "STRING_LIST",
                        "DATE",
                        "LONG"
                      ]
                    },
                    "dataSourceFieldName":
                    {
                      "type": "string"
                    },
                    "dateFieldFormat":
                    {
                      "type": "string",
                      "pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
                    }
                  },
                  "required":
                  [
                    "indexFieldName",
                    "indexFieldType",
                    "dataSourceFieldName"
                  ]
                }
              ]
            }
          },
          "required":
          [
            "fieldMappings"
          ]
        },
        "asset":
        {
          "type": "object",
          "properties":
          {
            "fieldMappings":
            {
              "type": "array",
              "items":
              [
                {
                  "type": "object",
                  "properties":
                  {
                    "indexFieldName":
                    {
                      "type": "string"
                    },
                    "indexFieldType":
                    {
                      "type": "string",
                      "enum":
                      [
                        "STRING",
                        "STRING_LIST",
                        "DATE",
                        "LONG"
                      ]
                    },
                    "dataSourceFieldName":
                    {
                      "type": "string"
                    },
                    "dateFieldFormat":
                    {
                      "type": "string",
                      "pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
                    }
                  },
                  "required":
                  [
                    "indexFieldName",
                    "indexFieldType",
                    "dataSourceFieldName"
                  ]
                }
              ]
            }
          },
          "required":
          [
            "fieldMappings"
          ]
        }
      }
    },
    "additionalProperties": {
      "type": "object",
      "properties":
      {
        "timeZoneId": {
          "type": "string",
          "enum": [
            "Africa/Abidjan",
            "Africa/Accra",
            "Africa/Addis_Ababa",
            "Africa/Algiers",
            "Africa/Asmara",
            "Africa/Asmera",
            "Africa/Bamako",
            "Africa/Bangui",
            "Africa/Banjul",
            "Africa/Bissau",
            "Africa/Blantyre",
            "Africa/Brazzaville",
            "Africa/Bujumbura",
            "Africa/Cairo",
            "Africa/Casablanca",
            "Africa/Ceuta",
            "Africa/Conakry",
            "Africa/Dakar",
            "Africa/Dar_es_Salaam",
            "Africa/Djibouti",
            "Africa/Douala",
            "Africa/El_Aaiun",
            "Africa/Freetown",
            "Africa/Gaborone",
            "Africa/Harare",
            "Africa/Johannesburg",
            "Africa/Juba",
            "Africa/Kampala",
            "Africa/Khartoum",
            "Africa/Kigali",
            "Africa/Kinshasa",
            "Africa/Lagos",
            "Africa/Libreville",
            "Africa/Lome",
            "Africa/Luanda",
            "Africa/Lubumbashi",
            "Africa/Lusaka",
            "Africa/Malabo",
            "Africa/Maputo",
            "Africa/Maseru",
            "Africa/Mbabane",
            "Africa/Mogadishu",
            "Africa/Monrovia",
            "Africa/Nairobi",
            "Africa/Ndjamena",
            "Africa/Niamey",
            "Africa/Nouakchott",
            "Africa/Ouagadougou",
            "Africa/Porto-Novo",
            "Africa/Sao_Tome",
            "Africa/Timbuktu",
            "Africa/Tripoli",
            "Africa/Tunis",
            "Africa/Windhoek",
            "America/Adak",
            "America/Anchorage",
            "America/Anguilla",
            "America/Antigua",
            "America/Araguaina",
            "America/Argentina/Buenos_Aires",
            "America/Argentina/Catamarca",
            "America/Argentina/ComodRivadavia",
            "America/Argentina/Cordoba",
            "America/Argentina/Jujuy",
            "America/Argentina/La_Rioja",
            "America/Argentina/Mendoza",
            "America/Argentina/Rio_Gallegos",
            "America/Argentina/Salta",
            "America/Argentina/San_Juan",
            "America/Argentina/San_Luis",
            "America/Argentina/Tucuman",
            "America/Argentina/Ushuaia",
            "America/Aruba",
            "America/Asuncion",
            "America/Atikokan",
            "America/Atka",
            "America/Bahia",
            "America/Bahia_Banderas",
            "America/Barbados",
            "America/Belem",
            "America/Belize",
            "America/Blanc-Sablon",
            "America/Boa_Vista",
            "America/Bogota",
            "America/Boise",
            "America/Buenos_Aires",
            "America/Cambridge_Bay",
            "America/Campo_Grande",
            "America/Cancun",
            "America/Caracas",
            "America/Catamarca",
            "America/Cayenne",
            "America/Cayman",
            "America/Chicago",
            "America/Chihuahua",
            "America/Ciudad_Juarez",
            "America/Coral_Harbour",
            "America/Cordoba",
            "America/Costa_Rica",
            "America/Creston",
            "America/Cuiaba",
            "America/Curacao",
            "America/Danmarkshavn",
            "America/Dawson",
            "America/Dawson_Creek",
            "America/Denver",
            "America/Detroit",
            "America/Dominica",
            "America/Edmonton",
            "America/Eirunepe",
            "America/El_Salvador",
            "America/Ensenada",
            "America/Fort_Nelson",
            "America/Fort_Wayne",
            "America/Fortaleza",
            "America/Glace_Bay",
            "America/Godthab",
            "America/Goose_Bay",
            "America/Grand_Turk",
            "America/Grenada",
            "America/Guadeloupe",
            "America/Guatemala",
            "America/Guayaquil",
            "America/Guyana",
            "America/Halifax",
            "America/Havana",
            "America/Hermosillo",
            "America/Indiana/Indianapolis",
            "America/Indiana/Knox",
            "America/Indiana/Marengo",
            "America/Indiana/Petersburg",
            "America/Indiana/Tell_City",
            "America/Indiana/Vevay",
            "America/Indiana/Vincennes",
            "America/Indiana/Winamac",
            "America/Indianapolis",
            "America/Inuvik",
            "America/Iqaluit",
            "America/Jamaica",
            "America/Jujuy",
            "America/Juneau",
            "America/Kentucky/Louisville",
            "America/Kentucky/Monticello",
            "America/Knox_IN",
            "America/Kralendijk",
            "America/La_Paz",
            "America/Lima",
            "America/Los_Angeles",
            "America/Louisville",
            "America/Lower_Princes",
            "America/Maceio",
            "America/Managua",
            "America/Manaus",
            "America/Marigot",
            "America/Martinique",
            "America/Matamoros",
            "America/Mazatlan",
            "America/Mendoza",
            "America/Menominee",
            "America/Merida",
            "America/Metlakatla",
            "America/Mexico_City",
            "America/Miquelon",
            "America/Moncton",
            "America/Monterrey",
            "America/Montevideo",
            "America/Montreal",
            "America/Montserrat",
            "America/Nassau",
            "America/New_York",
            "America/Nipigon",
            "America/Nome",
            "America/Noronha",
            "America/North_Dakota/Beulah",
            "America/North_Dakota/Center",
            "America/North_Dakota/New_Salem",
            "America/Nuuk",
            "America/Ojinaga",
            "America/Panama",
            "America/Pangnirtung",
            "America/Paramaribo",
            "America/Phoenix",
            "America/Port-au-Prince",
            "America/Port_of_Spain",
            "America/Porto_Acre",
            "America/Porto_Velho",
            "America/Puerto_Rico",
            "America/Punta_Arenas",
            "America/Rainy_River",
            "America/Rankin_Inlet",
            "America/Recife",
            "America/Regina",
            "America/Resolute",
            "America/Rio_Branco",
            "America/Rosario",
            "America/Santa_Isabel",
            "America/Santarem",
            "America/Santiago",
            "America/Santo_Domingo",
            "America/Sao_Paulo",
            "America/Scoresbysund",
            "America/Shiprock",
            "America/Sitka",
            "America/St_Barthelemy",
            "America/St_Johns",
            "America/St_Kitts",
            "America/St_Lucia",
            "America/St_Thomas",
            "America/St_Vincent",
            "America/Swift_Current",
            "America/Tegucigalpa",
            "America/Thule",
            "America/Thunder_Bay",
            "America/Tijuana",
            "America/Toronto",
            "America/Tortola",
            "America/Vancouver",
            "America/Virgin",
            "America/Whitehorse",
            "America/Winnipeg",
            "America/Yakutat",
            "America/Yellowknife",
            "Antarctica/Casey",
            "Antarctica/Davis",
            "Antarctica/DumontDUrville",
            "Antarctica/Macquarie",
            "Antarctica/Mawson",
            "Antarctica/McMurdo",
            "Antarctica/Palmer",
            "Antarctica/Rothera",
            "Antarctica/South_Pole",
            "Antarctica/Syowa",
            "Antarctica/Troll",
            "Antarctica/Vostok",
            "Arctic/Longyearbyen",
            "Asia/Aden",
            "Asia/Almaty",
            "Asia/Amman",
            "Asia/Anadyr",
            "Asia/Aqtau",
            "Asia/Aqtobe",
            "Asia/Ashgabat",
            "Asia/Ashkhabad",
            "Asia/Atyrau",
            "Asia/Baghdad",
            "Asia/Bahrain",
            "Asia/Baku",
            "Asia/Bangkok",
            "Asia/Barnaul",
            "Asia/Beirut",
            "Asia/Bishkek",
            "Asia/Brunei",
            "Asia/Calcutta",
            "Asia/Chita",
            "Asia/Choibalsan",
            "Asia/Chongqing",
            "Asia/Chungking",
            "Asia/Colombo",
            "Asia/Dacca",
            "Asia/Damascus",
            "Asia/Dhaka",
            "Asia/Dili",
            "Asia/Dubai",
            "Asia/Dushanbe",
            "Asia/Famagusta",
            "Asia/Gaza",
            "Asia/Harbin",
            "Asia/Hebron",
            "Asia/Ho_Chi_Minh",
            "Asia/Hong_Kong",
            "Asia/Hovd",
            "Asia/Irkutsk",
            "Asia/Istanbul",
            "Asia/Jakarta",
            "Asia/Jayapura",
            "Asia/Jerusalem",
            "Asia/Kabul",
            "Asia/Kamchatka",
            "Asia/Karachi",
            "Asia/Kashgar",
            "Asia/Kathmandu",
            "Asia/Katmandu",
            "Asia/Khandyga",
            "Asia/Kolkata",
            "Asia/Krasnoyarsk",
            "Asia/Kuala_Lumpur",
            "Asia/Kuching",
            "Asia/Kuwait",
            "Asia/Macao",
            "Asia/Macau",
            "Asia/Magadan",
            "Asia/Makassar",
            "Asia/Manila",
            "Asia/Muscat",
            "Asia/Nicosia",
            "Asia/Novokuznetsk",
            "Asia/Novosibirsk",
            "Asia/Omsk",
            "Asia/Oral",
            "Asia/Phnom_Penh",
            "Asia/Pontianak",
            "Asia/Pyongyang",
            "Asia/Qatar",
            "Asia/Qostanay",
            "Asia/Qyzylorda",
            "Asia/Rangoon",
            "Asia/Riyadh",
            "Asia/Saigon",
            "Asia/Sakhalin",
            "Asia/Samarkand",
            "Asia/Seoul",
            "Asia/Shanghai",
            "Asia/Singapore",
            "Asia/Srednekolymsk",
            "Asia/Taipei",
            "Asia/Tashkent",
            "Asia/Tbilisi",
            "Asia/Tehran",
            "Asia/Tel_Aviv",
            "Asia/Thimbu",
            "Asia/Thimphu",
            "Asia/Tokyo",
            "Asia/Tomsk",
            "Asia/Ujung_Pandang",
            "Asia/Ulaanbaatar",
            "Asia/Ulan_Bator",
            "Asia/Urumqi",
            "Asia/Ust-Nera",
            "Asia/Vientiane",
            "Asia/Vladivostok",
            "Asia/Yakutsk",
            "Asia/Yangon",
            "Asia/Yekaterinburg",
            "Asia/Yerevan",
            "Atlantic/Azores",
            "Atlantic/Bermuda",
            "Atlantic/Canary",
            "Atlantic/Cape_Verde",
            "Atlantic/Faeroe",
            "Atlantic/Faroe",
            "Atlantic/Jan_Mayen",
            "Atlantic/Madeira",
            "Atlantic/Reykjavik",
            "Atlantic/South_Georgia",
            "Atlantic/St_Helena",
            "Atlantic/Stanley",
            "Australia/ACT",
            "Australia/Adelaide",
            "Australia/Brisbane",
            "Australia/Broken_Hill",
            "Australia/Canberra",
            "Australia/Currie",
            "Australia/Darwin",
            "Australia/Eucla",
            "Australia/Hobart",
            "Australia/LHI",
            "Australia/Lindeman",
            "Australia/Lord_Howe",
            "Australia/Melbourne",
            "Australia/NSW",
            "Australia/North",
            "Australia/Perth",
            "Australia/Queensland",
            "Australia/South",
            "Australia/Sydney",
            "Australia/Tasmania",
            "Australia/Victoria",
            "Australia/West",
            "Australia/Yancowinna",
            "Brazil/Acre",
            "Brazil/DeNoronha",
            "Brazil/East",
            "Brazil/West",
            "CET",
            "CST6CDT",
            "Canada/Atlantic",
            "Canada/Central",
            "Canada/Eastern",
            "Canada/Mountain",
            "Canada/Newfoundland",
            "Canada/Pacific",
            "Canada/Saskatchewan",
            "Canada/Yukon",
            "Chile/Continental",
            "Chile/EasterIsland",
            "Cuba",
            "EET",
            "EST5EDT",
            "Egypt",
            "Eire",
            "Etc/GMT",
            "Etc/GMT+0",
            "Etc/GMT+1",
            "Etc/GMT+10",
            "Etc/GMT+11",
            "Etc/GMT+12",
            "Etc/GMT+2",
            "Etc/GMT+3",
            "Etc/GMT+4",
            "Etc/GMT+5",
            "Etc/GMT+6",
            "Etc/GMT+7",
            "Etc/GMT+8",
            "Etc/GMT+9",
            "Etc/GMT-0",
            "Etc/GMT-1",
            "Etc/GMT-10",
            "Etc/GMT-11",
            "Etc/GMT-12",
            "Etc/GMT-13",
            "Etc/GMT-14",
            "Etc/GMT-2",
            "Etc/GMT-3",
            "Etc/GMT-4",
            "Etc/GMT-5",
            "Etc/GMT-6",
            "Etc/GMT-7",
            "Etc/GMT-8",
            "Etc/GMT-9",
            "Etc/GMT0",
            "Etc/Greenwich",
            "Etc/UCT",
            "Etc/UTC",
            "Etc/Universal",
            "Etc/Zulu",
            "Europe/Amsterdam",
            "Europe/Andorra",
            "Europe/Astrakhan",
            "Europe/Athens",
            "Europe/Belfast",
            "Europe/Belgrade",
            "Europe/Berlin",
            "Europe/Bratislava",
            "Europe/Brussels",
            "Europe/Bucharest",
            "Europe/Budapest",
            "Europe/Busingen",
            "Europe/Chisinau",
            "Europe/Copenhagen",
            "Europe/Dublin",
            "Europe/Gibraltar",
            "Europe/Guernsey",
            "Europe/Helsinki",
            "Europe/Isle_of_Man",
            "Europe/Istanbul",
            "Europe/Jersey",
            "Europe/Kaliningrad",
            "Europe/Kiev",
            "Europe/Kirov",
            "Europe/Kyiv",
            "Europe/Lisbon",
            "Europe/Ljubljana",
            "Europe/London",
            "Europe/Luxembourg",
            "Europe/Madrid",
            "Europe/Malta",
            "Europe/Mariehamn",
            "Europe/Minsk",
            "Europe/Monaco",
            "Europe/Moscow",
            "Europe/Nicosia",
            "Europe/Oslo",
            "Europe/Paris",
            "Europe/Podgorica",
            "Europe/Prague",
            "Europe/Riga",
            "Europe/Rome",
            "Europe/Samara",
            "Europe/San_Marino",
            "Europe/Sarajevo",
            "Europe/Saratov",
            "Europe/Simferopol",
            "Europe/Skopje",
            "Europe/Sofia",
            "Europe/Stockholm",
            "Europe/Tallinn",
            "Europe/Tirane",
            "Europe/Tiraspol",
            "Europe/Ulyanovsk",
            "Europe/Uzhgorod",
            "Europe/Vaduz",
            "Europe/Vatican",
            "Europe/Vienna",
            "Europe/Vilnius",
            "Europe/Volgograd",
            "Europe/Warsaw",
            "Europe/Zagreb",
            "Europe/Zaporozhye",
            "Europe/Zurich",
            "GB",
            "GB-Eire",
            "GMT",
            "GMT0",
            "Greenwich",
            "Hongkong",
            "Iceland",
            "Indian/Antananarivo",
            "Indian/Chagos",
            "Indian/Christmas",
            "Indian/Cocos",
            "Indian/Comoro",
            "Indian/Kerguelen",
            "Indian/Mahe",
            "Indian/Maldives",
            "Indian/Mauritius",
            "Indian/Mayotte",
            "Indian/Reunion",
            "Iran",
            "Israel",
            "Jamaica",
            "Japan",
            "Kwajalein",
            "Libya",
            "MET",
            "MST7MDT",
            "Mexico/BajaNorte",
            "Mexico/BajaSur",
            "Mexico/General",
            "NZ",
            "NZ-CHAT",
            "Navajo",
            "PRC",
            "PST8PDT",
            "Pacific/Apia",
            "Pacific/Auckland",
            "Pacific/Bougainville",
            "Pacific/Chatham",
            "Pacific/Chuuk",
            "Pacific/Easter",
            "Pacific/Efate",
            "Pacific/Enderbury",
            "Pacific/Fakaofo",
            "Pacific/Fiji",
            "Pacific/Funafuti",
            "Pacific/Galapagos",
            "Pacific/Gambier",
            "Pacific/Guadalcanal",
            "Pacific/Guam",
            "Pacific/Honolulu",
            "Pacific/Johnston",
            "Pacific/Kanton",
            "Pacific/Kiritimati",
            "Pacific/Kosrae",
            "Pacific/Kwajalein",
            "Pacific/Majuro",
            "Pacific/Marquesas",
            "Pacific/Midway",
            "Pacific/Nauru",
            "Pacific/Niue",
            "Pacific/Norfolk",
            "Pacific/Noumea",
            "Pacific/Pago_Pago",
            "Pacific/Palau",
            "Pacific/Pitcairn",
            "Pacific/Pohnpei",
            "Pacific/Ponape",
            "Pacific/Port_Moresby",
            "Pacific/Rarotonga",
            "Pacific/Saipan",
            "Pacific/Samoa",
            "Pacific/Tahiti",
            "Pacific/Tarawa",
            "Pacific/Tongatapu",
            "Pacific/Truk",
            "Pacific/Wake",
            "Pacific/Wallis",
            "Pacific/Yap",
            "Poland",
            "Portugal",
            "ROK",
            "Singapore",
            "SystemV/AST4",
            "SystemV/AST4ADT",
            "SystemV/CST6",
            "SystemV/CST6CDT",
            "SystemV/EST5",
            "SystemV/EST5EDT",
            "SystemV/HST10",
            "SystemV/MST7",
            "SystemV/MST7MDT",
            "SystemV/PST8",
            "SystemV/PST8PDT",
            "SystemV/YST9",
            "SystemV/YST9YDT",
            "Turkey",
            "UCT",
            "US/Alaska",
            "US/Aleutian",
            "US/Arizona",
            "US/Central",
            "US/East-Indiana",
            "US/Eastern",
            "US/Hawaii",
            "US/Indiana-Starke",
            "US/Michigan",
            "US/Mountain",
            "US/Pacific",
            "US/Samoa",
            "UTC",
            "Universal",
            "W-SU",
            "WET",
            "Zulu",
            "EST",
            "HST",
            "MST",
            "ACT",
            "AET",
            "AGT",
            "ART",
            "AST",
            "BET",
            "BST",
            "CAT",
            "CNT",
            "CST",
            "CTT",
            "EAT",
            "ECT",
            "IET",
            "IST",
            "JST",
            "MIT",
            "NET",
            "NST",
            "PLT",
            "PNT",
            "PRT",
            "PST",
            "SST",
            "VST"
          ]
        },
        "pageRootPaths":
        {
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "assetRootPaths":
        {
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "crawlAssets":
        {
          "type": "boolean"
        },
        "crawlPages":
        {
          "type": "boolean"
        },
        "pagePathInclusionPatterns":
        {
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "pagePathExclusionPatterns":
        {
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "pageNameInclusionPatterns":
        {
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "pageNameExclusionPatterns":
        {
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "assetPathInclusionPatterns":
        {
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "assetPathExclusionPatterns":
        {
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "assetTypeInclusionPatterns":
        {
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "assetTypeExclusionPatterns":
        {
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "assetNameInclusionPatterns":
        {
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "assetNameExclusionPatterns":
        {
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "pageComponents": {
          "type": "array",
          "items": {
            "type": "object"
            }
        },
        "contentFragmentVariations": {
          "type": "array",
          "items": {
            "type": "object"
          }
        },
        "cugExemptedPrincipals": {
          "type": "array",
          "items": {
            "type": "string"
          }
        }
      },
      "required":
      []
    },
    "type": {
      "type": "string",
      "pattern": "AEM"
    },
    "enableIdentityCrawler": {
      "type": "boolean"
    },
    "syncMode": {
      "type": "string",
      "enum": [
        "FORCED_FULL_CRAWL",
        "FULL_CRAWL",
        "CHANGE_LOG"
      ]
    },
    "secretArn": {
      "type": "string",
      "minLength": 20,
      "maxLength": 2048
    }
  },
  "version": {
    "type": "string",
    "anyOf": [
      {
        "pattern": "1.0.0"
      }
    ]
  },
  "required": [
    "connectionConfiguration",
    "repositoryConfigurations",
    "syncMode",
    "additionalProperties",
    "secretArn",
    "type"
  ]
}
```

## Amazon FSx Esquema de plantillas (Windows)


Incluye un JSON que contiene el esquema del origen de datos como parte del objeto [https://docs.aws.amazon.com/kendra/latest/APIReference/API_TemplateConfiguration.html](https://docs.aws.amazon.com/kendra/latest/APIReference/API_TemplateConfiguration.html). Debe proporcionar el ID del sistema de archivos como parte de la configuración de la conexión o de los detalles del punto de conexión del repositorio. Además, debe especificar el tipo de origen de datos como `FSX`, un secreto para sus credenciales de autenticación y otras configuraciones necesarias. A continuación, especifique `TEMPLATE` como el `Type` cuando llame a [https://docs.aws.amazon.com/kendra/latest/APIReference/API_CreateDataSource.html](https://docs.aws.amazon.com/kendra/latest/APIReference/API_CreateDataSource.html).

Puede usar la plantilla que se proporciona en esta guía para desarrolladores. Consulte [Amazon FSx Esquema JSON (Windows)](#fsx-windows-json).

En la siguiente tabla se describen los parámetros del esquema JSON Amazon FSx (Windows).


| Configuración | Description (Descripción) | 
| --- | --- | 
| connectionConfiguration | Información de configuración para el punto de conexión para el origen de datos. | 
| repositoryEndpointMetadata | La información del punto de conexión para el origen de datos. | 
| fileSystemId | El identificador del sistema de Amazon FSx archivos. Puede encontrar el ID del sistema de archivos en el panel de sistemas de archivos de la Amazon FSx consola. | 
| fileSystemType | El tipo Amazon FSx de sistema de archivos. Para usar Windows File Server como tipo de sistema de archivos, especifique WINDOWS. | 
| repositoryConfigurations | Información de configuración del contenido del origen de datos. Por ejemplo, configurar tipos específicos de contenido y asignaciones de campos. | 
| Todos | Una lista de objetos que mapean los atributos o los nombres de campo de los archivos de la fuente de Amazon FSx datos para Amazon Kendra indexar los nombres de los campos. Para obtener más información, consulte [Asignación de campos de origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/field-mapping.html). | 
| additionalProperties | Opciones de configuración adicionales para el contenido del origen de datos. | 
| isCrawlAcl | true para rastrear la información de la lista de control de acceso (ACL) para los documentos, si tiene una ACL y desea usarla para el control de acceso. La ACL especifica a qué documentos pueden acceder los usuarios y los grupos. La información de la ACL se utiliza para filtrar los resultados de búsqueda en función del acceso del usuario o su grupo a los documentos. Para obtener más información, consulte [Filtrado de contexto de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#context-filter-user-incl-datasources). | 
| inclusionPatterns | Una lista de patrones de expresiones regulares para incluir determinados archivos en la fuente Amazon FSx de datos. Los archivos que coinciden con los patrones se incluyen en el índice. Los archivos que no coincidan con los patrones se excluyen del índice. Si un archivo coincide con un patrón de inclusión y de exclusión, el patrón de exclusión tiene prioridad y el archivo no se incluye en el índice. | 
| exclusionPatterns | Una lista de patrones de expresiones regulares para excluir determinados archivos de la fuente Amazon FSx de datos. Los archivos que coinciden con los patrones se excluyen del índice. Los archivos que no coincidan con los patrones se incluyen en el índice. Si un archivo coincide con un patrón de exclusión y de inclusión, el patrón de exclusión tiene prioridad y el archivo no se incluye en el índice. | 
| enableIdentityCrawler | trueutilizar el rastreador Amazon Kendra de identidad para sincronizar la identity/principal información sobre los usuarios y grupos con acceso a determinados documentos. Si el rastreador de identidades está desactivado, todos los documentos se pueden buscar públicamente. Si quiere usar el control de acceso para los documentos y el rastreador de identidades está desactivado, también puede usar la API [https://docs.aws.amazon.com/kendra/latest/dg/API_PutPrincipalMapping.html](https://docs.aws.amazon.com/kendra/latest/dg/API_PutPrincipalMapping.html) para cargar la información de acceso del usuario y del grupo. | 
| syncMode |  Especifique cómo Amazon Kendra debe actualizarse el índice cuando cambie el contenido de la fuente de datos. Puede elegir entre las siguientes opciones: [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | 
| type | El tipo del origen de datos. Para los orígenes de datos del sistema de archivos de Windows, especifique FSX. | 

### Amazon FSx Esquema JSON (Windows)


```
{
  "$schema": "http://json-schema.org/draft-04/schema#",
  "type": "object",
  "properties": {
    "connectionConfiguration": {
      "type": "object",
      "properties": {
        "repositoryEndpointMetadata": {
          "type": "object",
          "properties": {
            "fileSystemId": {
              "type": "string",
              "pattern": "fs-.*"
            },
            "fileSystemType": {
              "type": "string",
              "pattern": "WINDOWS"
            }
          },
          "required": ["fileSystemId", "fileSystemType"]
        }
      }
    },
    "repositoryConfigurations": {
      "type": "object",
      "properties": {
        "All": {
          "type": "object",
          "properties": {
            "fieldMappings": {
              "type": "array",
              "items": [
                {
                  "type": "object",
                  "properties": {
                    "indexFieldName": {
                      "type": "string"
                    },
                    "indexFieldType": {
                      "type": "string",
                      "enum": ["STRING", "STRING_LIST", "DATE"]
                    },
                    "dataSourceFieldName": {
                      "type": "string"
                    },
                    "dateFieldFormat": {
                      "type": "string",
                      "pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
                    }
                  },
                  "required": [
                    "indexFieldName",
                    "indexFieldType",
                    "dataSourceFieldName"
                  ]
                }
              ]
            }
          },
          "required": ["fieldMappings"]
        }
      },
      "required": ["All"]
    },
    "additionalProperties": {
      "type": "object",
      "properties": {
        "isCrawlAcl": {
          "type": "boolean"
        },
        "exclusionPatterns": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "inclusionPatterns": {
          "type": "array",
          "items": {
            "type": "string"
          }
        }
      },
      "required": []
    },
    "enableIdentityCrawler": {
      "type": "boolean"
    },
    "syncMode": {
      "type": "string",
      "enum": [
        "FORCED_FULL_CRAWL",
        "FULL_CRAWL"
      ]
    },
    "type" : {
      "type" : "string",
      "pattern": "FSX"
    }
  },
  "version": {
    "type": "string",
    "anyOf": [
      {
        "pattern": "1.0.0"
      }
    ]
  },
  "required": [
    "connectionConfiguration",
    "repositoryConfigurations",
    "syncMode",
    "enableIdentityCrawler",
    "additionalProperties",
    "type"
  ]
}
```

## Amazon FSx Esquema de plantillas (NetApp ONTAP)


Incluye un JSON que contiene el esquema del origen de datos como parte del objeto [https://docs.aws.amazon.com/kendra/latest/APIReference/API_TemplateConfiguration.html](https://docs.aws.amazon.com/kendra/latest/APIReference/API_TemplateConfiguration.html). Debe proporcionar el ID del sistema de archivos y la máquina virtual de almacenamiento (SVM) como parte de la configuración de la conexión o de los detalles del punto de conexión del repositorio. Además, debe especificar el tipo de origen de datos como `FSXONTAP`, un secreto para sus credenciales de autenticación y otras configuraciones necesarias. A continuación, especifique `TEMPLATE` como el `Type` cuando llame a [https://docs.aws.amazon.com/kendra/latest/APIReference/API_CreateDataSource.html](https://docs.aws.amazon.com/kendra/latest/APIReference/API_CreateDataSource.html).

Puede usar la plantilla que se proporciona en esta guía para desarrolladores. Consulte [Amazon FSx (NetApp ONTAP) Esquema JSON](#fsx-ontap-json).

En la siguiente tabla se describen los parámetros del esquema JSON Amazon FSx (NetApp ONTAP).


| Configuración | Description (Descripción) | 
| --- | --- | 
| connectionConfiguration | Información de configuración para el punto de conexión para el origen de datos. | 
| repositoryEndpointMetadata | La información del punto de conexión para el origen de datos. | 
| fileSystemId | El identificador del sistema de Amazon FSx archivos. Puede encontrar el ID del sistema de archivos en el panel de sistemas de archivos de la Amazon FSx consola. Para obtener información sobre cómo crear un sistema de archivos en la Amazon FSx consola de NetApp ONTAP, consulte la [Guía de introducción a NetApp ONTAP](https://docs.aws.amazon.com/fsx/latest/ONTAPGuide/getting-started.html) en la Guía del FSx for ONTAP usuario. | 
| fileSystemType | El tipo de sistema Amazon FSx de archivos. Para usar NetApp ONTAP como tipo de sistema de archivos, especifique ONTAP. | 
| svmId | El identificador de la máquina virtual de almacenamiento (SVM) que se utiliza con el sistema de archivos de Amazon FSx para NetApp ONTAP. Para encontrar su ID de SVM, vaya al panel de sistemas de archivos de la Amazon FSx consola, seleccione su ID de sistema de archivos y, a continuación, seleccione Máquinas virtuales de almacenamiento. Para obtener información sobre cómo crear un sistema de archivos en la Amazon FSx consolaNetApp ONTAP, consulte la Guía de [introducción a NetApp ONTAP en la Guía](https://docs.aws.amazon.com/fsx/latest/ONTAPGuide/getting-started.html) del FSx for ONTAP usuario. | 
| protocolType | Tanto si usa el protocolo Common Internet File System (CIFS) para Windows como el protocolo Network File System (NFS) para Linux. | 
| repositoryConfigurations | Información de configuración del contenido del origen de datos. Por ejemplo, configurar tipos específicos de contenido y asignaciones de campos. | 
| archivo | Una lista de objetos que mapean los atributos o los nombres de campo de los archivos de la fuente de Amazon FSx datos para Amazon Kendra indexar los nombres de los campos. Para obtener más información, consulte [Asignación de campos de origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/field-mapping.html). Los nombres de los campos del origen de datos deben existir en los metadatos personalizados de los archivos. | 
| additionalProperties | Opciones de configuración adicionales para el contenido del origen de datos. | 
| crawlAcl | true para rastrear la información de la lista de control de acceso (ACL) para los documentos, si tiene una ACL y desea usarla para el control de acceso. La ACL especifica a qué documentos pueden acceder los usuarios y los grupos. La información de la ACL se utiliza para filtrar los resultados de búsqueda en función del acceso del usuario o su grupo a los documentos. Para obtener más información, consulte [Filtrado de contexto de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#context-filter-user-incl-datasources). | 
| inclusionPatterns | Una lista de patrones de expresiones regulares para incluir determinados archivos en la fuente Amazon FSx de datos. Los archivos que coinciden con los patrones se incluyen en el índice. Los archivos que no coincidan con los patrones se excluyen del índice. Si un archivo coincide con un patrón de inclusión y de exclusión, el patrón de exclusión tiene prioridad y el archivo no se incluye en el índice. | 
| exclusionPatterns | Una lista de patrones de expresiones regulares para excluir determinados archivos de la fuente Amazon FSx de datos. Los archivos que coinciden con los patrones se excluyen del índice. Los archivos que no coincidan con los patrones se incluyen en el índice. Si un archivo coincide con un patrón de exclusión y de inclusión, el patrón de exclusión tiene prioridad y el archivo no se incluye en el índice. | 
| type | El tipo del origen de datos. Para los orígenes de datos del sistema de archivos de NetApp ONTAP, especifique FSXONTAP. | 
| syncMode |  Especifique cómo Amazon Kendra debe actualizarse el índice cuando cambie el contenido de la fuente de datos. Puede elegir entre las siguientes opciones: [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | 
| secretArn |  El nombre de recurso de Amazon (ARN) de un AWS Secrets Manager secreto que contiene los pares clave-valor necesarios para conectarse al sistema de archivos. Amazon FSx El secreto debe contener una estructura JSON con las siguientes claves: <pre>{<br />    "username": "user@corp.example.com",<br />    "password": "password"<br />}</pre> Si utiliza el protocolo NFS para su sistema de Amazon FSx archivos, el secreto se almacena en una estructura JSON con las siguientes claves: <pre>{<br />    "leftId": "left ID",<br />    "rightId": "right ID",<br />    "preSharedKey": "pre-shared key"<br />}</pre>  | 

### Amazon FSx (NetApp ONTAP) Esquema JSON


```
{
  "$schema": "http://json-schema.org/draft-04/schema#",
  "type": "object",
  "properties": {
    "connectionConfiguration": {
      "type": "object",
      "properties": {
        "repositoryEndpointMetadata": {
          "type": "object",
          "properties": {
            "fileSystemId": {
              "type": "string",
                "pattern": "^(fs-[0-9a-f]{8,21})$"
            },
            "fileSystemType": {
              "type": "string",
              "enum": ["ONTAP"]
            },
            "svmId": {
              "type": "string",
              "pattern": "^(svm-[0-9a-f]{17,21})$"
            },
            "protocolType": {
              "type": "string",
              "enum": [
                "CIFS",
                "NFS"
              ]
            }
          },
          "required": [
            "fileSystemId",
            "fileSystemType"
          ]
        }
      },
      "required": [
        "repositoryEndpointMetadata"
      ]
    },
    "repositoryConfigurations": {
      "type": "object",
      "properties": {
        "file": {
          "type": "object",
          "properties": {
            "fieldMappings": {
              "type": "array",
              "items": [
                {
                  "type": "object",
                  "properties": {
                    "indexFieldName": {
                      "type": "string",
                      "pattern": "^([a-zA-Z_]{1,20})$"
                    },
                    "indexFieldType": {
                      "type": "string",
                      "enum": [
                        "STRING",
                        "STRING_LIST",
                        "DATE",
                        "LONG"
                      ]
                    },
                    "dataSourceFieldName": {
                      "type": "string",
                      "pattern": "^([a-zA-Z_]{1,20})$"
                    },
                    "dateFieldFormat": {
                      "type": "string",
                      "pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
                    }
                  },
                  "required": [
                    "indexFieldName",
                    "indexFieldType",
                    "dataSourceFieldName"
                  ]
                }
              ],
              "maxItems": 50
            }
          },
          "required": [
            "fieldMappings"
          ]
        }
      },
      "required": [
        "file"
      ]
    },
    "additionalProperties": {
      "type": "object",
      "properties": {
        "crawlAcl": {
          "type": "boolean"
        },
        "inclusionPatterns": {
          "type": "array",
          "items": {
            "type": "string",
            "maxLength": 30
          },
          "maxItems": 100
        },
        "exclusionPatterns": {
          "type": "array",
          "items": {
            "type": "string",
            "maxLength": 30
          },
          "maxItems": 100
        }
      }
    },
    "type": {
      "type": "string",
      "pattern": "FSXONTAP"
    },
    "syncMode": {
      "type": "string",
      "enum": [
        "FORCED_FULL_CRAWL",
        "FULL_CRAWL"
      ]
    },
    "secretArn": {
      "type": "string",
      "pattern": "arn:aws:secretsmanager:.*"
    }
  },
  "required": [
    "connectionConfiguration",
    "repositoryConfigurations",
    "additionalProperties",
    "secretArn",
    "type"
  ]
}
```

## Esquema de plantilla de Alfresco


Incluye un JSON que contiene el esquema del origen de datos como parte del objeto [https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html](https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html). Debe proporcionar el ID del sitio de Alfresco, la URL del repositorio, la URL de la interfaz de usuario, el tipo de autenticación, si utiliza la nube o en las instalaciones y el tipo de contenido que desea rastrear. Debe proporcionarlos como parte de la configuración de la conexión o de los detalles del punto de conexión del repositorio. Especifique también el tipo de origen de datos como `ALFRESCO`, un secreto para sus credenciales de autenticación y otras configuraciones necesarias. A continuación, especifique `TEMPLATE` como el `Type` cuando llame a [https://docs.aws.amazon.com/kendra/latest/dg/API_CreateDataSource.html](https://docs.aws.amazon.com/kendra/latest/dg/API_CreateDataSource.html).

Puede usar la plantilla que se proporciona en esta guía para desarrolladores. Consulte [Esquema JSON de Alfresco](#alfresco-json).

En la tabla siguiente se describen los parámetros de un esquema JSON de Alfresco.


| Configuración | Description (Descripción) | 
| --- | --- | 
| connectionConfiguration | Información de configuración para el punto de conexión para el origen de datos. | 
| repositoryEndpointMetadata | La información del punto de conexión para el origen de datos. | 
| siteId | El identificador del sitio de Alfresco. | 
| repoUrl | La URL de su repositorio de Alfresco. Puede obtener la URL del repositorio de su administrador de Alfresco. Por ejemplo, si utiliza Alfresco Cloud (PaaS), la URL del repositorio podría ser https://company.alfrescocloud.com. O bien, si utiliza Alfresco On-Premises, la URL del repositorio podría ser https://company-alfresco-instance.company-domain.suffix:port. | 
| webAppUrl | La URL de la interfaz de usuario de Alfresco. Puede obtener la URL de la interfaz de usuario de Alfresco de su administrador de Alfresco. Por ejemplo, la URL de la interfaz de usuario podría ser https://example.com. | 
| repositoryAdditionalProperties | Propiedades adicionales para conectarse con el punto final repository/data de origen. | 
| authType | El tipo de autenticación que utiliza, ya sea OAuth2 o Basic. | 
| type (implementación) | El tipo de Alfresco que utiliza, ya sea PAAS o ON-PREM. | 
| crawlType | El tipo de contenido que quiere rastrear, ya sea ASPECT (contenido marcado con “Aspectos” en Alfresco), SITE\$1ID (contenido de un sitio de Alfresco específico) o ALL\$1SITES (contenido de todos sus sitios de Alfresco). | 
| repositoryConfigurations | Información de configuración del contenido del origen de datos. Por ejemplo, configurar tipos específicos de contenido y asignaciones de campos. | 
|  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | Una lista de objetos que mapean los atributos o los nombres de campo de sus documentos y comentarios de Alfresco para Amazon Kendra indexar los nombres de los campos. Para obtener más información, consulte [Asignación de campos de origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/field-mapping.html). | 
| additionalProperties | Opciones de configuración adicionales para el contenido del origen de datos. | 
| aspectName |  El nombre del “Aspecto” específico que desea indexar.  | 
| aspectProperties |  Una lista de propiedades de contenido de “Aspecto” específicas que desea indexar.  | 
| enableFineGrainedControl |  `true` para rastrear “Aspectos”.  | 
| isCrawlComment |  `true` para rastrear los comentarios.  | 
|  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | Una lista de patrones de expresión regular para incluir determinados archivos en su origen de datos de Alfresco. Los archivos que coinciden con los patrones se incluyen en el índice. Los archivos que no coincidan con los patrones se excluyen del índice. Si un archivo coincide con un patrón de inclusión y de exclusión, el patrón de exclusión tiene prioridad y el archivo no se incluye en el índice. | 
|  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | Una lista de patrones de expresión regular para excluir determinados archivos en su origen de datos de Alfresco. Los archivos que coinciden con los patrones se excluyen del índice. Los archivos que no coincidan con los patrones se incluyen en el índice. Si un archivo coincide con un patrón de inclusión y de exclusión, el patrón de exclusión tiene prioridad y el archivo no se incluye en el índice. | 
| type | El tipo del origen de datos. Especifica ALFRESCO como el tipo de origen de datos. | 
| secretArn |  El nombre de recurso de Amazon (ARN) de un AWS Secrets Manager secreto que contiene los pares clave-valor necesarios para conectarse a su. Alfresco El secreto debe contener una estructura JSON con las siguientes claves: Si utiliza la autenticación básica: <pre>{<br />    "username": "user name",<br />    "password": "password"<br />}</pre> Si utiliza OAuth la autenticación 2.0: <pre>{<br />    "clientId": "client ID",<br />    "clientSecret": "client secret",<br />    "tokenUrl": "token URL"<br />}</pre>  | 
| syncMode |  Especifique cómo Amazon Kendra debe actualizarse el índice cuando cambie el contenido de la fuente de datos. Puede elegir entre las siguientes opciones: [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | 
| enableIdentityCrawler | trueutilizar el rastreador Amazon Kendra de identidad para sincronizar la identity/principal información sobre los usuarios y grupos con acceso a determinados documentos. Si el rastreador de identidades está desactivado, todos los documentos se pueden buscar públicamente. Si quiere usar el control de acceso para los documentos y el rastreador de identidades está desactivado, también puede usar la API [https://docs.aws.amazon.com/kendra/latest/dg/API_PutPrincipalMapping.html](https://docs.aws.amazon.com/kendra/latest/dg/API_PutPrincipalMapping.html) para cargar la información de acceso del usuario y del grupo. | 
| versión | La versión de esta plantilla que se admite actualmente. | 

### Esquema JSON de Alfresco


```
{
  "$schema": "http://json-schema.org/draft-04/schema#",
  "type": "object",
  "properties": {
    "connectionConfiguration": {
      "type": "object",
      "properties": {
        "repositoryEndpointMetadata": {
          "type": "object",
          "properties": {
            "siteId": {
              "type": "string"
            },
            "repoUrl": {
              "type": "string"
            },
            "webAppUrl": {
              "type": "string"
            },
            "repositoryAdditionalProperties": {
              "type": "object",
              "properties": {
                "authType": {
                  "type": "string",
                  "enum": [
                    "OAuth2",
                    "Basic"
                  ]
                },
                "type": {
                  "type": "string",
                  "enum": [
                    "PAAS",
                    "ON_PREM"
                  ]
                },
                "crawlType": {
                  "type": "string",
                  "enum": [
                    "ASPECT",
                    "SITE_ID",
                    "ALL_SITES"
                  ]
                }
              }
            }
          }
        }
      },
      "required": [
        "repositoryEndpointMetadata"
      ]
    },
    "repositoryConfigurations": {
      "type": "object",
      "properties": {
        "document": {
          "type": "object",
          "properties": {
            "fieldMappings": {
              "type": "array",
              "items": {
                "anyOf": [
                  {
                    "type": "object",
                    "properties": {
                      "indexFieldName": {
                        "type": "string"
                      },
                      "indexFieldType": {
                        "type": "string",
                        "enum": [
                          "STRING",
                          "DATE",
                          "STRING_LIST",
                          "LONG"
                        ]
                      },
                      "dataSourceFieldName": {
                        "type": "string"
                      },
                      "dateFieldFormat": {
                        "type": "string",
                        "pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
                      }
                    },
                    "required": [
                      "indexFieldName",
                      "indexFieldType",
                      "dataSourceFieldName"
                    ]
                  }
                ]
              }
            }
          },
          "required": [
            "fieldMappings"
          ]
        },
        "comment": {
          "type": "object",
          "properties": {
            "fieldMappings": {
              "type": "array",
              "items": {
                "anyOf": [
                  {
                    "type": "object",
                    "properties": {
                      "indexFieldName": {
                        "type": "string"
                      },
                      "indexFieldType": {
                        "type": "string",
                        "enum": [
                          "STRING",
                          "DATE",
                          "STRING_LIST",
                          "LONG"
                        ]
                      },
                      "dataSourceFieldName": {
                        "type": "string"
                      },
                      "dateFieldFormat": {
                        "type": "string",
                        "pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
                      }
                    },
                    "required": [
                      "indexFieldName",
                      "indexFieldType",
                      "dataSourceFieldName"
                    ]
                  }
                ]
              }
            }
          },
          "required": [
            "fieldMappings"
          ]
        }
      }
    },
    "additionalProperties": {
      "type": "object",
      "properties": {
        "aspectName": {
          "type": "string"
        },
        "aspectProperties": {
          "type": "array"
        },
        "enableFineGrainedControl": {
          "type": "boolean"
        },
        "isCrawlComment": {
          "type": "boolean"
        },
        "inclusionFileNamePatterns": {
          "type": "array"
        },
        "exclusionFileNamePatterns": {
          "type": "array"
        },
        "inclusionFileTypePatterns": {
          "type": "array"
        },
        "exclusionFileTypePatterns": {
          "type": "array"
        },
        "inclusionFilePathPatterns": {
          "type": "array"
        },
        "exclusionFilePathPatterns": {
          "type": "array"
        }
      }
    },
    "type": {
      "type": "string",
      "pattern": "ALFRESCO"
    },
    "secretArn": {
      "type": "string",
      "minLength": 20,
      "maxLength": 2048
    },
    "syncMode": {
      "type": "string",
      "enum": [
        "FORCED_FULL_CRAWL",
        "FULL_CRAWL"
      ]
    },
    "enableIdentityCrawler": {
      "type": "boolean"
    },
    "version": {
      "type": "string",
      "anyOf": [
        {
          "pattern": "1.0.0"
        }
      ]
    }
  },
  "required": [
    "connectionConfiguration",
    "repositoryConfigurations",
    "additionalProperties",
    "type",
    "secretArn"
  ]
}
```

## Aurora Esquema de plantillas (MySQL)


Incluye un JSON que contiene el esquema del origen de datos como parte del objeto [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_TemplateConfiguration.html). Especifique el tipo de origen de datos como `JDBC`, el tipo de base de datos como `mysql`, un secreto para sus credenciales de autenticación y otras configuraciones necesarias. A continuación, especifique `TEMPLATE` como el `Type` cuando llame a [CreateDataSource](https://docs.aws.amazon.com/kendra/latest/APIReference/API_CreateDataSource.html).

Puede usar la plantilla que se proporciona en esta guía para desarrolladores. Consulte [Aurora Esquema JSON (MySQL)](#aurora-mysql-json).

En la siguiente tabla se describen los parámetros del esquema JSON Aurora (MySQL).


| Configuración | Description (Descripción) | 
| --- | --- | 
| connectionConfiguration | Información de configuración para el punto de conexión para el origen de datos. | 
| repositoryEndpointMetadata | Información de configuración necesaria para conectarse a su origen de datos.[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html) | 
| repositoryConfigurations | Información de configuración del contenido del origen de datos. Por ejemplo, configurar tipos específicos de contenido y asignaciones de campos. Especifique el tipo de origen de datos y el ARN secreto. | 
|  revisión  |  Una lista de objetos que asignan los atributos o los nombres de campo del contenido de la base de datos a los nombres de los campos de Amazon Kendra indexación. Para obtener más información, consulte [Asignación de campos de origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/field-mapping.html). | 
| additionalProperties | Opciones de configuración adicionales para el contenido del origen de datos. Se utiliza para incluir o excluir contenido específico en el origen de datos de la base de datos. | 
| primaryKey  | Proporciona la clave principal de la tabla de la base de datos. Esto identifica una tabla dentro de la base de datos. | 
| titleColumn | Proporciona el nombre de la columna del título del documento en la tabla de la base de datos. | 
| bodyColumn | Proporciona el nombre de la columna del título del documento en la tabla de la base de datos. | 
| sqlQuery | Introduce instrucciones de consulta SQL, como las operaciones SELECT y JOIN. Las consultas SQL deben tener menos de 32 KB. Amazon Kendra rastreará todo el contenido de la base de datos que coincida con su consulta. | 
| timestampColumn | Introduzca el nombre de la columna que contiene las marcas de tiempo. Amazon Kendra utiliza la información de la marca de tiempo para detectar cambios en el contenido y sincronizar solo el contenido modificado. | 
| timestampFormat | Introduce el nombre de la columna que contiene los formatos de marcas temporales que se deben utilizar para detectar cambios en el contenido y volver a sincronizar su contenido. | 
| timezone | Introduce el nombre de la columna que contiene las zonas horarias del contenido que se va a rastrear. | 
| changeDetectingColumns | Introduce los nombres de las columnas que Amazon Kendra se utilizarán para detectar cambios en el contenido. Amazon Kendra volverá a indexar el contenido cuando se produzca un cambio en alguna de estas columnas | 
| allowedUsersColumns | Introduzca el nombre de la columna que contiene el usuario IDs al que se le permitirá acceder al contenido. | 
| allowedGroupsColumn | Introduzca el nombre de la columna que contiene el usuario IDs al que se permitirá el acceso al contenido. | 
| fuente URIColumn | Introduzca el nombre de la columna que contiene la fuente que se URLs va a indexar. | 
| isSslEnabled | Introduce instrucciones de consulta SQL, como las operaciones SELECT y JOIN. Las consultas SQL deben tener menos de 32 KB. Amazon Kendra rastreará todo el contenido de la base de datos que coincida con su consulta. | 
| type | El tipo del origen de datos. Especifica JDBC como el tipo de origen de datos. | 
| syncMode |  Especifique cómo Amazon Kendra debe actualizarse el índice cuando cambie el contenido de la fuente de datos. Puede elegir entre las siguientes opciones: [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | 
| secretArn | El nombre de recurso de Amazon (ARN) de un secreto de Secrets Manager que contiene el nombre de usuario y la contraseña necesarios para conectarse a su base de datos. El secreto debe contener una estructura JSON con las siguientes claves: <pre>{<br />    "user name": "database user name",<br />    "password": "password"<br />}</pre> | 
| versión | La versión de la plantilla que se admite actualmente. | 

### Aurora Esquema JSON (MySQL)


```
{
  "$schema": "http://json-schema.org/draft-04/schema#",
  "type": "object",
  "properties": {
    "connectionConfiguration": {
      "type": "object",
      "properties": {
        "repositoryEndpointMetadata": {
          "type": "object",
          "properties": {
            "dbType": {
              "type": "string",
              "enum": [
                "mysql",
                "db2",
                "postgresql",
                "oracle",
                "sqlserver"
              ]
            },
            "dbHost": {
              "type": "string"
            },
            "dbPort": {
              "type": "string"
            },
            "dbInstance": {
              "type": "string"
            }
          },
          "required": [
            "dbType",
            "dbHost",
            "dbPort",
            "dbInstance"
          ]
        }
      },
      "required": [
        "repositoryEndpointMetadata"
      ]
    },
    "repositoryConfigurations": {
      "type": "object",
      "properties": {
        "document": {
          "type": "object",
          "properties": {
            "fieldMappings": {
              "type": "array",
              "items": [
                {
                  "type": "object",
                  "properties": {
                    "indexFieldName": {
                      "type": "string"
                    },
                    "indexFieldType": {
                      "type": "string"
                    },
                    "dataSourceFieldName": {
                      "type": "string"
                    }
                  },
                  "required": [
                    "indexFieldName",
                    "indexFieldType",
                    "dataSourceFieldName"
                  ]
                }
              ]
            }
          },
          "required": [
            "fieldMappings"
          ]
        }
      },
      "required": [
      ]
    },
    "additionalProperties": {
      "type": "object",
      "properties": {
        "primaryKey": {
          "type": "string"
        },
        "titleColumn": {
          "type": "string"
        },
        "bodyColumn": {
          "type": "string"
        },
        "sqlQuery": {
          "type": "string",
          "not": {
            "pattern": ";+"
          }
        },
        "timestampColumn": {
          "type": "string"
        },
        "timestampFormat": {
          "type": "string"
        },
        "timezone": {
          "type": "string"
        },
        "changeDetectingColumns": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "allowedUsersColumn": {
          "type": "string"
        },
        "allowedGroupsColumn": {
          "type": "string"
        },
        "sourceURIColumn": {
          "type": "string"
        },
        "isSslEnabled": {
          "type": "boolean"
        }
      },
      "required": ["primaryKey", "titleColumn", "bodyColumn", "sqlQuery"]
    },
    "type" : {
      "type" : "string",
      "pattern": "JDBC"
    },
    "syncMode": {
      "type": "string",
      "enum": [
        "FORCED_FULL_CRAWL",
        "FULL_CRAWL",
        "CHANGE_LOG"
      ]
    },
    "secretArn": {
      "type": "string"
    }
  },
  "version": {
    "type": "string",
    "anyOf": [
      {
        "pattern": "1.0.0"
      }
    ]
  },
  "required": [
      "connectionConfiguration",
      "repositoryConfigurations",
      "syncMode",
      "additionalProperties",
      "secretArn",
      "type"
  ]
}
```

## Aurora Esquema de plantillas (PostgreSQL)


Incluye un JSON que contiene el esquema del origen de datos como parte del objeto [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_TemplateConfiguration.html). Especifique el tipo de origen de datos como `JDBC`, el tipo de base de datos como `postgresql`, un secreto para sus credenciales de autenticación y otras configuraciones necesarias. A continuación, especifique `TEMPLATE` como el `Type` cuando llame a [CreateDataSource](https://docs.aws.amazon.com/kendra/latest/APIReference/API_CreateDataSource.html).

Puede usar la plantilla que se proporciona en esta guía para desarrolladores. Consulte [Aurora Esquema JSON (PostgreSQL)](#aurora-postgresql-json).

En la siguiente tabla se describen los parámetros del esquema Aurora JSON (PostgreSQL).


| Configuración | Description (Descripción) | 
| --- | --- | 
| connectionConfiguration | Información de configuración para el punto de conexión para el origen de datos. | 
| repositoryEndpointMetadata | Información de configuración necesaria para conectarse a su origen de datos.[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html) | 
| repositoryConfigurations | Información de configuración del contenido del origen de datos. Por ejemplo, configurar tipos específicos de contenido y asignaciones de campos. Especifique el tipo de origen de datos y el ARN secreto. | 
|  revisión  |  Una lista de objetos que mapean los atributos o los nombres de campo del contenido de la base de datos para Amazon Kendra indexar los nombres de los campos. Para obtener más información, consulte [Asignación de campos de origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/field-mapping.html). | 
| additionalProperties | Opciones de configuración adicionales para el contenido del origen de datos. Se utiliza para incluir o excluir contenido específico en el origen de datos de la base de datos. | 
| primaryKey  | Proporciona la clave principal de la tabla de la base de datos. Esto identifica una tabla dentro de la base de datos. | 
| titleColumn | Proporciona el nombre de la columna del título del documento en la tabla de la base de datos. | 
| bodyColumn | Proporciona el nombre de la columna del título del documento en la tabla de la base de datos. | 
| sqlQuery | Introduce instrucciones de consulta SQL, como las operaciones SELECT y JOIN. Las consultas SQL deben tener menos de 32 KB. Amazon Kendra rastreará todo el contenido de la base de datos que coincida con su consulta. | 
| timestampColumn | Introduzca el nombre de la columna que contiene las marcas de tiempo. Amazon Kendra utiliza la información de la marca de tiempo para detectar cambios en el contenido y sincronizar solo el contenido modificado. | 
| timestampFormat | Introduce el nombre de la columna que contiene los formatos de marcas temporales que se deben utilizar para detectar cambios en el contenido y volver a sincronizar su contenido. | 
| timezone | Introduce el nombre de la columna que contiene las zonas horarias del contenido que se va a rastrear. | 
| changeDetectingColumns | Introduce los nombres de las columnas que Amazon Kendra se utilizarán para detectar cambios en el contenido. Amazon Kendra volverá a indexar el contenido cuando se produzca un cambio en alguna de estas columnas | 
| allowedUsersColumns | Introduzca el nombre de la columna que contiene el usuario IDs al que se le permitirá acceder al contenido. | 
| allowedGroupsColumn | Introduzca el nombre de la columna que contiene el usuario IDs al que se permitirá el acceso al contenido. | 
| fuente URIColumn | Introduzca el nombre de la columna que contiene la fuente que se URLs va a indexar. | 
| isSslEnabled | Introduce instrucciones de consulta SQL, como las operaciones SELECT y JOIN. Las consultas SQL deben tener menos de 32 KB. Amazon Kendra rastreará todo el contenido de la base de datos que coincida con su consulta. | 
| type | El tipo del origen de datos. Especifica JDBC como el tipo de origen de datos. | 
| syncMode |  Especifique cómo Amazon Kendra debe actualizarse el índice cuando cambie el contenido de la fuente de datos. Puede elegir entre las siguientes opciones: [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | 
| secretArn | El nombre de recurso de Amazon (ARN) de un secreto de Secrets Manager que contiene el nombre de usuario y la contraseña necesarios para conectarse a su base de datos. El secreto debe contener una estructura JSON con las siguientes claves: <pre>{<br />    "user name": "database user name",<br />    "password": "password"<br />}</pre> | 
| versión | La versión de la plantilla que se admite actualmente. | 

### Aurora Esquema JSON (PostgreSQL)


```
{
  "$schema": "http://json-schema.org/draft-04/schema#",
  "type": "object",
  "properties": {
    "connectionConfiguration": {
      "type": "object",
      "properties": {
        "repositoryEndpointMetadata": {
          "type": "object",
          "properties": {
            "dbType": {
              "type": "string",
              "enum": [
                "mysql",
                "db2",
                "postgresql",
                "oracle",
                "sqlserver"
              ]
            },
            "dbHost": {
              "type": "string"
            },
            "dbPort": {
              "type": "string"
            },
            "dbInstance": {
              "type": "string"
            }
          },
          "required": [
            "dbType",
            "dbHost",
            "dbPort",
            "dbInstance"
          ]
        }
      },
      "required": [
        "repositoryEndpointMetadata"
      ]
    },
    "repositoryConfigurations": {
      "type": "object",
      "properties": {
        "document": {
          "type": "object",
          "properties": {
            "fieldMappings": {
              "type": "array",
              "items": [
                {
                  "type": "object",
                  "properties": {
                    "indexFieldName": {
                      "type": "string"
                    },
                    "indexFieldType": {
                      "type": "string"
                    },
                    "dataSourceFieldName": {
                      "type": "string"
                    }
                  },
                  "required": [
                    "indexFieldName",
                    "indexFieldType",
                    "dataSourceFieldName"
                  ]
                }
              ]
            }
          },
          "required": [
            "fieldMappings"
          ]
        }
      },
      "required": [
      ]
    },
    "additionalProperties": {
      "type": "object",
      "properties": {
        "primaryKey": {
          "type": "string"
        },
        "titleColumn": {
          "type": "string"
        },
        "bodyColumn": {
          "type": "string"
        },
        "sqlQuery": {
          "type": "string",
          "not": {
            "pattern": ";+"
          }
        },
        "timestampColumn": {
          "type": "string"
        },
        "timestampFormat": {
          "type": "string"
        },
        "timezone": {
          "type": "string"
        },
        "changeDetectingColumns": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "allowedUsersColumn": {
          "type": "string"
        },
        "allowedGroupsColumn": {
          "type": "string"
        },
        "sourceURIColumn": {
          "type": "string"
        },
        "isSslEnabled": {
          "type": "boolean"
        }
      },
      "required": ["primaryKey", "titleColumn", "bodyColumn", "sqlQuery"]
    },
    "type" : {
      "type" : "string",
      "pattern": "JDBC"
    },
    "syncMode": {
      "type": "string",
      "enum": [
        "FORCED_FULL_CRAWL",
        "FULL_CRAWL",
        "CHANGE_LOG"
      ]
    },
    "secretArn": {
      "type": "string"
    }
  },
  "version": {
    "type": "string",
    "anyOf": [
      {
        "pattern": "1.0.0"
      }
    ]
  },
  "required": [
      "connectionConfiguration",
      "repositoryConfigurations",
      "syncMode",
      "additionalProperties",
      "secretArn",
      "type"
  ]
}
```

## Amazon RDS Esquema de plantillas (Microsoft SQL Server)


Incluye un JSON que contiene el esquema del origen de datos como parte del objeto [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_TemplateConfiguration.html). Especifique el tipo de origen de datos como `JDBC`, el tipo de base de datos como `sqlserver`, un secreto para sus credenciales de autenticación y otras configuraciones necesarias. A continuación, especifique `TEMPLATE` como el `Type` cuando llame a [CreateDataSource](https://docs.aws.amazon.com/kendra/latest/APIReference/API_CreateDataSource.html).

Puede usar la plantilla que se proporciona en esta guía para desarrolladores. Consulte [Amazon RDS Esquema JSON (Microsoft SQL Server)](#rds-ms-sql-server-json).

En la siguiente tabla se describen los parámetros del esquema JSON Amazon RDS (Microsoft SQL Server).


| Configuración | Description (Descripción) | 
| --- | --- | 
| connectionConfiguration | Información de configuración para el punto de conexión para el origen de datos. | 
| repositoryEndpointMetadata | Información de configuración necesaria para conectarse a su origen de datos.[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html) | 
| repositoryConfigurations | Información de configuración del contenido del origen de datos. Por ejemplo, configurar tipos específicos de contenido y asignaciones de campos. Especifique el tipo de origen de datos y el ARN secreto. | 
|  revisión  |  Una lista de objetos que asignan los atributos o los nombres de campo del contenido de la base de datos para Amazon Kendra indexar los nombres de los campos. Para obtener más información, consulte [Asignación de campos de origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/field-mapping.html). | 
| additionalProperties | Opciones de configuración adicionales para el contenido del origen de datos. Se utiliza para incluir o excluir contenido específico en el origen de datos de la base de datos. | 
| primaryKey  | Proporciona la clave principal de la tabla de la base de datos. Esto identifica una tabla dentro de la base de datos. | 
| titleColumn | Proporciona el nombre de la columna del título del documento en la tabla de la base de datos. | 
| bodyColumn | Proporciona el nombre de la columna del título del documento en la tabla de la base de datos. | 
| sqlQuery | Introduce instrucciones de consulta SQL, como las operaciones SELECT y JOIN. Las consultas SQL deben tener menos de 32 KB. Amazon Kendra rastreará todo el contenido de la base de datos que coincida con su consulta. | 
| timestampColumn | Introduzca el nombre de la columna que contiene las marcas de tiempo. Amazon Kendra utiliza la información de la marca de tiempo para detectar cambios en el contenido y sincronizar solo el contenido modificado. | 
| timestampFormat | Introduce el nombre de la columna que contiene los formatos de marcas temporales que se deben utilizar para detectar cambios en el contenido y volver a sincronizar su contenido. | 
| timezone | Introduce el nombre de la columna que contiene las zonas horarias del contenido que se va a rastrear. | 
| changeDetectingColumns | Introduce los nombres de las columnas que Amazon Kendra se utilizarán para detectar cambios en el contenido. Amazon Kendra volverá a indexar el contenido cuando se produzca un cambio en alguna de estas columnas | 
| allowedUsersColumns | Introduzca el nombre de la columna que contiene el usuario IDs al que se le permitirá acceder al contenido. | 
| allowedGroupsColumn | Introduzca el nombre de la columna que contiene el usuario IDs al que se permitirá el acceso al contenido. | 
| fuente URIColumn | Introduzca el nombre de la columna que contiene la fuente que se URLs va a indexar. | 
| isSslEnabled | Introduce instrucciones de consulta SQL, como las operaciones SELECT y JOIN. Las consultas SQL deben tener menos de 32 KB. Amazon Kendra rastreará todo el contenido de la base de datos que coincida con su consulta. | 
| type | El tipo del origen de datos. Especifica JDBC como el tipo de origen de datos. | 
| syncMode |  Especifique cómo Amazon Kendra debe actualizarse el índice cuando cambie el contenido de la fuente de datos. Puede elegir entre las siguientes opciones: [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | 
| secretArn | El nombre de recurso de Amazon (ARN) de un secreto de Secrets Manager que contiene el nombre de usuario y la contraseña necesarios para conectarse a su base de datos. El secreto debe contener una estructura JSON con las siguientes claves: <pre>{<br />    "user name": "database user name",<br />    "password": "password"<br />}</pre> | 
| versión | La versión de la plantilla que se admite actualmente. | 

### Amazon RDS Esquema JSON (Microsoft SQL Server)


```
{
  "$schema": "http://json-schema.org/draft-04/schema#",
  "type": "object",
  "properties": {
    "connectionConfiguration": {
      "type": "object",
      "properties": {
        "repositoryEndpointMetadata": {
          "type": "object",
          "properties": {
            "dbType": {
              "type": "string",
              "enum": [
                "mysql",
                "db2",
                "postgresql",
                "oracle",
                "sqlserver"
              ]
            },
            "dbHost": {
              "type": "string"
            },
            "dbPort": {
              "type": "string"
            },
            "dbInstance": {
              "type": "string"
            }
          },
          "required": [
            "dbType",
            "dbHost",
            "dbPort",
            "dbInstance"
          ]
        }
      },
      "required": [
        "repositoryEndpointMetadata"
      ]
    },
    "repositoryConfigurations": {
      "type": "object",
      "properties": {
        "document": {
          "type": "object",
          "properties": {
            "fieldMappings": {
              "type": "array",
              "items": [
                {
                  "type": "object",
                  "properties": {
                    "indexFieldName": {
                      "type": "string"
                    },
                    "indexFieldType": {
                      "type": "string"
                    },
                    "dataSourceFieldName": {
                      "type": "string"
                    }
                  },
                  "required": [
                    "indexFieldName",
                    "indexFieldType",
                    "dataSourceFieldName"
                  ]
                }
              ]
            }
          },
          "required": [
            "fieldMappings"
          ]
        }
      },
      "required": [
      ]
    },
    "additionalProperties": {
      "type": "object",
      "properties": {
        "primaryKey": {
          "type": "string"
        },
        "titleColumn": {
          "type": "string"
        },
        "bodyColumn": {
          "type": "string"
        },
        "sqlQuery": {
          "type": "string",
          "not": {
            "pattern": ";+"
          }
        },
        "timestampColumn": {
          "type": "string"
        },
        "timestampFormat": {
          "type": "string"
        },
        "timezone": {
          "type": "string"
        },
        "changeDetectingColumns": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "allowedUsersColumn": {
          "type": "string"
        },
        "allowedGroupsColumn": {
          "type": "string"
        },
        "sourceURIColumn": {
          "type": "string"
        },
        "isSslEnabled": {
          "type": "boolean"
        }
      },
      "required": ["primaryKey", "titleColumn", "bodyColumn", "sqlQuery"]
    },
    "type" : {
      "type" : "string",
      "pattern": "JDBC"
    },
    "syncMode": {
      "type": "string",
      "enum": [
        "FORCED_FULL_CRAWL",
        "FULL_CRAWL",
        "CHANGE_LOG"
      ]
    },
    "secretArn": {
      "type": "string"
    }
  },
  "version": {
    "type": "string",
    "anyOf": [
      {
        "pattern": "1.0.0"
      }
    ]
  },
  "required": [
      "connectionConfiguration",
      "repositoryConfigurations",
      "syncMode",
      "additionalProperties",
      "secretArn",
      "type"
  ]
}
```

## Amazon RDS Esquema de plantillas (MySQL)


Incluye un JSON que contiene el esquema del origen de datos como parte del objeto [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_TemplateConfiguration.html). Especifique el tipo de origen de datos como `JDBC`, el tipo de base de datos como `mysql`, un secreto para sus credenciales de autenticación y otras configuraciones necesarias. A continuación, especifique `TEMPLATE` como el `Type` cuando llame a [CreateDataSource](https://docs.aws.amazon.com/kendra/latest/APIReference/API_CreateDataSource.html).

Puede usar la plantilla que se proporciona en esta guía para desarrolladores. Consulte [Amazon RDS Esquema JSON (MySQL)](#rds-mysql-json).

En la siguiente tabla se describen los parámetros del esquema JSON Amazon RDS (MySQL).


| Configuración | Description (Descripción) | 
| --- | --- | 
| connectionConfiguration | Información de configuración para el punto de conexión para el origen de datos. | 
| repositoryEndpointMetadata | Información de configuración necesaria para conectarse a su origen de datos.[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html) | 
| repositoryConfigurations | Información de configuración del contenido del origen de datos. Por ejemplo, configurar tipos específicos de contenido y asignaciones de campos. Especifique el tipo de origen de datos y el ARN secreto. | 
|  revisión  |  Una lista de objetos que asignan los atributos o los nombres de campo del contenido de la base de datos a los nombres de los campos de Amazon Kendra indexación. Para obtener más información, consulte [Asignación de campos de origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/field-mapping.html). | 
| additionalProperties | Opciones de configuración adicionales para el contenido del origen de datos. Se utiliza para incluir o excluir contenido específico en el origen de datos de la base de datos. | 
| primaryKey  | Proporciona la clave principal de la tabla de la base de datos. Esto identifica una tabla dentro de la base de datos. | 
| titleColumn | Proporciona el nombre de la columna del título del documento en la tabla de la base de datos. | 
| bodyColumn | Proporciona el nombre de la columna del título del documento en la tabla de la base de datos. | 
| sqlQuery | Introduce instrucciones de consulta SQL, como las operaciones SELECT y JOIN. Las consultas SQL deben tener menos de 32 KB. Amazon Kendra rastreará todo el contenido de la base de datos que coincida con su consulta. | 
| timestampColumn | Introduzca el nombre de la columna que contiene las marcas de tiempo. Amazon Kendra utiliza la información de la marca de tiempo para detectar cambios en el contenido y sincronizar solo el contenido modificado. | 
| timestampFormat | Introduce el nombre de la columna que contiene los formatos de marcas temporales que se deben utilizar para detectar cambios en el contenido y volver a sincronizar su contenido. | 
| timezone | Introduce el nombre de la columna que contiene las zonas horarias del contenido que se va a rastrear. | 
| changeDetectingColumns | Introduce los nombres de las columnas que Amazon Kendra se utilizarán para detectar cambios en el contenido. Amazon Kendra volverá a indexar el contenido cuando se produzca un cambio en alguna de estas columnas | 
| allowedUsersColumns | Introduzca el nombre de la columna que contiene el usuario IDs al que se le permitirá acceder al contenido. | 
| allowedGroupsColumn | Introduzca el nombre de la columna que contiene el usuario IDs al que se permitirá el acceso al contenido. | 
| fuente URIColumn | Introduzca el nombre de la columna que contiene la fuente que se URLs va a indexar. | 
| isSslEnabled | Introduce instrucciones de consulta SQL, como las operaciones SELECT y JOIN. Las consultas SQL deben tener menos de 32 KB. Amazon Kendra rastreará todo el contenido de la base de datos que coincida con su consulta. | 
| type | El tipo del origen de datos. Especifica JDBC como el tipo de origen de datos. | 
| syncMode |  Especifique cómo Amazon Kendra debe actualizarse el índice cuando cambie el contenido de la fuente de datos. Puede elegir entre las siguientes opciones: [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | 
| secretArn | El nombre de recurso de Amazon (ARN) de un secreto de Secrets Manager que contiene el nombre de usuario y la contraseña necesarios para conectarse a su base de datos. El secreto debe contener una estructura JSON con las siguientes claves: <pre>{<br />    "user name": "database user name",<br />    "password": "password"<br />}</pre> | 
| versión | La versión de la plantilla que se admite actualmente. | 

### Amazon RDS Esquema JSON (MySQL)


```
{
  "$schema": "http://json-schema.org/draft-04/schema#",
  "type": "object",
  "properties": {
    "connectionConfiguration": {
      "type": "object",
      "properties": {
        "repositoryEndpointMetadata": {
          "type": "object",
          "properties": {
            "dbType": {
              "type": "string",
              "enum": [
                "mysql",
                "db2",
                "postgresql",
                "oracle",
                "sqlserver"
              ]
            },
            "dbHost": {
              "type": "string"
            },
            "dbPort": {
              "type": "string"
            },
            "dbInstance": {
              "type": "string"
            }
          },
          "required": [
            "dbType",
            "dbHost",
            "dbPort",
            "dbInstance"
          ]
        }
      },
      "required": [
        "repositoryEndpointMetadata"
      ]
    },
    "repositoryConfigurations": {
      "type": "object",
      "properties": {
        "document": {
          "type": "object",
          "properties": {
            "fieldMappings": {
              "type": "array",
              "items": [
                {
                  "type": "object",
                  "properties": {
                    "indexFieldName": {
                      "type": "string"
                    },
                    "indexFieldType": {
                      "type": "string"
                    },
                    "dataSourceFieldName": {
                      "type": "string"
                    }
                  },
                  "required": [
                    "indexFieldName",
                    "indexFieldType",
                    "dataSourceFieldName"
                  ]
                }
              ]
            }
          },
          "required": [
            "fieldMappings"
          ]
        }
      },
      "required": [
      ]
    },
    "additionalProperties": {
      "type": "object",
      "properties": {
        "primaryKey": {
          "type": "string"
        },
        "titleColumn": {
          "type": "string"
        },
        "bodyColumn": {
          "type": "string"
        },
        "sqlQuery": {
          "type": "string",
          "not": {
            "pattern": ";+"
          }
        },
        "timestampColumn": {
          "type": "string"
        },
        "timestampFormat": {
          "type": "string"
        },
        "timezone": {
          "type": "string"
        },
        "changeDetectingColumns": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "allowedUsersColumn": {
          "type": "string"
        },
        "allowedGroupsColumn": {
          "type": "string"
        },
        "sourceURIColumn": {
          "type": "string"
        },
        "isSslEnabled": {
          "type": "boolean"
        }
      },
      "required": ["primaryKey", "titleColumn", "bodyColumn", "sqlQuery"]
    },
    "type" : {
      "type" : "string",
      "pattern": "JDBC"
    },
    "syncMode": {
      "type": "string",
      "enum": [
        "FORCED_FULL_CRAWL",
        "FULL_CRAWL",
        "CHANGE_LOG"
      ]
    },
    "secretArn": {
      "type": "string"
    }
  },
  "version": {
    "type": "string",
    "anyOf": [
      {
        "pattern": "1.0.0"
      }
    ]
  },
  "required": [
      "connectionConfiguration",
      "repositoryConfigurations",
      "syncMode",
      "additionalProperties",
      "secretArn",
      "type"
  ]
}
```

## Amazon RDS Esquema de plantillas (Oracle)


Incluye un JSON que contiene el esquema del origen de datos como parte del objeto [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_TemplateConfiguration.html). Especifique el tipo de origen de datos como `JDBC`, el tipo de base de datos como `oracle`, un secreto para sus credenciales de autenticación y otras configuraciones necesarias. A continuación, especifique `TEMPLATE` como el `Type` cuando llame a [CreateDataSource](https://docs.aws.amazon.com/kendra/latest/APIReference/API_CreateDataSource.html).

Puede usar la plantilla que se proporciona en esta guía para desarrolladores. Consulte [Amazon RDS Esquema JSON (Oracle)](#rds-oracle-json).

En la siguiente tabla se describen los parámetros del esquema JSON Amazon RDS (Oracle).


| Configuración | Description (Descripción) | 
| --- | --- | 
| connectionConfiguration | Información de configuración para el punto de conexión para el origen de datos. | 
| repositoryEndpointMetadata | Información de configuración necesaria para conectarse a su origen de datos.[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html) | 
| repositoryConfigurations | Información de configuración del contenido del origen de datos. Por ejemplo, configurar tipos específicos de contenido y asignaciones de campos. Especifique el tipo de origen de datos y el ARN secreto. | 
|  revisión  |  Una lista de objetos que asignan los atributos o los nombres de campo del contenido de la base de datos para Amazon Kendra indexar los nombres de los campos. Para obtener más información, consulte [Asignación de campos de origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/field-mapping.html). | 
| additionalProperties | Opciones de configuración adicionales para el contenido del origen de datos. Se utiliza para incluir o excluir contenido específico en el origen de datos de la base de datos. | 
| primaryKey  | Proporciona la clave principal de la tabla de la base de datos. Esto identifica una tabla dentro de la base de datos. | 
| titleColumn | Proporciona el nombre de la columna del título del documento en la tabla de la base de datos. | 
| bodyColumn | Proporciona el nombre de la columna del título del documento en la tabla de la base de datos. | 
| sqlQuery | Introduce instrucciones de consulta SQL, como las operaciones SELECT y JOIN. Las consultas SQL deben tener menos de 32 KB. Amazon Kendra rastreará todo el contenido de la base de datos que coincida con su consulta. | 
| timestampColumn | Introduzca el nombre de la columna que contiene las marcas de tiempo. Amazon Kendra utiliza la información de la marca de tiempo para detectar cambios en el contenido y sincronizar solo el contenido modificado. | 
| timestampFormat | Introduce el nombre de la columna que contiene los formatos de marcas temporales que se deben utilizar para detectar cambios en el contenido y volver a sincronizar su contenido. | 
| timezone | Introduce el nombre de la columna que contiene las zonas horarias del contenido que se va a rastrear. | 
| changeDetectingColumns | Introduce los nombres de las columnas que Amazon Kendra se utilizarán para detectar cambios en el contenido. Amazon Kendra volverá a indexar el contenido cuando se produzca un cambio en alguna de estas columnas | 
| allowedUsersColumns | Introduzca el nombre de la columna que contiene el usuario IDs al que se le permitirá acceder al contenido. | 
| allowedGroupsColumn | Introduzca el nombre de la columna que contiene el usuario IDs al que se permitirá el acceso al contenido. | 
| fuente URIColumn | Introduzca el nombre de la columna que contiene la fuente que se URLs va a indexar. | 
| isSslEnabled | Introduce instrucciones de consulta SQL, como las operaciones SELECT y JOIN. Las consultas SQL deben tener menos de 32 KB. Amazon Kendra rastreará todo el contenido de la base de datos que coincida con su consulta. | 
| type | El tipo del origen de datos. Especifica JDBC como el tipo de origen de datos. | 
| syncMode |  Especifique cómo Amazon Kendra debe actualizarse el índice cuando cambie el contenido de la fuente de datos. Puede elegir entre las siguientes opciones: [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | 
| secretArn | El nombre de recurso de Amazon (ARN) de un secreto de Secrets Manager que contiene el nombre de usuario y la contraseña necesarios para conectarse a su base de datos. El secreto debe contener una estructura JSON con las siguientes claves: <pre>{<br />    "user name": "database user name",<br />    "password": "password"<br />}</pre> | 
| versión | La versión de la plantilla que se admite actualmente. | 

### Amazon RDS Esquema JSON (Oracle)


```
{
  "$schema": "http://json-schema.org/draft-04/schema#",
  "type": "object",
  "properties": {
    "connectionConfiguration": {
      "type": "object",
      "properties": {
        "repositoryEndpointMetadata": {
          "type": "object",
          "properties": {
            "dbType": {
              "type": "string",
              "enum": [
                "mysql",
                "db2",
                "postgresql",
                "oracle",
                "sqlserver"
              ]
            },
            "dbHost": {
              "type": "string"
            },
            "dbPort": {
              "type": "string"
            },
            "dbInstance": {
              "type": "string"
            }
          },
          "required": [
            "dbType",
            "dbHost",
            "dbPort",
            "dbInstance"
          ]
        }
      },
      "required": [
        "repositoryEndpointMetadata"
      ]
    },
    "repositoryConfigurations": {
      "type": "object",
      "properties": {
        "document": {
          "type": "object",
          "properties": {
            "fieldMappings": {
              "type": "array",
              "items": [
                {
                  "type": "object",
                  "properties": {
                    "indexFieldName": {
                      "type": "string"
                    },
                    "indexFieldType": {
                      "type": "string"
                    },
                    "dataSourceFieldName": {
                      "type": "string"
                    }
                  },
                  "required": [
                    "indexFieldName",
                    "indexFieldType",
                    "dataSourceFieldName"
                  ]
                }
              ]
            }
          },
          "required": [
            "fieldMappings"
          ]
        }
      },
      "required": [
      ]
    },
    "additionalProperties": {
      "type": "object",
      "properties": {
        "primaryKey": {
          "type": "string"
        },
        "titleColumn": {
          "type": "string"
        },
        "bodyColumn": {
          "type": "string"
        },
        "sqlQuery": {
          "type": "string",
          "not": {
            "pattern": ";+"
          }
        },
        "timestampColumn": {
          "type": "string"
        },
        "timestampFormat": {
          "type": "string"
        },
        "timezone": {
          "type": "string"
        },
        "changeDetectingColumns": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "allowedUsersColumn": {
          "type": "string"
        },
        "allowedGroupsColumn": {
          "type": "string"
        },
        "sourceURIColumn": {
          "type": "string"
        },
        "isSslEnabled": {
          "type": "boolean"
        }
      },
      "required": ["primaryKey", "titleColumn", "bodyColumn", "sqlQuery"]
    },
    "type" : {
      "type" : "string",
      "pattern": "JDBC"
    },
    "syncMode": {
      "type": "string",
      "enum": [
        "FORCED_FULL_CRAWL",
        "FULL_CRAWL",
        "CHANGE_LOG"
      ]
    },
    "secretArn": {
      "type": "string"
    }
  },
  "version": {
    "type": "string",
    "anyOf": [
      {
        "pattern": "1.0.0"
      }
    ]
  },
  "required": [
      "connectionConfiguration",
      "repositoryConfigurations",
      "syncMode",
      "additionalProperties",
      "secretArn",
      "type"
  ]
}
```

## Amazon RDS Esquema de plantillas (PostgreSQL)


Incluye un JSON que contiene el esquema del origen de datos como parte del objeto [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_TemplateConfiguration.html). Especifique el tipo de origen de datos como `JDBC`, el tipo de base de datos como `postgresql`, un secreto para sus credenciales de autenticación y otras configuraciones necesarias. A continuación, especifique `TEMPLATE` como el `Type` cuando llame a [CreateDataSource](https://docs.aws.amazon.com/kendra/latest/APIReference/API_CreateDataSource.html).

Puede usar la plantilla que se proporciona en esta guía para desarrolladores. Consulte [Amazon RDS Esquema JSON (PostgreSQL)](#rds-postgresql-json).

En la siguiente tabla se describen los parámetros del esquema Amazon RDS JSON (PostgreSQL).


| Configuración | Description (Descripción) | 
| --- | --- | 
| connectionConfiguration | Información de configuración para el punto de conexión para el origen de datos. | 
| repositoryEndpointMetadata | Información de configuración necesaria para conectarse a su origen de datos.[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html) | 
| repositoryConfigurations | Información de configuración del contenido del origen de datos. Por ejemplo, configurar tipos específicos de contenido y asignaciones de campos. Especifique el tipo de origen de datos y el ARN secreto. | 
|  revisión  |  Una lista de objetos que mapean los atributos o los nombres de campo del contenido de la base de datos para Amazon Kendra indexar los nombres de los campos. Para obtener más información, consulte [Asignación de campos de origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/field-mapping.html). | 
| additionalProperties | Opciones de configuración adicionales para el contenido del origen de datos. Se utiliza para incluir o excluir contenido específico en el origen de datos de la base de datos. | 
| primaryKey  | Proporciona la clave principal de la tabla de la base de datos. Esto identifica una tabla dentro de la base de datos. | 
| titleColumn | Proporciona el nombre de la columna del título del documento en la tabla de la base de datos. | 
| bodyColumn | Proporciona el nombre de la columna del título del documento en la tabla de la base de datos. | 
| sqlQuery | Introduce instrucciones de consulta SQL, como las operaciones SELECT y JOIN. Las consultas SQL deben tener menos de 32 KB. Amazon Kendra rastreará todo el contenido de la base de datos que coincida con su consulta. | 
| timestampColumn | Introduzca el nombre de la columna que contiene las marcas de tiempo. Amazon Kendra utiliza la información de la marca de tiempo para detectar cambios en el contenido y sincronizar solo el contenido modificado. | 
| timestampFormat | Introduce el nombre de la columna que contiene los formatos de marcas temporales que se deben utilizar para detectar cambios en el contenido y volver a sincronizar su contenido. | 
| timezone | Introduce el nombre de la columna que contiene las zonas horarias del contenido que se va a rastrear. | 
| changeDetectingColumns | Introduce los nombres de las columnas que Amazon Kendra se utilizarán para detectar cambios en el contenido. Amazon Kendra volverá a indexar el contenido cuando se produzca un cambio en alguna de estas columnas | 
| allowedUsersColumns | Introduzca el nombre de la columna que contiene el usuario IDs al que se le permitirá acceder al contenido. | 
| allowedGroupsColumn | Introduzca el nombre de la columna que contiene el usuario IDs al que se permitirá el acceso al contenido. | 
| fuente URIColumn | Introduzca el nombre de la columna que contiene la fuente que se URLs va a indexar. | 
| isSslEnabled | Introduce instrucciones de consulta SQL, como las operaciones SELECT y JOIN. Las consultas SQL deben tener menos de 32 KB. Amazon Kendra rastreará todo el contenido de la base de datos que coincida con su consulta. | 
| type | El tipo del origen de datos. Especifica JDBC como el tipo de origen de datos. | 
| syncMode |  Especifique cómo Amazon Kendra debe actualizarse el índice cuando cambie el contenido de la fuente de datos. Puede elegir entre las siguientes opciones: [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | 
| secretArn | El nombre de recurso de Amazon (ARN) de un secreto de Secrets Manager que contiene el nombre de usuario y la contraseña necesarios para conectarse a su base de datos. El secreto debe contener una estructura JSON con las siguientes claves: <pre>{<br />    "user name": "database user name",<br />    "password": "password"<br />}</pre> | 
| versión | La versión de la plantilla que se admite actualmente. | 

### Amazon RDS Esquema JSON (PostgreSQL)


```
{
  "$schema": "http://json-schema.org/draft-04/schema#",
  "type": "object",
  "properties": {
    "connectionConfiguration": {
      "type": "object",
      "properties": {
        "repositoryEndpointMetadata": {
          "type": "object",
          "properties": {
            "dbType": {
              "type": "string",
              "enum": [
                "mysql",
                "db2",
                "postgresql",
                "oracle",
                "sqlserver"
              ]
            },
            "dbHost": {
              "type": "string"
            },
            "dbPort": {
              "type": "string"
            },
            "dbInstance": {
              "type": "string"
            }
          },
          "required": [
            "dbType",
            "dbHost",
            "dbPort",
            "dbInstance"
          ]
        }
      },
      "required": [
        "repositoryEndpointMetadata"
      ]
    },
    "repositoryConfigurations": {
      "type": "object",
      "properties": {
        "document": {
          "type": "object",
          "properties": {
            "fieldMappings": {
              "type": "array",
              "items": [
                {
                  "type": "object",
                  "properties": {
                    "indexFieldName": {
                      "type": "string"
                    },
                    "indexFieldType": {
                      "type": "string"
                    },
                    "dataSourceFieldName": {
                      "type": "string"
                    }
                  },
                  "required": [
                    "indexFieldName",
                    "indexFieldType",
                    "dataSourceFieldName"
                  ]
                }
              ]
            }
          },
          "required": [
            "fieldMappings"
          ]
        }
      },
      "required": [
      ]
    },
    "additionalProperties": {
      "type": "object",
      "properties": {
        "primaryKey": {
          "type": "string"
        },
        "titleColumn": {
          "type": "string"
        },
        "bodyColumn": {
          "type": "string"
        },
        "sqlQuery": {
          "type": "string",
          "not": {
            "pattern": ";+"
          }
        },
        "timestampColumn": {
          "type": "string"
        },
        "timestampFormat": {
          "type": "string"
        },
        "timezone": {
          "type": "string"
        },
        "changeDetectingColumns": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "allowedUsersColumn": {
          "type": "string"
        },
        "allowedGroupsColumn": {
          "type": "string"
        },
        "sourceURIColumn": {
          "type": "string"
        },
        "isSslEnabled": {
          "type": "boolean"
        }
      },
      "required": ["primaryKey", "titleColumn", "bodyColumn", "sqlQuery"]
    },
    "type" : {
      "type" : "string",
      "pattern": "JDBC"
    },
    "syncMode": {
      "type": "string",
      "enum": [
        "FORCED_FULL_CRAWL",
        "FULL_CRAWL",
        "CHANGE_LOG"
      ]
    },
    "secretArn": {
      "type": "string"
    }
  },
  "version": {
    "type": "string",
    "anyOf": [
      {
        "pattern": "1.0.0"
      }
    ]
  },
  "required": [
      "connectionConfiguration",
      "repositoryConfigurations",
      "syncMode",
      "additionalProperties",
      "secretArn",
      "type"
  ]
}
```

## Amazon S3 esquema de plantilla


Incluye un JSON que contiene el esquema del origen de datos como parte de la configuración de la plantilla. Debe proporcionar el nombre del bucket de S3 como parte de la configuración de la conexión o de los detalles del punto de conexión del repositorio. Especifique también el tipo de origen de datos como `S3` y otras configuraciones necesarias. A continuación, especifique `TEMPLATE` como el `Type` cuando llame a [CreateDataSource](https://docs.aws.amazon.com/kendra/latest/APIReference/API_CreateDataSource.html).

Puede usar la plantilla que se proporciona en esta guía para desarrolladores. Consulte [Esquema JSON de S3](#s3-json).

En la siguiente tabla se describen los parámetros del esquema Amazon S3 JSON.


| Configuración | Description (Descripción) | 
| --- | --- | 
| connectionConfiguration | Información de configuración para el punto de conexión para el origen de datos. | 
| repositoryEndpointMetadata | La información del punto de conexión para el origen de datos. | 
| BucketName | El nombre de tu Amazon S3 depósito. | 
| repositoryConfigurations | Información de configuración del contenido del origen de datos. Por ejemplo, configurar tipos específicos de contenido y asignaciones de campos. | 
| additionalProperties | Opciones de configuración adicionales para el contenido del origen de datos | 
| [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html) | Una lista de patrones de expresiones regulares para incluir o excluir archivos específicos de la fuente Amazon S3 de datos. Los archivos que coinciden con los patrones se incluyen en el índice. Los archivos que no coincidan con los patrones se excluyen del índice. Si un archivo coincide con un patrón de inclusión y de exclusión, el patrón de exclusión tiene prioridad y el archivo no se incluye en el índice. | 
| aclConfigurationFileRuta | La ruta del archivo que controla el acceso a los documentos en un índice de Amazon Kendra . | 
| metadataFilesPrefix | La ubicación dentro del bucket para los archivos de metadatos. | 
| syncMode |  Especifique cómo Amazon Kendra debe actualizarse el índice cuando cambie el contenido de la fuente de datos. Puede elegir entre las siguientes opciones: [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | 
| type | El tipo del origen de datos. Especifica S3 como el tipo de origen de datos. | 
| versión | La versión de la plantilla admitida. | 

### Esquema JSON de S3


```
{
  "$schema": "http://json-schema.org/draft-04/schema#",
  "type": "object",
  "properties": {
    "connectionConfiguration": {
      "type": "object",
      "properties": {
        "repositoryEndpointMetadata": {
          "type": "object",
          "properties": {
            "BucketName": {
              "type": "string"
            }
          },
          "required": [
            "BucketName"
          ]
        }
      },
      "required": [
        "repositoryEndpointMetadata"
      ]
    },
    "repositoryConfigurations": {
      "type": "object",
      "properties": {
        "document": {
          "type": "object",
          "properties": {
            "fieldMappings": {
              "type": "array",
              "items": [
                {
                  "type": "object",
                  "properties": {
                    "indexFieldName": {
                      "type": "string"
                    },
                    "indexFieldType": {
                      "type": "string",
                      "enum": [
                        "STRING"
                      ]
                    },
                    "dataSourceFieldName": {
                      "type": "string"
                    }
                  },
                  "required": [
                    "indexFieldName",
                    "indexFieldType",
                    "dataSourceFieldName"
                  ]
                }
              ]
            }
          },
          "required": [
            "fieldMappings"
          ]
        }
      },
      "required": [
        "document"
      ]
    },
    "additionalProperties": {
      "type": "object",
      "properties": {
        "inclusionPatterns": {
          "type": "array"
        },
        "exclusionPatterns": {
          "type": "array"
        },
        "inclusionPrefixes": {
          "type": "array"
        },
        "exclusionPrefixes": {
          "type": "array"
        },
        "aclConfigurationFilePath": {
          "type": "string"
        },
        "metadataFilesPrefix": {
          "type": "string"
        }
      }
    },
    "syncMode": {
      "type": "string",
      "enum": [
        "FULL_CRAWL",
        "FORCED_FULL_CRAWL"
      ]
    },
    "type": {
      "type": "string",
      "pattern": "S3"
    },
    "version": {
      "type": "string",
      "anyOf": [
        {
          "pattern": "1.0.0"
        }
      ]
    }
  },
  "required": [
    "connectionConfiguration",
    "type",
    "syncMode",
    "repositoryConfigurations"
  ]
}
```

## Amazon Kendra Esquema de plantillas de Web Crawler


Incluye un JSON que contiene el esquema del origen de datos como parte del objeto [https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html](https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html).

Usted proporciona la semilla o el punto de partida URLs, o puede proporcionar el mapa del sitio URLs, como parte de la configuración de la conexión o de los detalles del punto final del repositorio. En lugar de enumerar todos sus archivos manualmente URLs, puede proporcionar la ruta al Amazon S3 depósito que almacena un archivo de texto para su lista de archivos XML iniciales URLs o de mapa del sitio, que puede agrupar en un archivo ZIP en S3.

Además, defina el tipo de origen de datos como `WEBCRAWLERV2`, las credenciales de autenticación del sitio web y el tipo de autenticación si sus sitios web requieren autenticación, además de otras configuraciones necesarias.

A continuación, especifique `TEMPLATE` como el `Type` cuando llame a [https://docs.aws.amazon.com/kendra/latest/dg/API_CreateDataSource.html](https://docs.aws.amazon.com/kendra/latest/dg/API_CreateDataSource.html).

**importante**  
La creación de conectores Web Crawler v2.0 no es compatible con. CloudFormation Utilice el conector Web Crawler v1.0 si necesita asistencia. CloudFormation 

*Al seleccionar los sitios web que se van a indexar, se debe respetar la [Política de uso aceptable de Amazon](https://aws.amazon.com/aup/) y todas las demás condiciones de Amazon. Recuerde que solo debe usar Amazon Kendra Web Crawler para indexar sus propias páginas web o páginas web para las que tenga autorización para indexar. Para obtener información sobre cómo impedir que el rastreador web de Amazon Kendra indexe sus sitios web, consulte [Configuración del `robots.txt` archivo para Web Crawler Amazon Kendra](stop-web-crawler.md).*

Puede usar la plantilla que se proporciona en esta guía para desarrolladores. Consulte [Amazon Kendra Esquema JSON de Web Crawler](#web-crawler-json).

En la siguiente tabla se describen los parámetros del esquema JSON del Amazon Kendra Web Crawler.


| Configuración | Description (Descripción) | 
| --- | --- | 
| connectionConfiguration | Información de configuración para el punto de conexión para el origen de datos. | 
| repositoryEndpointMetadata | La información del punto de conexión para el origen de datos. | 
| siteMapUrls | La lista de mapas URLs del sitio web que quieres rastrear. Puedes enumerar hasta tres mapas del sitio URLs. | 
| s3 SeedUrl | La ruta S3 al archivo de texto que almacena la lista de semillas o puntos de partida URLs. Por ejemplo, s3://bucket-name/directory/. Cada URL del archivo de texto debe estar formateada en una línea independiente. Puedes incluir hasta 100 semillas URLs en un archivo. | 
| s3 SiteMapUrl | La ruta S3 a los archivos XML de mapa del sitio. Por ejemplo, s3://bucket-name/directory/. Puede enumerar hasta tres archivos XML de mapa del sitio. Puedes agrupar varios archivos de mapa del sitio en un archivo ZIP y almacenar el archivo ZIP en tu Amazon S3 depósito. | 
| seedUrlConnections | La lista de semillas o el punto URLs de partida de los sitios web que quieres rastrear. Puedes enumerar hasta 100 semillas. URLs | 
| seedUrl | La URL semilla o de punto de partida. | 
| authentication | El tipo de autenticación si sus sitios web requieren la misma autenticación; en caso contrario, especifique NoAuthentication. | 
| repositoryConfigurations | Información de configuración del contenido del origen de datos. Por ejemplo, configurar tipos específicos de contenido y asignaciones de campos. | 
|  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | Lista de objetos que asignan los atributos o nombres de campo de sus páginas web y archivos de páginas web para Amazon Kendra indexar los nombres de los campos. Por ejemplo, la etiqueta de título de la página web HTML se puede asignar al campo de índice de \$1document\$1title. Para obtener más información, consulte [Asignación de campos de origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/field-mapping.html). | 
| syncMode |  Especifique cómo Amazon Kendra debe actualizarse el índice cuando cambie el contenido de la fuente de datos. Puede elegir entre las siguientes opciones: [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | 
| additionalProperties | Opciones de configuración adicionales para el contenido del origen de datos. | 
| rateLimit | El número máximo de URLs rastreados por servidor de sitio web por minuto. | 
| maxFileSize | Tamaño máximo (en MB) de una página web o un archivo adjunto que se van a rastrear. | 
| crawlDepth | El número de niveles desde la URL semilla que se va a rastrear. Por ejemplo, la página URL semilla tiene la profundidad 1 y todos los hipervínculos de esta página que también se rastreen tienen la profundidad 2. | 
| maxLinksPerURL | El número máximo de URLs páginas web que se debe incluir al rastrear un sitio web. Este número es por página web. A medida que se rastrean las páginas web de un sitio web, también se rastrean todas las páginas web a las URLs que estén vinculadas. URLs en una página web se rastrean por orden de aparición. | 
| crawlSubDomain | true para rastrear los dominios del sitio web con subdominios. Por ejemplo, si la URL semilla es “abc.example.com”, también se rastrearán “a.abc.example.com” y “b.abc.example.com”. Si no lo configuras crawlSubDomain ni crawlAllDomain lo hacestrue, Amazon Kendra solo rastreará los dominios de los sitios web que desees rastrear. | 
| crawlAllDomain | true para rastrear los dominios del sitio web con subdominios y otros dominios a los que enlazan las páginas web. Si no lo configuras crawlSubDomain ni crawlAllDomain lo hacestrue, Amazon Kendra solo rastreará los dominios de los sitios web que quieras rastrear. | 
| honorRobots | true para respetar las directivas de robots.txt de los sitios web que desea rastrear. Estas directivas controlan la forma en que Amazon Kendra Web Crawler rastrea los sitios web, ya sea que solo Amazon Kendra pueda rastrear contenido específico o no rastrear ningún contenido. | 
| crawlAttachments | true para rastrear los archivos a los que enlazan las páginas web. | 
|  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | Una lista de patrones de expresiones regulares que incluye el rastreo URLs e indexación de algunos hipervínculos de estas páginas web con URL. URLs Los que coincidan con los patrones se incluyen en el índice. URLs los que no coincidan con los patrones se excluyen del índice. Si una URL coincide con un patrón de exclusión y un patrón de inclusión, el patrón de exclusión tiene prioridad y la URL/páginas web del sitio web no se incluyen en el índice. | 
|  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | Una lista de patrones de expresiones regulares para evitar el rastreo de determinadas páginas web con URL URLs y la indexación de cualquier hipervínculo en ellas. URLs los que coincidan con los patrones se excluyen del índice. URLs los que no coincidan con los patrones se incluyen en el índice. Si una URL coincide con un patrón de exclusión y un patrón de inclusión, el patrón de exclusión tiene prioridad y la URL/páginas web del sitio web no se incluyen en el índice. | 
| inclusionFileIndexPatrones | Una lista de patrones de expresión regular para incluir determinados archivos de página web. Los archivos que coinciden con los patrones se incluyen en el índice. Los archivos que no coincidan con los patrones se excluyen del índice. Si un archivo coincide con un patrón de inclusión y de exclusión, el patrón de exclusión tiene prioridad y el archivo no se incluye en el índice. | 
| exclusionFileIndexPatrones | Una lista de patrones de expresión regular para excluir determinados archivos de página web. Los archivos que coinciden con los patrones se excluyen del índice. Los archivos que no coincidan con los patrones se incluyen en el índice. Si un archivo coincide con un patrón de inclusión y de exclusión, el patrón de exclusión tiene prioridad y el archivo no se incluye en el índice. | 
| implicitWaitDuration |  implicitWaitDuration especifica cuánto tiempo esperará el conector, en segundos, antes de rastrear una página web. Rango: 0-10  p. ej. "implicitWaitDuration«: «5"  | 
| proxy | Información de configuración necesaria para conectarse a sus sitios web internos a través de un proxy web. | 
| host | El nombre del host del servidor proxy que desea utilizar para conectarse a sitios web internos. Por ejemplo, el nombre de host de https://a.example.com/page1.html es “a.example.com”. | 
| port | El número de puerto del servidor proxy que desea utilizar para conectarse a sitios web internos. Por ejemplo, 443 es el puerto estándar para HTTPS. | 
| secretArn (proxy) | Si se requieren credenciales de proxy web para conectarse a un servidor de sitios web, puede crear un AWS Secrets Manager secreto que almacene las credenciales. Proporciona el nombre de recurso de Amazon (ARN) del secreto. | 
| type | El tipo del origen de datos. Especifica WEBCRAWLERV2 como el tipo de origen de datos. | 
| secretArn |  El nombre de recurso de Amazon (ARN) de un AWS Secrets Manager secreto que se utiliza si sus sitios web requieren autenticación para acceder a los sitios web. Las credenciales de autenticación del sitio web se almacenan en el secreto que contiene los pares clave-valor de JSON. Si utiliza Basic o NTLM/Kerberos, introduzca el nombre de usuario y la contraseña. Las claves JSON del secreto deben ser `userName` y `password`. El protocolo de autenticación NTLM incluye el hash de contraseñas y el protocolo de autenticación de Kerberos incluye el cifrado de contraseñas. Si utilizas la autenticación mediante SAML o mediante formulario, introduce el nombre de usuario y la contraseña, XPath para el campo de nombre de usuario (y el botón de nombre de usuario si utilizas SAML), XPaths para el campo y el botón de contraseña y la URL de la página de inicio de sesión. Las claves JSON del secreto deben ser `userName`, `password`, `userNameFieldXpath`, `userNameButtonXpath`, `passwordFieldXpath`, `passwordButtonXpath` y `loginPageUrl`. Puede encontrar los elementos XPaths (lenguaje de rutas XML) mediante las herramientas de desarrollo de su navegador web. XPaths suelen seguir este formato:`//tagname[@Attribute='Value']`. Amazon Kendra también comprueba si la información del punto final (semilla URLs) incluida en el secreto es la misma que la información del punto final especificada en los detalles de configuración del punto final de la fuente de datos.  | 
| versión | La versión de esta plantilla que se admite actualmente. | 

### Amazon Kendra Esquema JSON de Web Crawler


```
{
  "$schema": "http://json-schema.org/draft-04/schema#",
  "type": "object",
  "properties": {
    "connectionConfiguration": {
      "type": "object",
      "properties": {
        "repositoryEndpointMetadata": {
          "type": "object",
          "properties": {
            "siteMapUrls": {
              "type": "array",
              "items":{
                "type": "string",
                "pattern": "https://.*"
              }
            },
            "s3SeedUrl": {
              "type": "string",
              "pattern": "s3:.*"
            },
            "s3SiteMapUrl": {
              "type": "string",
              "pattern": "s3:.*"
            },
            "seedUrlConnections": {
              "type": "array",
              "items": [
                {
                  "type": "object",
                  "properties": {
                    "seedUrl":{
                      "type": "string",
                      "pattern": "https://.*"
                    }
                  },
                  "required": [
                    "seedUrl"
                  ]
                }
              ]
            },
            "authentication": {
              "type": "string",
              "enum": [
                "NoAuthentication",
                "BasicAuth",
                "NTLM_Kerberos",
                "Form",
                "SAML"
              ]
            }
          }
        }
      },
      "required": [
        "repositoryEndpointMetadata"
      ]
    },
    "repositoryConfigurations": {
      "type": "object",
      "properties": {
        "webPage": {
          "type": "object",
          "properties": {
            "fieldMappings": {
              "type": "array",
              "items": [
                {
                  "type": "object",
                  "properties": {
                    "indexFieldName": {
                      "type": "string"
                    },
                    "indexFieldType": {
                      "type": "string",
                      "enum": [
                        "STRING",
                        "DATE",
                        "LONG"
                      ]
                    },
                    "dataSourceFieldName": {
                      "type": "string"
                    },
                    "dateFieldFormat": {
                      "type": "string",
                      "pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
                    }
                  },
                  "required": [
                    "indexFieldName",
                    "indexFieldType",
                    "dataSourceFieldName"
                  ]
                }
              ]
            }
          },
          "required": [
            "fieldMappings"
          ]
        },
        "attachment": {
          "type": "object",
          "properties": {
            "fieldMappings": {
              "type": "array",
              "items": [
                {
                  "type": "object",
                  "properties": {
                    "indexFieldName": {
                      "type": "string"
                    },
                    "indexFieldType": {
                      "type": "string",
                      "enum": [
                        "STRING",
                        "DATE",
                        "LONG"
                      ]
                    },
                    "dataSourceFieldName": {
                      "type": "string"
                    },
                    "dateFieldFormat": {
                      "type": "string",
                      "pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
                    }
                  },
                  "required": [
                    "indexFieldName",
                    "indexFieldType",
                    "dataSourceFieldName"
                  ]
                }
              ]
            }
          },
          "required": [
            "fieldMappings"
          ]
        }
      }
    },
    "syncMode": {
      "type": "string",
      "enum": [
        "FORCED_FULL_CRAWL",
        "FULL_CRAWL"
      ]
    },
    "additionalProperties": {
      "type": "object",
      "properties": {
        "rateLimit": {
          "type": "string",
          "default": "300"
        },
        "maxFileSize": {
          "type": "string",
          "default": "50"
        },
        "crawlDepth": {
          "type": "string",
          "default": "2"
        },
        "maxLinksPerUrl": {
          "type": "string",
          "default": "100"
        },
        "crawlSubDomain": {
          "type": "boolean",
          "default": false
        },
        "crawlAllDomain": {
          "type": "boolean",
          "default": false
        },
        "honorRobots": {
          "type": "boolean",
          "default": false
        },
        "crawlAttachments": {
          "type": "boolean",
          "default": false
        },
        "inclusionURLCrawlPatterns": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "exclusionURLCrawlPatterns": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "inclusionURLIndexPatterns": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "exclusionURLIndexPatterns": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "inclusionFileIndexPatterns": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "exclusionFileIndexPatterns": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "proxy": {
          "type": "object",
          "properties": {
            "host": {
              "type": "string"
            },
            "port": {
              "type": "string"
            },
            "secretArn": {
              "type": "string",
              "minLength": 20,
              "maxLength": 2048
            }
          }
        }
      },
      "implicitWaitDuration":  {
          "type":"object",
          "properties": {
            "innerNumber" : {
              "type": "number",
              "minimum": 0,
              "maximum": 10
            }
          }
        },
      "required": [
        "rateLimit",
        "maxFileSize",
        "crawlDepth",
        "crawlSubDomain",
        "crawlAllDomain",
        "maxLinksPerUrl",
        "honorRobots"
      ]
    },
    "type": {
      "type": "string",
      "pattern": "WEBCRAWLERV2"
    },
    "secretArn": {
      "type": "string",
      "minLength": 20,
      "maxLength": 2048
    }
  },
  "version": {
    "type": "string",
    "anyOf": [
      {
        "pattern": "1.0.0"
      }
    ]
  },
  "required": [
    "connectionConfiguration",
    "repositoryConfigurations",
    "syncMode",
    "type",
    "additionalProperties"
  ]
}
```

## Esquema de plantilla de Confluence


Incluye un JSON que contiene el esquema del origen de datos como parte del objeto [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_TemplateConfiguration.html). Proporciona la URL del host de Confluence, el método de alojamiento y el tipo de autenticación como parte de la configuración de la conexión o de los detalles del punto de conexión del repositorio. Además, especifique el tipo de origen de datos como `CONFLUENCEV2`, un secreto para sus credenciales de autenticación y otras configuraciones necesarias. A continuación, especifique `TEMPLATE` como el `Type` cuando llame a [CreateDataSource](https://docs.aws.amazon.com/kendra/latest/APIReference/API_CreateDataSource.html).

Puede usar la plantilla que se proporciona en esta guía para desarrolladores. Consulte [Esquema JSON de Confluence](#confluence-json).

En la tabla siguiente se describen los parámetros del esquema JSON de Confluence.


| Configuración | Description (Descripción) | 
| --- | --- | 
| connectionConfiguration | Información de configuración para el punto de conexión para el origen de datos. | 
| repositoryEndpointMetadata | La información del punto de conexión para el origen de datos. | 
| hostUrl | La dirección URL de la instancia de Confluence. Por ejemplo, https://example.confluence.com. | 
| type | El método de alojamiento de su instancia de Confluence, ya sea SAAS o ON\$1PREM. | 
| authType | El método de autenticación de su instancia de Confluence, ya sea Basic, OAuth2 o Personal-token. | 
| repositoryConfigurations | Información de configuración del contenido del origen de datos. Por ejemplo, configurar tipos específicos de contenido y asignaciones de campos. | 
|  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | Una lista de objetos que asignan los atributos o los nombres de campo de tus espacios, páginas, blogs, comentarios y archivos adjuntos de Confluence para Amazon Kendra indexar los nombres de los campos. Para obtener más información, consulte [Mapping data source fields](https://docs.aws.amazon.com/kendra/latest/dg/field-mapping.html) (Asignación de campos de origen de datos). Los nombres de los campos del origen de datos de Confluence deben existir en sus metadatos personalizados de Confluence. | 
| additionalProperties | Opciones de configuración adicionales para el contenido del origen de datos. | 
| isCrawlAcl | Configure true para rastrear la información de la lista de control de acceso (ACL) para los documentos, si tiene una ACL y desea usarla para el control de acceso. Tenga en cuenta que la ACL especifica a qué documentos pueden acceder los usuarios y los grupos. La información de la ACL se utiliza para filtrar los resultados de búsqueda en función del acceso del usuario o su grupo a los documentos. Esto significa que si isCrawlACL está desactivado, los documentos se pueden buscar públicamente. Para obtener más información, consulte [Filtrado de contexto de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#context-filter-user-incl-datasources). | 
| fieldForUserID | Especifique email si desea utilizar el correo electrónico del usuario como ID de usuario. email se usa de forma predeterminada y actualmente es el único tipo de ID de usuario compatible. | 
| [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html) | Una lista de patrones de expresiones regulares para incluir y and/or excluir determinados archivos de la fuente de datos de Confluence. Los archivos que coinciden con los patrones se incluyen en el índice. Los archivos que no coincidan con los patrones se excluyen del índice. Si un archivo coincide con un patrón de inclusión y de exclusión, el patrón de exclusión tiene prioridad y el archivo no se incluye en el índice. | 
| proxyHost | El nombre de host del proxy web que utiliza, sin el protocolo http:// o https://. | 
|  proxyPort  | El número de puerto utilizado por el protocolo de transporte de URL del host. Debe ser un valor numérico entre 0 y 65535. | 
|  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | true para rastrear los archivos de sus espacios personales, páginas, blogs, comentarios de página, archivos adjuntos de página, comentarios de blog y archivos adjuntos de blog de Confluence. | 
| maxFileSizeInMegaBytes | Especifique el límite de tamaño del archivo MBs que Amazon Kendra se puede rastrear. Amazon Kendra rastrea solo los archivos dentro del límite de tamaño que usted defina. El tamaño de archivo predeterminado es de 50 MB. El tamaño máximo del archivo debe ser mayor que 0 MB y menor o igual que 50 MB. | 
| type | El tipo del origen de datos. Especifica CONFLUENCEV2 como el tipo de origen de datos. | 
| enableIdentityCrawler | trueutilizar el rastreador Amazon Kendra de identidad para sincronizar la identity/principal información sobre los usuarios y grupos con acceso a determinados documentos. Si el rastreador de identidades está desactivado, todos los documentos se pueden buscar públicamente. Si quiere usar el control de acceso para los documentos y el rastreador de identidades está desactivado, también puede usar la API [https://docs.aws.amazon.com/kendra/latest/dg/API_PutPrincipalMapping.html](https://docs.aws.amazon.com/kendra/latest/dg/API_PutPrincipalMapping.html) para cargar la información de acceso del usuario y del grupo. | 
| syncMode | Especifique cómo Amazon Kendra debe actualizarse el índice cuando cambie el contenido de la fuente de datos. Puede elegir entre las siguientes opciones: [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | 
| secretARN | El nombre de recurso de Amazon (ARN) de un AWS Secrets Manager secreto que contiene los pares clave-valor necesarios para conectarse a Confluence. Para obtener información sobre estos pares clave-valor, consulte [Instrucciones de conexión de Confluence](https://docs.aws.amazon.com/kendra/latest/dg/data-source-v2-confluence.html#data-source-procedure-v2-confluence). | 
| versión | La versión de esta plantilla que se admite actualmente. | 

### Esquema JSON de Confluence


```
{
  "$schema": "http://json-schema.org/draft-04/schema#",
  "type": "object",
  "properties": {
    "connectionConfiguration": {
      "type": "object",
      "properties": {
        "repositoryEndpointMetadata": {
          "type": "object",
          "properties": {
            "hostUrl": {
              "type": "string",
              "pattern": "https:.*"
            },
            "type": {
              "type": "string",
              "enum": [
                "SAAS",
                "ON_PREM"
              ]
            },
            "authType": {
              "type": "string",
              "enum": [
                "Basic",
                "OAuth2",
                "Personal-token"
              ]
            }
          },
          "required": [
            "hostUrl",
            "type",
            "authType"
          ]
        }
      },
      "required": [
        "repositoryEndpointMetadata"
      ]
    },
    "repositoryConfigurations": {
      "type": "object",
      "properties": {
        "space": {
          "type": "object",
          "properties": {
            "fieldMappings": {
              "type": "array",
              "items": [
                {
                  "type": "object",
                  "properties": {
                    "indexFieldName": {
                      "type": "string"
                    },
                    "indexFieldType": {
                      "type": "string",
                      "enum": [
                        "STRING",
                        "STRING_LIST",
                        "DATE"
                      ]
                    },
                    "dataSourceFieldName": {
                      "type": "string"
                    },
                    "dateFieldFormat": {
                      "type": "string",
                      "pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
                    }
                  },
                  "required": [
                    "indexFieldName",
                    "indexFieldType",
                    "dataSourceFieldName"
                  ]
                }
              ]
            }
          },
          "required": [
            "fieldMappings"
          ]
        },
        "page": {
          "type": "object",
          "properties": {
            "fieldMappings": {
              "type": "array",
              "items": [
                {
                  "type": "object",
                  "properties": {
                    "indexFieldName": {
                      "type": "string"
                    },
                    "indexFieldType": {
                      "type": "string",
                      "enum": [
                        "STRING",
                        "STRING_LIST",
                        "DATE",
                        "LONG"
                      ]
                    },
                    "dataSourceFieldName": {
                      "type": "string"
                    },
                    "dateFieldFormat": {
                      "type": "string",
                      "pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
                    }
                  },
                  "required": [
                    "indexFieldName",
                    "indexFieldType",
                    "dataSourceFieldName"
                  ]
                }
              ]
            }
          },
          "required": [
            "fieldMappings"
          ]
        },
        "blog": {
          "type": "object",
          "properties": {
            "fieldMappings": {
              "type": "array",
              "items": [
                {
                  "type": "object",
                  "properties": {
                    "indexFieldName": {
                      "type": "string"
                    },
                    "indexFieldType": {
                      "type": "string",
                      "enum": [
                        "STRING",
                        "STRING_LIST",
                        "DATE",
                        "LONG"
                      ]
                    },
                    "dataSourceFieldName": {
                      "type": "string"
                    },
                    "dateFieldFormat": {
                      "type": "string",
                      "pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
                    }
                  },
                  "required": [
                    "indexFieldName",
                    "indexFieldType",
                    "dataSourceFieldName"
                  ]
                }
              ]
            }
          },
          "required": [
            "fieldMappings"
          ]
        },
        "comment": {
          "type": "object",
          "properties": {
            "fieldMappings": {
              "type": "array",
              "items": [
                {
                  "type": "object",
                  "properties": {
                    "indexFieldName": {
                      "type": "string"
                    },
                    "indexFieldType": {
                      "type": "string",
                      "enum": [
                        "STRING",
                        "STRING_LIST",
                        "DATE",
                        "LONG"
                      ]
                    },
                    "dataSourceFieldName": {
                      "type": "string"
                    },
                    "dateFieldFormat": {
                      "type": "string",
                      "pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
                    }
                  },
                  "required": [
                    "indexFieldName",
                    "indexFieldType",
                    "dataSourceFieldName"
                  ]
                }
              ]
            }
          },
          "required": [
            "fieldMappings"
          ]
        },
        "attachment": {
          "type": "object",
          "properties": {
            "fieldMappings": {
              "type": "array",
              "items": [
                {
                  "type": "object",
                  "properties": {
                    "indexFieldName": {
                      "type": "string"
                    },
                    "indexFieldType": {
                      "type": "string",
                      "enum": [
                        "STRING",
                        "STRING_LIST",
                        "DATE",
                        "LONG"
                      ]
                    },
                    "dataSourceFieldName": {
                      "type": "string"
                    },
                    "dateFieldFormat": {
                      "type": "string",
                      "pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
                    }
                  },
                  "required": [
                    "indexFieldName",
                    "indexFieldType",
                    "dataSourceFieldName"
                  ]
                }
              ]
            }
          },
          "required": [
            "fieldMappings"
          ]
        }
      }
    },
    "additionalProperties": {
      "type": "object",
      "properties": {
        "usersAclS3FilePath": {
          "type": "string"
        },
        "isCrawlAcl": {
          "type": "boolean"
        },
        "fieldForUserId": {
          "type": "string"
        },
        "inclusionSpaceKeyFilter": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "exclusionSpaceKeyFilter": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "pageTitleRegEX": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "blogTitleRegEX": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "commentTitleRegEX": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "attachmentTitleRegEX": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "isCrawlPersonalSpace": {
          "type": "boolean"
        },
        "isCrawlArchivedSpace": {
          "type": "boolean"
        },
        "isCrawlArchivedPage": {
          "type": "boolean"
        },
        "isCrawlPage": {
          "type": "boolean"
        },
        "isCrawlBlog": {
          "type": "boolean"
        },
        "isCrawlPageComment": {
          "type": "boolean"
        },
        "isCrawlPageAttachment": {
          "type": "boolean"
        },
        "isCrawlBlogComment": {
          "type": "boolean"
        },
        "isCrawlBlogAttachment": {
          "type": "boolean"
        },
        "maxFileSizeInMegaBytes":  {
          "type":"string"
        },
        "inclusionFileTypePatterns": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "exclusionFileTypePatterns": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "inclusionUrlPatterns": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "exclusionUrlPatterns": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "proxyHost": {
          "type": "string"
        },
        "proxyPort": {
          "type": "string"
        }
      },
      "required": []
    },
    "type": {
      "type": "string",
      "pattern": "CONFLUENCEV2"
    },
    "enableIdentityCrawler": {
      "type": "boolean"
    },
    "syncMode": {
      "type": "string",
      "enum": [
        "FULL_CRAWL",
        "FORCED_FULL_CRAWL"
      ]
    },
    "secretArn": {
      "type": "string",
      "minLength": 20,
      "maxLength": 2048
    }
  },
  "version": {
    "type": "string",
    "anyOf": [
      {
        "pattern": "1.0.0"
      }
    ]
  },
  "required": [
    "connectionConfiguration",
    "repositoryConfigurations",
    "syncMode",
    "additionalProperties",
    "secretArn",
    "type"
  ]
}
```

## Esquema de plantilla de Dropbox


Incluye un JSON que contiene el esquema del origen de datos como parte del objeto [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_TemplateConfiguration.html). Proporciona la clave de la aplicación, el secreto de la aplicación y el token de acceso de Dropbox como parte del secreto que almacena sus credenciales de autenticación. Especifica también el tipo de origen de datos como `DROPBOX`, el tipo de token de acceso que quiere usar (temporal o permanente) y otras configuraciones necesarias. A continuación, especifique `TEMPLATE` como el `Type` cuando llame a [CreateDataSource](https://docs.aws.amazon.com/kendra/latest/APIReference/API_CreateDataSource.html).

Puede usar la plantilla que se proporciona en esta guía para desarrolladores. Consulte [Esquema JSON de Dropbox](#dropbox-json).

En la tabla siguiente se describen los parámetros del esquema JSON de Dropbox.


| Configuración | Description (Descripción) | 
| --- | --- | 
| connectionConfiguration | Información de configuración para el punto de conexión para el origen de datos. | 
| repositoryEndpointMetadata | La información del punto de conexión para el origen de datos. Este origen de datos no especifica un punto de conexión en repositoryEndpointMetadata. Por el contrario, la información de conexión se incluye en un AWS Secrets Manager secreto que tú proporcionas. secretArn | 
| repositoryConfigurations | Información de configuración del contenido del origen de datos. Por ejemplo, configurar tipos específicos de contenido y asignaciones de campos. | 
|  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | Una lista de objetos que mapean los atributos o los nombres de campo de tus archivos de Dropbox, Dropbox Paper y atajos para Amazon Kendra indexar los nombres de los campos. Para obtener más información, consulte [Asignación de campos de origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/field-mapping.html). | 
| syncMode |  Especifica cómo Amazon Kendra debes actualizar tu índice cuando cambie el contenido de la fuente de datos. Puede elegir entre las siguientes opciones: [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | 
| enableIdentityCrawler | trueutilizar el rastreador Amazon Kendra de identidad para sincronizar la identity/principal información sobre los usuarios y grupos con acceso a determinados documentos. Si el rastreador de identidades está desactivado, todos los documentos se pueden buscar públicamente. Si quiere usar el control de acceso para los documentos y el rastreador de identidades está desactivado, también puede usar la API [https://docs.aws.amazon.com/kendra/latest/dg/API_PutPrincipalMapping.html](https://docs.aws.amazon.com/kendra/latest/dg/API_PutPrincipalMapping.html) para cargar la información de acceso del usuario y del grupo. | 
| secretARN | El nombre de recurso de Amazon (ARN) de un AWS Secrets Manager secreto que contiene los pares clave-valor necesarios para conectarse a tu Dropbox. El secreto debe contener una estructura JSON con las siguientes claves: <pre>{<br />    "appKey": "Dropbox app key",<br />    "appSecret": "Dropbox app secret",<br />    "accesstoken": "temporary access token or refresh access token"<br />}</pre> | 
| additionalProperties | Opciones de configuración adicionales para el contenido del origen de datos. | 
| isCrawlAcl | true para rastrear la información de la lista de control de acceso (ACL) para los documentos, si tiene una ACL y desea usarla para el control de acceso. La ACL especifica a qué documentos pueden acceder los usuarios y los grupos. La información de la ACL se utiliza para filtrar los resultados de búsqueda en función del acceso del usuario o su grupo a los documentos. Para obtener más información, consulte [Filtrado de contexto de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#context-filter-user-incl-datasources). | 
|  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | Una lista de patrones de expresión regular para incluir determinados nombres y tipos de archivo en su origen de datos de Dropbox. Los archivos que coinciden con los patrones se incluyen en el índice. Los archivos que no coincidan con los patrones se excluyen del índice. Si un archivo coincide con un patrón de inclusión y de exclusión, el patrón de exclusión tiene prioridad y el archivo no se incluye en el índice. | 
|  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | Una lista de patrones de expresión regular para excluir determinados nombres y tipos de archivo en su origen de datos de Dropbox. Los archivos que coinciden con los patrones se excluyen del índice. Los archivos que no coincidan con los patrones se incluyen en el índice. Si un archivo coincide con un patrón de exclusión y de inclusión, el patrón de exclusión tiene prioridad y el archivo no se incluye en el índice. | 
|  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | true para rastrear los archivos de su Dropbox, los documentos de Dropbox Paper, las plantillas de Dropbox Paper y los accesos directos a páginas web almacenados en su Dropbox. | 
| type | El tipo del origen de datos. Especifica DROPBOX como el tipo de origen de datos. | 
| tokenType | Especifica el tipo de token de acceso: token de acceso permanente o temporal. Se recomienda crear un token de acceso actualizado que no caduque nunca en Dropbox, en lugar de utilizar un token de acceso único que caduca a las 4 horas. Debe crear una aplicación y un token de acceso de actualización en la consola para desarrolladores de Dropbox y proporcionar el token de acceso en su secreto. | 
| versión | La versión de esta plantilla que se admite actualmente. | 

### Esquema JSON de Dropbox


```
{
  "$schema": "http://json-schema.org/draft-04/schema#",
  "type": "object",
  "properties": {
    "connectionConfiguration": {
      "type": "object",
      "properties": {
        "repositoryEndpointMetadata": {
          "type": "object",
          "properties": {
          }
        }
      },
      "required": [
        "repositoryEndpointMetadata"
      ]
    },
    "repositoryConfigurations": {
      "type": "object",
      "properties": {
        "file": {
          "type": "object",
          "properties": {
            "fieldMappings": {
              "type": "array",
              "items": {
                "anyOf": [
                  {
                    "type": "object",
                    "properties": {
                      "indexFieldName": {
                        "type": "string"
                      },
                      "indexFieldType": {
                        "type": "string",
                        "enum": [
                          "STRING",
                          "STRING_LIST",
                          "LONG",
                          "DATE"
                        ]
                      },
                      "dataSourceFieldName": {
                        "type": "string"
                      },
                      "dateFieldFormat": {
                        "type": "string",
                        "pattern": "dd-MM-yyyy HH:mm:ss"
                      }
                    },
                    "required": [
                      "indexFieldName",
                      "indexFieldType",
                      "dataSourceFieldName"
                    ]
                  }
                ]
              }
            }
          },
          "required": [
            "fieldMappings"
          ]
        },
        "paper": {
          "type": "object",
          "properties": {
            "fieldMappings": {
              "type": "array",
              "items": {
                "anyOf": [
                  {
                    "type": "object",
                    "properties": {
                      "indexFieldName": {
                        "type": "string"
                      },
                      "indexFieldType": {
                        "type": "string",
                        "enum": [
                          "STRING",
                          "STRING_LIST",
                          "LONG",
                          "DATE"
                        ]
                      },
                      "dataSourceFieldName": {
                        "type": "string"
                      },
                      "dateFieldFormat": {
                        "type": "string",
                        "pattern": "dd-MM-yyyy HH:mm:ss"
                      }
                    },
                    "required": [
                      "indexFieldName",
                      "indexFieldType",
                      "dataSourceFieldName"
                    ]
                  }
                ]
              }
            }
          },
          "required": [
            "fieldMappings"
          ]
        },
        "papert": {
          "type": "object",
          "properties": {
            "fieldMappings": {
              "type": "array",
              "items": {
                "anyOf": [
                  {
                    "type": "object",
                    "properties": {
                      "indexFieldName": {
                        "type": "string"
                      },
                      "indexFieldType": {
                        "type": "string",
                        "enum": [
                          "STRING",
                          "STRING_LIST",
                          "LONG",
                          "DATE"
                        ]
                      },
                      "dataSourceFieldName": {
                        "type": "string"
                      },
                      "dateFieldFormat": {
                        "type": "string",
                        "pattern": "dd-MM-yyyy HH:mm:ss"
                      }
                    },
                    "required": [
                      "indexFieldName",
                      "indexFieldType",
                      "dataSourceFieldName"
                    ]
                  }
                ]
              }
            }
          },
          "required": [
            "fieldMappings"
          ]
        },
        "shortcut": {
          "type": "object",
          "properties": {
            "fieldMappings": {
              "type": "array",
              "items": {
                "anyOf": [
                  {
                    "type": "object",
                    "properties": {
                      "indexFieldName": {
                        "type": "string"
                      },
                      "indexFieldType": {
                        "type": "string",
                        "enum": [
                          "STRING",
                          "STRING_LIST",
                          "LONG",
                          "DATE"
                        ]
                      },
                      "dataSourceFieldName": {
                        "type": "string"
                      },
                      "dateFieldFormat": {
                        "type": "string",
                        "pattern": "dd-MM-yyyy HH:mm:ss"
                      }
                    },
                    "required": [
                      "indexFieldName",
                      "indexFieldType",
                      "dataSourceFieldName"
                    ]
                  }
                ]
              }
            }
          },
          "required": [
            "fieldMappings"
          ]
        }
      }
    },
    "syncMode": {
      "type": "string",
      "enum": [
        "FULL_CRAWL",
        "FORCED_FULL_CRAWL",
        "CHANGE_LOG"
      ]
    },
    "enableIdentityCrawler": {
      "type": "boolean"
    },
    "secretArn": {
      "type": "string"
    },
    "additionalProperties": {
      "type": "object",
      "properties": {
        "isCrawlAcl": {
          "type": "boolean"
        },
        "inclusionFileNamePatterns": {
          "type": "array"
        },
        "exclusionFileNamePatterns": {
          "type": "array"
        },
        "inclusionFileTypePatterns": {
          "type": "array"
        },
        "exclusionFileTypePatterns": {
          "type": "array"
        },
        "crawlFile": {
          "type": "boolean"
        },
        "crawlPaper": {
          "type": "boolean"
        },
        "crawlPapert": {
          "type": "boolean"
        },
        "crawlShortcut": {
          "type": "boolean"
        }
      }
    },
    "type": {
      "type": "string",
      "pattern": "DROPBOX"
    },
    "tokenType": {
      "type": "string",
      "enum": [
        "PERMANENT",
        "TEMPORARY"
      ]
    },
    "version": {
      "type": "string",
      "anyOf": [
        {
          "pattern": "1.0.0"
        }
      ]
    }
  },
  "additionalProperties": false,
  "required": [
    "connectionConfiguration",
    "repositoryConfigurations",
    "additionalProperties",
    "syncMode",
    "enableIdentityCrawler",
    "secretArn",
    "type",
    "tokenType"
  ]
}
```

## Esquema de plantilla de Drupal


Incluye un JSON que contiene el esquema del origen de datos como parte del objeto [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html). Debe proporcionar la URL del host de Drupal y el tipo de autenticación como parte de la configuración de la conexión o de los detalles del punto de conexión del repositorio. Especifique también el tipo de origen de datos como DRUPAL, un secreto para sus credenciales de autenticación y otras configuraciones necesarias. A continuación, especifique `TEMPLATE` como el `Type` cuando llame a [CreateDataSource](https://docs.aws.amazon.com/kendra/latest/dg/API_CreateDataSource.html).

Puede usar la plantilla que se proporciona en esta guía para desarrolladores. Consulte [Esquema JSON de Drupal](#drupal-json).

En la tabla siguiente se describen los parámetros del esquema JSON de Drupal.


| Configuración | Description (Descripción) | 
| --- | --- | 
| connectionConfiguration | Información de configuración para el punto de conexión para el origen de datos. | 
| repositoryEndpointMetadata | La información del punto de conexión para el origen de datos. | 
| hostUrl | La URL del host de su sitio web de Drupal. Por ejemplo, https://<hostname>/<drupalsitename>. | 
| repositoryConfigurations | Información de configuración del contenido del origen de datos. | 
|  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | Una lista de objetos que asignan los atributos o los nombres de campo de sus archivos de Drupal. Para obtener más información, consulte [Asignación de campos de origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/field-mapping.html). Los nombres de los campos del origen de datos de Drupal deben existir en los metadatos personalizados de Drupal. | 
| additionalProperties | Opciones de configuración adicionales para el contenido del origen de datos. | 
|  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html) | Una lista de patrones de expresión regular para incluir determinados archivos en su origen de datos de Drupal. Los archivos que coinciden con los patrones se incluyen en el índice. Los archivos que no coincidan con los patrones se excluyen del índice. Si un archivo coincide con un patrón de inclusión y de exclusión, el patrón de exclusión tiene prioridad y el archivo no se incluye en el índice. | 
|  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html) | Una lista de patrones de expresión regular para excluir determinados archivos en su origen de datos de Drupal. Los archivos que coinciden con los patrones se excluyen del índice. Los archivos que no coincidan con los patrones se incluyen en el índice. Si un archivo coincide con un patrón de exclusión y de inclusión, el patrón de exclusión tiene prioridad y el archivo no se incluye en el índice. | 
| contentDefinitions[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | Especifica los tipos de contenido que desea rastrear y si desea rastrear los comentarios y los archivos adjuntos de los tipos de contenido seleccionados. | 
| type | El tipo del origen de datos. Especifica DRUPAL como el tipo de origen de datos. | 
| authType | El tipo de autenticación que utiliza, ya sea BASIC-AUTH o OAUTH2. | 
| syncMode |  Especifique cómo Amazon Kendra debe actualizarse el índice cuando cambie el contenido de la fuente de datos. Puede elegir entre las siguientes opciones: [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | 
| enableIdentityCrawler | trueutilizar el rastreador Amazon Kendra de identidad para sincronizar la identity/principal información sobre los usuarios y grupos con acceso a determinados documentos. Si el rastreador de identidades está desactivado, todos los documentos se pueden buscar públicamente. Si quiere usar el control de acceso para los documentos y el rastreador de identidades está desactivado, también puede usar la API [https://docs.aws.amazon.com/kendra/latest/dg/API_PutPrincipalMapping.html](https://docs.aws.amazon.com/kendra/latest/dg/API_PutPrincipalMapping.html) para cargar la información de acceso del usuario y del grupo. | 
| secretARN | El nombre de recurso de Amazon (ARN) de un AWS Secrets Manager secreto que contiene los pares clave-valor necesarios para conectarse a tu Drupal. El secreto debe contener una estructura JSON con las siguientes claves: **Si utiliza la autenticación básica:**<pre>{<br />    "username": "user name",<br />    "passwords": "password"<br />}</pre> **Si utilizas la autenticación 2.0: OAuth **<pre>{<br />    "username": "user name",<br />    "password": "password",<br />    "clientId": "client id",<br />    "clientSecret": "client secret"<br />}</pre>  | 
| versión | La versión de esta plantilla que se admite actualmente. | 

### Esquema JSON de Drupal


```
{
	"$schema": "http://json-schema.org/draft-04/schema#",
	"type": "object",
	"properties": {
		"connectionConfiguration": {
			"type": "object",
			"properties": {
				"repositoryEndpointMetadata": {
					"type": "object",
					"properties": {
						"hostUrl": {
							"type": "string",
							"pattern": "https:.*"
						}
					},
					"required": [
						"hostUrl"
					]
				}
			},
			"required": [
				"repositoryEndpointMetadata"
			]
		},
		"repositoryConfigurations": {
			"type": "object",
			"properties": {
				"content": {
					"type": "object",
					"properties": {
						"fieldMappings": {
							"type": "array",
							"items": [
								{
									"type": "object",
									"properties": {
										"indexFieldName": {
											"type": "string"
										},
										"indexFieldType": {
											"type": "string",
											"enum": [
												"STRING",
												"DATE"
											]
										},
										"dataSourceFieldName": {
											"type": "string"
										},
										"dateFieldFormat": {
											"type": "string",
											"pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
										}
									},
									"required": [
										"indexFieldName",
										"indexFieldType",
										"dataSourceFieldName"
									]
								}
							]
						}
					},
					"required": [
						"fieldMappings"
					]
				},
				"comment": {
					"type": "object",
					"properties": {
						"fieldMappings": {
							"type": "array",
							"items": [
								{
									"type": "object",
									"properties": {
										"indexFieldName": {
											"type": "string"
										},
										"indexFieldType": {
											"type": "string",
											"enum": [
												"STRING",
												"DATE"
											]
										},
										"dataSourceFieldName": {
											"type": "string"
										},
										"dateFieldFormat": {
											"type": "string",
											"pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
										}
									},
									"required": [
										"indexFieldName",
										"indexFieldType",
										"dataSourceFieldName"
									]
								}
							]
						}
					},
					"required": [
						"fieldMappings"
					]
				},
				"attachment": {
					"type": "object",
					"properties": {
						"fieldMappings": {
							"type": "array",
							"items": [
								{
									"type": "object",
									"properties": {
										"indexFieldName": {
											"type": "string"
										},
										"indexFieldType": {
											"type": "string",
											"enum": [
												"STRING",
												"DATE"
											]
										},
										"dataSourceFieldName": {
											"type": "string"
										},
										"dateFieldFormat": {
											"type": "string",
											"pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
										}
									},
									"required": [
										"indexFieldName",
										"indexFieldType",
										"dataSourceFieldName"
									]
								}
							]
						}
					},
					"required": [
						"fieldMappings"
					]
				}
			}
		},
		"additionalProperties": {
			"type": "object",
			"properties": {
				"isCrawlArticle": {
					"type": "boolean"
				},
				"isCrawlBasicPage": {
					"type": "boolean"
				},
				"isCrawlBasicBlock": {
					"type": "boolean"
				},
				"crawlCustomContentTypesList": {
					"type": "array",
					"items": {
						"type": "string"
					}
				},
				"crawlCustomBlockTypesList": {
					"type": "array",
					"items": {
						"type": "string"
					}
				},
				"filePath": {
					"anyOf": [
						{
							"type": "string",
							"pattern": "s3:.*"
						},
						{
							"type": "string",
							"pattern": ""
						}
					]
				},
				"inclusionFileNamePatterns": {
					"type": "array",
					"items": {
						"type": "string"
					}
				},
				"exclusionFileNamePatterns": {
					"type": "array",
					"items": {
						"type": "string"
					}
				},
				"articleTitleInclusionPatterns": {
					"type": "array",
					"items": {
						"type": "string"
					}
				},
				"articleTitleExclusionPatterns": {
					"type": "array",
					"items": {
						"type": "string"
					}
				},
				"pageTitleInclusionPatterns": {
					"type": "array",
					"items": {
						"type": "string"
					}
				},
				"pageTitleExclusionPatterns": {
					"type": "array",
					"items": {
						"type": "string"
					}
				},
				"customContentTitleInclusionPatterns": {
					"type": "array",
					"items": {
						"type": "string"
					}
				},
				"customContentTitleExclusionPatterns": {
					"type": "array",
					"items": {
						"type": "string"
					}
				},
				"basicBlockTitleInclusionPatterns": {
					"type": "array",
					"items": {
						"type": "string"
					}
				},
				"basicBlockTitleExclusionPatterns": {
					"type": "array",
					"items": {
						"type": "string"
					}
				},
				"customBlockTitleInclusionPatterns": {
					"type": "array",
					"items": {
						"type": "string"
					}
				},
				"customBlockTitleExclusionPatterns": {
					"type": "array",
					"items": {
						"type": "string"
					}
				},
				"contentDefinitions": {
					"type": "array",
					"items": {
						"properties": {
							"contentType": {
								"type": "string"
							},
							"fieldDefinition": {
								"type": "array",
								"items": [
									{
										"type": "object",
										"properties": {
											"machineName": {
												"type": "string"
											},
											"type": {
												"type": "string"
											}
										},
										"required": [
											"machineName",
											"type"
										]
									}
								]
							},
							"isCrawlComments": {
								"type": "boolean"
							},
							"isCrawlFiles": {
								"type": "boolean"
							}
						}
					},
					"required": [
						"contentType",
						"fieldDefinition",
						"isCrawlComments",
						"isCrawlFiles"
					]
				}
			},
			"required": []
		},
		"type": {
			"type": "string",
			"pattern": "DRUPAL"
		},
		"authType": {
			"type": "string",
			"enum": [
				"BASIC-AUTH",
				"OAUTH2"
			]
		},
		"syncMode": {
			"type": "string",
			"enum": [
				"FORCED_FULL_CRAWL",
				"FULL_CRAWL",
				"CHANGE_LOG"
			]
		},
		"enableIdentityCrawler": {
			"type": "boolean"
		},
		"secretArn": {
			"type": "string",
			"minLength": 20,
			"maxLength": 2048
		}
	},
	"version": {
		"type": "string",
		"anyOf": [
			{
				"pattern": "1.0.0"
			}
		]
	},
	"required": [
		"connectionConfiguration",
		"repositoryConfigurations",
		"syncMode",
		"additionalProperties",
		"secretArn",
		"type"
	]
}
```

## GitHub esquema de plantilla


Incluye un JSON que contiene el esquema del origen de datos como parte del objeto [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html). Debe proporcionar la URL del GitHub host, el nombre de la organización y si utiliza la GitHub GitHub nube o de forma local como parte de la configuración de la conexión o de los detalles del punto final del repositorio. Especifique también el tipo de origen de datos como `GITHUB`, un secreto para sus credenciales de autenticación y otras configuraciones necesarias. A continuación, especifique `TEMPLATE` como el `Type` cuando llame a [CreateDataSource](https://docs.aws.amazon.com/kendra/latest/dg/API_CreateDataSource.html).

Puede usar la plantilla que se proporciona en esta guía para desarrolladores. Consulte [GitHub Esquema JSON](#github-json).

En la siguiente tabla se describen los parámetros del esquema GitHub JSON.


| Configuración | Description (Descripción) | 
| --- | --- | 
| connectionConfiguration | Información de configuración para el punto de conexión para el origen de datos. | 
| repositoryEndpointMetadata | La información del punto de conexión para el origen de datos. | 
| type | Especifique el tipo, ya sea SAAS u ON\$1PREMISE. | 
| hostUrl | La URL del GitHub host. Por ejemplo, si utiliza GitHub SaaS/Enterprise Cloud:. https://api.github.com O, si usa un servidor GitHub local o empresarial:. https://on-prem-host-url/api/v3/ | 
| organizationName | Puede encontrar el nombre de su organización al iniciar sesión en el GitHub escritorio y ir a Sus organizaciones en el menú desplegable de su imagen de perfil. | 
| repositoryConfigurations | Información de configuración del contenido del origen de datos. Por ejemplo, configurar tipos específicos de contenido y asignaciones de campos. | 
|  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | Una lista de objetos que asignan los atributos o los nombres de campo del GitHub contenido para Amazon Kendra indexar los nombres de los campos. Para obtener más información, consulte [Asignación de campos de origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/field-mapping.html). | 
| additionalProperties | Opciones de configuración adicionales para el contenido del origen de datos. | 
| isCrawlAcl | true para rastrear la información de la lista de control de acceso (ACL) para los documentos, si tiene una ACL y desea usarla para el control de acceso. La ACL controla los documentos a los que los usuarios y los grupos pueden acceder y que pueden buscar. La información de la ACL se utiliza para filtrar los resultados de búsqueda en función del acceso del usuario o su grupo a los documentos. Para obtener más información, consulte [Filtrado de contexto de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#context-filter-user-incl-datasources). | 
| fieldForUserID | Especifique el tipo de ID de usuario que desea usar para el rastreo de las ACL. Especifique email si desea usar el correo electrónico del usuario como ID de usuario o username si desea usar el nombre de usuario como ID de usuario. Si no especifica una opción, se utiliza email como valor predeterminado. | 
| repositoryFilter | Una lista de nombres de repositorios específicos y nombres de ramas que desea indexar. | 
| crawlRepository | true para rastrear repositorios. | 
| crawlRepositoryDocuments | true para rastrear documentos del repositorio. | 
| crawlIssue | true para rastrear problemas. | 
| crawlIssueComment | true para rastrear comentarios de los problemas. | 
| crawlIssueCommentAdjunto | true para rastrear archivos adjuntos de comentarios de los problemas. | 
| crawlPullRequest | true para rastrear solicitudes de extracción. | 
| crawlPullRequestComentario | true para rastrear comentarios de solicitudes de extracción. | 
| crawlPullRequestCommentAttachment | true para rastrear archivos adjuntos de comentarios de solicitudes de extracción. | 
|  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | Una lista de patrones de expresiones regulares para incluir cierto contenido en la fuente GitHub de datos. El contenido que coincide con los patrones se incluye en el índice. El contenido que no coincide con los patrones se excluye del índice. Si algún contenido coincide con un patrón de inclusión y de exclusión, el patrón de exclusión tiene prioridad y el contenido no se incluye en el índice. | 
|  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | Una lista de patrones de expresiones regulares para excluir cierto contenido de la fuente GitHub de datos. El contenido que coincide con los patrones se excluye del índice. El contenido que no coincide con los patrones se incluye en el índice. Si algún contenido coincide con un patrón de inclusión y de exclusión, el patrón de exclusión tiene prioridad y el contenido no se incluye en el índice. | 
| type | El tipo del origen de datos. Especifica GITHUB como el tipo de origen de datos. | 
| enableIdentityCrawler | trueutilizar el rastreador Amazon Kendra de identidad para sincronizar la identity/principal información sobre los usuarios y grupos con acceso a determinados documentos. Si el rastreador de identidades está desactivado, todos los documentos se pueden buscar públicamente. Si quiere usar el control de acceso para los documentos y el rastreador de identidades está desactivado, también puede usar la API [https://docs.aws.amazon.com/kendra/latest/dg/API_PutPrincipalMapping.html](https://docs.aws.amazon.com/kendra/latest/dg/API_PutPrincipalMapping.html) para cargar la información de acceso del usuario y del grupo. | 
| syncMode |  Especifique cómo Amazon Kendra debe actualizarse el índice cuando cambie el contenido de la fuente de datos. Puede elegir entre las siguientes opciones: [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | 
| secretArn |  El nombre de recurso de Amazon (ARN) de un AWS Secrets Manager secreto que contiene los pares clave-valor necesarios para conectarse a su. GitHub El secreto debe contener una estructura JSON con las siguientes claves: <pre>{<br />    "personalToken": "token"<br />}</pre>  | 
| versión | La versión de esta plantilla que se admite actualmente. | 

### GitHub Esquema JSON


El siguiente es el esquema GitHub JSON:

```
{
    "$schema": "http://json-schema.org/draft-04/schema#",
    "type": "object",
    "properties": {
        "connectionConfiguration": {
            "type": "object",
            "properties": {
                "repositoryEndpointMetadata": {
                    "type": "object",
                    "properties": {
                        "type": {
                            "type": "string"
                        },
                        "hostUrl": {
                            "type": "string",
                            "pattern": "https://.*"
                        },
                        "organizationName": {
                            "type": "string"
                        }
                    },
                    "required": [
                        "type",
                        "hostUrl",
                        "organizationName"
                    ]
                }
            },
            "required": [
                "repositoryEndpointMetadata"
            ]
        },
        "repositoryConfigurations": {
            "type": "object",
            "properties": {
                "ghRepository": {
                    "type": "object",
                    "properties": {
                        "fieldMappings": {
                            "type": "array",
                            "items": [
                                {
                                    "type": "object",
                                    "properties": {
                                        "indexFieldName": {
                                            "type": "string"
                                        },
                                        "indexFieldType": {
                                            "type": "string",
                                            "enum": [
                                                "STRING",
                                                "STRING_LIST",
                                                "DATE"
                                            ]
                                        },
                                        "dataSourceFieldName": {
                                            "type": "string"
                                        },
                                        "dateFieldFormat": {
                                            "type": "string",
                                            "pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
                                        }
                                    },
                                    "required": [
                                        "indexFieldName",
                                        "indexFieldType",
                                        "dataSourceFieldName"
                                    ]
                                }
                            ]
                        }
                    },
                    "required": [
                        "fieldMappings"
                    ]
                },
                "ghCommit": {
                    "type": "object",
                    "properties": {
                        "fieldMappings": {
                            "type": "array",
                            "items": [
                                {
                                    "type": "object",
                                    "properties": {
                                        "indexFieldName": {
                                            "type": "string"
                                        },
                                        "indexFieldType": {
                                            "type": "string",
                                            "enum": [
                                                "STRING",
                                                "STRING_LIST",
                                                "DATE"
                                            ]
                                        },
                                        "dataSourceFieldName": {
                                            "type": "string"
                                        },
                                        "dateFieldFormat": {
                                            "type": "string",
                                            "pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
                                        }
                                    },
                                    "required": [
                                        "indexFieldName",
                                        "indexFieldType",
                                        "dataSourceFieldName"
                                    ]
                                }
                            ]
                        }
                    },
                    "required": [
                        "fieldMappings"
                    ]
                },
                "ghIssueDocument": {
                    "type": "object",
                    "properties": {
                        "fieldMappings": {
                            "type": "array",
                            "items": [
                                {
                                    "type": "object",
                                    "properties": {
                                        "indexFieldName": {
                                            "type": "string"
                                        },
                                        "indexFieldType": {
                                            "type": "string",
                                            "enum": [
                                                "STRING",
                                                "STRING_LIST",
                                                "DATE"
                                            ]
                                        },
                                        "dataSourceFieldName": {
                                            "type": "string"
                                        },
                                        "dateFieldFormat": {
                                            "type": "string",
                                            "pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
                                        }
                                    },
                                    "required": [
                                        "indexFieldName",
                                        "indexFieldType",
                                        "dataSourceFieldName"
                                    ]
                                }
                            ]
                        }
                    },
                    "required": [
                        "fieldMappings"
                    ]
                },
                "ghIssueComment": {
                    "type": "object",
                    "properties": {
                        "fieldMappings": {
                            "type": "array",
                            "items": [
                                {
                                    "type": "object",
                                    "properties": {
                                        "indexFieldName": {
                                            "type": "string"
                                        },
                                        "indexFieldType": {
                                            "type": "string",
                                            "enum": [
                                                "STRING",
                                                "STRING_LIST",
                                                "DATE"
                                            ]
                                        },
                                        "dataSourceFieldName": {
                                            "type": "string"
                                        },
                                        "dateFieldFormat": {
                                            "type": "string",
                                            "pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
                                        }
                                    },
                                    "required": [
                                        "indexFieldName",
                                        "indexFieldType",
                                        "dataSourceFieldName"
                                    ]
                                }
                            ]
                        }
                    },
                    "required": [
                        "fieldMappings"
                    ]
                },
                "ghIssueAttachment": {
                    "type": "object",
                    "properties": {
                        "fieldMappings": {
                            "type": "array",
                            "items": [
                                {
                                    "type": "object",
                                    "properties": {
                                        "indexFieldName": {
                                            "type": "string"
                                        },
                                        "indexFieldType": {
                                            "type": "string",
                                            "enum": [
                                                "STRING",
                                                "STRING_LIST",
                                                "DATE"
                                            ]
                                        },
                                        "dataSourceFieldName": {
                                            "type": "string"
                                        },
                                        "dateFieldFormat": {
                                            "type": "string",
                                            "pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
                                        }
                                    },
                                    "required": [
                                        "indexFieldName",
                                        "indexFieldType",
                                        "dataSourceFieldName"
                                    ]
                                }
                            ]
                        }
                    },
                    "required": [
                        "fieldMappings"
                    ]
                },
                "ghPRDocument": {
                    "type": "object",
                    "properties": {
                        "fieldMappings": {
                            "type": "array",
                            "items": [
                                {
                                    "type": "object",
                                    "properties": {
                                        "indexFieldName": {
                                            "type": "string"
                                        },
                                        "indexFieldType": {
                                            "type": "string",
                                            "enum": [
                                                "STRING",
                                                "STRING_LIST",
                                                "DATE"
                                            ]
                                        },
                                        "dataSourceFieldName": {
                                            "type": "string"
                                        },
                                        "dateFieldFormat": {
                                            "type": "string",
                                            "pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
                                        }
                                    },
                                    "required": [
                                        "indexFieldName",
                                        "indexFieldType",
                                        "dataSourceFieldName"
                                    ]
                                }
                            ]
                        }
                    },
                    "required": [
                        "fieldMappings"
                    ]
                },
                "ghPRComment": {
                    "type": "object",
                    "properties": {
                        "fieldMappings": {
                            "type": "array",
                            "items": [
                                {
                                    "type": "object",
                                    "properties": {
                                        "indexFieldName": {
                                            "type": "string"
                                        },
                                        "indexFieldType": {
                                            "type": "string",
                                            "enum": [
                                                "STRING",
                                                "STRING_LIST",
                                                "DATE"
                                            ]
                                        },
                                        "dataSourceFieldName": {
                                            "type": "string"
                                        },
                                        "dateFieldFormat": {
                                            "type": "string",
                                            "pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
                                        }
                                    },
                                    "required": [
                                        "indexFieldName",
                                        "indexFieldType",
                                        "dataSourceFieldName"
                                    ]
                                }
                            ]
                        }
                    },
                    "required": [
                        "fieldMappings"
                    ]
                },
                "ghPRAttachment": {
                    "type": "object",
                    "properties": {
                        "fieldMappings": {
                            "type": "array",
                            "items": [
                                {
                                    "type": "object",
                                    "properties": {
                                        "indexFieldName": {
                                            "type": "string"
                                        },
                                        "indexFieldType": {
                                            "type": "string",
                                            "enum": [
                                                "STRING",
                                                "STRING_LIST",
                                                "DATE"
                                            ]
                                        },
                                        "dataSourceFieldName": {
                                            "type": "string"
                                        },
                                        "dateFieldFormat": {
                                            "type": "string",
                                            "pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
                                        }
                                    },
                                    "required": [
                                        "indexFieldName",
                                        "indexFieldType",
                                        "dataSourceFieldName"
                                    ]
                                }
                            ]
                        }
                    },
                    "required": [
                        "fieldMappings"
                    ]
                }
            }
        },
        "additionalProperties": {
            "type": "object",
            "properties": {
                "isCrawlAcl": {
                    "type": "boolean"
                },
                "fieldForUserId": {
                    "type": "string"
                },
                "crawlRepository": {
                    "type": "boolean"
                },
                "crawlRepositoryDocuments": {
                    "type": "boolean"
                },
                "crawlIssue": {
                    "type": "boolean"
                },
                "crawlIssueComment": {
                    "type": "boolean"
                },
                "crawlIssueCommentAttachment": {
                    "type": "boolean"
                },
                "crawlPullRequest": {
                    "type": "boolean"
                },
                "crawlPullRequestComment": {
                    "type": "boolean"
                },
                "crawlPullRequestCommentAttachment": {
                    "type": "boolean"
                },
                "repositoryFilter": {
                    "type": "array",
                    "items": [
                        {
                            "type": "object",
                            "properties": {
                                "repositoryName": {
                                    "type": "string"
                                },
                                "branchNameList": {
                                    "type": "array",
                                    "items": {
                                        "type": "string"
                                    }
                                }
                            }
                        }
                    ]
                },
                "inclusionFolderNamePatterns": {
                    "type": "array",
                    "items": {
                        "type": "string"
                    }
                },
                "inclusionFileTypePatterns": {
                    "type": "array",
                    "items": {
                        "type": "string"
                    }
                },
                "inclusionFileNamePatterns": {
                    "type": "array",
                    "items": {
                        "type": "string"
                    }
                },
                "exclusionFolderNamePatterns": {
                    "type": "array",
                    "items": {
                        "type": "string"
                    }
                },
                "exclusionFileTypePatterns": {
                    "type": "array",
                    "items": {
                        "type": "string"
                    }
                },
                "exclusionFileNamePatterns": {
                    "type": "array",
                    "items": {
                        "type": "string"
                    }
                }
            },
            "required": []
        },
        "type": {
            "type": "string",
            "pattern": "GITHUB"
        },
        "syncMode": {
            "type": "string",
            "enum": [
                "FULL_CRAWL",
                "FORCED_FULL_CRAWL",
                "CHANGE_LOG"
            ]
        },
        "enableIdentityCrawler": {
            "type": "boolean"
        },
        "secretArn": {
            "type": "string",
            "minLength": 20,
            "maxLength": 2048
        }
    },
    "version": {
        "type": "string",
        "anyOf": [
            {
                "pattern": "1.0.0"
            }
        ]
    },
    "required": [
        "connectionConfiguration",
        "repositoryConfigurations",
        "syncMode",
        "additionalProperties",
        "enableIdentityCrawler"
    ]
}
```

## Esquema de plantilla de Gmail


Incluye un JSON que contiene el esquema del origen de datos como parte del objeto [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_TemplateConfiguration.html). Especifique el tipo de origen de datos como `GMAIL`, un secreto para sus credenciales de autenticación y otras configuraciones necesarias. A continuación, especifique `TEMPLATE` como el `Type` cuando llame a [CreateDataSource](https://docs.aws.amazon.com/kendra/latest/APIReference/API_CreateDataSource.html).

Puede usar la plantilla que se proporciona en esta guía para desarrolladores. Consulte [Esquema JSON de Gmail](#gmail-json).

En la tabla siguiente se describen los parámetros del esquema JSON de Gmail.


| Configuración | Description (Descripción) | 
| --- | --- | 
| connectionConfiguration | Información de configuración para el punto de conexión para el origen de datos. | 
| repositoryEndpointMetadata | La información del punto de conexión para el origen de datos. Este origen de datos no especifica un punto de conexión en repositoryEndpointMetadata. Más bien, la información de conexión se incluye en un AWS Secrets Manager secreto que usted proporcionasecretArn. | 
| repositoryConfigurations | Información de configuración del contenido del origen de datos. Por ejemplo, configurar tipos específicos de contenido y asignaciones de campos. Especifique el tipo de origen de datos y el ARN secreto. | 
|  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  |  Una lista de objetos que asignan los atributos o los nombres de campo de tus mensajes y archivos adjuntos de Gmail para Amazon Kendra indexar los nombres de los campos. Para obtener más información, consulte [Asignación de campos de origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/field-mapping.html). | 
| additionalProperties | Opciones de configuración adicionales para el contenido del origen de datos. | 
|  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  |  Una lista de patrones de expresión regular para incluir o excluir mensajes con nombres de asuntos específicos en su origen de datos de Gmail. Los archivos que coinciden con los patrones se incluyen en el índice. Si un archivo coincide con un patrón de inclusión y de exclusión, el patrón de exclusión tiene prioridad y el archivo no se incluye en el índice. | 
| beforeDateFilter | Especifica los mensajes y archivos adjuntos que se incluirán antes de una fecha determinada.  | 
| afterDateFilter | Especifica los mensajes y archivos adjuntos que se incluirán después de una fecha determinada. | 
| isCrawlAttachment | Un valor booleano para elegir si desea rastrear los archivos adjuntos. Los mensajes se rastrean automáticamente. | 
| type | El tipo del origen de datos. Especifica GMAIL como el tipo de origen de datos. | 
| shouldCrawlDraftMensajes | Un valor booleano para elegir si desea rastrear los borradores de mensajes. | 
| syncMode | Especifique cómo Amazon Kendra debe actualizarse el índice cuando cambie el contenido de la fuente de datos. Puede elegir entre las siguientes opciones: [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  Como no hay una API para actualizar los mensajes de Gmail eliminados permanentemente, cualquier sincronización del contenido nuevo, modificado o eliminado:   No eliminará del índice de Amazon Kendra los mensajes que se hayan eliminado permanentemente de Gmail   No sincronizará los cambios en las etiquetas de correo de Gmail   Para sincronizar los cambios en la etiqueta de la fuente de datos de Gmail y los mensajes de correo electrónico eliminados permanentemente con tu Amazon Kendra índice, debes realizar rastreos completos de forma periódica.   | 
| secretARN | El nombre de recurso de Amazon (ARN) de un secreto de Secrets Manager que contiene los pares clave/valor necesarios para conectarse a su Gmail. El secreto debe contener una estructura JSON con las siguientes claves: <pre>{<br />    "adminAccountEmailId": "service account email",<br />    "clientEmailId": "user account email",<br />    "privateKey": "private key"<br />}</pre> | 
| versión | La versión de la plantilla que se admite actualmente. | 

### Esquema JSON de Gmail


```
{
  "$schema": "http://json-schema.org/draft-04/schema#",
  "type": "object",
  "properties": {
    "connectionConfiguration": {
      "type": "object",
      "properties": {
      }
    },
    "repositoryConfigurations": {
      "type": "object",
      "properties": {
        "message": {
          "type": "object",
          "properties": {
            "fieldMappings": {
              "type": "array",
              "items": [
                {
                  "type": "object",
                  "properties": {
                    "indexFieldName": {
                      "type": "string"
                    },
                    "indexFieldType": {
                      "type": "string",
                      "enum": ["STRING", "STRING_LIST", "DATE"]
                    },
                    "dataSourceFieldName": {
                      "type": "string"
                    },
                    "dateFieldFormat": {
                      "type": "string"
                    }
                  },
                  "required": [
                    "indexFieldName",
                    "indexFieldType",
                    "dataSourceFieldName"
                  ]
                }
              ]
            }
          }
        },
        "attachments": {
          "type": "object",
          "properties": {
            "fieldMappings": {
              "type": "array",
              "items": [
                {
                  "type": "object",
                  "properties": {
                    "indexFieldName": {
                      "type": "string"
                    },
                    "indexFieldType": {
                      "type": "string",
                      "enum": ["STRING"]
                    },
                    "dataSourceFieldName": {
                      "type": "string"
                    }
                  },
                  "required": [
                    "indexFieldName",
                    "indexFieldType",
                    "dataSourceFieldName"
                  ]
                }
              ]
            }
          }
        }
      },
      "required": []
    },
    "additionalProperties": {
      "type": "object",
      "properties": {
        "inclusionLabelNamePatterns": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "exclusionLabelNamePatterns": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "inclusionAttachmentTypePatterns": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "exclusionAttachmentTypePatterns": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "inclusionAttachmentNamePatterns": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "exclusionAttachmentNamePatterns": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "inclusionSubjectFilter": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "exclusionSubjectFilter": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "isSubjectAnd": {
          "type": "boolean"
        },
        "inclusionFromFilter": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "exclusionFromFilter": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "inclusionToFilter": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "exclusionToFilter": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "inclusionCcFilter": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "exclusionCcFilter": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "inclusionBccFilter": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "exclusionBccFilter": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "beforeDateFilter": {
          "anyOf": [
            {
              "type": "string",
              "pattern": "^[0-9]{4}-[0-9]{2}-[0-9]{2}T[0-9]{2}:[0-9]{2}:[0-9]{2}Z$"
            },
            {
              "type": "string",
              "pattern": ""
            }
          ]
        },
        "afterDateFilter": {
          "anyOf": [
            {
              "type": "string",
              "pattern": "^[0-9]{4}-[0-9]{2}-[0-9]{2}T[0-9]{2}:[0-9]{2}:[0-9]{2}Z$"
            },
            {
              "type": "string",
              "pattern": ""
            }
          ]
        },
        "isCrawlAttachment": {
          "type": "boolean"
        },
        "shouldCrawlDraftMessages": {
          "type": "boolean"
        }
      },
      "required": [
        "isCrawlAttachment",
        "shouldCrawlDraftMessages"
      ]
    },
    "type" : {
      "type" : "string",
      "pattern": "GMAIL"
    },
    "syncMode": {
      "type": "string",
      "enum": [
        "FORCED_FULL_CRAWL",
        "FULL_CRAWL"
      ]
    },
    "secretArn": {
      "type": "string"
    },
    "version": {
      "type": "string",
      "anyOf": [
        {
          "pattern": "1.0.0"
        }
      ]
    }
  },
  "required": [
    "connectionConfiguration",
    "repositoryConfigurations",
    "additionalProperties",
    "syncMode",
    "secretArn",
    "type"
  ]
}
```

## Esquema de plantilla de Google Drive


Incluye un JSON que contiene el esquema del origen de datos como parte del objeto [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_TemplateConfiguration.html). Especifique el tipo de origen de datos como `GOOGLEDRIVE2`, un secreto para sus credenciales de autenticación y otras configuraciones necesarias. A continuación, especifique `TEMPLATE` como el `Type` cuando llame a [CreateDataSource](https://docs.aws.amazon.com/kendra/latest/APIReference/API_CreateDataSource.html).

Puede usar la plantilla que se proporciona en esta guía para desarrolladores. Consulte [Esquema JSON de Google Drive](#googledrive-json).

En la tabla siguiente se describen los parámetros del esquema JSON de Google Drive.


| Configuración | Description (Descripción) | 
| --- | --- | 
| connectionConfiguration | Información de configuración del origen de datos. | 
| repositoryEndpointMetadata | La información del punto de conexión para el origen de datos. Este origen de datos no especifica un punto de conexión. Usted elige el tipo de autenticación: serviceAccount y OAuth2. La información de conexión se incluye en un AWS Secrets Manager secreto que usted proporciona. secretArn | 
| authType | Elija entre serviceAccount y OAuth2 en función de su caso de uso. | 
| repositoryConfigurations | Información de configuración del contenido del origen de datos. Por ejemplo, configurar tipos específicos de contenido y asignaciones de campos. | 
|  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  |  Una lista de objetos que asignan los atributos o los nombres de campo de su Google Drive a los nombres de campo del índice de Amazon Kendra . Para obtener más información, consulte [Asignación de campos de origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/field-mapping.html). | 
| additionalProperties | Opciones de configuración adicionales para el contenido del origen de datos | 
|  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | Especifique un límite de tamaño de archivo MBs que Amazon Kendra deba rastrearse. | 
|  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | true para rastrear los comentarios en su origen de datos de Google Drive. | 
|  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | truepara rastrear MyDrive y compartir conmigo Drives en tu fuente de datos de Google Drive. | 
|  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | true para rastrear las unidades compartidas en su origen de datos de Google Drive. | 
| isCrawlAcl | true para rastrear la información de la lista de control de acceso (ACL) para los documentos, si tiene una ACL y desea usarla para el control de acceso. La ACL controla los documentos a los que los usuarios y los grupos pueden acceder y que pueden buscar. La información de la ACL se utiliza para filtrar los resultados de búsqueda en función del acceso del usuario o su grupo a los documentos. Para obtener más información, consulte [Filtrado de contexto de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#context-filter-user-incl-datasources). | 
|  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | Una lista de patrones de expresión regular para excluir determinados archivos en su origen de datos de Google Drive. Los archivos que coinciden con los patrones se excluyen del índice. Los archivos que no coincidan con los patrones se incluyen en el índice. Si un archivo coincide con un patrón de exclusión y de inclusión, el patrón de exclusión tiene prioridad y el archivo no se incluye en el índice. | 
|  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | Una lista de patrones de expresión regular para incluir determinados archivos en su origen de datos de Google Drive. Los archivos que coinciden con los patrones se incluyen en el índice. Los archivos que no coincidan con los patrones se excluyen del índice. Si un archivo coincide con un patrón de inclusión y de exclusión, el patrón de exclusión tiene prioridad y el archivo no se incluye en el índice. | 
| type | El tipo del origen de datos. Especifica GOOOGLEDRIVEV2 como el tipo de origen de datos. | 
| enableIdentityCrawler | trueutilizar el rastreador Amazon Kendra de identidad para sincronizar la identity/principal información sobre los usuarios y grupos con acceso a determinados documentos. Si el rastreador de identidades está desactivado, todos los documentos se pueden buscar públicamente. Si quiere usar el control de acceso para los documentos y el rastreador de identidades está desactivado, también puede usar la API [https://docs.aws.amazon.com/kendra/latest/dg/API_PutPrincipalMapping.html](https://docs.aws.amazon.com/kendra/latest/dg/API_PutPrincipalMapping.html) para cargar la información de acceso del usuario y del grupo. | 
| syncMode |  Especifique cómo Amazon Kendra debe actualizarse el índice cuando cambie el contenido de la fuente de datos. Puede elegir entre las siguientes opciones: [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | 
| secretARN | El nombre de recurso de Amazon (ARN) de un AWS Secrets Manager secreto que contiene los pares clave-valor necesarios para conectarse a Google Drive. El secreto debe contener una estructura JSON con las siguientes claves: ****Si utiliza la autenticación de la cuenta de servicio de Google:<pre>{<br />    "clientEmail": "user account email",<br />    "adminAccountEmail": "service account email",<br />    "privateKey": "private key"<br />}</pre> ****Si utilizas la autenticación 2.0 OAuth : <pre>{<br />    "clientID": "OAuth client ID",<br />    "clientSecret": "client secret",<br />    "refreshToken": "refresh token"<br />}</pre> | 
| versión | La versión de esta plantilla que se admite actualmente. | 

### Esquema JSON de Google Drive


```
{
  "$schema": "http://json-schema.org/draft-04/schema#",
  "type": "object",
  "properties": {
    "connectionConfiguration": {
      "type": "object",
      "properties": {
        "repositoryEndpointMetadata": {
          "type": "object",
          "properties": {
            "authType": {
              "type": "string",
              "enum": [
                "serviceAccount",
                "OAuth2"
              ]
            }
          },
          "required": [
            "authType"
          ]
        }
      },
      "required": [
        "repositoryEndpointMetadata"
      ]
    },
    "repositoryConfigurations": {
      "type": "object",
      "properties": {
        "file": {
          "type": "object",
          "properties": {
            "fieldMappings": {
              "type": "array",
              "items": [
                {
                  "type": "object",
                  "properties": {
                    "indexFieldName": {
                      "type": "string"
                    },
                    "indexFieldType": {
                      "type": "string",
                      "enum": [
                        "STRING",
                        "DATE",
                        "STRING_LIST",
                        "LONG"
                      ]
                    },
                    "dataSourceFieldName": {
                      "type": "string"
                    },
                    "dateFieldFormat": {
                      "type": "string",
                      "pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
                    }
                  },
                  "required": [
                    "indexFieldName",
                    "indexFieldType",
                    "dataSourceFieldName"
                  ]
                }
              ]
            }
          },
          "required": [
            "fieldMappings"
          ]
        },
        "comment": {
          "type": "object",
          "properties": {
            "fieldMappings": {
              "type": "array",
              "items": [
                {
                  "type": "object",
                  "properties": {
                    "indexFieldName": {
                      "type": "string"
                    },
                    "indexFieldType": {
                      "type": "string",
                      "enum": [
                        "STRING",
                        "DATE",
                        "STRING_LIST"
                      ]
                    },
                    "dataSourceFieldName": {
                      "type": "string"
                    },
                    "dateFieldFormat": {
                      "type": "string",
                      "pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
                    }
                  },
                  "required": [
                    "indexFieldName",
                    "indexFieldType",
                    "dataSourceFieldName"
                  ]
                }
              ]
            }
          },
          "required": [
            "fieldMappings"
          ]
        }
      }
    },
    "additionalProperties": {
      "type": "object",
      "properties": {
        "maxFileSizeInMegaBytes": {
          "type": "string"
        },
        "isCrawlComment": {
          "type": "boolean"
        },
        "isCrawlMyDriveAndSharedWithMe": {
          "type": "boolean"
        },
        "isCrawlSharedDrives": {
          "type": "boolean"
        },
        "isCrawlAcl": {
          "type": "boolean"
        },
        "excludeUserAccounts": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "excludeSharedDrives": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "excludeMimeTypes": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "includeUserAccounts": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "includeSharedDrives": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "includeMimeTypes": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "includeTargetAudienceGroup": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "inclusionFileTypePatterns": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "inclusionFileNamePatterns": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "exclusionFileTypePatterns": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "exclusionFileNamePatterns": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "inclusionFilePathFilter": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "exclusionFilePathFilter": {
          "type": "array",
          "items": {
            "type": "string"
          }
        }
      }
    },
    "type": {
      "type": "string",
      "pattern": "GOOGLEDRIVEV2"
    },
    "enableIdentityCrawler": {
      "type": "boolean"
    },
    "syncMode": {
      "type": "string",
      "enum": [
        "FORCED_FULL_CRAWL",
        "FULL_CRAWL",
        "CHANGE_LOG"
      ]
    },
    "secretArn": {
      "type": "string",
      "minLength": 20,
      "maxLength": 2048
    }
  },
  "version": {
    "type": "string",
    "anyOf": [
      {
        "pattern": "1.0.0"
      }
    ]
  },
  "required": [
    "connectionConfiguration",
    "repositoryConfigurations",
    "syncMode",
    "additionalProperties",
    "secretArn",
    "type"
  ]
}
```

## Esquema DB2 de plantillas de IBM


Incluye un JSON que contiene el esquema del origen de datos como parte del objeto [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_TemplateConfiguration.html). Especifique el tipo de origen de datos como `JDBC`, el tipo de base de datos como `db2`, un secreto para sus credenciales de autenticación y otras configuraciones necesarias. A continuación, especifique `TEMPLATE` como el `Type` cuando llame a [CreateDataSource](https://docs.aws.amazon.com/kendra/latest/APIReference/API_CreateDataSource.html).

Puede usar la plantilla que se proporciona en esta guía para desarrolladores. Consulte [Esquema DB2 JSON de IBM](#ibm-db2-json).

En la siguiente tabla se describen los parámetros del esquema DB2 JSON de IBM.


| Configuración | Description (Descripción) | 
| --- | --- | 
| connectionConfiguration | Información de configuración para el punto de conexión para el origen de datos. | 
| repositoryEndpointMetadata | Información de configuración necesaria para conectarse a su origen de datos.[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html) | 
| repositoryConfigurations | Información de configuración del contenido del origen de datos. Por ejemplo, configurar tipos específicos de contenido y asignaciones de campos. Especifique el tipo de origen de datos y el ARN secreto. | 
|  revisión  |  Una lista de objetos que mapean los atributos o los nombres de campo del contenido de la base de datos para Amazon Kendra indexar los nombres de los campos. Para obtener más información, consulte [Asignación de campos de origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/field-mapping.html). | 
| additionalProperties | Opciones de configuración adicionales para el contenido del origen de datos. Se utiliza para incluir o excluir contenido específico en el origen de datos de la base de datos. | 
| primaryKey  | Proporciona la clave principal de la tabla de la base de datos. Esto identifica una tabla dentro de la base de datos. | 
| titleColumn | Proporciona el nombre de la columna del título del documento en la tabla de la base de datos. | 
| bodyColumn | Proporciona el nombre de la columna del título del documento en la tabla de la base de datos. | 
| sqlQuery | Introduce instrucciones de consulta SQL, como las operaciones SELECT y JOIN. Las consultas SQL deben tener menos de 32 KB. Amazon Kendra rastreará todo el contenido de la base de datos que coincida con su consulta. | 
| timestampColumn | Introduzca el nombre de la columna que contiene las marcas de tiempo. Amazon Kendra utiliza la información de la marca de tiempo para detectar cambios en el contenido y sincronizar solo el contenido modificado. | 
| timestampFormat | Introduce el nombre de la columna que contiene los formatos de marcas temporales que se deben utilizar para detectar cambios en el contenido y volver a sincronizar su contenido. | 
| timezone | Introduce el nombre de la columna que contiene las zonas horarias del contenido que se va a rastrear. | 
| changeDetectingColumns | Introduce los nombres de las columnas que Amazon Kendra se utilizarán para detectar cambios en el contenido. Amazon Kendra volverá a indexar el contenido cuando se produzca un cambio en alguna de estas columnas | 
| allowedUsersColumns | Introduzca el nombre de la columna que contiene el usuario IDs al que se le permitirá acceder al contenido. | 
| allowedGroupsColumn | Introduzca el nombre de la columna que contiene el usuario IDs al que se permitirá el acceso al contenido. | 
| fuente URIColumn | Introduzca el nombre de la columna que contiene la fuente que se URLs va a indexar. | 
| isSslEnabled | Introduce instrucciones de consulta SQL, como las operaciones SELECT y JOIN. Las consultas SQL deben tener menos de 32 KB. Amazon Kendra rastreará todo el contenido de la base de datos que coincida con su consulta. | 
| type | El tipo del origen de datos. Especifica JDBC como el tipo de origen de datos. | 
| syncMode |  Especifique cómo Amazon Kendra debe actualizarse el índice cuando cambie el contenido de la fuente de datos. Puede elegir entre las siguientes opciones: [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | 
| secretArn | El nombre de recurso de Amazon (ARN) de un secreto de Secrets Manager que contiene el nombre de usuario y la contraseña necesarios para conectarse a su base de datos. El secreto debe contener una estructura JSON con las siguientes claves: <pre>{<br />    "user name": "database user name",<br />    "password": "password"<br />}</pre> | 
| versión | La versión de la plantilla que se admite actualmente. | 

### Esquema DB2 JSON de IBM


```
{
  "$schema": "http://json-schema.org/draft-04/schema#",
  "type": "object",
  "properties": {
    "connectionConfiguration": {
      "type": "object",
      "properties": {
        "repositoryEndpointMetadata": {
          "type": "object",
          "properties": {
            "dbType": {
              "type": "string",
              "enum": [
                "mysql",
                "db2",
                "postgresql",
                "oracle",
                "sqlserver"
              ]
            },
            "dbHost": {
              "type": "string"
            },
            "dbPort": {
              "type": "string"
            },
            "dbInstance": {
              "type": "string"
            }
          },
          "required": [
            "dbType",
            "dbHost",
            "dbPort",
            "dbInstance"
          ]
        }
      },
      "required": [
        "repositoryEndpointMetadata"
      ]
    },
    "repositoryConfigurations": {
      "type": "object",
      "properties": {
        "document": {
          "type": "object",
          "properties": {
            "fieldMappings": {
              "type": "array",
              "items": [
                {
                  "type": "object",
                  "properties": {
                    "indexFieldName": {
                      "type": "string"
                    },
                    "indexFieldType": {
                      "type": "string"
                    },
                    "dataSourceFieldName": {
                      "type": "string"
                    }
                  },
                  "required": [
                    "indexFieldName",
                    "indexFieldType",
                    "dataSourceFieldName"
                  ]
                }
              ]
            }
          },
          "required": [
            "fieldMappings"
          ]
        }
      },
      "required": [
      ]
    },
    "additionalProperties": {
      "type": "object",
      "properties": {
        "primaryKey": {
          "type": "string"
        },
        "titleColumn": {
          "type": "string"
        },
        "bodyColumn": {
          "type": "string"
        },
        "sqlQuery": {
          "type": "string",
          "not": {
            "pattern": ";+"
          }
        },
        "timestampColumn": {
          "type": "string"
        },
        "timestampFormat": {
          "type": "string"
        },
        "timezone": {
          "type": "string"
        },
        "changeDetectingColumns": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "allowedUsersColumn": {
          "type": "string"
        },
        "allowedGroupsColumn": {
          "type": "string"
        },
        "sourceURIColumn": {
          "type": "string"
        },
        "isSslEnabled": {
          "type": "boolean"
        }
      },
      "required": ["primaryKey", "titleColumn", "bodyColumn", "sqlQuery"]
    },
    "type" : {
      "type" : "string",
      "pattern": "JDBC"
    },
    "syncMode": {
      "type": "string",
      "enum": [
        "FORCED_FULL_CRAWL",
        "FULL_CRAWL",
        "CHANGE_LOG"
      ]
    },
    "secretArn": {
      "type": "string"
    }
  },
  "version": {
    "type": "string",
    "anyOf": [
      {
        "pattern": "1.0.0"
      }
    ]
  },
  "required": [
      "connectionConfiguration",
      "repositoryConfigurations",
      "syncMode",
      "additionalProperties",
      "secretArn",
      "type"
  ]
}
```

## Esquema de plantilla de Microsoft Exchange


Incluye un JSON que contiene el esquema del origen de datos como parte del objeto [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_TemplateConfiguration.html). Debe proporcionar el ID de inquilino como parte de la configuración de la conexión o de los detalles del punto de conexión del repositorio. Además, especifique el tipo de origen de datos como `MSEXCHANGE`, un secreto para sus credenciales de autenticación y otras configuraciones necesarias. A continuación, especifique `TEMPLATE` como el `Type` cuando llame a [CreateDataSource](https://docs.aws.amazon.com/kendra/latest/APIReference/API_CreateDataSource.html).

Puede usar la plantilla que se proporciona en esta guía para desarrolladores. Consulte [Esquema JSON de Microsoft Exchange](#msexchange-json).

En la tabla siguiente se describen los parámetros del esquema JSON de Microsoft Exchange.


| Configuración | Description (Descripción) | 
| --- | --- | 
| connectionConfiguration | Información de configuración para el punto de conexión para el origen de datos. | 
| repositoryEndpointMetadata | La información del punto de conexión para el origen de datos. | 
| tenantId | El ID de inquilino de Microsoft 365. Puede encontrar su ID de inquilino en las propiedades de su portal de Azure Active Directory o en su OAuth aplicación. | 
| repositoryConfigurations | Información de configuración del contenido del origen de datos. Por ejemplo, configurar tipos específicos de contenido y asignaciones de campos. | 
|  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | Una lista de objetos que asignan los atributos o nombres de campo de la fuente de datos de Microsoft Exchange a los campos de Amazon Kendra indexación. Para obtener más información, consulte [Asignación de campos de origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/field-mapping.html). | 
| additionalProperties | Opciones de configuración adicionales para el contenido del origen de datos | 
| inclusionPatterns | Una lista de patrones de expresión regular para incluir determinados archivos en su origen de datos de Microsoft Exchange. Los archivos que coinciden con los patrones se incluyen en el índice. Los archivos que no coincidan con los patrones se excluyen del índice. Si un archivo coincide con un patrón de inclusión y de exclusión, el patrón de exclusión tiene prioridad y el archivo no se incluye en el índice. | 
| exclusionPatterns | Una lista de patrones de expresión regular para excluir determinados archivos en su origen de datos de Microsoft Exchange. Los archivos que coinciden con los patrones se excluyen del índice. Los archivos que no coincidan con los patrones se incluyen en el índice. Si un archivo coincide con un patrón de exclusión y de inclusión, el patrón de exclusión tiene prioridad y el archivo no se incluye en el índice. | 
|  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | Una lista de patrones de expresión regular para incluir determinados usuarios y archivos de usuario en su origen de datos de Microsoft Exchange. Los usuarios que coinciden con los patrones se incluyen en el índice. Los usuarios que no coinciden con los patrones se excluyen del índice. Si un usuario coincide con un patrón de inclusión y de exclusión, el patrón de exclusión tiene prioridad y el usuario no se incluye en el índice. | 
|  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | Una lista de patrones de expresión regular para excluir determinados usuarios y archivos de usuario en su origen de datos de Microsoft Exchange. Los usuarios que coinciden con los patrones se excluyen del índice. Los usuarios que no coinciden con los patrones se incluyen en el índice. Si un usuario coincide con un patrón de exclusión y de inclusión, el patrón de exclusión tiene prioridad y el usuario no se incluye en el índice. | 
| s3bucketName | El nombre del bucket de S3, si lo desea usar. | 
|  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | true para rastrear estos tipos de contenido e información de control de acceso a su origen de datos de Microsoft Exchange. | 
| startCalendarDateHora | Puede configurar una fecha y hora de inicio específicas para el contenido de su calendario. | 
| endCalendarDateHora | Puede configurar una fecha y hora de finalización específicas para el contenido del calendario. | 
| subject | Puede configurar una línea de asunto específica para el contenido de su correo. | 
| emailFrom | Puede configurar un correo electrónico específico para el contenido del correo del remitente. | 
| emailTo | Puede configurar un correo electrónico específico para el contenido del correo del destinatario. | 
| syncMode |  Especifique cómo Amazon Kendra debe actualizarse el índice cuando cambie el contenido de la fuente de datos. Puede elegir entre las siguientes opciones: [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | 
| type | El tipo del origen de datos. Especifica MSEXCHANGE como el tipo de origen de datos. | 
| secretARN | El nombre de recurso de Amazon (ARN) de un AWS Secrets Manager secreto que contiene los pares clave-valor necesarios para conectarse a Microsoft Exchange. Esto incluye su ID de cliente y su secreto de cliente que se generan al crear una OAuth aplicación en el portal de Azure. | 
| versión | La versión de esta plantilla que se admite actualmente. | 

### Esquema JSON de Microsoft Exchange


```
{
  "$schema": "http://json-schema.org/draft-04/schema#",
  "type": "object",
  "properties": {
    "connectionConfiguration": {
      "type": "object",
      "properties": {
        "repositoryEndpointMetadata": {
          "type": "object",
          "properties": {
            "tenantId": {
              "type": "string",
              "pattern": "^[0-9a-f]{8}-[0-9a-f]{4}-[0-9a-f]{4}-[0-9a-f]{4}-[0-9a-f]{12}$",
              "minLength": 36,
              "maxLength": 36
            }
          },
          "required": ["tenantId"]
        }
      }
    },
    "repositoryConfigurations": {
      "type": "object",
      "properties": {
        "email": {
          "type": "object",
          "properties": {
            "fieldMappings": {
              "type": "array",
              "items": [
                {
                  "type": "object",
                  "properties": {
                    "indexFieldName": {
                      "type": "string"
                    },
                    "indexFieldType": {
                      "type": "string",
                      "enum": ["STRING", "STRING_LIST", "DATE"]
                    },
                    "dataSourceFieldName": {
                      "type": "string"
                    },
                    "dateFieldFormat": {
                      "type": "string",
                      "pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
                    }
                  },
                  "required": [
                    "indexFieldName",
                    "indexFieldType",
                    "dataSourceFieldName"
                  ]
                }
              ]
            }
          },
          "required": [
            "fieldMappings"
          ]
        },
        "attachment": {
          "type": "object",
          "properties": {
            "fieldMappings": {
              "type": "array",
              "items": [
                {
                  "type": "object",
                  "properties": {
                    "indexFieldName": {
                      "type": "string"
                    },
                    "indexFieldType": {
                      "type": "string",
                      "enum": ["STRING", "DATE","LONG"]
                    },
                    "dataSourceFieldName": {
                      "type": "string"
                    },
                    "dateFieldFormat": {
                      "type": "string",
                      "pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
                    }
                  },
                  "required": [
                    "indexFieldName",
                    "indexFieldType",
                    "dataSourceFieldName"
                  ]
                }
              ]
            }
          },
          "required": [
            "fieldMappings"
          ]
        },
        "calendar": {
          "type": "object",
          "properties": {
            "fieldMappings": {
              "type": "array",
              "items": [
                {
                  "type": "object",
                  "properties": {
                    "indexFieldName": {
                      "type": "string"
                    },
                    "indexFieldType": {
                      "type": "string",
                      "enum": ["STRING", "STRING_LIST", "DATE"]
                    },
                    "dataSourceFieldName": {
                      "type": "string"
                    },
                    "dateFieldFormat": {
                      "type": "string",
                      "pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
                    }
                  },
                  "required": [
                    "indexFieldName",
                    "indexFieldType",
                    "dataSourceFieldName"
                  ]
                }
              ]
            }
          },
          "required": [
            "fieldMappings"
          ]
        },
        "contacts": {
          "type": "object",
          "properties": {
            "fieldMappings": {
              "type": "array",
              "items": [
                {
                  "type": "object",
                  "properties": {
                    "indexFieldName": {
                      "type": "string"
                    },
                    "indexFieldType": {
                      "type": "string",
                      "enum": ["STRING", "STRING_LIST", "DATE"]
                    },
                    "dataSourceFieldName": {
                      "type": "string"
                    },
                    "dateFieldFormat": {
                      "type": "string",
                      "pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
                    }
                  },
                  "required": [
                    "indexFieldName",
                    "indexFieldType",
                    "dataSourceFieldName"
                  ]
                }
              ]
            }
          },
          "required": [
            "fieldMappings"
          ]
        },
        "notes": {
          "type": "object",
          "properties": {
            "fieldMappings": {
              "type": "array",
              "items": [
                {
                  "type": "object",
                  "properties": {
                    "indexFieldName": {
                      "type": "string"
                    },
                    "indexFieldType": {
                      "type": "string",
                      "enum": ["STRING", "DATE"]
                    },
                    "dataSourceFieldName": {
                      "type": "string"
                    },
                    "dateFieldFormat": {
                      "type": "string",
                      "pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
                    }
                  },
                  "required": [
                    "indexFieldName",
                    "indexFieldType",
                    "dataSourceFieldName"
                  ]
                }
              ]
            }
          },
          "required": [
            "fieldMappings"
          ]
        }
      },
      "required": ["email"
      ]
    },
    "additionalProperties": {
      "type": "object",
      "properties": {
        "inclusionPatterns": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "exclusionPatterns": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "inclusionUsersList": {
          "type": "array",
          "items": {
            "type": "string",
            "format": "email"
          }
        },
        "exclusionUsersList": {
          "type": "array",
          "items": {
            "type": "string",
            "format": "email"
          }
        },
        "s3bucketName": {
          "type": "string"
        },
        "inclusionUsersFileName": {
          "type": "string"
        },
        "exclusionUsersFileName": {
          "type": "string"
        },
        "inclusionDomainUsers": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "exclusionDomainUsers": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "crawlCalendar": {
          "type": "boolean"
        },
        "crawlNotes": {
          "type": "boolean"
        },
        "crawlContacts": {
          "type": "boolean"
        },
        "crawlFolderAcl": {
          "type": "boolean"
        },
        "startCalendarDateTime": {
          "anyOf": [
            {
              "type": "string",
              "pattern": "^[0-9]{4}-[0-9]{2}-[0-9]{2}T[0-9]{2}:[0-9]{2}:[0-9]{2}Z$"
            },
            {
              "type": "string",
              "pattern": ""
            }
          ]
        },
        "endCalendarDateTime": {
          "anyOf": [
            {
            "type": "string",
            "pattern": "^[0-9]{4}-[0-9]{2}-[0-9]{2}T[0-9]{2}:[0-9]{2}:[0-9]{2}Z$"
            },
            {
              "type": "string",
              "pattern": ""
            }
          ]
        },
        "subject": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "emailFrom": {
          "type": "array",
          "items": {
            "type": "string",
            "format": "email"
          }
        },
        "emailTo": {
          "type": "array",
          "items": {
            "type": "string",
            "format": "email"
          }
        }
      },
      "required": [
      ]
    },
    "syncMode": {
      "type": "string",
      "enum": [
        "FORCED_FULL_CRAWL",
        "FULL_CRAWL",
        "CHANGE_LOG"
      ]
    },
    "type" : {
      "type" : "string",
      "pattern": "MSEXCHANGE"
    },
    "secretArn": {
      "type": "string"
    }
  },
  "version": {
    "type": "string",
    "anyOf": [
      {
        "pattern": "1.0.0"
      }
    ]
  },
  "required": [
    "connectionConfiguration",
    "repositoryConfigurations",
    "syncMode",
    "additionalProperties",
    "secretArn",
    "type"
  ]
}
```

## Esquema OneDrive de plantillas de Microsoft


Incluye un JSON que contiene el esquema del origen de datos como parte del objeto [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_TemplateConfiguration.html). Debe proporcionar el ID de inquilino como parte de la configuración de la conexión o de los detalles del punto de conexión del repositorio. Especifique también el tipo de origen de datos como `ONEDRIVEV2`, un secreto para sus credenciales de autenticación y otras configuraciones necesarias. A continuación, especifique `TEMPLATE` como el `Type` cuando llame a [CreateDataSource](https://docs.aws.amazon.com/kendra/latest/APIReference/API_CreateDataSource.html).

Puede usar la plantilla que se proporciona en esta guía para desarrolladores. Consulte [Esquema OneDrive JSON de Microsoft](#onedrive-json).

En la siguiente tabla se describen los parámetros del esquema OneDrive JSON de Microsoft.


| Configuración | Description (Descripción) | 
| --- | --- | 
| connectionConfiguration | Información de configuración para el punto de conexión para el origen de datos. | 
| repositoryEndpointMetadata | La información del punto de conexión para el origen de datos. | 
| tenantId | El ID de inquilino de Microsoft 365. Puede encontrar su ID de inquilino en las propiedades de su Azure Active Directory Portal o en su OAuth aplicación. | 
| repositoryConfigurations | Información de configuración del contenido del origen de datos. Por ejemplo, configurar tipos específicos de contenido y asignaciones de campos. | 
| archivo | Una lista de objetos que asignan los atributos o los nombres de campo de los OneDrive archivos de Microsoft a los nombres de los campos de Amazon Kendra indexación. Para obtener más información, consulte [Asignación de campos de origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/field-mapping.html). | 
| additionalProperties | Opciones de configuración adicionales para el contenido del origen de datos | 
|  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | Puede elegir indexar archivos, OneNote secciones y OneNote páginas específicos y filtrar por nombre de usuario. | 
| isUserNameEn S3 | true para proporcionar una lista de nombres de usuario en un archivo almacenado en un Amazon S3. | 
| type | El tipo del origen de datos. Especifica ONEDRIVEV2 como el tipo de origen de datos. | 
| enableIdentityCrawler | trueutilizar el rastreador Amazon Kendra de identidad para sincronizar la identity/principal información sobre los usuarios y grupos con acceso a determinados documentos. Si el rastreador de identidades está desactivado, todos los documentos se pueden buscar públicamente. Si quiere usar el control de acceso para los documentos y el rastreador de identidades está desactivado, también puede usar la API [https://docs.aws.amazon.com/kendra/latest/dg/API_PutPrincipalMapping.html](https://docs.aws.amazon.com/kendra/latest/dg/API_PutPrincipalMapping.html) para cargar la información de acceso del usuario y del grupo. | 
| type | El tipo del origen de datos. Especifica ONEDRIVEV2 como el tipo de origen de datos. | 
| syncMode |  Especifique cómo Amazon Kendra debe actualizarse el índice cuando cambie el contenido de la fuente de datos. Puede elegir entre las siguientes opciones: [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | 
| secretARN | El nombre de recurso de Amazon (ARN) de un AWS Secrets Manager secreto que contiene los pares clave-valor necesarios para conectarse a Microsoft. OneDrive El secreto debe contener una estructura JSON con las siguientes claves: <pre>{<br />    "clientId": "client ID",<br />    "clientSecret": "client secret"<br />}</pre> | 
| versión | La versión de esta plantilla que se admite actualmente. | 

### Esquema OneDrive JSON de Microsoft


```
{
	"$schema": "http://json-schema.org/draft-04/schema#",
	"type": "object",
	"properties": {
		"connectionConfiguration": {
			"type": "object",
			"properties": {
				"repositoryEndpointMetadata": {
					"type": "object",
					"properties": {
						"tenantId": {
							"type": "string",
							"pattern": "^[0-9a-f]{8}-[0-9a-f]{4}-[0-9a-f]{4}-[0-9a-f]{4}-[0-9a-f]{12}$",
							"minLength": 36,
							"maxLength": 36
						}
					},
					"required": [
						"tenantId"
					]
				}
			},
			"required": [
				"repositoryEndpointMetadata"
			]
		},
		"repositoryConfigurations": {
			"type": "object",
			"properties": {
				"file": {
					"type": "object",
					"properties": {
						"fieldMappings": {
							"type": "array",
							"items": [
								{
									"type": "object",
									"properties": {
										"indexFieldName": {
											"type": "string"
										},
										"indexFieldType": {
											"type": "string",
											"enum": [
												"STRING",
												"STRING_LIST",
												"DATE",
												"LONG"
											]
										},
										"dataSourceFieldName": {
											"type": "string"
										},
										"dateFieldFormat": {
											"type": "string",
											"pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
										}
									},
									"required": [
										"indexFieldName",
										"indexFieldType",
										"dataSourceFieldName"
									]
								}
							]
						}
					},
					"required": [
						"fieldMappings"
					]
				}
			}
		},
		"additionalProperties": {
			"type": "object",
			"properties": {
				"userNameFilter": {
					"type": "array",
					"items": {
						"type": "string"
					}
				},
				"userFilterPath": {
					"type": "string"
				},
				"isUserNameOnS3": {
					"type": "boolean"
				},
				"inclusionFileTypePatterns": {
					"type": "array",
					"items": {
						"type": "string"
					}
				},
				"exclusionFileTypePatterns": {
					"type": "array",
					"items": {
						"type": "string"
					}
				},
				"inclusionFileNamePatterns": {
					"type": "array",
					"items": {
						"type": "string"
					}
				},
				"exclusionFileNamePatterns": {
					"type": "array",
					"items": {
						"type": "string"
					}
				},
				"inclusionFilePathPatterns": {
					"type": "array",
					"items": {
						"type": "string"
					}
				},
				"exclusionFilePathPatterns": {
					"type": "array",
					"items": {
						"type": "string"
					}
				},
				"inclusionOneNoteSectionNamePatterns": {
					"type": "array",
					"items": {
						"type": "string"
					}
				},
				"exclusionOneNoteSectionNamePatterns": {
					"type": "array",
					"items": {
						"type": "string"
					}
				},
				"inclusionOneNotePageNamePatterns": {
					"type": "array",
					"items": {
						"type": "string"
					}
				},
				"exclusionOneNotePageNamePatterns": {
					"type": "array",
					"items": {
						"type": "string"
					}
				}
			},
			"required": []
		},

		"enableIdentityCrawler": {
			"type": "boolean"
		},
		"type": {
			"type": "string",
			"pattern": "ONEDRIVEV2"
		},
		"syncMode": {
			"type": "string",
			"enum": [
				"FULL_CRAWL",
				"FORCED_FULL_CRAWL",
				"CHANGE_LOG"
			]
		},
		"secretArn": {
			"type": "string",
			"minLength": 20,
			"maxLength": 2048
		}
	},
	"version": {
		"type": "string",
		"anyOf": [
			{
				"pattern": "1.0.0"
			}
		]
	},
	"required": [
		"connectionConfiguration",
		"repositoryConfigurations",
		"syncMode",
		"additionalProperties",
		"secretArn",
		"type"
	]
}
```

## Esquema SharePoint de plantillas de Microsoft


Incluye un JSON que contiene el esquema de la fuente de datos como parte del [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_TemplateConfiguration.html)objeto. Debe proporcionar la URL del SharePoint sitioURLs, el dominio y también un ID de inquilino, si es necesario, como parte de la configuración de la conexión o de los detalles del punto final del repositorio. Además, especifique el tipo de origen de datos como `SHAREPOINTV2`, un secreto para sus credenciales de autenticación y otras configuraciones necesarias. A continuación, especifíquelo `TEMPLATE` como **Tipo** cuando llame [CreateDataSource](https://docs.aws.amazon.com/kendra/latest/APIReference/API_CreateDataSource.html).

Puede usar la plantilla que se proporciona en esta guía para desarrolladores. Consulte [SharePoint Esquema JSON](#sharepoint-json).

En la siguiente tabla se describen los parámetros del esquema SharePoint JSON de Microsoft.


| Configuración | Description (Descripción) | 
| --- | --- | 
| connectionConfiguration | Información de configuración para el punto de conexión para el origen de datos | 
| repositoryEndpointMetadata | La información del punto de conexión para el origen de datos | 
| tenantId | El identificador de inquilino de tu SharePoint cuenta. | 
| Dominio  | El dominio de tu SharePoint cuenta. | 
| siteUrls | El anfitrión URLs de tu SharePoint cuenta. | 
| repositoryAdditionalProperties | Propiedades adicionales para conectarse con el punto final repository/data de origen. | 
| s3bucketName | El nombre del Amazon S3 depósito que almacena el certificado X.509 autofirmado de Azure AD. | 
| s3certificateName | El nombre del certificado X.509 autofirmado de Azure AD almacenado en el depósito. Amazon S3  | 
| authType | El tipo de autenticación que utiliza, ya sea OAuth2, OAuth2Certificate, OAuth2App, Basic, OAuth2\$1RefreshToken, NTLM o Kerberos. | 
| versión | La SharePoint versión que usa, ya sea oServer. Online | 
| onPremVersion | La versión SharePoint del servidor que utiliza, ya sea 2013 20162019, oSubscriptionEdition. | 
| repositoryConfigurations | Información de configuración del contenido del origen de datos. Por ejemplo, configurar tipos específicos de contenido y asignaciones de campos. | 
|  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | Una lista de objetos que asignan los atributos o los nombres de campo del SharePoint contenido para Amazon Kendra indexar los nombres de los campos. Para obtener más información, consulte [Asignación de campos de origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/field-mapping.html). | 
| additionalProperties | Opciones de configuración adicionales para el contenido del origen de datos. | 
|  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html) | Una lista de patrones de expresiones regulares para include/exclude determinado contenido de la fuente SharePoint de datos. Los elementos de contenido que coincidan con los patrones de inclusión se incluyen en el índice. Los elementos de contenido que no coincidan con los patrones de inclusión se excluyen del índice. Si un archivo coincide con un patrón de inclusión y de exclusión, el patrón de exclusión tiene prioridad y el archivo no se incluye en el índice. | 
| [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html) | true para rastrear estos tipos de contenido. | 
| crawlAcl | true para rastrear la información de la lista de control de acceso (ACL) para los documentos, si tiene una ACL y desea usarla para el control de acceso. La ACL controla los documentos a los que los usuarios y los grupos pueden acceder y que pueden buscar. La información de la ACL se utiliza para filtrar los resultados de búsqueda en función del acceso del usuario o su grupo a los documentos. Para obtener más información, consulte [Filtrado de contexto de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#context-filter-user-incl-datasources). | 
| fieldForUserID | Especifique email si desea usar el correo electrónico del usuario como ID de usuario o userPrincipalName si desea usar un nombre de usuario como ID de usuario. Si no especifica una opción, se utiliza email como valor predeterminado. | 
| aclConfiguration | Especifique ACLWithLDAPEmailFmt, ACLWithManualEmailFmt o ACLWithUsernameFmtM. | 
| emailDomain | El dominio del correo electrónico. Por ejemplo, “amazon.com”. | 
|  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | true para rastrear la información de asignación de grupos. | 
| proxyHost | El nombre de host del proxy web que utiliza, sin el protocolo http:// o https://. | 
| proxyPort | El número de puerto utilizado por el protocolo de transporte de URL del host. Debe ser un valor numérico entre 0 y 65535. | 
| type | Especifica SHAREPOINTV2 como el tipo de origen de datos | 
| enableIdentityCrawler | trueutilizar el rastreador Amazon Kendra de identidad para sincronizar la identity/principal información sobre los usuarios y grupos con acceso a determinados documentos. Si el rastreador de identidades está desactivado, todos los documentos se pueden buscar públicamente. Si quiere usar el control de acceso para los documentos y el rastreador de identidades está desactivado, también puede usar la API [https://docs.aws.amazon.com/kendra/latest/dg/API_PutPrincipalMapping.html](https://docs.aws.amazon.com/kendra/latest/dg/API_PutPrincipalMapping.html) para cargar la información de acceso del usuario y del grupo. | 
| syncMode |  Especifique cómo Amazon Kendra debe actualizarse el índice cuando cambie el contenido de la fuente de datos. Puede elegir entre las siguientes opciones: [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | 
| secretARN | El nombre de recurso de Amazon (ARN) de un AWS Secrets Manager secreto que contiene los pares clave-valor necesarios para conectarse a su. SharePoint Para obtener información sobre estos pares clave-valor, consulte las [instrucciones de conexión](https://docs.aws.amazon.com/kendra/latest/dg/data-source-v2-sharepoint.html#data-source-procedure-v2-sharepoint) en línea y en servidor. SharePoint SharePoint | 
| versión | La versión de esta plantilla que se admite actualmente. | 

## SharePoint Esquema JSON


```
{
	"$schema": "http://json-schema.org/draft-04/schema#",
	"type": "object",
	"properties": {
		"connectionConfiguration": {
			"type": "object",
			"properties": {
				"repositoryEndpointMetadata": {
					"type": "object",
					"properties": {
						"tenantId": {
							"type": "string",
							"pattern": "^[0-9a-f]{8}-[0-9a-f]{4}-[0-9a-f]{4}-[0-9a-f]{4}-[0-9a-f]{12}$",
							"minLength": 36,
							"maxLength": 36
						},
						"domain": {
							"type": "string"
						},
						"siteUrls": {
							"type": "array",
							"items": {
								"type": "string",
								"pattern": "https://.*"
							}
						},
						"repositoryAdditionalProperties": {
							"type": "object",
							"properties": {
								"s3bucketName": {
									"type": "string"
								},
								"s3certificateName": {
									"type": "string"
								},
								"authType": {
									"type": "string",
									"enum": [
										"OAuth2",
										"OAuth2Certificate",
										"OAuth2App",
										"Basic",
										"OAuth2_RefreshToken",
										"NTLM",
										"Kerberos"
									]
								},
								"version": {
									"type": "string",
									"enum": [
										"Server",
										"Online"
									]
								},
								"onPremVersion": {
									"type": "string",
									"enum": [
										"",
										"2013",
										"2016",
										"2019",
										"SubscriptionEdition"
									]
								}
							},
							"required": [
								"authType",
								"version"
							]
						}
					},
					"required": [
						"siteUrls",
						"domain",
						"repositoryAdditionalProperties"
					]
				}
			},
			"required": [
				"repositoryEndpointMetadata"
			]
		},
		"repositoryConfigurations": {
			"type": "object",
			"properties": {
				"event": {
					"type": "object",
					"properties": {
						"fieldMappings": {
							"type": "array",
							"items": [
								{
									"type": "object",
									"properties": {
										"indexFieldName": {
											"type": "string"
										},
										"indexFieldType": {
											"type": "string",
											"enum": [
												"STRING",
												"STRING_LIST",
												"DATE"
											]
										},
										"dataSourceFieldName": {
											"type": "string"
										},
										"dateFieldFormat": {
											"type": "string",
											"pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
										}
									},
									"required": [
										"indexFieldName",
										"indexFieldType",
										"dataSourceFieldName"
									]
								}
							]
						}
					},
					"required": [
						"fieldMappings"
					]
				},
				"page": {
					"type": "object",
					"properties": {
						"fieldMappings": {
							"type": "array",
							"items": [
								{
									"type": "object",
									"properties": {
										"indexFieldName": {
											"type": "string"
										},
										"indexFieldType": {
											"type": "string",
											"enum": [
												"STRING",
												"DATE",
												"LONG"
											]
										},
										"dataSourceFieldName": {
											"type": "string"
										},
										"dateFieldFormat": {
											"type": "string",
											"pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
										}
									},
									"required": [
										"indexFieldName",
										"indexFieldType",
										"dataSourceFieldName"
									]
								}
							]
						}
					},
					"required": [
						"fieldMappings"
					]
				},
				"file": {
					"type": "object",
					"properties": {
						"fieldMappings": {
							"type": "array",
							"items": [
								{
									"type": "object",
									"properties": {
										"indexFieldName": {
											"type": "string"
										},
										"indexFieldType": {
											"type": "string",
											"enum": [
												"STRING",
												"DATE",
												"LONG"
											]
										},
										"dataSourceFieldName": {
											"type": "string"
										},
										"dateFieldFormat": {
											"type": "string",
											"pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
										}
									},
									"required": [
										"indexFieldName",
										"indexFieldType",
										"dataSourceFieldName"
									]
								}
							]
						}
					},
					"required": [
						"fieldMappings"
					]
				},
				"link": {
					"type": "object",
					"properties": {
						"fieldMappings": {
							"type": "array",
							"items": [
								{
									"type": "object",
									"properties": {
										"indexFieldName": {
											"type": "string"
										},
										"indexFieldType": {
											"type": "string",
											"enum": [
												"STRING",
												"STRING_LIST",
												"DATE"
											]
										},
										"dataSourceFieldName": {
											"type": "string"
										},
										"dateFieldFormat": {
											"type": "string",
											"pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
										}
									},
									"required": [
										"indexFieldName",
										"indexFieldType",
										"dataSourceFieldName"
									]
								}
							]
						}
					},
					"required": [
						"fieldMappings"
					]
				},
				"attachment": {
					"type": "object",
					"properties": {
						"fieldMappings": {
							"type": "array",
							"items": [
								{
									"type": "object",
									"properties": {
										"indexFieldName": {
											"type": "string"
										},
										"indexFieldType": {
											"type": "string",
											"enum": [
												"STRING",
												"STRING_LIST",
												"DATE"
											]
										},
										"dataSourceFieldName": {
											"type": "string"
										},
										"dateFieldFormat": {
											"type": "string",
											"pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
										}
									},
									"required": [
										"indexFieldName",
										"indexFieldType",
										"dataSourceFieldName"
									]
								}
							]
						}
					},
					"required": [
						"fieldMappings"
					]
				},
				"comment": {
					"type": "object",
					"properties": {
						"fieldMappings": {
							"type": "array",
							"items": [
								{
									"type": "object",
									"properties": {
										"indexFieldName": {
											"type": "string"
										},
										"indexFieldType": {
											"type": "string",
											"enum": [
												"STRING",
												"STRING_LIST",
												"DATE"
											]
										},
										"dataSourceFieldName": {
											"type": "string"
										},
										"dateFieldFormat": {
											"type": "string",
											"pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
										}
									},
									"required": [
										"indexFieldName",
										"indexFieldType",
										"dataSourceFieldName"
									]
								}
							]
						}
					},
					"required": [
						"fieldMappings"
					]
				}
			}
		},
		"additionalProperties": {
			"type": "object",
			"properties": {
				"eventTitleFilterRegEx": {
					"type": "array",
					"items": {
						"type": "string"
					}
				},
				"pageTitleFilterRegEx": {
					"type": "array",
					"items": {
						"type": "string"
					}
				},
				"linkTitleFilterRegEx": {
					"type": "array",
					"items": {
						"type": "string"
					}
				},
				"inclusionFilePath": {
					"type": "array",
					"items": {
						"type": "string"
					}
				},
				"exclusionFilePath": {
					"type": "array",
					"items": {
						"type": "string"
					}
				},
				"inclusionFileTypePatterns": {
					"type": "array",
					"items": {
						"type": "string"
					}
				},
				"exclusionFileTypePatterns": {
					"type": "array",
					"items": {
						"type": "string"
					}
				},
				"inclusionFileNamePatterns": {
					"type": "array",
					"items": {
						"type": "string"
					}
				},
				"exclusionFileNamePatterns": {
					"type": "array",
					"items": {
						"type": "string"
					}
				},
				"inclusionOneNoteSectionNamePatterns": {
					"type": "array",
					"items": {
						"type": "string"
					}
				},
				"exclusionOneNoteSectionNamePatterns": {
					"type": "array",
					"items": {
						"type": "string"
					}
				},
				"inclusionOneNotePageNamePatterns": {
					"type": "array",
					"items": {
						"type": "string"
					}
				},
				"exclusionOneNotePageNamePatterns": {
					"type": "array",
					"items": {
						"type": "string"
					}
				},
				"crawlFiles": {
					"type": "boolean"
				},
				"crawlPages": {
					"type": "boolean"
				},
				"crawlEvents": {
					"type": "boolean"
				},
				"crawlComments": {
					"type": "boolean"
				},
				"crawlLinks": {
					"type": "boolean"
				},
				"crawlAttachments": {
					"type": "boolean"
				},
				"crawlListData": {
					"type": "boolean"
				},
				"crawlAcl": {
					"type": "boolean"
				},
				"fieldForUserId": {
					"type": "string"
				},
				"aclConfiguration": {
					"type": "string",
					"enum": [
						"ACLWithLDAPEmailFmt",
						"ACLWithManualEmailFmt",
						"ACLWithUsernameFmt"
					]
				},
				"emailDomain": {
					"type": "string"
				},
				"isCrawlLocalGroupMapping": {
					"type": "boolean"
				},
				"isCrawlAdGroupMapping": {
					"type": "boolean"
				},
				"proxyHost": {
					"type": "string"
				},
				"proxyPort": {
					"type": "string"
				}
			},
			"required": [
			]
		},
		"type": {
			"type": "string",
			"pattern": "SHAREPOINTV2"
		},
		"enableIdentityCrawler": {
			"type": "boolean"
		},
		"syncMode": {
			"type": "string",
			"enum": [
				"FULL_CRAWL",
				"FORCED_FULL_CRAWL",
				"CHANGE_LOG"
			]
		},
		"secretArn": {
			"type": "string",
			"minLength": 20,
			"maxLength": 2048
		}
	},
	"version": {
		"type": "string",
		"anyOf": [
			{
				"pattern": "1.0.0"
			}
		]
	},
	"required": [
		"connectionConfiguration",
		"repositoryConfigurations",
		"enableIdentityCrawler",
		"syncMode",
		"additionalProperties",
		"secretArn",
		"type"
	]
}
```

## Esquema de plantilla de Microsoft SQL Server


Incluye un JSON que contiene el esquema del origen de datos como parte del objeto [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_TemplateConfiguration.html). Especifique el tipo de origen de datos como `JDBC`, el tipo de base de datos como `sqlserver`, un secreto para sus credenciales de autenticación y otras configuraciones necesarias. A continuación, especifique `TEMPLATE` como el `Type` cuando llame a [CreateDataSource](https://docs.aws.amazon.com/kendra/latest/APIReference/API_CreateDataSource.html).

Puede usar la plantilla que se proporciona en esta guía para desarrolladores. Consulte [Esquema JSON de Microsoft SQL Server](#ms-sql-server-json).

En la tabla siguiente se describen los parámetros del esquema JSON de Microsoft SQL Server.


| Configuración | Description (Descripción) | 
| --- | --- | 
| connectionConfiguration | Información de configuración para el punto de conexión para el origen de datos. | 
| repositoryEndpointMetadata | Información de configuración necesaria para conectarse a su origen de datos.[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html) | 
| repositoryConfigurations | Información de configuración del contenido del origen de datos. Por ejemplo, configurar tipos específicos de contenido y asignaciones de campos. Especifique el tipo de origen de datos y el ARN secreto. | 
|  revisión  |  Una lista de objetos que asignan los atributos o los nombres de campo del contenido de la base de datos para Amazon Kendra indexar los nombres de los campos. Para obtener más información, consulte [Asignación de campos de origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/field-mapping.html). | 
| additionalProperties | Opciones de configuración adicionales para el contenido del origen de datos. Se utiliza para incluir o excluir contenido específico en el origen de datos de la base de datos. | 
| primaryKey  | Proporciona la clave principal de la tabla de la base de datos. Esto identifica una tabla dentro de la base de datos. | 
| titleColumn | Proporciona el nombre de la columna del título del documento en la tabla de la base de datos. | 
| bodyColumn | Proporciona el nombre de la columna del título del documento en la tabla de la base de datos. | 
| sqlQuery | Introduce instrucciones de consulta SQL, como las operaciones SELECT y JOIN. Las consultas SQL deben tener menos de 32 KB. Amazon Kendra rastreará todo el contenido de la base de datos que coincida con su consulta. | 
| timestampColumn | Introduzca el nombre de la columna que contiene las marcas de tiempo. Amazon Kendra utiliza la información de la marca de tiempo para detectar cambios en el contenido y sincronizar solo el contenido modificado. | 
| timestampFormat | Introduce el nombre de la columna que contiene los formatos de marcas temporales que se deben utilizar para detectar cambios en el contenido y volver a sincronizar su contenido. | 
| timezone | Introduce el nombre de la columna que contiene las zonas horarias del contenido que se va a rastrear. | 
| changeDetectingColumns | Introduce los nombres de las columnas que Amazon Kendra se utilizarán para detectar cambios en el contenido. Amazon Kendra volverá a indexar el contenido cuando se produzca un cambio en alguna de estas columnas | 
| allowedUsersColumns | Introduzca el nombre de la columna que contiene el usuario IDs al que se le permitirá acceder al contenido. | 
| allowedGroupsColumn | Introduzca el nombre de la columna que contiene el usuario IDs al que se permitirá el acceso al contenido. | 
| fuente URIColumn | Introduzca el nombre de la columna que contiene la fuente que se URLs va a indexar. | 
| isSslEnabled | Introduce instrucciones de consulta SQL, como las operaciones SELECT y JOIN. Las consultas SQL deben tener menos de 32 KB. Amazon Kendra rastreará todo el contenido de la base de datos que coincida con su consulta. | 
| type | El tipo del origen de datos. Especifica JDBC como el tipo de origen de datos. | 
| syncMode |  Especifique cómo Amazon Kendra debe actualizarse el índice cuando cambie el contenido de la fuente de datos. Puede elegir entre las siguientes opciones: [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | 
| secretArn | El nombre de recurso de Amazon (ARN) de un secreto de Secrets Manager que contiene el nombre de usuario y la contraseña necesarios para conectarse a su base de datos. El secreto debe contener una estructura JSON con las siguientes claves: <pre>{<br />    "user name": "database user name",<br />    "password": "password"<br />}</pre> | 
| versión | La versión de la plantilla que se admite actualmente. | 

### Esquema JSON de Microsoft SQL Server


```
{
  "$schema": "http://json-schema.org/draft-04/schema#",
  "type": "object",
  "properties": {
    "connectionConfiguration": {
      "type": "object",
      "properties": {
        "repositoryEndpointMetadata": {
          "type": "object",
          "properties": {
            "dbType": {
              "type": "string",
              "enum": [
                "mysql",
                "db2",
                "postgresql",
                "oracle",
                "sqlserver"
              ]
            },
            "dbHost": {
              "type": "string"
            },
            "dbPort": {
              "type": "string"
            },
            "dbInstance": {
              "type": "string"
            }
          },
          "required": [
            "dbType",
            "dbHost",
            "dbPort",
            "dbInstance"
          ]
        }
      },
      "required": [
        "repositoryEndpointMetadata"
      ]
    },
    "repositoryConfigurations": {
      "type": "object",
      "properties": {
        "document": {
          "type": "object",
          "properties": {
            "fieldMappings": {
              "type": "array",
              "items": [
                {
                  "type": "object",
                  "properties": {
                    "indexFieldName": {
                      "type": "string"
                    },
                    "indexFieldType": {
                      "type": "string"
                    },
                    "dataSourceFieldName": {
                      "type": "string"
                    }
                  },
                  "required": [
                    "indexFieldName",
                    "indexFieldType",
                    "dataSourceFieldName"
                  ]
                }
              ]
            }
          },
          "required": [
            "fieldMappings"
          ]
        }
      },
      "required": [
      ]
    },
    "additionalProperties": {
      "type": "object",
      "properties": {
        "primaryKey": {
          "type": "string"
        },
        "titleColumn": {
          "type": "string"
        },
        "bodyColumn": {
          "type": "string"
        },
        "sqlQuery": {
          "type": "string",
          "not": {
            "pattern": ";+"
          }
        },
        "timestampColumn": {
          "type": "string"
        },
        "timestampFormat": {
          "type": "string"
        },
        "timezone": {
          "type": "string"
        },
        "changeDetectingColumns": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "allowedUsersColumn": {
          "type": "string"
        },
        "allowedGroupsColumn": {
          "type": "string"
        },
        "sourceURIColumn": {
          "type": "string"
        },
        "isSslEnabled": {
          "type": "boolean"
        }
      },
      "required": ["primaryKey", "titleColumn", "bodyColumn", "sqlQuery"]
    },
    "type" : {
      "type" : "string",
      "pattern": "JDBC"
    },
    "syncMode": {
      "type": "string",
      "enum": [
        "FORCED_FULL_CRAWL",
        "FULL_CRAWL",
        "CHANGE_LOG"
      ]
    },
    "secretArn": {
      "type": "string"
    }
  },
  "version": {
    "type": "string",
    "anyOf": [
      {
        "pattern": "1.0.0"
      }
    ]
  },
  "required": [
      "connectionConfiguration",
      "repositoryConfigurations",
      "syncMode",
      "additionalProperties",
      "secretArn",
      "type"
  ]
}
```

## Esquema de plantilla de Microsoft Teams


Incluye un JSON que contiene el esquema del origen de datos como parte del objeto [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_TemplateConfiguration.html). Debe proporcionar el ID de inquilino como parte de la configuración de la conexión o de los detalles del punto de conexión del repositorio. Además, especifique el tipo de origen de datos como `MSTEAMS`, un secreto para sus credenciales de autenticación y otras configuraciones necesarias. A continuación, especifique `TEMPLATE` como el `Type` cuando llame a [CreateDataSource](https://docs.aws.amazon.com/kendra/latest/APIReference/API_CreateDataSource.html).

Puede usar la plantilla que se proporciona en esta guía para desarrolladores. Consulte [Esquema JSON de Microsoft Teams](#msteams-json).

En la tabla siguiente se describen los parámetros del esquema JSON de Microsoft Teams.


| Configuración | Description (Descripción) | 
| --- | --- | 
| connectionConfiguration | Información de configuración para el punto de conexión para el origen de datos. | 
| repositoryEndpointMetadata | La información del punto de conexión para el origen de datos. | 
| tenantId | El ID de inquilino de Microsoft 365. Puede encontrar su ID de inquilino en las propiedades de su portal de Azure Active Directory o en su OAuth aplicación. | 
| repositoryConfigurations | Información de configuración del contenido del origen de datos. Por ejemplo, configurar tipos específicos de contenido y asignaciones de campos. | 
|  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | Una lista de objetos que asignan los atributos o los nombres de campo del contenido de Microsoft Teams para Amazon Kendra indexar los nombres de los campos. Para obtener más información, consulte [Asignación de campos de origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/field-mapping.html). | 
| additionalProperties | Opciones de configuración adicionales para el contenido del origen de datos. | 
| paymentModel | Especifica el tipo de modelo de pago que se debe utilizar con el origen de datos de Microsoft Teams. Los modelos de pago del modelo A están restringidos a los modelos de licencia y pago que requieren el cumplimiento de las normas de seguridad. Los modelos de pago del modelo B son adecuados para los modelos de licencia y pago que no requieren el cumplimiento de las normas de seguridad. | 
|  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | Una lista de patrones de expresión regular para incluir determinado contenido en su origen de datos de Microsoft Teams. El contenido que coincide con los patrones se incluye en el índice. El contenido que no coincide con los patrones se excluye del índice. Si el contenido coincide con un patrón de inclusión y de exclusión, el patrón de exclusión tiene prioridad y el contenido no se incluye en el índice. | 
|  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | Una lista de patrones de expresión regular para excluir determinado contenido en su origen de datos de Microsoft Teams. El contenido que coincide con los patrones se excluye del índice. El contenido que no coincide con los patrones se incluye en el índice. Si el contenido coincide con un patrón de inclusión y de exclusión, el patrón de exclusión tiene prioridad y el contenido no se incluye en el índice. | 
|  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | true para rastrear estos tipos de contenido en su origen de datos de Microsoft Teams. | 
| startCalendarDateHora | Puede configurar una fecha y hora de inicio específicas para el contenido de su calendario. | 
| endCalendarDateHora | Puede configurar una fecha y hora de finalización específicas para el contenido del calendario. | 
| type | El tipo del origen de datos. Especifica MSTEAMS como el tipo de origen de datos. | 
| enableIdentityCrawler | trueutilizar el rastreador Amazon Kendra de identidad para sincronizar la identity/principal información sobre los usuarios y grupos con acceso a determinados documentos. Si el rastreador de identidades está desactivado, todos los documentos se pueden buscar públicamente. Si quiere usar el control de acceso para los documentos y el rastreador de identidades está desactivado, también puede usar la API [https://docs.aws.amazon.com/kendra/latest/dg/API_PutPrincipalMapping.html](https://docs.aws.amazon.com/kendra/latest/dg/API_PutPrincipalMapping.html) para cargar la información de acceso del usuario y del grupo. | 
| syncMode |  Especifique cómo Amazon Kendra debe actualizarse el índice cuando cambie el contenido de la fuente de datos. Puede elegir entre las siguientes opciones: [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | 
| secretArn | El nombre de recurso de Amazon (ARN) de un AWS Secrets Manager secreto que contiene los pares clave-valor necesarios para conectarse a Microsoft Teams. Esto incluye su ID de cliente y su secreto de cliente que se generan al crear una OAuth aplicación en el portal de Azure. | 
| versión | La versión de esta plantilla que se admite actualmente. | 

### Esquema JSON de Microsoft Teams


```
{
  "$schema": "http://json-schema.org/draft-04/schema#",
  "type": "object",
  "properties": {
    "connectionConfiguration": {
      "type": "object",
      "properties": {
        "repositoryEndpointMetadata": {
          "type": "object",
          "properties": {
            "tenantId": {
              "type": "string",
              "pattern": "^[0-9a-f]{8}-[0-9a-f]{4}-[0-9a-f]{4}-[0-9a-f]{4}-[0-9a-f]{12}$",
              "minLength": 36,
              "maxLength": 36
            }
          },
          "required": [
            "tenantId"
          ]
        }
      },
      "required": [
        "repositoryEndpointMetadata"
      ]
    },
    "repositoryConfigurations": {
      "type": "object",
      "properties": {
        "chatMessage": {
          "type": "object",
          "properties": {
            "fieldMappings": {
              "type": "array",
              "items": [
                {
                  "type": "object",
                  "properties": {
                    "indexFieldName": {
                      "type": "string"
                    },
                    "indexFieldType": {
                      "type": "string",
                      "enum": [
                        "STRING",
                        "STRING_LIST",
                        "DATE"
                      ]
                    },
                    "dataSourceFieldName": {
                      "type": "string"
                    },
                    "dateFieldFormat": {
                      "type": "string",
                      "pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
                    }
                  },
                  "required": [
                    "indexFieldName",
                    "indexFieldType",
                    "dataSourceFieldName"
                  ]
                }
              ]
            }
          },
          "required": [
            "fieldMappings"
          ]
        },
        "chatAttachment": {
          "type": "object",
          "properties": {
            "fieldMappings": {
              "type": "array",
              "items": [
                {
                  "type": "object",
                  "properties": {
                    "indexFieldName": {
                      "type": "string"
                    },
                    "indexFieldType": {
                      "type": "string",
                      "enum": [
                        "STRING",
                        "DATE",
                        "LONG"
                      ]
                    },
                    "dataSourceFieldName": {
                      "type": "string"
                    },
                    "dateFieldFormat": {
                      "type": "string",
                      "pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
                    }
                  },
                  "required": [
                    "indexFieldName",
                    "indexFieldType",
                    "dataSourceFieldName"
                  ]
                }
              ]
            }
          },
          "required": [
            "fieldMappings"
          ]
        },
        "channelPost": {
          "type": "object",
          "properties": {
            "fieldMappings": {
              "type": "array",
              "items": [
                {
                  "type": "object",
                  "properties": {
                    "indexFieldName": {
                      "type": "string"
                    },
                    "indexFieldType": {
                      "type": "string",
                      "enum": [
                        "STRING",
                        "STRING_LIST",
                        "DATE"
                      ]
                    },
                    "dataSourceFieldName": {
                      "type": "string"
                    },
                    "dateFieldFormat": {
                      "type": "string",
                      "pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
                    }
                  },
                  "required": [
                    "indexFieldName",
                    "indexFieldType",
                    "dataSourceFieldName"
                  ]
                }
              ]
            }
          },
          "required": [
            "fieldMappings"
          ]
        },
        "channelWiki": {
          "type": "object",
          "properties": {
            "fieldMappings": {
              "type": "array",
              "items": [
                {
                  "type": "object",
                  "properties": {
                    "indexFieldName": {
                      "type": "string"
                    },
                    "indexFieldType": {
                      "type": "string",
                      "enum": [
                        "STRING",
                        "DATE",
                        "LONG"
                      ]
                    },
                    "dataSourceFieldName": {
                      "type": "string"
                    },
                    "dateFieldFormat": {
                      "type": "string",
                      "pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
                    }
                  },
                  "required": [
                    "indexFieldName",
                    "indexFieldType",
                    "dataSourceFieldName"
                  ]
                }
              ]
            }
          },
          "required": [
            "fieldMappings"
          ]
        },
        "channelAttachment": {
          "type": "object",
          "properties": {
            "fieldMappings": {
              "type": "array",
              "items": [
                {
                  "type": "object",
                  "properties": {
                    "indexFieldName": {
                      "type": "string"
                    },
                    "indexFieldType": {
                      "type": "string",
                      "enum": [
                        "STRING",
                        "DATE",
                        "LONG"
                      ]
                    },
                    "dataSourceFieldName": {
                      "type": "string"
                    },
                    "dateFieldFormat": {
                      "type": "string",
                      "pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
                    }
                  },
                  "required": [
                    "indexFieldName",
                    "indexFieldType",
                    "dataSourceFieldName"
                  ]
                }
              ]
            }
          },
          "required": [
            "fieldMappings"
          ]
        },
        "meetingChat": {
          "type": "object",
          "properties": {
            "fieldMappings": {
              "type": "array",
              "items": [
                {
                  "type": "object",
                  "properties": {
                    "indexFieldName": {
                      "type": "string"
                    },
                    "indexFieldType": {
                      "type": "string",
                      "enum": [
                        "STRING",
                        "STRING_LIST",
                        "DATE"
                      ]
                    },
                    "dataSourceFieldName": {
                      "type": "string"
                    },
                    "dateFieldFormat": {
                      "type": "string",
                      "pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
                    }
                  },
                  "required": [
                    "indexFieldName",
                    "indexFieldType",
                    "dataSourceFieldName"
                  ]
                }
              ]
            }
          },
          "required": [
            "fieldMappings"
          ]
        },
        "meetingFile": {
          "type": "object",
          "properties": {
            "fieldMappings": {
              "type": "array",
              "items": [
                {
                  "type": "object",
                  "properties": {
                    "indexFieldName": {
                      "type": "string"
                    },
                    "indexFieldType": {
                      "type": "string",
                      "enum": [
                        "STRING",
                        "DATE",
                        "LONG"
                      ]
                    },
                    "dataSourceFieldName": {
                      "type": "string"
                    },
                    "dateFieldFormat": {
                      "type": "string",
                      "pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
                    }
                  },
                  "required": [
                    "indexFieldName",
                    "indexFieldType",
                    "dataSourceFieldName"
                  ]
                }
              ]
            }
          },
          "required": [
            "fieldMappings"
          ]
        },
        "meetingNote": {
          "type": "object",
          "properties": {
            "fieldMappings": {
              "type": "array",
              "items": [
                {
                  "type": "object",
                  "properties": {
                    "indexFieldName": {
                      "type": "string"
                    },
                    "indexFieldType": {
                      "type": "string",
                      "enum": [
                        "STRING",
                        "DATE"
                      ]
                    },
                    "dataSourceFieldName": {
                      "type": "string"
                    },
                    "dateFieldFormat": {
                      "type": "string",
                      "pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
                    }
                  },
                  "required": [
                    "indexFieldName",
                    "indexFieldType",
                    "dataSourceFieldName"
                  ]
                }
              ]
            }
          },
          "required": [
            "fieldMappings"
          ]
        },
        "calendarMeeting": {
          "type": "object",
          "properties": {
            "fieldMappings": {
              "type": "array",
              "items": [
                {
                  "type": "object",
                  "properties": {
                    "indexFieldName": {
                      "type": "string"
                    },
                    "indexFieldType": {
                      "type": "string",
                      "enum": [
                        "STRING",
                        "DATE"
                      ]
                    },
                    "dataSourceFieldName": {
                      "type": "string"
                    },
                    "dateFieldFormat": {
                      "type": "string",
                      "pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
                    }
                  },
                  "required": [
                    "indexFieldName",
                    "indexFieldType",
                    "dataSourceFieldName"
                  ]
                }
              ]
            }
          },
          "required": [
            "fieldMappings"
          ]
        }
      }
    },
     "additionalProperties": {
      "type": "object",
      "properties": {
        "paymentModel": {
          "type": "string",
          "enum": [
            "A",
            "B",
            "Evaluation Mode"
          ]
        },
        "inclusionTeamNameFilter": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "exclusionTeamNameFilter": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "inclusionChannelNameFilter": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "exclusionChannelNameFilter": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "inclusionFileNamePatterns": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "exclusionFileNamePatterns": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "inclusionFileTypePatterns": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "exclusionFileTypePatterns": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "inclusionUserEmailFilter": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "inclusionOneNoteSectionNamePatterns": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "exclusionOneNoteSectionNamePatterns": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "inclusionOneNotePageNamePatterns": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "exclusionOneNotePageNamePatterns": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "isCrawlChatMessage": {
          "type": "boolean"
        },
        "isCrawlChatAttachment": {
          "type": "boolean"
        },
        "isCrawlChannelPost": {
          "type": "boolean"
        },
        "isCrawlChannelAttachment": {
          "type": "boolean"
        },
        "isCrawlChannelWiki": {
          "type": "boolean"
        },
        "isCrawlCalendarMeeting": {
          "type": "boolean"
        },
        "isCrawlMeetingChat": {
          "type": "boolean"
        },
        "isCrawlMeetingFile": {
          "type": "boolean"
        },
        "isCrawlMeetingNote": {
          "type": "boolean"
        },
        "startCalendarDateTime": {
          "anyOf": [
            {
              "type": "string",
              "pattern": "^[0-9]{4}-[0-9]{2}-[0-9]{2}T[0-9]{2}:[0-9]{2}:[0-9]{2}Z$"
            },
            {
              "type": "string",
              "pattern": ""
            }
          ]
        },
        "endCalendarDateTime": {
          "anyOf": [
            {
              "type": "string",
              "pattern": "^[0-9]{4}-[0-9]{2}-[0-9]{2}T[0-9]{2}:[0-9]{2}:[0-9]{2}Z$"
            },
            {
              "type": "string",
              "pattern": ""
            }
          ]
        }
      },
      "required": []
    },
    "type": {
      "type": "string",
      "pattern": "MSTEAMS"
    },
    "enableIdentityCrawler": {
      "type": "boolean"
    },
    "syncMode": {
      "type": "string",
      "enum": [
        "FORCED_FULL_CRAWL",
        "FULL_CRAWL",
        "CHANGE_LOG"
      ]
    },
    "secretArn": {
      "type": "string",
      "minLength": 20,
      "maxLength": 2048
    }
  },
  "version": {
    "type": "string",
    "anyOf": [
      {
        "pattern": "1.0.0"
      }
    ]
  },
  "required": [
    "connectionConfiguration",
    "repositoryConfigurations",
    "syncMode",
    "additionalProperties",
    "secretArn",
    "type"
  ]
}
```

## Esquema de plantilla de Microsoft Yammer


Incluye un JSON que contiene el esquema de la fuente de datos como parte del [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_TemplateConfiguration.html)objeto. Especifique el tipo de origen de datos como `YAMMER`, un secreto para sus credenciales de autenticación y otras configuraciones necesarias. A continuación, especifíquelo `TEMPLATE` como **Tipo** cuando llame [CreateDataSource](https://docs.aws.amazon.com/kendra/latest/APIReference/API_CreateDataSource.html).

Puede usar la plantilla que se proporciona en esta guía para desarrolladores.

En la tabla siguiente se describen los parámetros del esquema JSON de Microsoft Yammer.


| Configuración | Description (Descripción) | 
| --- | --- | 
| connectionConfiguration | Información de configuración del origen de datos. | 
| repositoryEndpointMetadata | La información del punto de conexión para el origen de datos. Este origen de datos no especifica un punto de conexión en repositoryEndpointMetadata. Más bien, la información de conexión se incluye en un AWS Secrets Manager secreto que usted proporcionasecretArn. | 
| repositoryConfigurations | Información de configuración del contenido del origen de datos. Por ejemplo, configurar tipos específicos de contenido y asignaciones de campos. | 
|  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | Una lista de objetos que asignan atributos o nombres de campo de Microsoft Yammer a los nombres de campo del índice de Amazon Kendra. Para obtener más información, consulte [Asignación de campos de origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/field-mapping.html). | 
| additionalProperties | Opciones de configuración adicionales para el contenido del origen de datos | 
| inclusionPatterns | Una lista de patrones de expresión regular para incluir determinados archivos en su origen de datos de Microsoft Yammer. Los archivos que coinciden con los patrones se incluyen en el índice. Los archivos que no coinciden con los patrones se excluyen del índice. Si un archivo coincide con un patrón de inclusión y de exclusión, el patrón de exclusión tiene prioridad y el archivo no se incluye en el índice. | 
| exclusionPatterns | Una lista de patrones de expresión regular para excluir determinados archivos en su origen de datos de Microsoft Yammer. Los archivos que coinciden con los patrones se excluyen del índice. Los archivos que no coincidan con los patrones se incluyen en el índice. Si un archivo coincide con un patrón de exclusión y de inclusión, el patrón de exclusión tiene prioridad y el archivo no se incluye en el índice. | 
| sinceDate | Puede optar por configurar un parámetro sinceDate para que el conector de Microsoft Yammer rastree el contenido en función de una sinceDate específica. | 
| communityNameFilter | Puede elegir indexar contenido específico de la comunidad. | 
|  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | true para rastrear mensajes, archivos adjuntos de mensajes y mensajes privados. | 
| type | Especifica YAMMER como el tipo de origen de datos. | 
| secretARN | El nombre de recurso de Amazon (ARN) de un AWS Secrets Manager secreto que contiene los pares clave-valor necesarios para conectarse a Microsoft Yammer. Esto incluye el nombre de usuario y la contraseña de Microsoft Yammer, así como el ID y el secreto de cliente que se generan al crear una OAuth aplicación en el portal de Azure. | 
| useChangeLog | true para usar el registro de cambios de Microsoft Yammer y determinar qué documentos deben actualizarse en el índice. | 
| syncMode |  Especifique cómo Amazon Kendra debe actualizarse el índice cuando cambie el contenido de la fuente de datos. Puede elegir entre las siguientes opciones: [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | 
| enableIdentityCrawler | trueutilizar el rastreador Amazon Kendra de identidad para sincronizar la identity/principal información sobre los usuarios y grupos con acceso a determinados documentos. Si el rastreador de identidades está desactivado, todos los documentos se pueden buscar públicamente. Si quiere usar el control de acceso para los documentos y el rastreador de identidades está desactivado, también puede usar la API [https://docs.aws.amazon.com/kendra/latest/dg/API_PutPrincipalMapping.html](https://docs.aws.amazon.com/kendra/latest/dg/API_PutPrincipalMapping.html) para cargar la información de acceso del usuario y del grupo. | 

### Esquema JSON de Microsoft Yammer


```
{
  "$schema": "http://json-schema.org/draft-04/schema#",
  "type": "object",
  "properties": {
    "connectionConfiguration": {
      "type": "object",
      "properties": {
        "repositoryEndpointMetadata": {
          "type": "object",
          "properties": {
          }
        }
      },
      "required": [
        "repositoryEndpointMetadata"
      ]
    },
    "repositoryConfigurations": {
      "type": "object",
      "properties": {
        "community": {
          "type": "object",
          "properties": {
            "fieldMappings": {
              "type": "array",
              "items": {
                "anyOf": [
                  {
                    "type": "object",
                    "properties": {
                      "indexFieldName": {
                        "type": "string"
                      },
                      "indexFieldType": {
                        "type": "string",
                        "enum": [
                          "STRING",
                          "DATE"
                        ]
                      },
                      "dataSourceFieldName": {
                        "type": "string"
                      },
                      "dateFieldFormat": {
                        "type": "string",
                        "pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
                      }
                    },
                    "required": [
                      "indexFieldName",
                      "indexFieldType",
                      "dataSourceFieldName"
                    ]
                  }
                ]
              }
            }
          },
          "required": [
            "fieldMappings"
          ]
        },
        "user": {
          "type": "object",
          "properties": {
            "fieldMappings": {
              "type": "array",
              "items": {
                "anyOf": [
                  {
                    "type": "object",
                    "properties": {
                      "indexFieldName": {
                        "type": "string"
                      },
                      "indexFieldType": {
                        "type": "string",
                        "enum": [
                          "STRING",
                          "DATE"
                        ]
                      },
                      "dataSourceFieldName": {
                        "type": "string"
                      },
                      "dateFieldFormat": {
                        "type": "string",
                        "pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
                      }
                    },
                    "required": [
                      "indexFieldName",
                      "indexFieldType",
                      "dataSourceFieldName"
                    ]
                  }
                ]
              }
            }
          },
          "required": [
            "fieldMappings"
          ]
        },
        "message": {
          "type": "object",
          "properties": {
            "fieldMappings": {
              "type": "array",
              "items": {
                "anyOf": [
                  {
                    "type": "object",
                    "properties": {
                      "indexFieldName": {
                        "type": "string"
                      },
                      "indexFieldType": {
                        "type": "string",
                        "enum": [
                          "STRING",
                          "DATE"
                        ]
                      },
                      "dataSourceFieldName": {
                        "type": "string"
                      },
                      "dateFieldFormat": {
                        "type": "string",
                        "pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
                      }
                    },
                    "required": [
                      "indexFieldName",
                      "indexFieldType",
                      "dataSourceFieldName"
                    ]
                  }
                ]
              }
            }
          },
          "required": [
            "fieldMappings"
          ]
        },
        "attachment": {
          "type": "object",
          "properties": {
            "fieldMappings": {
              "type": "array",
              "items": {
                "anyOf": [
                  {
                    "type": "object",
                    "properties": {
                      "indexFieldName": {
                        "type": "string"
                      },
                      "indexFieldType": {
                        "type": "string",
                        "enum": [
                          "STRING",
                          "DATE"
                        ]
                      },
                      "dataSourceFieldName": {
                        "type": "string"
                      },
                      "dateFieldFormat": {
                        "type": "string",
                        "pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
                      }
                    },
                    "required": [
                      "indexFieldName",
                      "indexFieldType",
                      "dataSourceFieldName"
                    ]
                  }
                ]
              }
            }
          },
          "required": [
            "fieldMappings"
          ]
        }
      }
    },
    "additionalProperties": {
      "type": "object",
      "properties": {
        "inclusionPatterns": {
          "type": "array"
        },
        "exclusionPatterns": {
          "type": "array"
        },
        "sinceDate": {
          "type": "string",
          "pattern": "^(19|2[0-9])[0-9]{2}-(0[1-9]|1[012])-(0[1-9]|[12][0-9]|3[01])T(0[0-9]|1[0-9]|2[0-3]):([0-5][0-9]):([0-5][0-9])((\\+|-)(0[0-9]|1[0-9]|2[0-3]):([0-5][0-9]))?$"
        },
        "communityNameFilter": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "isCrawlMessage": {
          "type": "boolean"
        },
        "isCrawlAttachment": {
          "type": "boolean"
        },
        "isCrawlPrivateMessage": {
          "type": "boolean"
        }
      },
      "required": [
        "sinceDate"
      ]
    },
    "type": {
      "type": "string",
      "pattern": "YAMMER"
    },
    "secretArn": {
      "type": "string",
      "minLength": 20,
      "maxLength": 2048
    },
    "useChangeLog": {
      "type": "string",
      "enum": [
        "true",
        "false"
      ]
    },
    "syncMode": {
      "type": "string",
      "enum": [
        "FORCED_FULL_CRAWL",
        "FULL_CRAWL",
        "CHANGE_LOG"
      ]
    },
    "enableIdentityCrawler": {
      "type": "boolean"
    },
    "version": {
      "type": "string",
      "anyOf": [
        {
          "pattern": "1.0.0"
        }
      ]
    }
  },
  "required": [
    "connectionConfiguration",
    "repositoryConfigurations",
    "additionalProperties",
    "type",
    "secretArn",
    "syncMode"
  ]
}
```

## Esquema de plantilla de MySQL


Incluye un JSON que contiene el esquema del origen de datos como parte del objeto [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_TemplateConfiguration.html). Especifique el tipo de origen de datos como `JDBC`, el tipo de base de datos como `mysql`, un secreto para sus credenciales de autenticación y otras configuraciones necesarias. A continuación, especifique `TEMPLATE` como el `Type` cuando llame a [CreateDataSource](https://docs.aws.amazon.com/kendra/latest/APIReference/API_CreateDataSource.html).

Puede usar la plantilla que se proporciona en esta guía para desarrolladores. Consulte [Esquema JSON de MySQL](#mysql-json).

En la tabla siguiente se describen los parámetros del esquema JSON de MySQL.


| Configuración | Description (Descripción) | 
| --- | --- | 
| connectionConfiguration | Información de configuración para el punto de conexión para el origen de datos. | 
| repositoryEndpointMetadata | Información de configuración necesaria para conectarse a su origen de datos.[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html) | 
| repositoryConfigurations | Información de configuración del contenido del origen de datos. Por ejemplo, configurar tipos específicos de contenido y asignaciones de campos. Especifique el tipo de origen de datos y el ARN secreto. | 
|  revisión  |  Una lista de objetos que mapean los atributos o los nombres de campo del contenido de la base de datos para Amazon Kendra indexar los nombres de los campos. Para obtener más información, consulte [Asignación de campos de origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/field-mapping.html). | 
| additionalProperties | Opciones de configuración adicionales para el contenido del origen de datos. Se utiliza para incluir o excluir contenido específico en el origen de datos de la base de datos. | 
| primaryKey  | Proporciona la clave principal de la tabla de la base de datos. Esto identifica una tabla dentro de la base de datos. | 
| titleColumn | Proporciona el nombre de la columna del título del documento en la tabla de la base de datos. | 
| bodyColumn | Proporciona el nombre de la columna del título del documento en la tabla de la base de datos. | 
| sqlQuery | Introduce instrucciones de consulta SQL, como las operaciones SELECT y JOIN. Las consultas SQL deben tener menos de 32 KB. Amazon Kendra rastreará todo el contenido de la base de datos que coincida con su consulta. | 
| timestampColumn | Introduzca el nombre de la columna que contiene las marcas de tiempo. Amazon Kendra utiliza la información de la marca de tiempo para detectar cambios en el contenido y sincronizar solo el contenido modificado. | 
| timestampFormat | Introduce el nombre de la columna que contiene los formatos de marcas temporales que se deben utilizar para detectar cambios en el contenido y volver a sincronizar su contenido. | 
| timezone | Introduce el nombre de la columna que contiene las zonas horarias del contenido que se va a rastrear. | 
| changeDetectingColumns | Introduce los nombres de las columnas que Amazon Kendra se utilizarán para detectar cambios en el contenido. Amazon Kendra volverá a indexar el contenido cuando se produzca un cambio en alguna de estas columnas | 
| allowedUsersColumns | Introduzca el nombre de la columna que contiene el usuario IDs al que se le permitirá acceder al contenido. | 
| allowedGroupsColumn | Introduzca el nombre de la columna que contiene el usuario IDs al que se permitirá el acceso al contenido. | 
| fuente URIColumn | Introduzca el nombre de la columna que contiene la fuente que se URLs va a indexar. | 
| isSslEnabled | Introduce instrucciones de consulta SQL, como las operaciones SELECT y JOIN. Las consultas SQL deben tener menos de 32 KB. Amazon Kendra rastreará todo el contenido de la base de datos que coincida con su consulta. | 
| type | El tipo del origen de datos. Especifica JDBC como el tipo de origen de datos. | 
| syncMode |  Especifique cómo Amazon Kendra debe actualizarse el índice cuando cambie el contenido de la fuente de datos. Puede elegir entre las siguientes opciones: [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | 
| secretArn | El nombre de recurso de Amazon (ARN) de un secreto de Secrets Manager que contiene el nombre de usuario y la contraseña necesarios para conectarse a su base de datos. El secreto debe contener una estructura JSON con las siguientes claves: <pre>{<br />    "user name": "database user name",<br />    "password": "password"<br />}</pre> | 
| versión | La versión de la plantilla que se admite actualmente. | 

### Esquema JSON de MySQL


```
{
  "$schema": "http://json-schema.org/draft-04/schema#",
  "type": "object",
  "properties": {
    "connectionConfiguration": {
      "type": "object",
      "properties": {
        "repositoryEndpointMetadata": {
          "type": "object",
          "properties": {
            "dbType": {
              "type": "string",
              "enum": [
                "mysql",
                "db2",
                "postgresql",
                "oracle",
                "sqlserver"
              ]
            },
            "dbHost": {
              "type": "string"
            },
            "dbPort": {
              "type": "string"
            },
            "dbInstance": {
              "type": "string"
            }
          },
          "required": [
            "dbType",
            "dbHost",
            "dbPort",
            "dbInstance"
          ]
        }
      },
      "required": [
        "repositoryEndpointMetadata"
      ]
    },
    "repositoryConfigurations": {
      "type": "object",
      "properties": {
        "document": {
          "type": "object",
          "properties": {
            "fieldMappings": {
              "type": "array",
              "items": [
                {
                  "type": "object",
                  "properties": {
                    "indexFieldName": {
                      "type": "string"
                    },
                    "indexFieldType": {
                      "type": "string"
                    },
                    "dataSourceFieldName": {
                      "type": "string"
                    }
                  },
                  "required": [
                    "indexFieldName",
                    "indexFieldType",
                    "dataSourceFieldName"
                  ]
                }
              ]
            }
          },
          "required": [
            "fieldMappings"
          ]
        }
      },
      "required": [
      ]
    },
    "additionalProperties": {
      "type": "object",
      "properties": {
        "primaryKey": {
          "type": "string"
        },
        "titleColumn": {
          "type": "string"
        },
        "bodyColumn": {
          "type": "string"
        },
        "sqlQuery": {
          "type": "string",
          "not": {
            "pattern": ";+"
          }
        },
        "timestampColumn": {
          "type": "string"
        },
        "timestampFormat": {
          "type": "string"
        },
        "timezone": {
          "type": "string"
        },
        "changeDetectingColumns": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "allowedUsersColumn": {
          "type": "string"
        },
        "allowedGroupsColumn": {
          "type": "string"
        },
        "sourceURIColumn": {
          "type": "string"
        },
        "isSslEnabled": {
          "type": "boolean"
        }
      },
      "required": ["primaryKey", "titleColumn", "bodyColumn", "sqlQuery"]
    },
    "type" : {
      "type" : "string",
      "pattern": "JDBC"
    },
    "syncMode": {
      "type": "string",
      "enum": [
        "FORCED_FULL_CRAWL",
        "FULL_CRAWL",
        "CHANGE_LOG"
      ]
    },
    "secretArn": {
      "type": "string"
    }
  },
  "version": {
    "type": "string",
    "anyOf": [
      {
        "pattern": "1.0.0"
      }
    ]
  },
  "required": [
      "connectionConfiguration",
      "repositoryConfigurations",
      "syncMode",
      "additionalProperties",
      "secretArn",
      "type"
  ]
}
```

## Esquema de plantilla de Oracle Database


Incluye un JSON que contiene el esquema del origen de datos como parte del objeto [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_TemplateConfiguration.html). Especifique el tipo de origen de datos como `JDBC`, el tipo de base de datos como `oracle`, un secreto para sus credenciales de autenticación y otras configuraciones necesarias. A continuación, especifique `TEMPLATE` como el `Type` cuando llame a [CreateDataSource](https://docs.aws.amazon.com/kendra/latest/APIReference/API_CreateDataSource.html).

Puede usar la plantilla que se proporciona en esta guía para desarrolladores. Consulte [Esquema JSON de Oracle Database](#oracle-database-json).

En la tabla siguiente se describen los parámetros del esquema JSON de Oracle Database.


| Configuración | Description (Descripción) | 
| --- | --- | 
| connectionConfiguration | Información de configuración para el punto de conexión para el origen de datos. | 
| repositoryEndpointMetadata | Información de configuración necesaria para conectarse a su origen de datos.[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html) | 
| repositoryConfigurations | Información de configuración del contenido del origen de datos. Por ejemplo, configurar tipos específicos de contenido y asignaciones de campos. Especifique el tipo de origen de datos y el ARN secreto. | 
|  revisión  |  Una lista de objetos que asignan los atributos o los nombres de campo del contenido de la base de datos para Amazon Kendra indexar los nombres de los campos. Para obtener más información, consulte [Asignación de campos de origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/field-mapping.html). | 
| additionalProperties | Opciones de configuración adicionales para el contenido del origen de datos. Se utiliza para incluir o excluir contenido específico en el origen de datos de la base de datos. | 
| primaryKey  | Proporciona la clave principal de la tabla de la base de datos. Esto identifica una tabla dentro de la base de datos. | 
| titleColumn | Proporciona el nombre de la columna del título del documento en la tabla de la base de datos. | 
| bodyColumn | Proporciona el nombre de la columna del título del documento en la tabla de la base de datos. | 
| sqlQuery | Introduce instrucciones de consulta SQL, como las operaciones SELECT y JOIN. Las consultas SQL deben tener menos de 32 KB. Amazon Kendra rastreará todo el contenido de la base de datos que coincida con su consulta. | 
| timestampColumn | Introduzca el nombre de la columna que contiene las marcas de tiempo. Amazon Kendra utiliza la información de la marca de tiempo para detectar cambios en el contenido y sincronizar solo el contenido modificado. | 
| timestampFormat | Introduce el nombre de la columna que contiene los formatos de marcas temporales que se deben utilizar para detectar cambios en el contenido y volver a sincronizar su contenido. | 
| timezone | Introduce el nombre de la columna que contiene las zonas horarias del contenido que se va a rastrear. | 
| changeDetectingColumns | Introduce los nombres de las columnas que Amazon Kendra se utilizarán para detectar cambios en el contenido. Amazon Kendra volverá a indexar el contenido cuando se produzca un cambio en alguna de estas columnas | 
| allowedUsersColumns | Introduzca el nombre de la columna que contiene el usuario IDs al que se le permitirá acceder al contenido. | 
| allowedGroupsColumn | Introduzca el nombre de la columna que contiene el usuario IDs al que se permitirá el acceso al contenido. | 
| fuente URIColumn | Introduzca el nombre de la columna que contiene la fuente que se URLs va a indexar. | 
| isSslEnabled | Introduce instrucciones de consulta SQL, como las operaciones SELECT y JOIN. Las consultas SQL deben tener menos de 32 KB. Amazon Kendra rastreará todo el contenido de la base de datos que coincida con su consulta. | 
| type | El tipo del origen de datos. Especifica JDBC como el tipo de origen de datos. | 
| syncMode |  Especifique cómo Amazon Kendra debe actualizarse el índice cuando cambie el contenido de la fuente de datos. Puede elegir entre las siguientes opciones: [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | 
| secretArn | El nombre de recurso de Amazon (ARN) de un secreto de Secrets Manager que contiene el nombre de usuario y la contraseña necesarios para conectarse a su base de datos. El secreto debe contener una estructura JSON con las siguientes claves: <pre>{<br />    "user name": "database user name",<br />    "password": "password"<br />}</pre> | 
| versión | La versión de la plantilla que se admite actualmente. | 

### Esquema JSON de Oracle Database


```
{
  "$schema": "http://json-schema.org/draft-04/schema#",
  "type": "object",
  "properties": {
    "connectionConfiguration": {
      "type": "object",
      "properties": {
        "repositoryEndpointMetadata": {
          "type": "object",
          "properties": {
            "dbType": {
              "type": "string",
              "enum": [
                "mysql",
                "db2",
                "postgresql",
                "oracle",
                "sqlserver"
              ]
            },
            "dbHost": {
              "type": "string"
            },
            "dbPort": {
              "type": "string"
            },
            "dbInstance": {
              "type": "string"
            }
          },
          "required": [
            "dbType",
            "dbHost",
            "dbPort",
            "dbInstance"
          ]
        }
      },
      "required": [
        "repositoryEndpointMetadata"
      ]
    },
    "repositoryConfigurations": {
      "type": "object",
      "properties": {
        "document": {
          "type": "object",
          "properties": {
            "fieldMappings": {
              "type": "array",
              "items": [
                {
                  "type": "object",
                  "properties": {
                    "indexFieldName": {
                      "type": "string"
                    },
                    "indexFieldType": {
                      "type": "string"
                    },
                    "dataSourceFieldName": {
                      "type": "string"
                    }
                  },
                  "required": [
                    "indexFieldName",
                    "indexFieldType",
                    "dataSourceFieldName"
                  ]
                }
              ]
            }
          },
          "required": [
            "fieldMappings"
          ]
        }
      },
      "required": [
      ]
    },
    "additionalProperties": {
      "type": "object",
      "properties": {
        "primaryKey": {
          "type": "string"
        },
        "titleColumn": {
          "type": "string"
        },
        "bodyColumn": {
          "type": "string"
        },
        "sqlQuery": {
          "type": "string",
          "not": {
            "pattern": ";+"
          }
        },
        "timestampColumn": {
          "type": "string"
        },
        "timestampFormat": {
          "type": "string"
        },
        "timezone": {
          "type": "string"
        },
        "changeDetectingColumns": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "allowedUsersColumn": {
          "type": "string"
        },
        "allowedGroupsColumn": {
          "type": "string"
        },
        "sourceURIColumn": {
          "type": "string"
        },
        "isSslEnabled": {
          "type": "boolean"
        }
      },
      "required": ["primaryKey", "titleColumn", "bodyColumn", "sqlQuery"]
    },
    "type" : {
      "type" : "string",
      "pattern": "JDBC"
    },
    "syncMode": {
      "type": "string",
      "enum": [
        "FORCED_FULL_CRAWL",
        "FULL_CRAWL",
        "CHANGE_LOG"
      ]
    },
    "secretArn": {
      "type": "string"
    }
  },
  "version": {
    "type": "string",
    "anyOf": [
      {
        "pattern": "1.0.0"
      }
    ]
  },
  "required": [
      "connectionConfiguration",
      "repositoryConfigurations",
      "syncMode",
      "additionalProperties",
      "secretArn",
      "type"
  ]
}
```

## Esquema de plantilla de PostgreSQL


Incluye un JSON que contiene el esquema del origen de datos como parte del objeto [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_TemplateConfiguration.html). Especifique el tipo de origen de datos como `JDBC`, el tipo de base de datos como `postgresql`, un secreto para sus credenciales de autenticación y otras configuraciones necesarias. A continuación, especifique `TEMPLATE` como el `Type` cuando llame a [CreateDataSource](https://docs.aws.amazon.com/kendra/latest/APIReference/API_CreateDataSource.html).

Puede usar la plantilla que se proporciona en esta guía para desarrolladores. Consulte [Esquema JSON de PostgreSQL](#postgresql-json).

En la tabla siguiente se describen los parámetros del esquema JSON de PostgreSQL.


| Configuración | Description (Descripción) | 
| --- | --- | 
| connectionConfiguration | Información de configuración para el punto de conexión para el origen de datos. | 
| repositoryEndpointMetadata | Información de configuración necesaria para conectarse a su origen de datos.[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html) | 
| repositoryConfigurations | Información de configuración del contenido del origen de datos. Por ejemplo, configurar tipos específicos de contenido y asignaciones de campos. Especifique el tipo de origen de datos y el ARN secreto. | 
|  revisión  |  Una lista de objetos que asignan los atributos o los nombres de campo del contenido de la base de datos para Amazon Kendra indexar los nombres de los campos. Para obtener más información, consulte [Asignación de campos de origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/field-mapping.html). | 
| additionalProperties | Opciones de configuración adicionales para el contenido del origen de datos. Se utiliza para incluir o excluir contenido específico en el origen de datos de la base de datos. | 
| primaryKey  | Proporciona la clave principal de la tabla de la base de datos. Esto identifica una tabla dentro de la base de datos. | 
| titleColumn | Proporciona el nombre de la columna del título del documento en la tabla de la base de datos. | 
| bodyColumn | Proporciona el nombre de la columna del título del documento en la tabla de la base de datos. | 
| sqlQuery | Introduce instrucciones de consulta SQL, como las operaciones SELECT y JOIN. Las consultas SQL deben tener menos de 32 KB. Amazon Kendra rastreará todo el contenido de la base de datos que coincida con su consulta. | 
| timestampColumn | Introduzca el nombre de la columna que contiene las marcas de tiempo. Amazon Kendra utiliza la información de la marca de tiempo para detectar cambios en el contenido y sincronizar solo el contenido modificado. | 
| timestampFormat | Introduce el nombre de la columna que contiene los formatos de marcas temporales que se deben utilizar para detectar cambios en el contenido y volver a sincronizar su contenido. | 
| timezone | Introduce el nombre de la columna que contiene las zonas horarias del contenido que se va a rastrear. | 
| changeDetectingColumns | Introduce los nombres de las columnas que Amazon Kendra se utilizarán para detectar cambios en el contenido. Amazon Kendra volverá a indexar el contenido cuando se produzca un cambio en alguna de estas columnas | 
| allowedUsersColumns | Introduzca el nombre de la columna que contiene el usuario IDs al que se le permitirá acceder al contenido. | 
| allowedGroupsColumn | Introduzca el nombre de la columna que contiene el usuario IDs al que se permitirá el acceso al contenido. | 
| fuente URIColumn | Introduzca el nombre de la columna que contiene la fuente que se URLs va a indexar. | 
| isSslEnabled | Introduce instrucciones de consulta SQL, como las operaciones SELECT y JOIN. Las consultas SQL deben tener menos de 32 KB. Amazon Kendra rastreará todo el contenido de la base de datos que coincida con su consulta. | 
| type | El tipo del origen de datos. Especifica JDBC como el tipo de origen de datos. | 
| syncMode |  Especifique cómo Amazon Kendra debe actualizarse el índice cuando cambie el contenido de la fuente de datos. Puede elegir entre las siguientes opciones: [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | 
| secretArn | El nombre de recurso de Amazon (ARN) de un secreto de Secrets Manager que contiene el nombre de usuario y la contraseña necesarios para conectarse a su base de datos. El secreto debe contener una estructura JSON con las siguientes claves: <pre>{<br />    "user name": "database user name",<br />    "password": "password"<br />}</pre> | 
| versión | La versión de la plantilla que se admite actualmente. | 

### Esquema JSON de PostgreSQL


```
{
  "$schema": "http://json-schema.org/draft-04/schema#",
  "type": "object",
  "properties": {
    "connectionConfiguration": {
      "type": "object",
      "properties": {
        "repositoryEndpointMetadata": {
          "type": "object",
          "properties": {
            "dbType": {
              "type": "string",
              "enum": [
                "mysql",
                "db2",
                "postgresql",
                "oracle",
                "sqlserver"
              ]
            },
            "dbHost": {
              "type": "string"
            },
            "dbPort": {
              "type": "string"
            },
            "dbInstance": {
              "type": "string"
            }
          },
          "required": [
            "dbType",
            "dbHost",
            "dbPort",
            "dbInstance"
          ]
        }
      },
      "required": [
        "repositoryEndpointMetadata"
      ]
    },
    "repositoryConfigurations": {
      "type": "object",
      "properties": {
        "document": {
          "type": "object",
          "properties": {
            "fieldMappings": {
              "type": "array",
              "items": [
                {
                  "type": "object",
                  "properties": {
                    "indexFieldName": {
                      "type": "string"
                    },
                    "indexFieldType": {
                      "type": "string"
                    },
                    "dataSourceFieldName": {
                      "type": "string"
                    }
                  },
                  "required": [
                    "indexFieldName",
                    "indexFieldType",
                    "dataSourceFieldName"
                  ]
                }
              ]
            }
          },
          "required": [
            "fieldMappings"
          ]
        }
      },
      "required": [
      ]
    },
    "additionalProperties": {
      "type": "object",
      "properties": {
        "primaryKey": {
          "type": "string"
        },
        "titleColumn": {
          "type": "string"
        },
        "bodyColumn": {
          "type": "string"
        },
        "sqlQuery": {
          "type": "string",
          "not": {
            "pattern": ";+"
          }
        },
        "timestampColumn": {
          "type": "string"
        },
        "timestampFormat": {
          "type": "string"
        },
        "timezone": {
          "type": "string"
        },
        "changeDetectingColumns": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "allowedUsersColumn": {
          "type": "string"
        },
        "allowedGroupsColumn": {
          "type": "string"
        },
        "sourceURIColumn": {
          "type": "string"
        },
        "isSslEnabled": {
          "type": "boolean"
        }
      },
      "required": ["primaryKey", "titleColumn", "bodyColumn", "sqlQuery"]
    },
    "type" : {
      "type" : "string",
      "pattern": "JDBC"
    },
    "syncMode": {
      "type": "string",
      "enum": [
        "FORCED_FULL_CRAWL",
        "FULL_CRAWL",
        "CHANGE_LOG"
      ]
    },
    "secretArn": {
      "type": "string"
    }
  },
  "version": {
    "type": "string",
    "anyOf": [
      {
        "pattern": "1.0.0"
      }
    ]
  },
  "required": [
      "connectionConfiguration",
      "repositoryConfigurations",
      "syncMode",
      "additionalProperties",
      "secretArn",
      "type"
  ]
}
```

## Esquema de plantilla de Salesforce


Incluye un JSON que contiene el esquema del origen de datos como parte del objeto [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_TemplateConfiguration.html). Debe proporcionar la URL del host de Salesforce como parte de la configuración de la conexión o de los detalles del punto de conexión del repositorio. Además, especifique el tipo de origen de datos como `SALESFORCEV2`, un secreto para sus credenciales de autenticación y otras configuraciones necesarias. A continuación, especifique `TEMPLATE` como el `Type` cuando llame a [CreateDataSource](https://docs.aws.amazon.com/kendra/latest/APIReference/API_CreateDataSource.html).

Puede usar la plantilla que se proporciona en esta guía para desarrolladores. Consulte [Esquema JSON de Salesforce](#salesforce-json).

En la tabla siguiente se describen los parámetros del esquema JSON de Salesforce.


| Configuración | Description (Descripción) | 
| --- | --- | 
| connectionConfiguration | Información de configuración para el punto de conexión para el origen de datos. | 
| repositoryEndpointMetadata | La información del punto de conexión para el origen de datos. | 
| hostUrl | La URL de la instancia de Salesforce que se va a indexar. | 
| repositoryConfigurations | Información de configuración del contenido del origen de datos. Por ejemplo, configurar tipos específicos de contenido y asignaciones de campos. | 
|  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  |  Una lista de objetos que mapean los atributos o los nombres de campo de sus entidades de Salesforce para Amazon Kendra indexar los nombres de los campos. Para obtener más información, consulte [Asignación de campos de origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/field-mapping.html). | 
| secretARN | El nombre de recurso de Amazon (ARN) de un AWS Secrets Manager secreto que contiene los pares clave-valor necesarios para conectarse a su Salesforce. El secreto debe contener una estructura JSON con las siguientes claves: <pre>{<br />    "authenticationUrl": "OAUTH endpoint that Amazon Kendra connects to get an OAUTH token",<br />    "consumerKey": "Application public key generated when you created your Salesforce application",<br />    "consumerSecret": "Application private key generated when you created your Salesforce application",<br />    "password": "Password associated with the user logging in to the Salesforce instance",<br />    "securityToken": "Token associated with the user account logging in to the Salesforce instance",<br />    "username": "User name of the user logging in to the Salesforce instance"<br />}</pre> | 
| additionalProperties | Opciones de configuración adicionales para el contenido del origen de datos | 
|  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | Una colección de cadenas que especifica qué entidades filtrar. | 
| inclusionPatterns [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | Una lista de patrones de expresión regular para incluir determinados archivos en su origen de datos de Salesforce. Los archivos que coinciden con los patrones se incluyen en el índice. Los archivos que no coincidan con los patrones se excluyen del índice. Si un archivo coincide con un patrón de inclusión y de exclusión, el patrón de exclusión tiene prioridad y el archivo no se incluye en el índice. | 
| exclusionPatterns [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | Una lista de patrones de expresión regular para excluir determinados archivos en su origen de datos de Salesforce. Los archivos que coinciden con los patrones se excluyen del índice. Los archivos que no coincidan con los patrones se incluyen en el índice. Si un archivo coincide con un patrón de exclusión y de inclusión, el patrón de exclusión tiene prioridad y el archivo no se incluye en el índice. | 
|  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | true para rastrear estos tipos de archivos en su cuenta de Salesforce. | 
| type | El tipo del origen de datos. Especifica SALESFORCEV2 como el tipo de origen de datos. | 
| enableIdentityCrawler | trueutilizar el rastreador Amazon Kendra de identidad para sincronizar la identity/principal información sobre los usuarios y grupos con acceso a determinados documentos. Si el rastreador de identidades está desactivado, todos los documentos se pueden buscar públicamente. Si quiere usar el control de acceso para los documentos y el rastreador de identidades está desactivado, también puede usar la API [https://docs.aws.amazon.com/kendra/latest/dg/API_PutPrincipalMapping.html](https://docs.aws.amazon.com/kendra/latest/dg/API_PutPrincipalMapping.html) para cargar la información de acceso del usuario y del grupo. | 
| syncMode |  Especifique cómo Amazon Kendra debe actualizarse el índice cuando cambie el contenido de la fuente de datos. Puede elegir entre las siguientes opciones: [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | 
| versión | La versión de esta plantilla que se admite actualmente. | 

### Esquema JSON de Salesforce


```
{
  "$schema": "http://json-schema.org/draft-04/schema#",
  "type": "object",
  "properties":
  {
    "connectionConfiguration": {
      "type": "object",
      "properties":
      {
        "repositoryEndpointMetadata":
        {
          "type": "object",
          "properties":
          {
            "hostUrl":
            {
              "type": "string",
              "pattern": "https:.*"
            }
          },
          "required":
          [
            "hostUrl"
          ]
        }
      },
      "required":
      [
        "repositoryEndpointMetadata"
      ]
    },
    "repositoryConfigurations": {
      "type": "object",
      "properties":
      {
        "account":
        {
          "type": "object",
          "properties":
          {
            "fieldMappings":
            {
              "type": "array",
              "items":
              [
                {
                  "type": "object",
                  "properties":
                  {
                    "indexFieldName":
                    {
                      "type": "string"
                    },
                    "indexFieldType":
                    {
                      "type": "string",
                      "enum":
                      [
                        "STRING",
                        "STRING_LIST",
                        "DATE",
                        "LONG"
                      ]
                    },
                    "dataSourceFieldName":
                    {
                      "type": "string"
                    },
                    "dateFieldFormat":
                    {
                      "type": "string",
                      "pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
                    }
                  },
                  "required":
                  [
                    "indexFieldName",
                    "indexFieldType",
                    "dataSourceFieldName"
                  ]
                }
              ]
            }
          },
          "required":
          [
            "fieldMappings"
          ]
        },
        "contact":
        {
          "type": "object",
          "properties":
          {
            "fieldMappings":
            {
              "type": "array",
              "items":
              [
                {
                  "type": "object",
                  "properties":
                  {
                    "indexFieldName":
                    {
                      "type": "string"
                    },
                    "indexFieldType":
                    {
                      "type": "string",
                      "enum":
                      [
                        "STRING",
                        "STRING_LIST",
                        "DATE"
                      ]
                    },
                    "dataSourceFieldName":
                    {
                      "type": "string"
                    },
                    "dateFieldFormat":
                    {
                      "type": "string",
                      "pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
                    }
                  },
                  "required":
                  [
                    "indexFieldName",
                    "indexFieldType",
                    "dataSourceFieldName"
                  ]
                }
              ]
            }
          },
          "required":
          [
            "fieldMappings"
          ]
        },
        "campaign":
        {
          "type": "object",
          "properties":
          {
            "fieldMappings":
            {
              "type": "array",
              "items":
              [
                {
                  "type": "object",
                  "properties":
                  {
                    "indexFieldName":
                    {
                      "type": "string"
                    },
                    "indexFieldType":
                    {
                      "type": "string",
                      "enum":
                      [
                        "STRING",
                        "STRING_LIST",
                        "DATE",
                        "LONG"
                      ]
                    },
                    "dataSourceFieldName":
                    {
                      "type": "string"
                    },
                    "dateFieldFormat":
                    {
                      "type": "string",
                      "pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
                    }
                  },
                  "required":
                  [
                    "indexFieldName",
                    "indexFieldType",
                    "dataSourceFieldName"
                  ]
                }
              ]
            }
          },
          "required":
          [
            "fieldMappings"
          ]
        },
        "case":
        {
          "type": "object",
          "properties":
          {
            "fieldMappings":
            {
              "type": "array",
              "items":
              [
                {
                  "type": "object",
                  "properties":
                  {
                    "indexFieldName":
                    {
                      "type": "string"
                    },
                    "indexFieldType":
                    {
                      "type": "string",
                      "enum":
                      [
                        "STRING",
                        "STRING_LIST",
                        "DATE"
                      ]
                    },
                    "dataSourceFieldName":
                    {
                      "type": "string"
                    },
                    "dateFieldFormat":
                    {
                      "type": "string",
                      "pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
                    }
                  },
                  "required":
                  [
                    "indexFieldName",
                    "indexFieldType",
                    "dataSourceFieldName"
                  ]
                }
              ]
            }
          },
          "required":
          [
            "fieldMappings"
          ]
        },
        "product":
        {
          "type": "object",
          "properties":
          {
            "fieldMappings":
            {
              "type": "array",
              "items":
              [
                {
                  "type": "object",
                  "properties":
                  {
                    "indexFieldName":
                    {
                      "type": "string"
                    },
                    "indexFieldType":
                    {
                      "type": "string",
                      "enum":
                      [
                        "STRING",
                        "STRING_LIST",
                        "DATE"
                      ]
                    },
                    "dataSourceFieldName":
                    {
                      "type": "string"
                    },
                    "dateFieldFormat":
                    {
                      "type": "string",
                      "pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
                    }
                  },
                  "required":
                  [
                    "indexFieldName",
                    "indexFieldType",
                    "dataSourceFieldName"
                  ]
                }
              ]
            }
          },
          "required":
          [
            "fieldMappings"
          ]
        },
        "lead":
        {
          "type": "object",
          "properties":
          {
            "fieldMappings":
            {
              "type": "array",
              "items":
              [
                {
                  "type": "object",
                  "properties":
                  {
                    "indexFieldName":
                    {
                      "type": "string"
                    },
                    "indexFieldType":
                    {
                      "type": "string",
                      "enum":
                      [
                        "STRING",
                        "STRING_LIST",
                        "DATE",
                        "LONG"
                      ]
                    },
                    "dataSourceFieldName":
                    {
                      "type": "string"
                    },
                    "dateFieldFormat":
                    {
                      "type": "string",
                      "pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
                    }
                  },
                  "required":
                  [
                    "indexFieldName",
                    "indexFieldType",
                    "dataSourceFieldName"
                  ]
                }
              ]
            }
          },
          "required":
          [
            "fieldMappings"
          ]
        },
        "contract":
        {
          "type": "object",
          "properties":
          {
            "fieldMappings":
            {
              "type": "array",
              "items":
              [
                {
                  "type": "object",
                  "properties":
                  {
                    "indexFieldName":
                    {
                      "type": "string"
                    },
                    "indexFieldType":
                    {
                      "type": "string",
                      "enum":
                      [
                        "STRING",
                        "STRING_LIST",
                        "DATE"
                      ]
                    },
                    "dataSourceFieldName":
                    {
                      "type": "string"
                    },
                    "dateFieldFormat":
                    {
                      "type": "string",
                      "pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
                    }
                  },
                  "required":
                  [
                    "indexFieldName",
                    "indexFieldType",
                    "dataSourceFieldName"
                  ]
                }
              ]
            }
          },
          "required":
          [
            "fieldMappings"
          ]
        },
        "partner":
        {
          "type": "object",
          "properties":
          {
            "fieldMappings":
            {
              "type": "array",
              "items":
              [
                {
                  "type": "object",
                  "properties":
                  {
                    "indexFieldName":
                    {
                      "type": "string"
                    },
                    "indexFieldType":
                    {
                      "type": "string",
                      "enum":
                      [
                        "STRING",
                        "STRING_LIST",
                        "DATE"
                      ]
                    },
                    "dataSourceFieldName":
                    {
                      "type": "string"
                    },
                    "dateFieldFormat":
                    {
                      "type": "string",
                      "pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
                    }
                  },
                  "required":
                  [
                    "indexFieldName",
                    "indexFieldType",
                    "dataSourceFieldName"
                  ]
                }
              ]
            }
          },
          "required":
          [
            "fieldMappings"
          ]
        },
        "profile":
        {
          "type": "object",
          "properties":
          {
            "fieldMappings":
            {
              "type": "array",
              "items":
              [
                {
                  "type": "object",
                  "properties":
                  {
                    "indexFieldName":
                    {
                      "type": "string"
                    },
                    "indexFieldType":
                    {
                      "type": "string",
                      "enum":
                      [
                        "STRING",
                        "STRING_LIST",
                        "DATE"
                      ]
                    },
                    "dataSourceFieldName":
                    {
                      "type": "string"
                    },
                    "dateFieldFormat":
                    {
                      "type": "string",
                      "pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
                    }
                  },
                  "required":
                  [
                    "indexFieldName",
                    "indexFieldType",
                    "dataSourceFieldName"
                  ]
                }
              ]
            }
          },
          "required":
          [
            "fieldMappings"
          ]
        },
        "idea":
        {
          "type": "object",
          "properties":
          {
            "fieldMappings":
            {
              "type": "array",
              "items":
              [
                {
                  "type": "object",
                  "properties":
                  {
                    "indexFieldName":
                    {
                      "type": "string"
                    },
                    "indexFieldType":
                    {
                      "type": "string",
                      "enum":
                      [
                        "STRING",
                        "STRING_LIST",
                        "DATE",
                        "LONG"
                      ]
                    },
                    "dataSourceFieldName":
                    {
                      "type": "string"
                    },
                    "dateFieldFormat":
                    {
                      "type": "string",
                      "pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
                    }
                  },
                  "required":
                  [
                    "indexFieldName",
                    "indexFieldType",
                    "dataSourceFieldName"
                  ]
                }
              ]
            }
          },
          "required":
          [
            "fieldMappings"
          ]
        },
        "pricebook":
        {
          "type": "object",
          "properties":
          {
            "fieldMappings":
            {
              "type": "array",
              "items":
              [
                {
                  "type": "object",
                  "properties":
                  {
                    "indexFieldName":
                    {
                      "type": "string"
                    },
                    "indexFieldType":
                    {
                      "type": "string",
                      "enum":
                      [
                        "STRING",
                        "STRING_LIST",
                        "DATE"
                      ]
                    },
                    "dataSourceFieldName":
                    {
                      "type": "string"
                    },
                    "dateFieldFormat":
                    {
                      "type": "string",
                      "pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
                    }
                  },
                  "required":
                  [
                    "indexFieldName",
                    "indexFieldType",
                    "dataSourceFieldName"
                  ]
                }
              ]
            }
          },
          "required":
          [
            "fieldMappings"
          ]
        },
        "task":
        {
          "type": "object",
          "properties":
          {
            "fieldMappings":
            {
              "type": "array",
              "items":
              [
                {
                  "type": "object",
                  "properties":
                  {
                    "indexFieldName":
                    {
                      "type": "string"
                    },
                    "indexFieldType":
                    {
                      "type": "string",
                      "enum":
                      [
                        "STRING",
                        "STRING_LIST",
                        "DATE"
                      ]
                    },
                    "dataSourceFieldName":
                    {
                      "type": "string"
                    },
                    "dateFieldFormat":
                    {
                      "type": "string",
                      "pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
                    }
                  },
                  "required":
                  [
                    "indexFieldName",
                    "indexFieldType",
                    "dataSourceFieldName"
                  ]
                }
              ]
            }
          },
          "required":
          [
            "fieldMappings"
          ]
        },
        "solution":
        {
          "type": "object",
          "properties":
          {
            "fieldMappings":
            {
              "type": "array",
              "items":
              [
                {
                  "type": "object",
                  "properties":
                  {
                    "indexFieldName":
                    {
                      "type": "string"
                    },
                    "indexFieldType":
                    {
                      "type": "string",
                      "enum":
                      [
                        "STRING",
                        "STRING_LIST",
                        "DATE"
                      ]
                    },
                    "dataSourceFieldName":
                    {
                      "type": "string"
                    },
                    "dateFieldFormat":
                    {
                      "type": "string",
                      "pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
                    }
                  },
                  "required":
                  [
                    "indexFieldName",
                    "indexFieldType",
                    "dataSourceFieldName"
                  ]
                }
              ]
            }
          },
          "required":
          [
            "fieldMappings"
          ]
        },
        "attachment":
        {
          "type": "object",
          "properties":
          {
            "fieldMappings":
            {
              "type": "array",
              "items":
              [
                {
                  "type": "object",
                  "properties":
                  {
                    "indexFieldName":
                    {
                      "type": "string"
                    },
                    "indexFieldType":
                    {
                      "type": "string",
                      "enum":
                      [
                        "STRING",
                        "STRING_LIST",
                        "DATE",
                        "LONG"
                      ]
                    },
                    "dataSourceFieldName":
                    {
                      "type": "string"
                    },
                    "dateFieldFormat":
                    {
                      "type": "string",
                      "pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
                    }
                  },
                  "required":
                  [
                    "indexFieldName",
                    "indexFieldType",
                    "dataSourceFieldName"
                  ]
                }
              ]
            }
          },
          "required":
          [
            "fieldMappings"
          ]
        },
        "user":
        {
          "type": "object",
          "properties":
          {
            "fieldMappings":
            {
              "type": "array",
              "items":
              [
                {
                  "type": "object",
                  "properties":
                  {
                    "indexFieldName":
                    {
                      "type": "string"
                    },
                    "indexFieldType":
                    {
                      "type": "string",
                      "enum":
                      [
                        "STRING",
                        "STRING_LIST",
                        "DATE"
                      ]
                    },
                    "dataSourceFieldName":
                    {
                      "type": "string"
                    },
                    "dateFieldFormat":
                    {
                      "type": "string",
                      "pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
                    }
                  },
                  "required":
                  [
                    "indexFieldName",
                    "indexFieldType",
                    "dataSourceFieldName"
                  ]
                }
              ]
            }
          },
          "required":
          [
            "fieldMappings"
          ]
        },
        "document":
        {
          "type": "object",
          "properties":
          {
            "fieldMappings":
            {
              "type": "array",
              "items":
              [
                {
                  "type": "object",
                  "properties":
                  {
                    "indexFieldName":
                    {
                      "type": "string"
                    },
                    "indexFieldType":
                    {
                      "type": "string",
                      "enum":
                      [
                        "STRING",
                        "STRING_LIST",
                        "DATE",
                        "LONG"
                      ]
                    },
                    "dataSourceFieldName":
                    {
                      "type": "string"
                    },
                    "dateFieldFormat":
                    {
                      "type": "string",
                      "pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
                    }
                  },
                  "required":
                  [
                    "indexFieldName",
                    "indexFieldType",
                    "dataSourceFieldName"
                  ]
                }
              ]
            }
          },
          "required":
          [
            "fieldMappings"
          ]
        },
        "knowledgeArticles":
        {
          "type": "object",
          "properties":
          {
            "fieldMappings":
            {
              "type": "array",
              "items":
              [
                {
                  "type": "object",
                  "properties":
                  {
                    "indexFieldName":
                    {
                      "type": "string"
                    },
                    "indexFieldType":
                    {
                      "type": "string",
                      "enum":
                      [
                        "STRING",
                        "STRING_LIST",
                        "DATE"
                      ]
                    },
                    "dataSourceFieldName":
                    {
                      "type": "string"
                    },
                    "dateFieldFormat":
                    {
                      "type": "string",
                      "pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
                    }
                  },
                  "required":
                  [
                    "indexFieldName",
                    "indexFieldType",
                    "dataSourceFieldName"
                  ]
                }
              ]
            }
          },
          "required":
          [
            "fieldMappings"
          ]
        },
        "group":
        {
          "type": "object",
          "properties":
          {
            "fieldMappings":
            {
              "type": "array",
              "items":
              [
                {
                  "type": "object",
                  "properties":
                  {
                    "indexFieldName":
                    {
                      "type": "string"
                    },
                    "indexFieldType":
                    {
                      "type": "string",
                      "enum":
                      [
                        "STRING",
                        "STRING_LIST",
                        "DATE"
                      ]
                    },
                    "dataSourceFieldName":
                    {
                      "type": "string"
                    },
                    "dateFieldFormat":
                    {
                      "type": "string",
                      "pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
                    }
                  },
                  "required":
                  [
                    "indexFieldName",
                    "indexFieldType",
                    "dataSourceFieldName"
                  ]
                }
              ]
            }
          },
          "required":
          [
            "fieldMappings"
          ]
        },
        "opportunity":
        {
          "type": "object",
          "properties":
          {
            "fieldMappings":
            {
              "type": "array",
              "items":
              [
                {
                  "type": "object",
                  "properties":
                  {
                    "indexFieldName":
                    {
                      "type": "string"
                    },
                    "indexFieldType":
                    {
                      "type": "string",
                      "enum":
                      [
                        "STRING",
                        "STRING_LIST",
                        "DATE",
                        "LONG"
                      ]
                    },
                    "dataSourceFieldName":
                    {
                      "type": "string"
                    },
                    "dateFieldFormat":
                    {
                      "type": "string",
                      "pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
                    }
                  },
                  "required":
                  [
                    "indexFieldName",
                    "indexFieldType",
                    "dataSourceFieldName"
                  ]
                }
              ]
            }
          },
          "required":
          [
            "fieldMappings"
          ]
        },
        "chatter":
        {
          "type": "object",
          "properties":
          {
            "fieldMappings":
            {
              "type": "array",
              "items":
              [
                {
                  "type": "object",
                  "properties":
                  {
                    "indexFieldName":
                    {
                      "type": "string"
                    },
                    "indexFieldType":
                    {
                      "type": "string",
                      "enum":
                      [
                        "STRING",
                        "STRING_LIST",
                        "DATE"
                      ]
                    },
                    "dataSourceFieldName":
                    {
                      "type": "string"
                    },
                    "dateFieldFormat":
                    {
                      "type": "string",
                      "pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
                    }
                  },
                  "required":
                  [
                    "indexFieldName",
                    "indexFieldType",
                    "dataSourceFieldName"
                  ]
                }
              ]
            }
          },
          "required":
          [
            "fieldMappings"
          ]
        },
        "customEntity":
        {
          "type": "object",
          "properties":
          {
            "fieldMappings":
            {
              "type": "array",
              "items":
              [
                {
                  "type": "object",
                  "properties":
                  {
                    "indexFieldName":
                    {
                      "type": "string"
                    },
                    "indexFieldType":
                    {
                      "type": "string",
                      "enum":
                      [
                        "STRING",
                        "STRING_LIST",
                        "DATE"
                      ]
                    },
                    "dataSourceFieldName":
                    {
                      "type": "string"
                    },
                    "dateFieldFormat":
                    {
                      "type": "string",
                      "pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
                    }
                  },
                  "required":
                  [
                    "indexFieldName",
                    "indexFieldType",
                    "dataSourceFieldName"
                  ]
                }
              ]
            }
          },
          "required":
          [
            "fieldMappings"
          ]
        }
      }
    },
    "additionalProperties": {
      "type": "object",
      "properties":
      {
        "accountFilter":{
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "contactFilter":{
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "caseFilter":{
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "campaignFilter":{
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "contractFilter":{
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "groupFilter":{
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "leadFilter":{
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "productFilter":{
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "opportunityFilter":{
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "partnerFilter":{
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "pricebookFilter":{
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "ideaFilter":{
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "profileFilter":{
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "taskFilter":{
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "solutionFilter":{
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "userFilter":{
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "chatterFilter":{
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "documentFilter":{
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "knowledgeArticleFilter":{
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "customEntities":{
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "isCrawlAccount": {
          "type": "boolean"
        },
        "isCrawlContact": {
          "type": "boolean"
        },
        "isCrawlCase": {
          "type": "boolean"
        },
        "isCrawlCampaign": {
          "type": "boolean"
        },
        "isCrawlProduct": {
          "type": "boolean"
        },
        "isCrawlLead": {
          "type": "boolean"
        },
        "isCrawlContract": {
          "type": "boolean"
        },
        "isCrawlPartner": {
          "type": "boolean"
        },
        "isCrawlProfile": {
          "type": "boolean"
        },
        "isCrawlIdea": {
          "type": "boolean"
        },
        "isCrawlPricebook": {
          "type": "boolean"
        },
        "isCrawlDocument": {
          "type": "boolean"
        },
        "crawlSharedDocument": {
          "type": "boolean"
        },
        "isCrawlGroup": {
          "type": "boolean"
        },
        "isCrawlOpportunity": {
          "type": "boolean"
        },
        "isCrawlChatter": {
          "type": "boolean"
        },
        "isCrawlUser": {
          "type": "boolean"
        },
        "isCrawlSolution":{
          "type": "boolean"
        },
        "isCrawlTask":{
          "type": "boolean"
        },

        "isCrawlAccountAttachments": {
          "type": "boolean"
        },
        "isCrawlContactAttachments": {
          "type": "boolean"
        },
        "isCrawlCaseAttachments": {
          "type": "boolean"
        },
        "isCrawlCampaignAttachments": {
          "type": "boolean"
        },
        "isCrawlLeadAttachments": {
          "type": "boolean"
        },
        "isCrawlContractAttachments": {
          "type": "boolean"
        },
        "isCrawlGroupAttachments": {
          "type": "boolean"
        },
        "isCrawlOpportunityAttachments": {
          "type": "boolean"
        },
        "isCrawlChatterAttachments": {
          "type": "boolean"
        },
        "isCrawlSolutionAttachments":{
          "type": "boolean"
        },
        "isCrawlTaskAttachments":{
          "type": "boolean"
        },
        "isCrawlCustomEntityAttachments":{
          "type": "boolean"
        },
        "isCrawlKnowledgeArticles": {
          "type": "object",
          "properties":
          {
            "isCrawlDraft": {
              "type": "boolean"
            },
            "isCrawlPublish": {
              "type": "boolean"
            },
            "isCrawlArchived": {
              "type": "boolean"
            }
          }
        },
        "inclusionDocumentFileTypePatterns":{
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "exclusionDocumentFileTypePatterns": {
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "inclusionDocumentFileNamePatterns":{
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "exclusionDocumentFileNamePatterns": {
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "inclusionAccountFileTypePatterns": {
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "exclusionAccountFileTypePatterns": {
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "inclusionAccountFileNamePatterns":{
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "exclusionAccountFileNamePatterns":{
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "inclusionCampaignFileTypePatterns": {
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "exclusionCampaignFileTypePatterns": {
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "inclusionCampaignFileNamePatterns":{
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "exclusionCampaignFileNamePatterns":{
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "inclusionCaseFileTypePatterns":{
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "exclusionCaseFileTypePatterns":{
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "inclusionCaseFileNamePatterns":{
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "exclusionCaseFileNamePatterns":{
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "inclusionContactFileTypePatterns":{
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "exclusionContactFileTypePatterns":{
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "inclusionContactFileNamePatterns":{
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "exclusionContactFileNamePatterns":{
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "inclusionContractFileTypePatterns":{
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "exclusionContractFileTypePatterns":{
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "inclusionContractFileNamePatterns":{
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "exclusionContractFileNamePatterns":{
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "inclusionLeadFileTypePatterns":{
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "exclusionLeadFileTypePatterns":{
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "inclusionLeadFileNamePatterns":{
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "exclusionLeadFileNamePatterns":{
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "inclusionOpportunityFileTypePatterns":{
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "exclusionOpportunityFileTypePatterns":{
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "inclusionOpportunityFileNamePatterns":{
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "exclusionOpportunityFileNamePatterns":{
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "inclusionSolutionFileTypePatterns":{
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "exclusionSolutionFileTypePatterns":{
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "inclusionSolutionFileNamePatterns":{
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "exclusionSolutionFileNamePatterns":{
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "inclusionTaskFileTypePatterns":{
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "exclusionTaskFileTypePatterns":{
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "inclusionTaskFileNamePatterns":{
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "exclusionTaskFileNamePatterns":{
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "inclusionGroupFileTypePatterns":{
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "exclusionGroupFileTypePatterns":{
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "inclusionGroupFileNamePatterns":{
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "exclusionGroupFileNamePatterns":{
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "inclusionChatterFileTypePatterns":{
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "exclusionChatterFileTypePatterns":{
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "inclusionChatterFileNamePatterns":{
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "exclusionChatterFileNamePatterns":{
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "inclusionCustomEntityFileTypePatterns":{
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "exclusionCustomEntityFileTypePatterns":{
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "inclusionCustomEntityFileNamePatterns":{
          "type": "array",
          "items":
          {
            "type": "string"
          }
        },
        "exclusionCustomEntityFileNamePatterns":{
          "type": "array",
          "items":
          {
            "type": "string"
          }
        }
      },
      "required":
      []
    },
    "enableIdentityCrawler": {
      "type": "boolean"
    },
    "type": {
      "type": "string",
      "pattern": "SALESFORCEV2"
    },
    "syncMode": {
      "type": "string",
      "enum": [
        "FULL_CRAWL",
        "FORCED_FULL_CRAWL",
        "CHANGE_LOG"
      ]
    },
    "secretArn": {
      "type": "string",
      "minLength": 20,
      "maxLength": 2048
    }
  },
  "version": {
    "type": "string",
    "anyOf": [
      {
        "pattern": "1.0.0"
      }
    ]
  },
  "required": [
    "connectionConfiguration",
    "repositoryConfigurations",
    "syncMode",
    "additionalProperties",
    "secretArn",
    "type"
  ]
}
```

## ServiceNow esquema de plantilla


Incluye un JSON que contiene el esquema del origen de datos como parte del objeto [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_TemplateConfiguration.html). Debe proporcionar la URL del ServiceNow host, el tipo de autenticación y la versión de la instancia como parte de la configuración de la conexión o de los detalles del punto final del repositorio. Especifique también el tipo de origen de datos como `SERVICENOWV2`, un secreto para sus credenciales de autenticación y otras configuraciones necesarias. A continuación, especifique `TEMPLATE` como el `Type` cuando llame a [CreateDataSource](https://docs.aws.amazon.com/kendra/latest/APIReference/API_CreateDataSource.html).

Puede usar la plantilla que se proporciona en esta guía para desarrolladores. Consulte [ServiceNow Esquema JSON](#servicenow-json).

En la siguiente tabla se describen los parámetros del esquema ServiceNow JSON.


| Configuración | Description (Descripción) | 
| --- | --- | 
| connectionConfiguration | Información de configuración para el punto de conexión para el origen de datos. | 
| repositoryEndpointMetadata | La información del punto de conexión para el origen de datos. | 
| hostUrl | La URL del ServiceNow host. Por ejemplo, your-domain.service-now.com. | 
| authType | El tipo de autenticación que utiliza, ya sea basicAuth o OAuth2. | 
| servicenowInstanceVersion | La ServiceNow versión que utilizas. Puede elegir entre Tokyo, Sandiego, Rome y Others. | 
| repositoryConfigurations | Información de configuración del contenido del origen de datos. Por ejemplo, configurar tipos específicos de contenido y asignaciones de campos. | 
|  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | Una lista de objetos que mapean los atributos o nombres de campo de sus artículos de ServiceNow conocimiento, adjuntos, catálogo de servicios e incidentes para Amazon Kendra indexar los nombres de los campos. Para obtener más información, consulte [Asignación de campos de origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/field-mapping.html). Los nombres de los campos de la fuente de ServiceNow datos deben estar en sus metadatos ServiceNow personalizados. | 
| additional properties | Opciones de configuración adicionales para el contenido del origen de datos. | 
| maxFileSizeInMegaBytes | Especifique el límite de tamaño de los archivos MBs que Amazon Kendra rastreará. Amazon Kendra rastreará solo los archivos que se encuentren dentro del límite de tamaño que defina. El tamaño de archivo predeterminado es de 50 MB. El tamaño máximo del archivo debe ser mayor que 0 MB y menor o igual que 50 MB. | 
|  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | Una lista de patrones de expresiones regulares para incluir y and/or excluir determinados archivos de la fuente ServiceNow de datos. Los archivos que coinciden con los patrones se incluyen en el índice. Los archivos que no coincidan con los patrones se excluyen del índice. Si un archivo coincide con un patrón de inclusión y de exclusión, el patrón de exclusión tiene prioridad y el archivo no se incluye en el índice. | 
|  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | truepara rastrear artículos de ServiceNow conocimiento, catálogos de servicios, incidentes y archivos adjuntos. | 
| type | El tipo del origen de datos. Especifica SERVICENOWV2 como el tipo de origen de datos. | 
| enableIdentityCrawler | trueutilizar el rastreador Amazon Kendra de identidad para sincronizar la identity/principal información sobre los usuarios y grupos con acceso a determinados documentos. Si el rastreador de identidades está desactivado, todos los documentos se pueden buscar públicamente. Si quiere usar el control de acceso para los documentos y el rastreador de identidades está desactivado, también puede usar la API [https://docs.aws.amazon.com/kendra/latest/dg/API_PutPrincipalMapping.html](https://docs.aws.amazon.com/kendra/latest/dg/API_PutPrincipalMapping.html) para cargar la información de acceso del usuario y del grupo. | 
| syncMode | Especifique cómo Amazon Kendra debe actualizarse el índice cuando cambie el contenido de la fuente de datos. Puede elegir entre las siguientes opciones: [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | 
| secretARN | El nombre de recurso de Amazon (ARN) de un AWS Secrets Manager secreto que contiene los pares clave-valor necesarios para conectarse a su. ServiceNow El secreto debe contener una estructura JSON con las siguientes claves: <pre>{<br />    "username": "user name",<br />    "password": "password"<br />}</pre> Si utilizas la OAuth2 autenticación, tu secreto debe contener una estructura JSON con las siguientes claves: <pre>{<br />    "username": "user name",<br />    "password": "password",<br />    "clientId": "client id",<br />    "clientSecret": "client secret"         <br />}</pre>  | 
| versión | La versión de la plantilla que se admite actualmente. | 

### ServiceNow Esquema JSON


```
{
  "$schema": "http://json-schema.org/draft-04/schema#",
  "type": "object",
  "properties": {
    "connectionConfiguration": {
      "type": "object",
      "properties": {
        "repositoryEndpointMetadata": {
          "type": "object",
          "properties": {
            "hostUrl": {
              "type": "string",
              "pattern": "^(?!(^(https?|ftp|file):\/\/))[a-z0-9-]+(.service-now.com|.servicenowservices.com)$",
              "minLength": 1,
              "maxLength": 2048
            },
            "authType": {
              "type": "string",
              "enum": [
                "basicAuth",
                "OAuth2"
              ]
            },
            "servicenowInstanceVersion": {
              "type": "string",
              "enum": [
                "Tokyo",
                "Sandiego",
                "Rome",
                "Others"
                ]
            }
          },
          "required": [
            "hostUrl",
            "authType",
            "servicenowInstanceVersion"
          ]
        }
      },
      "required": [
        "repositoryEndpointMetadata"
      ]
    },
    "repositoryConfigurations": {
      "type": "object",
      "properties": {
        "knowledgeArticle": {
          "type": "object",
          "properties": {
            "fieldMappings": {
              "type": "array",
              "items": [
                {
                  "type": "object",
                  "properties": {
                    "indexFieldName": {
                      "type": "string"
                    },
                    "indexFieldType": {
                      "type": "string",
                      "enum": [
                        "STRING",
                        "DATE",
                        "STRING_LIST"
                      ]
                    },
                    "dataSourceFieldName": {
                      "type": "string"
                    },
                    "dateFieldFormat": {
                      "type": "string",
                      "pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
                    }
                  },
                  "required": [
                    "indexFieldName",
                    "indexFieldType",
                    "dataSourceFieldName"
                  ]
                }
              ]
            }
          },
          "required": [
            "fieldMappings"
          ]
        },
        "attachment": {
          "type": "object",
          "properties": {
            "fieldMappings": {
              "type": "array",
              "items": [
                {
                  "type": "object",
                  "properties": {
                    "indexFieldName": {
                      "type": "string"
                    },
                    "indexFieldType": {
                      "type": "string",
                      "enum": [
                        "STRING",
                        "LONG",
                        "DATE",
                        "STRING_LIST"
                      ]
                    },
                    "dataSourceFieldName": {
                      "type": "string"
                    },
                    "dateFieldFormat": {
                      "type": "string",
                      "pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
                    }
                  },
                  "required": [
                    "indexFieldName",
                    "indexFieldType",
                    "dataSourceFieldName"
                  ]
                }
              ]
            }
          },
          "required": [
            "fieldMappings"
          ]
        },
        "serviceCatalog": {
          "type": "object",
          "properties": {
            "fieldMappings": {
              "type": "array",
              "items": [
                {
                  "type": "object",
                  "properties": {
                    "indexFieldName": {
                      "type": "string"
                    },
                    "indexFieldType": {
                      "type": "string",
                      "enum": [
                        "STRING",
                        "DATE",
                        "STRING_LIST"
                      ]
                    },
                    "dataSourceFieldName": {
                      "type": "string"
                    },
                    "dateFieldFormat": {
                      "type": "string",
                      "pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
                    }
                  },
                  "required": [
                    "indexFieldName",
                    "indexFieldType",
                    "dataSourceFieldName"
                  ]
                }
              ]
            }
          },
          "required": [
            "fieldMappings"
          ]
        },
        "incident": {
          "type": "object",
          "properties": {
            "fieldMappings": {
              "type": "array",
              "items": [
                {
                  "type": "object",
                  "properties": {
                    "indexFieldName": {
                      "type": "string"
                    },
                    "indexFieldType": {
                      "type": "string",
                      "enum": [
                        "STRING",
                        "DATE",
                        "STRING_LIST"
                      ]
                    },
                    "dataSourceFieldName": {
                      "type": "string"
                    },
                    "dateFieldFormat": {
                      "type": "string",
                      "pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
                    }
                  },
                  "required": [
                    "indexFieldName",
                    "indexFieldType",
                    "dataSourceFieldName"
                  ]
                }
              ]
            }
          },
          "required": [
            "fieldMappings"
          ]
        }
      }
    },
    "additionalProperties": {
      "type": "object",
      "properties": {
        "maxFileSizeInMegaBytes": {
          "type": "string"
        },
        "isCrawlKnowledgeArticle": {
          "type": "boolean"
        },
        "isCrawlKnowledgeArticleAttachment": {
          "type": "boolean"
        },
        "includePublicArticlesOnly": {
          "type": "boolean"
        },
        "knowledgeArticleFilter": {
          "type": "string"
        },
        "incidentQueryFilter": {
          "type": "string"
        },
        "serviceCatalogQueryFilter": {
          "type": "string"
        },
        "isCrawlServiceCatalog": {
          "type": "boolean"
        },
        "isCrawlServiceCatalogAttachment": {
          "type": "boolean"
        },
        "isCrawlActiveServiceCatalog": {
          "type": "boolean"
        },
        "isCrawlInactiveServiceCatalog": {
          "type": "boolean"
        },
        "isCrawlIncident": {
          "type": "boolean"
        },
        "isCrawlIncidentAttachment": {
          "type": "boolean"
        },
        "isCrawlActiveIncident": {
          "type": "boolean"
        },
        "isCrawlInactiveIncident": {
          "type": "boolean"
        },
        "applyACLForKnowledgeArticle": {
          "type": "boolean"
        },
        "applyACLForServiceCatalog": {
          "type": "boolean"
        },
        "applyACLForIncident": {
          "type": "boolean"
        },
        "incidentStateType": {
          "type": "array",
          "items": {
            "type": "string",
            "enum": [
              "Open",
              "Open - Unassigned",
              "Resolved",
              "All"
            ]
          }
        },
        "knowledgeArticleTitleRegExp": {
          "type": "string"
        },
        "serviceCatalogTitleRegExp": {
          "type": "string"
        },
        "incidentTitleRegExp": {
          "type": "string"
        },
        "inclusionFileTypePatterns": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "exclusionFileTypePatterns": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "inclusionFileNamePatterns": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "exclusionFileNamePatterns": {
          "type": "array",
          "items": {
            "type": "string"
          }
        }
      },
      "required": []
    },
    "type": {
      "type": "string",
      "pattern": "SERVICENOWV2"
    },
    "enableIdentityCrawler": {
      "type": "boolean"
    },
    "syncMode": {
      "type": "string",
      "enum": [
        "FORCED_FULL_CRAWL",
        "FULL_CRAWL"
      ]
    },
    "secretArn": {
      "type": "string",
      "minLength": 20,
      "maxLength": 2048
    }
  },
  "version": {
    "type": "string",
    "anyOf": [
      {
        "pattern": "1.0.0"
      }
    ]
  },
  "required": [
    "connectionConfiguration",
    "repositoryConfigurations",
    "syncMode",
    "additionalProperties",
    "secretArn",
    "type"
  ]
}
```

## Esquema de plantilla de Slack


Incluye un JSON que contiene el esquema de la fuente de datos como parte del [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_TemplateConfiguration.html)objeto. Debe proporcionar la URL del host como parte de la configuración de la conexión o de los detalles del punto de conexión del repositorio. Además, especifique el tipo de origen de datos como `SLACK`, un secreto para sus credenciales de autenticación y otras configuraciones necesarias. A continuación, especifique `TEMPLATE` como el `Type` cuando llame a [CreateDataSource](https://docs.aws.amazon.com/kendra/latest/APIReference/API_CreateDataSource.html).

Puede usar la plantilla que se proporciona en esta guía para desarrolladores. Consulte [Esquema JSON de Slack](#slack-json).

En la tabla siguiente se describen los parámetros del esquema JSON de Slack.


| Configuración | Description (Descripción) | 
| --- | --- | 
| connectionConfiguration | Información de configuración para el punto de conexión para el origen de datos. | 
| repositoryEndpointMetadata | La información del punto de conexión para el origen de datos. | 
| teamId | El ID de equipo de Slack que copió de la URL de su página principal de Slack. | 
| repositoryConfigurations | Información de configuración del contenido del origen de datos. Por ejemplo, configurar tipos específicos de contenido y asignaciones de campos. | 
| Todos | Una lista de objetos que asignan los atributos o los nombres de campo del Slack contenido para Amazon Kendra indexar los nombres de los campos.  | 
| additionalProperties | Opciones de configuración adicionales para el contenido del origen de datos. | 
| inclusionPatterns | Una lista de patrones de expresiones regulares para incluir contenido específico desde su origen de datos de Slack. El contenido que coincide con los patrones se incluye en el índice. El contenido que no coincide con los patrones se excluye del índice. Si algún contenido coincide con un patrón de inclusión y de exclusión, el patrón de exclusión tiene prioridad y el contenido no se incluye en el índice. | 
| exclusionPatterns | Una lista de patrones de expresiones regulares para excluir contenido específico en su origen de datos de Slack. El contenido que coincide con los patrones se excluye del índice. El contenido que no coincide con los patrones se incluye en el índice. Si algún contenido coincide con un patrón de inclusión y de exclusión, el patrón de exclusión tiene prioridad y el contenido no se incluye en el índice. | 
| crawlBotMessages | truepara rastrear los mensajes de los bots. | 
| excludeArchived | true para excluir del rastreo los mensajes archivados. | 
| conversationType | El tipo de conversación que desea indexar, ya sea PUBLIC\$1CHANNEL, PRIVATE\$1CHANNEL, GROUP\$1MESSAGE o DIRECT\$1MESSAGE. | 
| channelFilter | El tipo de canal que quiere indexar si private\$1channel o public\$1channel. | 
| sinceDate | Puede optar por configurar un parámetro sinceDate para que el conector de Slack rastree el contenido en una sinceDate específica. | 
| lookBack | Puede configurar un parámetro de lookBack para que el conector de Slack rastree el contenido actualizado o eliminado hasta un número específico de horas antes de la última sincronización del conector. | 
| syncMode |  Especifique cómo Amazon Kendra debe actualizarse el índice cuando cambie el contenido de la fuente de datos. Puede elegir entre las siguientes opciones: [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | 
| type | El tipo del origen de datos. Especifica SLACK como el tipo de origen de datos. | 
| enableIdentityCrawler | trueutilizar el rastreador Amazon Kendra de identidad para sincronizar la identity/principal información sobre los usuarios y grupos con acceso a determinados documentos. Si el rastreador de identidades está desactivado, todos los documentos se pueden buscar públicamente. Si quiere usar el control de acceso para los documentos y el rastreador de identidades está desactivado, también puede usar la API [https://docs.aws.amazon.com/kendra/latest/dg/API_PutPrincipalMapping.html](https://docs.aws.amazon.com/kendra/latest/dg/API_PutPrincipalMapping.html) para cargar la información de acceso del usuario y del grupo. | 
| secretArn |  El nombre de recurso de Amazon (ARN) de un AWS Secrets Manager secreto que contiene los pares clave-valor necesarios para conectarse a su. Slack El secreto debe contener una estructura JSON con las siguientes claves: <pre>{<br />    "slackToken": "token"<br />}</pre>  | 
| versión | La versión de esta plantilla que se admite actualmente. | 

### Esquema JSON de Slack


```
{
  "$schema": "http://json-schema.org/draft-04/schema#",
  "type": "object",
  "properties": {
    "connectionConfiguration": {
      "type": "object",
      "properties": {
        "repositoryEndpointMetadata": {
          "type": "object",
          "properties": {
            "teamId": {
              "type": "string"
            }
          },
          "required": ["teamId"]
        }
      }
    },
    "repositoryConfigurations": {
      "type": "object",
      "properties": {
        "All": {
          "type": "object",
          "properties": {
            "fieldMappings": {
              "type": "array",
              "items": [
                {
                  "type": "object",
                  "properties": {
                    "indexFieldName": {
                      "type": "string"
                    },
                    "indexFieldType": {
                      "type": "string",
                      "enum": ["STRING", "STRING_LIST", "DATE","LONG"]
                    },
                    "dataSourceFieldName": {
                      "type": "string"
                    },
                    "dateFieldFormat": {
                      "type": "string",
                      "pattern": "yyyy-MM-dd'T'HH:mm:ss'Z'"
                    }
                  },
                  "required": [
                    "indexFieldName",
                    "indexFieldType",
                    "dataSourceFieldName"
                  ]
                }
              ]
            }
          },
          "required": [
            "fieldMappings"
          ]
        }
      },
      "required": [
      ]
    },
    "additionalProperties": {
      "type": "object",
      "properties": {
        "exclusionPatterns": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "inclusionPatterns": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "crawlBotMessages": {
          "type": "boolean"
        },
        "excludeArchived": {
          "type": "boolean"
        },
        "conversationType": {
          "type": "array",
          "items": {
            "type": "string",
            "enum": [
              "PUBLIC_CHANNEL",
              "PRIVATE_CHANNEL",
              "GROUP_MESSAGE",
              "DIRECT_MESSAGE"
            ]
          }
        },
        "channelFilter": {
            "type": "object",
            "properties": {
              "private_channel": {
                "type": "array",
                "items": {
                  "type": "string"
                }
              },
              "public_channel": {
                "type": "array",
                "items": {
                  "type": "string"
                }
              }
          }
        },
        "channelIdFilter": {
          "type": "array",
          "items": {
            "type": "string"
          }
        },
        "sinceDate": {
          "anyOf": [
            {
              "type": "string",
              "pattern": "^[0-9]{4}-[0-9]{2}-[0-9]{2}T[0-9]{2}:[0-9]{2}:[0-9]{2}Z$"
            },
            {
              "type": "string",
              "pattern": ""
            }
          ]
        },
        "lookBack": {
          "type": "string",
          "pattern": "^[0-9]*$"
        }
      },
      "required": [
      ]
    },
    "syncMode": {
      "type": "string",
      "enum": [
        "FORCED_FULL_CRAWL",
        "FULL_CRAWL",
        "CHANGE_LOG"
      ]
    },
    "type" : {
      "type" : "string",
      "pattern": "SLACK"
    },
    "enableIdentityCrawler": {
      "type": "boolean"
    },
    "secretArn": {
      "type": "string"
    }
  },
  "version": {
    "type": "string",
    "anyOf": [
      {
        "pattern": "1.0.0"
      }
    ]
  },
  "required": [
    "connectionConfiguration",
    "repositoryConfigurations",
    "syncMode",
    "additionalProperties",
    "secretArn",
    "type",
    "enableIdentityCrawler"
  ]
}
```

## Esquema de plantilla de Zendesk


Incluye un JSON que contiene el esquema de la fuente de datos como parte del objeto. [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_TemplateConfiguration.html) Debe proporcionar la URL del host como parte de la configuración de la conexión o de los detalles del punto de conexión del repositorio. Además, especifique el tipo de origen de datos como `ZENDESK`, un secreto para sus credenciales de autenticación y otras configuraciones necesarias. A continuación, especifique `TEMPLATE` como el `Type` cuando llame a [CreateDataSource](https://docs.aws.amazon.com/kendra/latest/APIReference/API_CreateDataSource.html).

Puede usar la plantilla que se proporciona en esta guía para desarrolladores. Consulte [Esquema JSON de Zendesk](#zendesk-json).

En la tabla siguiente se describen los parámetros del esquema JSON de Zendesk.


| Configuración | Description (Descripción) | 
| --- | --- | 
| connectionConfiguration | Información de configuración para el punto de conexión para el origen de datos. | 
| repositoryEndpointMetadata | La información del punto de conexión para el origen de datos. | 
| hostURL | La URL del host de Zendesk. Por ejemplo, https://yoursubdomain.zendesk.com. | 
| repositoryConfigurations | Información de configuración del contenido del origen de datos. Por ejemplo, configurar tipos específicos de contenido y asignaciones de campos. | 
|  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | Una lista de objetos que asignan atributos de origen de datos o nombres de campo de tickets de Zendesk a los nombres de campo del índice de Amazon Kendra. Para obtener más información, consulte [Asignación de campos de origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/field-mapping.html). | 
| secretARN | El nombre de recurso de Amazon (ARN) de un AWS Secrets Manager secreto que contiene los pares clave-valor necesarios para conectarse a su cuenta de Zendesk. El secreto debe contener una estructura JSON con las siguientes claves: URL de host, ID de cliente, secreto del cliente, nombre de usuario y contraseña. | 
| additionalProperties | Opciones de configuración adicionales para el contenido del origen de datos | 
| organizationNameFilter | Puede optar por indexar los tickets que existen en una organización específica. | 
| sinceDate | Puede optar por configurar un parámetro sinceDate para que el conector de Zendesk rastree el contenido en función de una sinceDate específica. | 
| inclusionPatterns | Una lista de patrones de expresión regular para incluir determinados archivos en su origen de datos de Zendesk. Los archivos que coinciden con los patrones se incluyen en el índice. Los archivos que no coincidan con los patrones se excluyen del índice. Si un archivo coincide con un patrón de inclusión y de exclusión, el patrón de exclusión tiene prioridad y el archivo no se incluye en el índice. | 
| exclusionPatterns | Una lista de patrones de expresión regular para excluir determinados archivos en su origen de datos de Zendesk. Los archivos que coinciden con los patrones se excluyen del índice. Los archivos que no coincidan con los patrones se incluyen en el índice. Si un archivo coincide con un patrón de exclusión y de inclusión, el patrón de exclusión tiene prioridad y el archivo no se incluye en el índice. | 
|  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/ds-schemas.html)  | Introduzca “true” para rastrear estos tipos de contenido. | 
| type | Especifica ZENDESK como el tipo de origen de datos. | 
| useChangeLog | Introduzca “true” para usar el registro de cambios de Zendesk y determinar qué documentos deben actualizarse en el índice. Según el tamaño del registro de cambios, podría ser más rápido escanear los documentos en Zendesk. Si está sincronizando el origen de datos de Zendesk con su índice por primera vez, se escanean todos los documentos. | 

### Esquema JSON de Zendesk


```
{
  "$schema": "http://json-schema.org/draft-04/schema#",
  "type": "object",
  "properties": {
    "connectionConfiguration": {
      "type": "object",
      "properties": {
        "repositoryEndpointMetadata": {
          "type": "object",
          "properties": {
            "hostUrl": {
              "type": "string",
              "pattern": "https:.*"
            }
          },
          "required": [
            "hostUrl"
          ]
        }
      },
      "required": [
        "repositoryEndpointMetadata"
      ]
    },
    "repositoryConfigurations": {
      "type": "object",
      "properties": {
        "ticket": {
          "type": "object",
          "properties": {
            "fieldMappings": {
              "type": "array",
              "items": {
                "anyOf": [
                  {
                    "type": "object",
                    "properties": {
                      "indexFieldName": {
                        "type": "string"
                      },
                      "indexFieldType": {
                        "type": "string",
                        "enum": ["STRING", "STRING_LIST", "LONG", "DATE"]
                      },
                      "dataSourceFieldName": {
                        "type": "string"
                      },
                      "dateFieldFormat": {
                        "type": "string",
                        "pattern": "dd-MM-yyyy HH:mm:ss"
                      }
                    },
                    "required": [
                      "indexFieldName",
                      "indexFieldType",
                      "dataSourceFieldName"

                    ]
                  }
                ]
              }
            }
          },
          "required": [
            "fieldMappings"
          ]
        },
        "ticketComment": {
          "type": "object",
          "properties": {
            "fieldMappings": {
              "type": "array",
              "items": {
                "anyOf": [
                  {
                    "type": "object",
                    "properties": {
                      "indexFieldName": {
                        "type": "string"
                      },
                      "indexFieldType": {
                        "type": "string",
                        "enum": ["STRING", "STRING_LIST", "LONG", "DATE"]
                      },
                      "dataSourceFieldName": {
                        "type": "string"
                      },
                      "dateFieldFormat": {
                        "type": "string",
                        "pattern": "dd-MM-yyyy HH:mm:ss"
                      }
                    },
                    "required": [
                      "indexFieldName",
                      "indexFieldType",
                      "dataSourceFieldName"

                    ]
                  }
                ]
              }
            }
          },
          "required": [
            "fieldMappings"
          ]
        },
        "ticketCommentAttachment": {
          "type": "object",
          "properties": {
            "fieldMappings": {
              "type": "array",
              "items": {
                "anyOf": [
                  {
                    "type": "object",
                    "properties": {
                      "indexFieldName": {
                        "type": "string"
                      },
                      "indexFieldType": {
                        "type": "string",
                        "enum": ["STRING", "STRING_LIST", "LONG", "DATE"]
                      },
                      "dataSourceFieldName": {
                        "type": "string"
                      },
                      "dateFieldFormat": {
                        "type": "string",
                        "pattern": "dd-MM-yyyy HH:mm:ss"
                      }
                    },
                    "required": [
                      "indexFieldName",
                      "indexFieldType",
                      "dataSourceFieldName"
                    ]
                  }
                ]
              }
            }
          },
          "required": [
            "fieldMappings"
          ]
        },
        "article": {
          "type": "object",
          "properties": {
            "fieldMappings": {
              "type": "array",
              "items": {
                "anyOf": [
                  {
                    "type": "object",
                    "properties": {
                      "indexFieldName": {
                        "type": "string"
                      },
                      "indexFieldType": {
                        "type": "string",
                        "enum": ["STRING", "STRING_LIST", "LONG", "DATE"]
                      },
                      "dataSourceFieldName": {
                        "type": "string"
                      },
                      "dateFieldFormat": {
                        "type": "string",
                        "pattern": "dd-MM-yyyy HH:mm:ss"
                      }
                    },
                    "required": [
                      "indexFieldName",
                      "indexFieldType",
                      "dataSourceFieldName"
                    ]
                  }
                ]
              }
            }
          },
          "required": [
            "fieldMappings"
          ]
        },
        "communityPostComment": {
          "type": "object",
          "properties": {
            "fieldMappings": {
              "type": "array",
              "items": {
                "anyOf": [
                  {
                    "type": "object",
                    "properties": {
                      "indexFieldName": {
                        "type": "string"
                      },
                      "indexFieldType": {
                        "type": "string",
                        "enum": ["STRING", "STRING_LIST", "LONG", "DATE"]
                      },
                      "dataSourceFieldName": {
                        "type": "string"
                      },
                      "dateFieldFormat": {
                        "type": "string",
                        "pattern": "dd-MM-yyyy HH:mm:ss"
                      }
                    },
                    "required": [
                      "indexFieldName",
                      "indexFieldType",
                      "dataSourceFieldName"
                    ]
                  }
                ]
              }
            }
          },
          "required": [
            "fieldMappings"
          ]
        },
        "articleComment": {
          "type": "object",
          "properties": {
            "fieldMappings": {
              "type": "array",
              "items": {
                "anyOf": [
                  {
                    "type": "object",
                    "properties": {
                      "indexFieldName": {
                        "type": "string"
                      },
                      "indexFieldType": {
                        "type": "string",
                        "enum": ["STRING", "STRING_LIST", "LONG", "DATE"]
                      },
                      "dataSourceFieldName": {
                        "type": "string"
                      },
                      "dateFieldFormat": {
                        "type": "string",
                        "pattern": "dd-MM-yyyy HH:mm:ss"
                      }
                    },
                    "required": [
                      "indexFieldName",
                      "indexFieldType",
                      "dataSourceFieldName"
                    ]
                  }
                ]
              }
            }
          },
          "required": [
            "fieldMappings"
          ]
        },
        "articleAttachment": {
          "type": "object",
          "properties": {
            "fieldMappings": {
              "type": "array",
              "items": {
                "anyOf": [
                  {
                    "type": "object",
                    "properties": {
                      "indexFieldName": {
                        "type": "string"
                      },
                      "indexFieldType": {
                        "type": "string",
                        "enum": ["STRING", "STRING_LIST", "LONG", "DATE"]
                      },
                      "dataSourceFieldName": {
                        "type": "string"
                      },
                      "dateFieldFormat": {
                        "type": "string",
                        "pattern": "dd-MM-yyyy HH:mm:ss"
                      }
                    },
                    "required": [
                      "indexFieldName",
                      "indexFieldType",
                      "dataSourceFieldName"
                    ]
                  }
                ]
              }
            }
          },
          "required": [
            "fieldMappings"
          ]
        },
        "communityTopic": {
          "type": "object",
          "properties": {
            "fieldMappings": {
              "type": "array",
              "items": {
                "anyOf": [
                  {
                    "type": "object",
                    "properties": {
                      "indexFieldName": {
                        "type": "string"
                      },
                      "indexFieldType": {
                        "type": "string",
                        "enum": ["STRING", "STRING_LIST", "LONG", "DATE"]
                      },
                      "dataSourceFieldName": {
                        "type": "string"
                      },
                      "dateFieldFormat": {
                        "type": "string",
                        "pattern": "dd-MM-yyyy HH:mm:ss"
                      }
                    },
                    "required": [
                      "indexFieldName",
                      "indexFieldType",
                      "dataSourceFieldName"
                    ]
                  }
                ]
              }
            }
          },
          "required": [
            "fieldMappings"
          ]
        }
      }
    },
    "secretArn": {
      "type": "string",
      "minLength": 20,
      "maxLength": 2048
    },
    "additionalProperties": {
      "type": "object",
      "properties": {
        "organizationNameFilter": {
          "type": "array"
        },
        "sinceDate": {
          "type": "string",
          "pattern": "^[0-9]{4}-[0-9]{2}-[0-9]{2} [0-9]{2}:[0-9]{2}:[0-9]{2}$"
        },
        "inclusionPatterns": {
          "type": "array"
        },
        "exclusionPatterns": {
          "type": "array"
        },
        "isCrawTicket": {
          "type": "string"
        },
        "isCrawTicketComment": {
          "type": "string"
        },
        "isCrawTicketCommentAttachment": {
          "type": "string"
        },
        "isCrawlArticle": {
          "type": "string"
        },
        "isCrawlArticleAttachment": {
          "type": "string"
        },
        "isCrawlArticleComment": {
          "type": "string"
        },
        "isCrawlCommunityTopic": {
          "type": "string"
        },
        "isCrawlCommunityPost": {
          "type": "string"
        },
        "isCrawlCommunityPostComment": {
          "type": "string"
        }
      }
    },
    "type": {
      "type": "string",
      "pattern": "ZENDESK"
    },
    "useChangeLog": {
      "type": "string",
      "enum": ["true", "false"]
    }
  },
  "version": {
    "type": "string",
    "anyOf": [
      {
        "pattern": "1.0.0"
      }
    ]
  },
  "additionalProperties": false,
  "required": [
    "connectionConfiguration",
    "repositoryConfigurations",
    "additionalProperties",
    "useChangeLog",
    "secretArn",
    "type"
  ]
}
```

# Adobe Experience Manager


**nota**  
El conector Adobe Experience Manager seguirá siendo totalmente compatible con los clientes actuales hasta el 31 de mayo de 2026. Si bien este conector ya no está disponible para los nuevos usuarios, los usuarios actuales pueden seguir utilizándolo sin interrupciones. Desarrollamos de forma continua nuestra cartera de conectores para ofrecer soluciones más escalables y personalizables. Para futuras integraciones, le recomendamos que valore el marco de conectores personalizados de Amazon Kendra[1], diseñado de manera más flexible para una variedad más amplia de casos de uso empresariales.

Adobe Experience Manager es un sistema de gestión de contenido que se utiliza para crear contenido de sitios web o aplicaciones móviles. Puede usarlo Amazon Kendra para conectarse a sus páginas Adobe Experience Manager y activos de contenido e indexarlos.

Amazon Kendraadmite Adobe Experience Manager (AEM) como instancia de autor de Cloud Service y como instancia de autor y publicación Adobe Experience Manager local.

Puede conectarse Amazon Kendra a su fuente de Adobe Experience Manager datos mediante la [Amazon Kendraconsola](https://console.aws.amazon.com/kendra/) o la [https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html](https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html)API.

Para solucionar problemas del conector de fuentes de datos de Amazon Kendra Adobe Experience Manager, consulte[Solución de problemas con los orígenes de datos](troubleshooting-data-sources.md).

**Topics**
+ [

## Características admitidas
](#supported-features-aem)
+ [

## Requisitos previos
](#prerequisites-aem)
+ [

## Instrucciones de conexión
](#data-source-procedure-aem)

## Características admitidas


El conector de origen de datos de Adobe Experience Manager admite las siguientes características:
+ Asignaciones de campos
+ Control de acceso de usuarios
+ Filtros de inclusión/exclusión
+ Sincronizaciones completas e incrementales del contenido
+ OAuth 2.0 y autenticación básica
+ Nube privada virtual (VPC)

## Requisitos previos


Antes de poder utilizarla Amazon Kendra para indexar la fuente de Adobe Experience Manager datos, realice estos cambios en sus AWS cuentas Adobe Experience Manager y.

**En Adobe Experience Manager, asegúrese de que**:
+ Tiene acceso a una cuenta con privilegios administrativos o un usuario administrador.
+ Ha copiado la URL del host de Adobe Experience Manager.
**nota**  
(local o en el servidor) Amazon Kendra comprueba si la información de punto final incluida AWS Secrets Manager es la misma que la información de punto final especificada en los detalles de configuración de la fuente de datos. Esto ayuda a evitar el [problema del suplente confuso](https://docs.aws.amazon.com/IAM/latest/UserGuide/confused-deputy.html), que es un problema de seguridad en el que un usuario no tiene permiso para realizar una acción, pero utiliza Amazon Kendra como proxy para acceder al secreto configurado y realizar la acción. Si más adelante cambia la información de punto de conexión, debe crear un nuevo secreto para sincronizar esta información.
+ Ha apuntado las credenciales de autenticación básica del nombre de usuario y la contraseña del administrador.
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).
+ **Opcional**: se configuraron las credenciales OAuth 2.0 en Adobe Experience Manager (AEM) como un servicio en la nube o en AEM local. Si utiliza AEM On-Premise, las credenciales incluyen el ID de cliente, el secreto del cliente y la clave privada. Si utiliza AEM as a Cloud Service, las credenciales incluyen el ID de cliente, el secreto del cliente, la clave privada, el ID de la organización, el ID de la cuenta técnica y el host de Adobe Identity Management System (IMS). Para obtener más información sobre cómo generar estas credenciales para AEM as a Cloud Service, consulte la [documentación de Adobe Experience Manager](https://experienceleague.adobe.com/docs/experience-manager-learn/getting-started-with-aem-headless/authentication/service-credentials.html). En el caso de AEM On-Premise, la implementación del servidor Adobe Granite OAuth 2.0 (com.adobe.granite.oauth.server) es compatible con las funcionalidades del servidor OAuth 2.0 en AEM.
+ Ha comprobado que cada documento es único en Adobe Experience Manager y en otros orígenes de datos que vaya a utilizar para el mismo índice. Cada origen de datos que desee utilizar para un índice no debe contener el mismo documento en varios orígenes de datos. IDs Los documentos son globales en un índice y deben ser únicos por índice.

**En el tuyoCuenta de AWS, asegúrate de tener:**
+ [Creó un Amazon Kendra índice](https://docs.aws.amazon.com/kendra/latest/dg/create-index.html) y, si usa la API, anotó el ID del índice.
+ [Creó un IAM rol](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds) para su fuente de datos y, si usa la API, anotó el ARN del IAM rol.
**nota**  
Si cambias el tipo de autenticación y las credenciales, debes actualizar tu IAM rol para acceder al ID AWS Secrets Manager secreto correcto.
+ Ha guardado sus credenciales de autenticación de Adobe Experience Manager en un secreto de AWS Secrets Manager y, si utiliza la API, ha anotado el ARN del secreto.
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).

Si no tienes un IAM rol o secreto existente, puedes usar la consola para crear un nuevo IAM rol y Secrets Manager secreto al conectar tu fuente de datos de Adobe Experience Manager aAmazon Kendra. Si utiliza la API, debe proporcionar el ARN de un IAM rol y un Secrets Manager secreto existentes y un ID de índice.

## Instrucciones de conexión


Para conectarse Amazon Kendra a su fuente de Adobe Experience Manager datos, debe proporcionar los detalles necesarios de la fuente de Adobe Experience Manager datos para que Amazon Kendra pueda acceder a sus datos. Si aún no lo ha configurado Adobe Experience ManagerAmazon Kendra, consulte[Requisitos previos](#prerequisites-aem).

------
#### [ Console ]

**Para conectarse Amazon Kendra a Adobe Experience Manager** 

1. Inicie sesión en la [Amazon Kendraconsola Consola de administración de AWS y ábrala](https://console.aws.amazon.com/kendra/).

1. En el panel de navegación izquierdo, elija **Índices** y, a continuación, elija el índice que desee usar de la lista de índices.
**nota**  
Puede elegir configurar o editar los ajustes de **Control de acceso de usuarios** en la **Configuración del índice**. 

1. En la página **Introducción**, seleccione **Agregar origen de datos**.

1. En la página **Agregar origen de datos**, seleccione **Conector de Adobe Experience Manager** y, a continuación, seleccione **Agregar conector**. Si usa la versión 2 (si corresponde), elija el **conector de Adobe Experience Manager** con la etiqueta “V2.0”.

1. En la página **Especificar detalles del origen de datos**, introduzca la siguiente información:

   1. En **Nombre y descripción**, en **Nombre del origen de datos**: introduzca un nombre para el origen de datos. Puede incluir guiones, pero no espacios.

   1. (Opcional)** Descripción**: introduzca una descripción opcional para el origen de datos.

   1. En **Idioma predeterminado**: elija un idioma para filtrar los documentos para el índice. A menos que especifique lo contrario, el idioma predeterminado es el inglés. El idioma especificado en los metadatos del documento anula el idioma seleccionado.

   1. En **Etiquetas**, para **añadir una nueva etiqueta**: incluye etiquetas opcionales para buscar y filtrar tus recursos o realizar un seguimiento de tus AWS costes.

   1. Elija **Siguiente**.

1. En la página **Definir acceso y seguridad**, introduzca la siguiente información:

   1. **Origen**: elija **AEM On-Premise** o **AEM as a Cloud Service**.

      Introduzca la URL del host de Adobe Experience Manager. Por ejemplo, si utiliza AEM On-Premise, debe incluir el nombre de host y el puerto: *https://hostname:port*. O bien, si usa AEM as a Cloud Service, puede usar la URL del autor: *https://author-xxxxxx-xxxxxxx.adobeaemcloud.com*.

   1. **Ubicación del certificado SSL**: introduzca la ruta al certificado SSL almacenado en un bucket de Amazon S3. Se utiliza para conectarse a AEM On-Premise mediante una conexión SSL segura.

   1. **Autorización**: active o desactive la información de la lista de control de acceso (ACL) para los documentos, si tiene una ACL y desea usarla para el control de acceso. La ACL especifica a qué documentos pueden acceder los usuarios y los grupos. La información de la ACL se utiliza para filtrar los resultados de búsqueda en función del acceso del usuario o su grupo a los documentos. Para obtener más información, consulte [Filtrado de contexto de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#context-filter-user-incl-datasources).

   1. **Autenticación**: elija la **autenticación básica o la autenticación OAuth ** **2.0**. A continuación, elija un AWS Secrets Manager secreto existente o cree uno nuevo para almacenar sus Adobe Experience Manager credenciales. Si decides crear un secreto nuevo, se abrirá una ventana AWS Secrets Manager secreta.

      Si ha elegido la **autenticación básica**, introduzca un nombre para el secreto, el nombre de usuario del sitio de Adobe Experience Manager y la contraseña. El usuario debe tener permiso de administrador o ser un usuario administrador.

      Si ha elegido la **autenticación OAuth 2.0** y utiliza AEM On-Premise, introduzca un nombre para el secreto, el ID de cliente, el secreto de cliente y la clave privada. Si utiliza AEM as a Cloud Service, introduzca un nombre para el secreto, el ID de cliente, el secreto del cliente, la clave privada, el ID de la organización, el ID de la cuenta técnica y el host de Adobe Identity Management System (IMS).

      Guarde y añada su secreto.

   1. **Nube privada virtual (VPC)**: puede optar por utilizar una VPC. Si es así, debe agregar **Subredes** y **Grupos de seguridad de VPC**.

   1. **Rastreador de identidades**: especifique si se debe activar el rastreador de identidades de Amazon Kendra. El rastreador de identidades utiliza la información de la lista de control de acceso (ACL) de los documentos para filtrar los resultados de la búsqueda en función del acceso del usuario o del grupo a los documentos. Si tiene una ACL para sus documentos y decide utilizarla, también puede optar por activar el rastreador de identidades para configurar el [filtrado Amazon Kendra de los resultados de búsqueda por contexto de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#context-filter-user-incl-datasources). De lo contrario, si el rastreador de identidades está desactivado, todos los documentos se pueden buscar públicamente. Si quieres usar el control de acceso para tus documentos y el rastreador de identidad está desactivado, también puedes usar la [PutPrincipalMapping](https://docs.aws.amazon.com/kendra/latest/APIReference/API_PutPrincipalMapping.html)API para cargar información de acceso de usuarios y grupos para filtrar el contexto de los usuarios.

   1. **IAMrol**: elija un IAM rol existente o cree uno nuevo IAM para acceder a las credenciales del repositorio y al contenido del índice.
**nota**  
IAMlos roles utilizados para los índices no se pueden usar para las fuentes de datos. Si no está seguro de si un rol existente se utiliza para un índice o para las preguntas frecuentes, elija **Crear un nuevo rol** para evitar errores.

   1. Elija **Siguiente**.

1. En la página **Configurar ajustes de sincronización**, introduzca la siguiente información:

   1. **Ámbito de sincronización**: establezca límites para rastrear determinados tipos de contenido, componentes de páginas y rutas raíz y filtre el contenido mediante patrones de expresiones regex.

      1. **Tipos de contenido**: elija si deseas rastrear solo las páginas o los activos, o ambos.

      1. (Opcional) **Configuración adicional**: configure los siguientes ajustes:
         + **Componentes de página**: los nombres específicos de los componentes de página. El componente de página es un componente de página extensible diseñado para funcionar con el editor de Adobe Experience Manager plantillas y permite ensamblar los componentes de página header/footer y estructura con el editor de plantillas.
         + **Variaciones de fragmentos de contenido**: los nombres específicos de las variaciones de fragmentos de contenido. Los fragmentos de contenido le permiten diseñar, crear, seleccionar y publicar contenido independiente de la página en Adobe Experience Manager. Permiten preparar contenido listo para su uso en locations/over múltiples canales.
         + **Rutas raíz**: las rutas raíz a contenido específico.
         + **Patrones regex**: patrones de expresiones regulares para incluir o excluir determinadas páginas y recursos.

   1. **Modo de sincronización**: elija cómo desea actualizar el índice cuando cambie el contenido del origen de datos. Al sincronizar la fuente de datos Amazon Kendra por primera vez, todo el contenido se rastrea e indexa de forma predeterminada. Debe ejecutar una sincronización completa de los datos si la sincronización inicial falló, incluso si no selecciona la sincronización completa como opción de modo de sincronización.
      + Sincronización completa: se vuelve a indexar todo el contenido, reemplazando el contenido existente cada vez que el origen de datos se sincronice con el índice.
      + Sincronización de lo nuevo y modificado: se indexa solo el contenido nuevo y modificado cada vez que el origen de datos se sincroniza con el índice. Amazon Kendra puede utilizar el mecanismo del origen de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido modificado desde la última sincronización.
      + Sincronización nueva, modificada o eliminada: indexe solo el contenido nuevo, modificado y eliminado cada vez que la fuente de datos se sincronice con el índice. Amazon Kendrapuede usar el mecanismo de la fuente de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido que ha cambiado desde la última sincronización.

   1. **ID de zona horaria**: si utiliza AEM On-Premise y la zona horaria del servidor es diferente a la zona horaria del conector o índice de AEM de Amazon Kendra, puede especificar la zona horaria del servidor para alinearla con el conector o índice de AEM. La zona horaria predeterminada de AEM On-Premise es la zona horaria del conector o índice de AEM de Amazon Kendra. La zona horaria predeterminada de AEM as a Cloud Service es la hora media de Greenwich.

   1. **Programación de ejecución de sincronización**, en **Frecuencia**: elija la frecuencia con la que desea sincronizar el contenido del origen de datos y actualizar el índice.

   1. Elija **Siguiente**.

1. En la página **Establecer asignaciones de campos**, especifique la siguiente información:

   1. Seleccione uno de los campos de fuente de datos predeterminados Amazon Kendra generados que desee asignar a su índice. Para agregar campos de origen de datos personalizados, cree un nombre de campo de índice para asignarlos y el tipo de datos del campo.

   1. Elija **Siguiente**.

1. En la página **Revisar y crear**, compruebe que la información que ha introducido es correcta y, a continuación, seleccione **Añadir origen de datos**. También puede elegir editar la información desde esta página. El origen de datos aparecerá en la página **Orígenes de datos** una vez que el origen de datos se haya agregado correctamente.

------
#### [ API ]

**Para conectarse Amazon Kendra a Adobe Experience Manager**

Debe especificar un JSON del [esquema del origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/ds-schemas.html#ds-aem-schema) mediante la API [https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html](https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html). Debe proporcionar la siguiente información:
+ **Origen de datos**: defina el tipo de origen de datos como `AEM` cuando utilice el esquema JSON [https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html](https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html). Además, defina el origen de datos como `TEMPLATE` al llamar a la API [https://docs.aws.amazon.com/kendra/latest/dg/API_CreateDataSource.html](https://docs.aws.amazon.com/kendra/latest/dg/API_CreateDataSource.html).
+ **URL del host de AEM**: especifique la URL del host de Adobe Experience Manager. Por ejemplo, si utiliza AEM On-Premise, debe incluir el nombre de host y el puerto: *https://hostname:port*. O bien, si usa AEM as a Cloud Service, puede usar la URL del autor: *https://author-xxxxxx-xxxxxxx.adobeaemcloud.com*.
+ **Modo de sincronización**: especifique cómo Amazon Kendra debe actualizarse el índice cuando cambie el contenido de la fuente de datos. Al sincronizar el origen de datos con Amazon Kendra por primera vez, todo el contenido se rastrea y se indexa de forma predeterminada. Debe ejecutar una sincronización completa de los datos si la sincronización inicial falló, incluso si no selecciona la sincronización completa como opción de modo de sincronización. Puede elegir entre las siguientes opciones:
  + `FORCED_FULL_CRAWL` para volver a indexar todo el contenido, reemplazando el contenido existente cada vez que el origen de datos se sincronice con el índice.
  + `FULL_CRAWL` para indexar solo el contenido nuevo, modificado y eliminado cada vez que el origen de datos se sincronice con el índice. Amazon Kendra puede utilizar el mecanismo del origen de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido modificado desde la última sincronización.
  + `CHANGE_LOG` para indexar solo el contenido nuevo y modificado cada vez que el origen de datos se sincronice con el índice. Amazon Kendra puede utilizar el mecanismo del origen de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido modificado desde la última sincronización.
+ **Tipo de autenticación**: especifique qué tipo de autenticación quiere usar, ya sea `Basic` o `OAuth2`.
+ **Tipo de AEM**: especifique qué tipo de Adobe Experience Manager va a utilizar, ya sea `CLOUD` o `ON_PREMISE`.
+ **Nombre de recurso de Amazon (ARN) secreto**: si desea utilizar la autenticación básica para AEM On-Premise o Cloud, debe proporcionar un secreto que almacene las credenciales de autenticación de su nombre de usuario y contraseña. Usted proporciona el nombre de recurso de Amazon (ARN) de un AWS Secrets Manager secreto. El secreto se almacena en una estructura JSON con las siguientes claves:

  ```
  {
      "aemUrl": "Adobe Experience Manager On-Premise host URL",
      "username": "user name with admin permissions",
      "password": "password with admin permissions"
  }
  ```

  Si desea utilizar la autenticación OAuth 2.0 para AEM On-Premise, el secreto se almacena en una estructura JSON con las siguientes claves:

  ```
  {
      "aemUrl": "Adobe Experience Manager host URL",
      "clientId": "client ID",
      "clientSecret": "client secret",
      "privateKey": "private key"
  }
  ```

  Si desea utilizar la autenticación OAuth 2.0 para AEM como servicio en la nube, el secreto se almacena en una estructura JSON con las siguientes claves:

  ```
  {
      "clientId": "client ID",
      "clientSecret": "client secret",
      "privateKey": "private key",
      "orgId": "organization ID",
      "technicalAccountId": "technical account ID",
      "imsHost": "Adobe Identity Management System (IMS) host"
  }
  ```
+ **IAMrol**: especifique `RoleArn` cuándo llama `CreateDataSource` para proporcionar un IAM rol con permisos para acceder a su Secrets Manager secreto y para llamar al público requerido APIs para el conector Adobe Experience Manager y. Amazon Kendra Para obtener más información, consulte [Roles de IAM para orígenes de datos de Adobe Experience Manager](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds).

También puede añadir las siguientes características opcionales:
+  **Nube privada virtual (VPC)**: especifique a `VpcConfiguration` cuándo llamar a `CreateDataSource`. Para obtener más información, consulte [¿Se está configurando Amazon Kendra para usar un Amazon VPC](vpc-configuration.md).
+ **ID de zona horaria**: si utiliza AEM On-Premise y la zona horaria del servidor es diferente a la zona horaria del conector o índice de Amazon Kendra AEM, puede especificar la zona horaria del servidor para alinearla con el conector o índice de AEM.

  La zona horaria predeterminada de AEM On-Premise es la zona horaria del conector o índice de AEM. Amazon Kendra La zona horaria predeterminada de AEM as a Cloud Service es la hora media de Greenwich.

  [Para obtener información sobre las zonas horarias compatibles IDs, consulte Adobe Experience Manager el esquema JSON.](https://docs.aws.amazon.com/kendra/latest/dg/ds-schemas.html#aem-json)
+ **Filtros de inclusión y exclusión**: especifique si desea incluir o excluir determinadas páginas y activos.
**nota**  
La mayoría de los orígenes de datos utilizan patrones de expresiones regulares, que son patrones de inclusión o exclusión denominados filtros. Si especifica un filtro de inclusión, solo se indexará el contenido que coincida con el filtro de inclusión. Los documentos que no coincidan con el filtro de inclusión no se indexan. Si especifica un filtro de inclusión y exclusión, los documentos que coincidan con el filtro de exclusión no se indexarán, aunque coincidan con el filtro de inclusión.
+ **Rastreador de identidades**: especifique si se debe activar el rastreador de identidades de Amazon Kendra. El rastreador de identidades utiliza la información de la lista de control de acceso (ACL) de los documentos para filtrar los resultados de la búsqueda en función del acceso del usuario o del grupo a los documentos. Si tiene una ACL para sus documentos y decide utilizarla, también puede optar por activar el rastreador de identidades para configurar el [filtrado Amazon Kendra de los resultados de búsqueda por contexto de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#context-filter-user-incl-datasources). De lo contrario, si el rastreador de identidades está desactivado, todos los documentos se pueden buscar públicamente. Si quieres usar el control de acceso para tus documentos y el rastreador de identidad está desactivado, también puedes usar la [PutPrincipalMapping](https://docs.aws.amazon.com/kendra/latest/APIReference/API_PutPrincipalMapping.html)API para cargar información de acceso de usuarios y grupos para filtrar el contexto de los usuarios.
+  **Asignaciones de campos**: elija asignar los campos del origen de datos de Adobe Experience Manager a los campos de índice de Amazon Kendra. Para obtener más información, consulte [Asignación de campos de origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/field-mapping.html).
**nota**  
El campo del cuerpo del documento o el cuerpo del documento equivalente de sus documentos es obligatorio Amazon Kendra para poder buscarlos. Debe asignar el nombre del campo del cuerpo del documento en el origen de datos al nombre del campo del índice `_document_body`. Todos los demás campos son opcionales.

Para obtener una lista de otras claves JSON importantes que debe configurar, consulte el [Esquema de plantilla de Adobe Experience Manager](https://docs.aws.amazon.com/kendra/latest/dg/ds-schemas.html#ds-aem-schema).

------

# Alfresco


**nota**  
El conector de Alfresco seguirá siendo totalmente compatible con los clientes actuales hasta el 31 de mayo de 2026. Si bien este conector ya no está disponible para los nuevos usuarios, los usuarios actuales pueden seguir utilizándolo sin interrupciones. Desarrollamos de forma continua nuestra cartera de conectores para ofrecer soluciones más escalables y personalizables. Para futuras integraciones, le recomendamos que valore el marco de conectores personalizados de Amazon Kendra[1], diseñado de manera más flexible para una variedad más amplia de casos de uso empresariales.

Alfresco es un servicio de administración de contenido que ayuda a los clientes a almacenar y administrar su contenido. Puede usarlo Amazon Kendra para indexar su biblioteca de Alfresco documentos, wiki y blog.

Amazon Kendraes compatible con el Alfresco entorno local y Alfresco en la nube (plataforma como servicio).

Puede conectarse Amazon Kendra a su fuente de Alfresco datos mediante la [Amazon Kendraconsola](https://console.aws.amazon.com/kendra/) o la [https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html](https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html)API.

Para solucionar problemas del conector de fuente de datos de Amazon Kendra Alfresco, consulte[Solución de problemas con los orígenes de datos](troubleshooting-data-sources.md).

**Topics**
+ [

## Características admitidas
](#supported-features-alfresco)
+ [

## Requisitos previos
](#prerequisites-alfresco)
+ [

## Instrucciones de conexión
](#data-source-procedure-alfresco)
+ [

## Más información
](#alfresco-learn-more)

## Características admitidas


El conector de origen de datos de Amazon KendraAlfresco admite las siguientes características:
+ Asignaciones de campos
+ Control de acceso de usuarios
+ Filtros de inclusión/exclusión
+ Sincronizaciones completas e incrementales del contenido
+ OAuth 2.0 y autenticación básica
+ Nube privada virtual (VPC)

## Requisitos previos


Antes de poder utilizarla Amazon Kendra para indexar su fuente de datos de Alfresco, realice estos cambios en su archivo Alfresco yCuentas de AWS.

**En Alfresco, asegúrese de que**:
+ Ha copiado la URL del repositorio de Alfresco y la URL de la aplicación web. Si solo quiere indexar un sitio de Alfresco específico, copie también el ID del sitio.
+ Ha apuntado sus credenciales de autenticación de Alfresco, que incluyen un nombre de usuario y una contraseña con al menos permisos de lectura. Si quiere utilizar la autenticación OAuth 2.0, debe añadir el usuario al grupo de Alfresco administradores.
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).
+ **Opcional**: se OAuth configuraron las credenciales 2.0 enAlfresco. Las credenciales incluyen el ID de cliente, el secreto del cliente y la URL del token. Para obtener más información sobre cómo configurar los clientes para Alfresco On-Premises, consulte la [documentación de Alfresco](https://docs.alfresco.com/identity-service/latest/tutorial/sso/saml/). Si usa Alfresco la nube (PaaS), debe ponerse en contacto con el [soporte de Hyland](https://community.hyland.com/) para obtener la autenticación Alfresco OAuth 2.0.
+ Ha comprobado que cada documento es único en Alfresco y en otros orígenes de datos que vaya a utilizar para el mismo índice. Cada origen de datos que desee utilizar para un índice no debe contener el mismo documento en varios orígenes de datos. IDs Los documentos son globales para un índice y deben ser únicos por índice.

**En el tuyoCuenta de AWS, asegúrate de tener:**
+ [Creó un Amazon Kendra índice](https://docs.aws.amazon.com/kendra/latest/dg/create-index.html) y, si usa la API, anotó el ID del índice.
+ [Creó un IAM rol](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds) para su fuente de datos y, si usa la API, anotó el ARN del IAM rol.
**nota**  
Si cambias el tipo de autenticación y las credenciales, debes actualizar tu IAM rol para acceder al ID AWS Secrets Manager secreto correcto.
+ Ha guardado sus credenciales de autenticación de Alfresco en un secreto de AWS Secrets Manager y, si utiliza la API, ha anotado el ARN del secreto.
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).

Si no tiene un IAM rol o secreto existente, puede usar la consola para crear un nuevo IAM rol y un Secrets Manager secreto al conectar su fuente de datos de Alfresco. Amazon Kendra Si utiliza la API, debe proporcionar el ARN de un IAM rol y un Secrets Manager secreto existentes y un ID de índice.

## Instrucciones de conexión


Para conectarse Amazon Kendra a su fuente de datos de Alfresco, debe proporcionar los detalles necesarios de su fuente de datos de Alfresco para que Amazon Kendra pueda acceder a sus datos. Si aún no ha configurado Alfresco paraAmazon Kendra, consulte. [Requisitos previos](#prerequisites-alfresco)

------
#### [ Console ]

**Para conectarse a Amazon Kendra Alfresco**

1. Inicie sesión en la [Amazon Kendraconsola Consola de administración de AWS y ábrala](https://console.aws.amazon.com/kendra/).

1. En el panel de navegación izquierdo, elija **Índices** y, a continuación, elija el índice que desee usar de la lista de índices.
**nota**  
Puede elegir configurar o editar los ajustes de **Control de acceso de usuarios** en la **Configuración del índice**. 

1. En la página **Introducción**, seleccione **Agregar origen de datos**.

1. En la página **Agregar origen de datos**, seleccione **Conector de Alfresco** y, a continuación, seleccione **Agregar conector**. Si usa la versión 2 (si corresponde), elija el **conector de Alfresco** con la etiqueta “V2.0”.

1. En la página **Especificar detalles del origen de datos**, introduzca la siguiente información:

   1. En **Nombre y descripción**, en **Nombre del origen de datos**: introduzca un nombre para el origen de datos. Puede incluir guiones, pero no espacios.

   1. (Opcional)** Descripción**: introduzca una descripción opcional para el origen de datos.

   1. En **Idioma predeterminado**: elija un idioma para filtrar los documentos para el índice. A menos que especifique lo contrario, el idioma predeterminado es el inglés. El idioma especificado en los metadatos del documento anula el idioma seleccionado.

   1. En **Etiquetas**, para **añadir una nueva etiqueta**: incluye etiquetas opcionales para buscar y filtrar tus recursos o realizar un seguimiento de tus AWS costes.

   1. Elija **Siguiente**.

1. En la página **Definir acceso y seguridad**, introduzca la siguiente información:

   1. **Tipo de Alfresco**: elija si desea utilizar Alfresco en las instalaciones, en el servidor o Alfresco Cloud (plataforma como servicio).

   1. **URL del repositorio de Alfresco**: introduzca la URL del repositorio de Alfresco. Por ejemplo, si utiliza Alfresco Cloud (PaaS), la URL del repositorio podría ser *https://company.alfrescocloud.com*. O bien, si utiliza Alfresco On-Premises, la URL del repositorio podría ser *https://company-alfresco-instance.company-domain.suffix:port*.

   1. **Aplicación de usuario de Alfresco. URL**: introduzca la URL de la interfaz de usuario de Alfresco. Puede obtener la URL del repositorio de su administrador de Alfresco. Por ejemplo, la URL de la interfaz de usuario podría ser *https://example.com*.

   1. **Ubicación del certificado SSL**: introduzca la ruta al certificado SSL almacenado en un Amazon S3 depósito. Se utiliza para conectarse a Alfresco On-Premises mediante una conexión SSL segura.

   1. **Autorización**: active o desactive la información de la lista de control de acceso (ACL) para los documentos, si tiene una ACL y desea usarla para el control de acceso. La ACL especifica a qué documentos pueden acceder los usuarios y los grupos. La información de la ACL se utiliza para filtrar los resultados de búsqueda en función del acceso del usuario o su grupo a los documentos. Para obtener más información, consulte [Filtrado de contexto de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#context-filter-user-incl-datasources).

   1. **Autenticación**: elija la **autenticación básica o la autenticación OAuth ** **2.0**. A continuación, elija un secreto de Secrets Manager existente o cree uno nuevo para almacenar sus credenciales de Alfresco. Si decide crear un secreto nuevo, se abrirá una ventana AWS Secrets Manager secreta.

      Si ha elegido la **autenticación básica**, introduzca un nombre para el secreto, el nombre de usuario de Alfresco y la contraseña.

      Si ha elegido la **autenticación OAuth 2.0**, introduzca un nombre para el secreto, el ID de cliente, el secreto del cliente y la URL del token.

   1. **Nube privada virtual (VPC)**: puede optar por utilizar una VPC. Si es así, debe agregar **Subredes** y **Grupos de seguridad de VPC**.

   1. **Rastreador de identidades**: especifique si se debe activar el rastreador de identidades de Amazon Kendra. El rastreador de identidades utiliza la información de la lista de control de acceso (ACL) de los documentos para filtrar los resultados de la búsqueda en función del acceso del usuario o del grupo a los documentos. Si tiene una ACL para sus documentos y decide utilizarla, también puede optar por activar el rastreador de identidades para configurar el [filtrado Amazon Kendra de los resultados de búsqueda por contexto de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#context-filter-user-incl-datasources). De lo contrario, si el rastreador de identidades está desactivado, todos los documentos se pueden buscar públicamente. Si quieres usar el control de acceso para tus documentos y el rastreador de identidad está desactivado, también puedes usar la [PutPrincipalMapping](https://docs.aws.amazon.com/kendra/latest/APIReference/API_PutPrincipalMapping.html)API para cargar información de acceso de usuarios y grupos para filtrar el contexto de los usuarios.

   1. **IAMrol**: elija un IAM rol existente o cree uno nuevo IAM para acceder a las credenciales del repositorio y al contenido del índice.
**nota**  
IAMlos roles utilizados para los índices no se pueden usar para las fuentes de datos. Si no está seguro de si un rol existente se utiliza para un índice o para las preguntas frecuentes, elija **Crear un nuevo rol** para evitar errores.

   1. Elija **Siguiente**.

1. En la página **Configurar ajustes de sincronización**, introduzca la siguiente información:

   1. **Ámbito de sincronización**: establezca límites para rastrear determinado contenido y filtre el contenido mediante patrones de expresiones regex.

   1. 

      1. **Contenido**: elija si rastrear contenido marcado con “Aspectos” en Alfresco, contenido de un sitio de Alfresco específico o contenido de todos sus sitios de Alfresco.

      1. (Opcional) **Configuración adicional**: configure los siguientes ajustes:
         + **Incluir comentarios**: elija incluir comentarios en la biblioteca de documentos y en el blog de Alfresco.
         + **Patrones regex**: patrones de expresiones regulares para incluir o excluir determinados archivos.

   1. **Modo de sincronización**: elija cómo desea actualizar el índice cuando cambie el contenido del origen de datos. Al sincronizar la fuente de datos Amazon Kendra por primera vez, todo el contenido se rastrea e indexa de forma predeterminada. Debe ejecutar una sincronización completa de los datos si la sincronización inicial falló, incluso si no selecciona la sincronización completa como opción de modo de sincronización.
      + Sincronización completa: se vuelve a indexar todo el contenido, reemplazando el contenido existente cada vez que el origen de datos se sincronice con el índice.
      + Sincronización nueva, modificada o eliminada: indexe solo el contenido nuevo, modificado y eliminado cada vez que la fuente de datos se sincronice con el índice. Amazon Kendrapuede usar el mecanismo de la fuente de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido que ha cambiado desde la última sincronización.

   1. En **Programación de ejecución de sincronización**, en **Frecuencia**: elija la frecuencia con la que desea sincronizar el contenido del origen de datos y actualizar el índice.

   1. Elija **Siguiente**.

1. En la página **Establecer asignaciones de campos**, especifique la siguiente información:

   1. Seleccione uno de los campos de fuente de datos predeterminados Amazon Kendra generados que desee asignar a su índice.

   1. Para agregar campos de origen de datos personalizados, cree un nombre de campo de índice para asignarlos y el tipo de datos del campo.

   1. Elija **Siguiente**.

1. En la página **Revisar y crear**, compruebe que la información que ha introducido es correcta y, a continuación, seleccione **Añadir origen de datos**. También puede elegir editar la información desde esta página. El origen de datos aparecerá en la página **Orígenes de datos** una vez que el origen de datos se haya agregado correctamente.

------
#### [ API ]

**Para conectarse Amazon Kendra a Alfresco**

Debe especificar un JSON del [esquema del origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/ds-schemas.html#ds-alfresco-schema) mediante la API [https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html](https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html). Debe proporcionar la siguiente información:
+ **Origen de datos**: defina el tipo de origen de datos como `ALFRESCO` cuando utilice el esquema JSON [https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html](https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html). Además, defina el origen de datos como `TEMPLATE` al llamar a la API [https://docs.aws.amazon.com/kendra/latest/dg/API_CreateDataSource.html](https://docs.aws.amazon.com/kendra/latest/dg/API_CreateDataSource.html).
+ **ID del sitio de Alfresco**: especifique el ID del sitio de Alfresco.
+ **URL del repositorio de Alfresco**: especifique la URL del repositorio de Alfresco. Puede obtener la URL del repositorio de su administrador de Alfresco. Por ejemplo, si utiliza Alfresco Cloud (PaaS), la URL del repositorio podría ser *https://company.alfrescocloud.com*. O bien, si utiliza Alfresco On-Premises, la URL del repositorio podría ser *https://company-alfresco-instance.company-domain.suffix:port*.
+ **URL de la aplicación web de Alfresco**: especifique la URL de la interfaz de usuario de Alfresco. Puede obtener la URL del repositorio de su administrador de Alfresco. Por ejemplo, la URL de la interfaz de usuario podría ser *https://example.com*.
+ **Tipo de autenticación**: especifique el tipo de autenticación que desea usar, ya sea `OAuth2` o `Basic`.
+ **Tipo de Alfresco**: especifique qué tipo de Alfresco que utiliza, ya sea `PAAS` (Cloud/Platform as a Service) o `ON_PREM` (On-Premises).
+ **Nombre de recurso de Amazon (ARN) secreto**: si desea utilizar la autenticación básica, debe proporcionar un secreto que almacene las credenciales de autenticación de su nombre de usuario y contraseña. Usted proporciona el nombre de recurso de Amazon (ARN) de un AWS Secrets Manager secreto. El secreto se almacena en una estructura JSON con las siguientes claves:

  ```
  {
      "username": "user name",
      "password": "password"
  }
  ```

  Si desea utilizar la autenticación OAuth 2.0, el secreto se almacena en una estructura JSON con las siguientes claves:

  ```
  {
      "clientId": "client ID",
      "clientSecret": "client secret",
      "tokenUrl": "token URL"
  }
  ```
+ **IAMrol**: especifique `RoleArn` cuándo debe llamar `CreateDataSource` para proporcionar a un IAM rol permisos para acceder a su Secrets Manager secreto y para llamar al público requerido APIs para el conector de Alfresco y. Amazon Kendra Para obtener más información, consulte [Roles de IAM para orígenes de datos de Alfresco](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds).

También puede añadir las siguientes características opcionales:
+  **Nube privada virtual (VPC)**: especifique a `VpcConfiguration` cuándo llamar a `CreateDataSource`. Para obtener más información, consulte [¿Se está configurando Amazon Kendra para usar un Amazon VPC](vpc-configuration.md).
+ **Tipo de contenido**: el tipo de contenido que quiere rastrear, ya sea contenido marcado con “Aspectos” en Alfresco, contenido de un sitio de Alfresco específico o contenido de todos sus sitios de Alfresco. También puede incluir contenido de “Aspectos” específicos.
+ **Filtros de inclusión y exclusión**: especifique si desea incluir o excluir determinados archivos.
**nota**  
La mayoría de los orígenes de datos utilizan patrones de expresiones regulares, que son patrones de inclusión o exclusión denominados filtros. Si especifica un filtro de inclusión, solo se indexará el contenido que coincida con el filtro de inclusión. Los documentos que no coincidan con el filtro de inclusión no se indexan. Si especifica un filtro de inclusión y exclusión, los documentos que coincidan con el filtro de exclusión no se indexarán, aunque coincidan con el filtro de inclusión.
+ **Modo de sincronización**: especifique cómo Amazon Kendra debe actualizarse su índice cuando cambie el contenido de la fuente de datos. Al sincronizar el origen de datos con Amazon Kendra por primera vez, todo el contenido se rastrea y se indexa de forma predeterminada. Debe ejecutar una sincronización completa de los datos si la sincronización inicial falló, incluso si no selecciona la sincronización completa como opción de modo de sincronización. Puede elegir entre las siguientes opciones:
  + `FORCED_FULL_CRAWL` para volver a indexar todo el contenido, reemplazando el contenido existente cada vez que el origen de datos se sincronice con el índice.
  + `FULL_CRAWL` para indexar solo el contenido nuevo, modificado y eliminado cada vez que el origen de datos se sincronice con el índice. Amazon Kendra puede utilizar el mecanismo del origen de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido modificado desde la última sincronización.
+ **Rastreador de identidades**: especifique si se debe activar el rastreador de identidades de Amazon Kendra. El rastreador de identidades utiliza la información de la lista de control de acceso (ACL) de los documentos para filtrar los resultados de la búsqueda en función del acceso del usuario o del grupo a los documentos. Si tiene una ACL para sus documentos y decide utilizarla, también puede optar por activar el rastreador de identidades para configurar el [filtrado Amazon Kendra de los resultados de búsqueda según el contexto del usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#context-filter-user-incl-datasources). De lo contrario, si el rastreador de identidades está desactivado, todos los documentos se pueden buscar públicamente. Si quieres usar el control de acceso para tus documentos y el rastreador de identidad está desactivado, también puedes usar la [PutPrincipalMapping](https://docs.aws.amazon.com/kendra/latest/APIReference/API_PutPrincipalMapping.html)API para cargar información de acceso de usuarios y grupos para filtrar el contexto de los usuarios.
+  **Asignaciones de campos**: elija asignar los campos del origen de datos de Alfresco a los campos de índice de Amazon Kendra. Para obtener más información, consulte [Asignación de campos de origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/field-mapping.html).
**nota**  
El campo del cuerpo del documento o el cuerpo del documento equivalente de sus documentos es obligatorio Amazon Kendra para poder buscarlos. Debe asignar el nombre del campo del cuerpo del documento en el origen de datos al nombre del campo del índice `_document_body`. Todos los demás campos son opcionales.

Para obtener una lista de otras claves JSON importantes que debe configurar, consulte el [Esquema de plantilla de Alfresco](https://docs.aws.amazon.com/kendra/latest/dg/ds-schemas.html#ds-alfresco-schema).

------

## Más información


Para obtener más información sobre la integración Amazon Kendra con su fuente de datos de Alfresco, consulte:
+ [Busque contenido de forma inteligente mediante AlfrescoAmazon Kendra](https://aws.amazon.com/blogs/machine-learning/intelligently-search-alfresco-content-using-amazon-kendra/)

# Aurora(MySQL)


**nota**  
El conector de Aurora(MySQL) seguirá siendo totalmente compatible con los clientes actuales hasta el 31 de mayo de 2026. Si bien este conector ya no está disponible para los nuevos usuarios, los usuarios actuales pueden seguir utilizándolo sin interrupción. Desarrollamos de forma continua nuestra cartera de conectores para ofrecer soluciones más escalables y personalizables. Para futuras integraciones, le recomendamos que valore el marco de conectores personalizados de Amazon Kendra[1], diseñado de manera más flexible para una variedad más amplia de casos de uso empresariales.

Auroraes un sistema de administración de bases de datos relacionales (RDBMS) creado para la nube. Si es un Aurora usuario, puede usarlo Amazon Kendra para indexar su Aurora(MySQL) fuente de datos. El conector Amazon Kendra Aurora(MySQL) de fuente de datos es compatible con Aurora MySQL 3 y Aurora Serverless MySQL 8.0.

Puede conectarse Amazon Kendra a su fuente de Aurora(MySQL) datos mediante la [Amazon Kendraconsola](https://console.aws.amazon.com/kendra/) y la [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html)API.

Para solucionar problemas del conector de la fuente de Amazon Kendra Aurora(MySQL) datos, consulte[Solución de problemas con los orígenes de datos](troubleshooting-data-sources.md).

**Topics**
+ [

## Características admitidas
](#supported-features-aurora-mysql)
+ [

## Requisitos previos
](#prerequisites-aurora-mysql)
+ [

## Instrucciones de conexión
](#data-source-procedure-aurora-mysql)
+ [

## Notas
](#aurora-mysql-notes)

## Características admitidas

+ Asignaciones de campo
+ Filtrado de contexto de usuario
+ Filtros de inclusión/exclusión
+ Sincronizaciones completas e incrementales del contenido
+ Nube privada virtual (VPC)

## Requisitos previos


Antes de poder utilizarla Amazon Kendra para indexar la fuente de Aurora(MySQL) datos, realice estos cambios en sus AWS cuentas Aurora(MySQL) y.

**En Aurora(MySQL), asegúrese de que**:
+ Ha anotado el nombre de usuario y contraseña de la base de datos.
**importante**  
Como práctica recomendada, proporcione credenciales de base Amazon Kendra de datos de solo lectura.
+ Ha copiado la URL, el puerto y la instancia del host de la base de datos. Puede encontrar esta información en la Amazon RDS consola.
+ Ha comprobado que cada documento es único en Aurora(MySQL) y en otros orígenes de datos que vaya a utilizar para el mismo índice. Cada origen de datos que desee utilizar para un índice no debe contener el mismo documento en varios orígenes de datos. IDs Los documentos son globales para un índice y deben ser únicos por índice.

**En el tuyoCuenta de AWS, asegúrate de tener:**
+ [Creó un Amazon Kendra índice](https://docs.aws.amazon.com/kendra/latest/dg/create-index.html) y, si usa la API, anotó el ID del índice.
+ [Creó un IAM rol](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds) para su fuente de datos y, si usa la API, anotó el ARN del IAM rol.
**nota**  
Si cambias el tipo de autenticación y las credenciales, debes actualizar tu IAM rol para acceder al ID AWS Secrets Manager secreto correcto.
+ Ha guardado sus credenciales de autenticación de Aurora(MySQL) en un secreto de AWS Secrets Manager y, si utiliza la API, ha anotado el ARN del secreto.
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).

Si no tiene un IAM rol o secreto existente, puede usar la consola para crear un nuevo IAM rol y un Secrets Manager secreto al conectar su fuente de Aurora(MySQL) datosAmazon Kendra. Si utiliza la API, debe proporcionar el ARN de un IAM rol y un Secrets Manager secreto existentes y un ID de índice.

## Instrucciones de conexión


Para conectarse Amazon Kendra a su fuente de Aurora(MySQL) datos, debe proporcionar los detalles de sus Aurora(MySQL) credenciales para Amazon Kendra poder acceder a sus datos. Si aún no lo ha configuradoAurora(MySQL), Amazon Kendra consulte[Requisitos previos](#prerequisites-aurora-mysql).

------
#### [ Console ]

**Para conectarse Amazon Kendra a Aurora(MySQL)** 

1. Inicie sesión en la [Amazon Kendraconsola Consola de administración de AWS y ábrala](https://console.aws.amazon.com/kendra/).

1. En el panel de navegación izquierdo, elija **Índices** y, a continuación, elija el índice que desee usar de la lista de índices.
**nota**  
Puede elegir configurar o editar los ajustes de **Control de acceso de usuarios** en la **Configuración del índice**. 

1. En la página **Introducción**, seleccione **Agregar origen de datos**.

1. En la página **Agregar origen de datos**, seleccione el **Conector de Aurora(MySQL)** y, a continuación, seleccione **Agregar conector**. Si usa la versión 2 (si corresponde), elija el **Conector de Aurora(MySQL)** con la etiqueta “V2.0”.

1. En la página **Especificar detalles del origen de datos**, introduzca la siguiente información:

   1. En **Nombre y descripción**, en **Nombre del origen de datos**: introduzca un nombre para el origen de datos. Puede incluir guiones, pero no espacios.

   1. (Opcional)** Descripción**: introduzca una descripción opcional para el origen de datos.

   1. En **Idioma predeterminado**: elija un idioma para filtrar los documentos para el índice. A menos que especifique lo contrario, el idioma predeterminado es el inglés. El idioma especificado en los metadatos del documento anula el idioma seleccionado.

   1. En **Etiquetas**, para **añadir una nueva etiqueta**: incluye etiquetas opcionales para buscar y filtrar tus recursos o realizar un seguimiento de tus AWS costes.

   1. Elija **Siguiente**.

1. En la página **Definir acceso y seguridad**, introduzca la siguiente información:

   1. En **Origen**, introduzca la siguiente información:

   1.  **Host**: ingrese la URL del host de la base de datos, por ejemplo: `http://instance URL.region.rds.amazonaws.com`.

   1.  **Puerto**: ingrese el puerto de la base de datos, por ejemplo, `5432`.

   1.  **Instancia**: introduzca la instancia de la base de datos.

   1. En **Autenticación**, introduzca la siguiente información:

      1. **AWS Secrets Managersecreto**: elija un secreto existente o cree uno nuevo Secrets Manager para almacenar sus credenciales de Aurora(MySQL) autenticación. Si decide crear un secreto nuevo, se abrirá una ventana de secreto de AWS Secrets Manager.

        1. Introduzca la siguiente información en la **ventana Crear un secreto de AWS Secrets Manager**:

           1. **Nombre del secreto**: un nombre para su secreto. El prefijo 'AmazonKendra- Aurora(MySQL) -' se añade automáticamente a tu nombre secreto.

           1. Para el **nombre de usuario** y la **contraseña de la base de datos**: introduzca los valores de las credenciales de autenticación que ha copiado de la base de datos. 

        1. Seleccione **Save**.

   1. **Nube privada virtual (VPC)**: puede optar por utilizar una VPC. Si es así, debe agregar **Subredes** y **Grupos de seguridad de VPC**.

   1. **IAMrol**: elige un IAM rol existente o crea uno nuevo IAM para acceder a las credenciales del repositorio y al contenido del índice.
**nota**  
IAMlos roles utilizados para los índices no se pueden usar para las fuentes de datos. Si no está seguro de si un rol existente se utiliza para un índice o para las preguntas frecuentes, elija **Crear un nuevo rol** para evitar errores.

   1. Elija **Siguiente**.

1. En la página **Configurar ajustes de sincronización**, introduzca la siguiente información:

   1. En **Ámbito de sincronización**, seleccione de entre las siguientes opciones:
      + **Consulta SQL**: introduzca instrucciones de consulta SQL, como las operaciones SELECT y JOIN. Las consultas SQL deben tener menos de 32 KB. Las consultas SQL deben tener menos de 32 KB y no contener puntos y comas (;). Amazon Kendrarastreará todo el contenido de la base de datos que coincida con su consulta.
      + **Columna de clave principal**: proporcione la clave principal de la tabla de la base de datos. Esto identifica una tabla dentro de la base de datos.
      + **Columna de título**: proporcione el nombre de la columna del título del documento en la tabla de la base de datos.
      + **Columna de cuerpo**: proporcione el nombre de la columna del cuerpo del documento en la tabla de la base de datos.

   1. En **Configuración adicional (*opcional*)**, elija una de las siguientes opciones para sincronizar contenido específico en lugar de sincronizar todos los archivos:
      + **Columnas de detección de cambios**: introduzca los nombres de las columnas que se Amazon Kendra utilizarán para detectar cambios en el contenido. Amazon Kendravolverá a indexar el contenido cuando se produzca un cambio en alguna de estas columnas.
      + ** IDsColumna de usuarios**: introduzca el nombre de la columna que contiene el usuario IDs al que se le permitirá acceder al contenido.
      + **Columna de grupos**: introduzca el nombre de la columna que contiene los grupos a los que se dará acceso al contenido.
      + ** URLsColumna de origen**: introduzca el nombre de la columna que contiene el origen que se va URLs a indexar.
      + **Columna de marcas de tiempo**: introduzca el nombre de la columna que contiene las marcas de tiempo. Amazon Kendrautiliza la información de las marcas de tiempo para detectar cambios en el contenido y sincronizar solo el contenido modificado. 
      + **Columna de zonas horarias**: introduzca el nombre de la columna que contiene las zonas horarias del contenido que se va a rastrear.
      + **Formato de marcas temporales**: introduzca el nombre de la columna que contiene los formatos de marcas temporales que se deben utilizar para detectar cambios en el contenido y volver a sincronizar su contenido.

   1. **Modo de sincronización**: elija cómo desea actualizar el índice cuando cambie el contenido del origen de datos. Al sincronizar la fuente de datos Amazon Kendra por primera vez, todo el contenido se rastrea e indexa de forma predeterminada. Debe ejecutar una sincronización completa de los datos si la sincronización inicial falló, incluso si no selecciona la sincronización completa como opción de modo de sincronización.
      + Sincronización completa: se vuelve a indexar todo el contenido, reemplazando el contenido existente cada vez que el origen de datos se sincronice con el índice.
      + Sincronización de lo nuevo y modificado: se indexa solo el contenido nuevo y modificado cada vez que el origen de datos se sincroniza con el índice. Amazon Kendra puede utilizar el mecanismo del origen de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido modificado desde la última sincronización.
      + Sincronización nueva, modificada o eliminada: indexe solo el contenido nuevo, modificado y eliminado cada vez que la fuente de datos se sincronice con el índice. Amazon Kendrapuede usar el mecanismo de la fuente de datos para rastrear los cambios en el contenido e indexar el contenido que ha cambiado desde la última sincronización.

   1. En **Programa de ejecución de sincronización**, en **Frecuencia**: la frecuencia con la que Amazon Kendra se sincronizará con el origen de datos.

   1. Elija **Siguiente**.

1. En la página **Establecer asignaciones de campos**, especifique la siguiente información:

   1. Seleccione uno de los campos de fuente de datos predeterminados generados (**Documento IDs****, Títulos** de documentos y **Fuente URLs**) que desee mapear para Amazon Kendra indexarlos.

   1.  **Agregar campo**: para agregar campos de origen de datos personalizados para crear un nombre de campo de índice al que asignarlos y el tipo de datos del campo.

   1. Elija **Siguiente**.

1. En la página **Revisar y crear**, compruebe que la información que ha introducido es correcta y, a continuación, seleccione **Añadir origen de datos**. También puede elegir editar la información desde esta página. El origen de datos aparecerá en la página **Orígenes de datos** una vez que el origen de datos se haya agregado correctamente.

------
#### [ API ]

**Para conectarse a Amazon Kendra Aurora(MySQL)**

Debe especificar lo siguiente mediante la [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html)API:
+ **Origen de datos**: defina el tipo de origen de datos como `JDBC` cuando utilice el esquema JSON [https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html](https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html). Además, defina el origen de datos como `TEMPLATE` al llamar a la API [https://docs.aws.amazon.com/kendra/latest/dg/API_CreateDataSource.html](https://docs.aws.amazon.com/kendra/latest/dg/API_CreateDataSource.html).
+ **Tipo de base de datos**: debe especificar el tipo de base de datos como `mySql`.
+ **Consulta SQL**: especifique instrucciones de consulta SQL, como las operaciones SELECT y JOIN. Las consultas de SQL deben ser inferiores a 32 KB. Amazon Kendra rastreará todo el contenido de la base de datos que coincida con su consulta.
+ **Modo de sincronización**: especifique cómo Amazon Kendra debe actualizarse el índice cuando cambie el contenido de la fuente de datos. Al sincronizar el origen de datos con Amazon Kendra por primera vez, todo el contenido se rastrea y se indexa de forma predeterminada. Debe ejecutar una sincronización completa de los datos si la sincronización inicial falló, incluso si no selecciona la sincronización completa como opción de modo de sincronización. Puede elegir entre las siguientes opciones:
  + `FORCED_FULL_CRAWL` para volver a indexar todo el contenido, reemplazando el contenido existente cada vez que el origen de datos se sincronice con el índice.
  + `FULL_CRAWL` para indexar solo el contenido nuevo, modificado y eliminado cada vez que el origen de datos se sincronice con el índice. Amazon Kendra puede utilizar el mecanismo del origen de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido modificado desde la última sincronización.
  + `CHANGE_LOG` para indexar solo el contenido nuevo y modificado cada vez que el origen de datos se sincronice con el índice. Amazon Kendra puede utilizar el mecanismo del origen de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido modificado desde la última sincronización.
+ **Nombre secreto de recurso de Amazon (ARN): proporcione** el nombre de recurso de Amazon (ARN) de un Secrets Manager secreto que contenga las credenciales de autenticación que creó en su cuenta. Aurora(MySQL) El secreto se almacena en una estructura JSON con las siguientes claves:

  ```
  {
      "user name": "database user name",
      "password": "password"
  }
  ```
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).
+ **IAMrol**: especifique `RoleArn` cuándo llama `CreateDataSource` para proporcionar un IAM rol con permisos para acceder a su Secrets Manager secreto y para llamar al público requerido APIs para el conector y. Aurora(MySQL) Amazon Kendra Para obtener más información, consulte [Roles de IAM para orígenes de datos de Aurora(MySQL)](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds).

También puede añadir las siguientes características opcionales:
+  **Nube privada virtual (VPC)**: especifique a `VpcConfiguration` cuándo llamar a `CreateDataSource`. Para obtener más información, consulte [¿Se está configurando Amazon Kendra para usar un Amazon VPC](vpc-configuration.md).
+  **Filtros de inclusión y exclusión**: puede especificar si desea incluir contenido específico mediante el usuario IDs, los grupos, la fuente URLs, las marcas horarias y las zonas horarias. 
+  **Filtrado de contexto de usuario y control de acceso**: si hay una lista de control de acceso (ACL) para los documentos, Amazon Kendra la rastreará. La información de la ACL se utiliza para filtrar los resultados de búsqueda en función del acceso del usuario o su grupo a los documentos. Para obtener más información, consulte [Filtrado de contexto de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#datasource-context-filter).
+  **Asignaciones de campos**: elija asignar los campos del origen de datos de Aurora(MySQL) a los campos de índice de Amazon Kendra. Para obtener más información, consulte [Asignación de campos de origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/field-mapping.html).
**nota**  
El campo del cuerpo del documento o el cuerpo del documento equivalente de sus documentos es obligatorio Amazon Kendra para poder buscarlos. Debe asignar el nombre del campo del cuerpo del documento en el origen de datos al nombre del campo del índice `_document_body`. Todos los demás campos son opcionales.

Para obtener una lista de otras claves JSON importantes que debe configurar, consulte [Aurora Esquema de plantillas (MySQL)](ds-schemas.md#ds-aurora-mysql-schema).

------

## Notas

+ Las filas de la base de datos eliminadas no se registrarán cuando se Amazon Kendra compruebe si hay contenido actualizado.
+ El tamaño de los nombres y valores de los campos de una fila de la base de datos no puede superar los 400 KB.
+ Si tiene una gran cantidad de datos en la fuente de datos de la base de datos y no desea Amazon Kendra indexar todo el contenido de la base de datos después de la primera sincronización, puede optar por sincronizar solo los documentos nuevos, modificados o eliminados.
+ Como práctica recomendada, proporcione credenciales de base Amazon Kendra de datos de solo lectura.
+ Como práctica recomendada, evite añadir tablas con datos confidenciales o información de identificación personal (PII).

# Aurora(PostgreSQL)


**nota**  
El conector de Aurora(PostgreSQL) seguirá siendo totalmente compatible con los clientes actuales hasta el 31 de mayo de 2026. Si bien este conector ya no está disponible para los nuevos usuarios, los usuarios actuales pueden seguir utilizándolo sin interrupción. Desarrollamos de forma continua nuestra cartera de conectores para ofrecer soluciones más escalables y personalizables. Para futuras integraciones, le recomendamos que valore el marco de conectores personalizados de Amazon Kendra[1], diseñado de manera más flexible para una variedad más amplia de casos de uso empresariales.

Auroraes un sistema de administración de bases de datos relacionales (RDBMS) creado para la nube. Si es un Aurora usuario, puede usarlo Amazon Kendra para indexar su Aurora(PostgreSQL) fuente de datos. El conector Amazon Kendra Aurora(PostgreSQL) de fuente de datos es compatible con Aurora PostgreSQL 1.

Puede conectarse Amazon Kendra a su fuente de Aurora(PostgreSQL) datos mediante la [Amazon Kendraconsola](https://console.aws.amazon.com/kendra/) y la [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html)API.

Para solucionar problemas del conector de la fuente de Amazon Kendra Aurora(PostgreSQL) datos, consulte[Solución de problemas con los orígenes de datos](troubleshooting-data-sources.md).

**Topics**
+ [

## Características admitidas
](#supported-features-aurora-postgresql)
+ [

## Requisitos previos
](#prerequisites-aurora-postgresql)
+ [

## Instrucciones de conexión
](#data-source-procedure-aurora-postgresql)
+ [

## Notas
](#aurora-postgresql-notes)

## Características admitidas

+ Asignaciones de campo
+ Filtrado de contexto de usuario
+ Filtros de inclusión/exclusión
+ Sincronizaciones completas e incrementales del contenido
+ Nube privada virtual (VPC)

## Requisitos previos


Antes de poder utilizarla Amazon Kendra para indexar la fuente de Aurora(PostgreSQL) datos, realice estos cambios en sus AWS cuentas Aurora(PostgreSQL) y.

**En Aurora(PostgreSQL), asegúrese de que**:
+ Ha anotado el nombre de usuario y contraseña de la base de datos.
**importante**  
Como práctica recomendada, proporcione credenciales de base Amazon Kendra de datos de solo lectura.
+ Ha copiado la URL, el puerto y la instancia del host de la base de datos.
+ Ha comprobado que cada documento es único en Aurora(PostgreSQL) y en otros orígenes de datos que vaya a utilizar para el mismo índice. Cada origen de datos que desee utilizar para un índice no debe contener el mismo documento en varios orígenes de datos. IDs Los documentos son globales para un índice y deben ser únicos por índice.

**En el tuyoCuenta de AWS, asegúrate de tener:**
+ [Creó un Amazon Kendra índice](https://docs.aws.amazon.com/kendra/latest/dg/create-index.html) y, si usa la API, anotó el ID del índice.
+ [Creó un IAM rol](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds) para su fuente de datos y, si usa la API, anotó el ARN del IAM rol.
**nota**  
Si cambias el tipo de autenticación y las credenciales, debes actualizar tu IAM rol para acceder al ID AWS Secrets Manager secreto correcto.
+ Ha guardado sus credenciales de autenticación de Aurora(PostgreSQL) en un secreto de AWS Secrets Manager y, si utiliza la API, ha anotado el ARN del secreto.
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).

Si no tiene un IAM rol o secreto existente, puede usar la consola para crear un nuevo IAM rol y un Secrets Manager secreto al conectar su fuente de Aurora(PostgreSQL) datosAmazon Kendra. Si utiliza la API, debe proporcionar el ARN de un IAM rol y un Secrets Manager secreto existentes y un ID de índice.

## Instrucciones de conexión


Para conectarse Amazon Kendra a su fuente de Aurora(PostgreSQL) datos, debe proporcionar los detalles de sus Aurora(PostgreSQL) credenciales para Amazon Kendra poder acceder a sus datos. Si aún no lo ha configuradoAurora(PostgreSQL), Amazon Kendra consulte[Requisitos previos](#prerequisites-aurora-postgresql).

------
#### [ Console ]

**Para conectarse Amazon Kendra a Aurora(PostgreSQL)** 

1. Inicie sesión en la [Amazon Kendraconsola Consola de administración de AWS y ábrala](https://console.aws.amazon.com/kendra/).

1. En el panel de navegación izquierdo, elija **Índices** y, a continuación, elija el índice que desee usar de la lista de índices.
**nota**  
Puede elegir configurar o editar los ajustes de **Control de acceso de usuarios** en la **Configuración del índice**. 

1. En la página **Introducción**, seleccione **Agregar origen de datos**.

1. En la página **Agregar origen de datos**, seleccione el **Conector de Aurora(PostgreSQL)** y, a continuación, seleccione **Agregar conector**. Si usa la versión 2 (si corresponde), elija el **Conector de Aurora(PostgreSQL)** con la etiqueta “V2.0”.

1. En la página **Especificar detalles del origen de datos**, introduzca la siguiente información:

   1. En **Nombre y descripción**, en **Nombre del origen de datos**: introduzca un nombre para el origen de datos. Puede incluir guiones, pero no espacios.

   1. (Opcional)** Descripción**: introduzca una descripción opcional para el origen de datos.

   1. En **Idioma predeterminado**: elija un idioma para filtrar los documentos para el índice. A menos que especifique lo contrario, el idioma predeterminado es el inglés. El idioma especificado en los metadatos del documento anula el idioma seleccionado.

   1. En **Etiquetas**, para **añadir una nueva etiqueta**: incluye etiquetas opcionales para buscar y filtrar tus recursos o realizar un seguimiento de tus AWS costes.

   1. Elija **Siguiente**.

1. En la página **Definir acceso y seguridad**, introduzca la siguiente información:

   1. En **Origen**, introduzca la siguiente información:

   1.  **Host**: ingrese la URL del host de la base de datos, por ejemplo: `http://instance URL.region.rds.amazonaws.com`.

   1.  **Puerto**: ingrese el puerto de la base de datos, por ejemplo, `5432`.

   1.  **Instancia**: ingrese la instancia de la base de datos, por ejemplo `postgres`.

   1. **Habilitar la ubicación del certificado SSL**: elija introducir la Amazon S3 ruta al archivo de certificado SSL.

   1. En **Autenticación**, introduzca la siguiente información:

      1. **AWS Secrets Managersecreto**: elija un secreto existente o cree uno nuevo Secrets Manager para almacenar sus credenciales de Aurora(PostgreSQL) autenticación. Si decide crear un secreto nuevo, se abrirá una ventana de secreto de AWS Secrets Manager.

        1. Introduzca la siguiente información en la **ventana Crear un secreto de AWS Secrets Manager**:

           1. **Nombre del secreto**: un nombre para su secreto. El prefijo 'AmazonKendra- Aurora(PostgreSQL) -' se añade automáticamente a tu nombre secreto.

           1. Para el **nombre de usuario** y la **contraseña de la base de datos**: introduzca los valores de las credenciales de autenticación que ha copiado de la base de datos. 

        1. Seleccione **Save**.

   1. **Nube privada virtual (VPC)**: puede optar por utilizar una VPC. Si es así, debe agregar **Subredes** y **Grupos de seguridad de VPC**.

   1. **IAMrol**: elige un IAM rol existente o crea uno nuevo IAM para acceder a las credenciales del repositorio y al contenido del índice.
**nota**  
IAMlos roles utilizados para los índices no se pueden usar para las fuentes de datos. Si no está seguro de si un rol existente se utiliza para un índice o para las preguntas frecuentes, elija **Crear un nuevo rol** para evitar errores.

   1. Elija **Siguiente**.

1. En la página **Configurar ajustes de sincronización**, introduzca la siguiente información:

   1. En **Ámbito de sincronización**, seleccione de entre las siguientes opciones:
      + **Consulta SQL**: introduzca instrucciones de consulta SQL, como las operaciones SELECT y JOIN. Las consultas SQL deben tener menos de 32 KB. Las consultas SQL deben tener menos de 32 KB y no contener puntos y comas (;). Amazon Kendrarastreará todo el contenido de la base de datos que coincida con su consulta.
      + **Columna de clave principal**: proporcione la clave principal de la tabla de la base de datos. Esto identifica una tabla dentro de la base de datos.
      + **Columna de título**: proporcione el nombre de la columna del título del documento en la tabla de la base de datos.
      + **Columna de cuerpo**: proporcione el nombre de la columna del cuerpo del documento en la tabla de la base de datos.

   1. En **Configuración adicional (*opcional*)**, elija una de las siguientes opciones para sincronizar contenido específico en lugar de sincronizar todos los archivos:
      + **Columnas de detección de cambios**: introduzca los nombres de las columnas que se Amazon Kendra utilizarán para detectar cambios en el contenido. Amazon Kendravolverá a indexar el contenido cuando se produzca un cambio en alguna de estas columnas.
      + ** IDsColumna de usuarios**: introduzca el nombre de la columna que contiene el usuario IDs al que se le permitirá acceder al contenido.
      + **Columna de grupos**: introduzca el nombre de la columna que contiene los grupos a los que se dará acceso al contenido.
      + ** URLsColumna de origen**: introduzca el nombre de la columna que contiene el origen que se va URLs a indexar.
      + **Columna de marcas de tiempo**: introduzca el nombre de la columna que contiene las marcas de tiempo. Amazon Kendrautiliza la información de las marcas de tiempo para detectar cambios en el contenido y sincronizar solo el contenido modificado. 
      + **Columna de zonas horarias**: introduzca el nombre de la columna que contiene las zonas horarias del contenido que se va a rastrear.
      + **Formato de marcas temporales**: introduzca el nombre de la columna que contiene los formatos de marcas temporales que se deben utilizar para detectar cambios en el contenido y volver a sincronizar su contenido.

   1. **Modo de sincronización**: elija cómo desea actualizar el índice cuando cambie el contenido del origen de datos. Al sincronizar la fuente de datos Amazon Kendra por primera vez, todo el contenido se rastrea e indexa de forma predeterminada. Debe ejecutar una sincronización completa de los datos si la sincronización inicial falló, incluso si no selecciona la sincronización completa como opción de modo de sincronización.
      + Sincronización completa: se vuelve a indexar todo el contenido, reemplazando el contenido existente cada vez que el origen de datos se sincronice con el índice.
      + Sincronización de lo nuevo y modificado: se indexa solo el contenido nuevo y modificado cada vez que el origen de datos se sincroniza con el índice. Amazon Kendra puede utilizar el mecanismo del origen de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido modificado desde la última sincronización.
      + Sincronización nueva, modificada o eliminada: indexe solo el contenido nuevo, modificado y eliminado cada vez que la fuente de datos se sincronice con el índice. Amazon Kendrapuede usar el mecanismo de la fuente de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido que ha cambiado desde la última sincronización.

   1. En **Programa de ejecución de sincronización**, en **Frecuencia**: la frecuencia con la que Amazon Kendra se sincronizará con el origen de datos.

   1. Elija **Siguiente**.

1. En la página **Establecer asignaciones de campos**, especifique la siguiente información:

   1. Seleccione uno de los campos de fuente de datos predeterminados generados (**Documento IDs****, Títulos** de documentos y **Fuente URLs**) que desee mapear para Amazon Kendra indexarlos.

   1.  **Agregar campo**: para agregar campos de origen de datos personalizados para crear un nombre de campo de índice al que asignarlos y el tipo de datos del campo.

   1. Elija **Siguiente**.

1. En la página **Revisar y crear**, compruebe que la información que ha introducido es correcta y, a continuación, seleccione **Añadir origen de datos**. También puede elegir editar la información desde esta página. El origen de datos aparecerá en la página **Orígenes de datos** una vez que el origen de datos se haya agregado correctamente.

------
#### [ API ]

**Para conectarse a Amazon Kendra Aurora(PostgreSQL)**

Debe especificar lo siguiente mediante la [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html)API:
+ **Origen de datos**: defina el tipo de origen de datos como `JDBC` cuando utilice el esquema JSON [https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html](https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html). Además, defina el origen de datos como `TEMPLATE` al llamar a la API [https://docs.aws.amazon.com/kendra/latest/dg/API_CreateDataSource.html](https://docs.aws.amazon.com/kendra/latest/dg/API_CreateDataSource.html).
+ **Tipo de base de datos**: debe especificar el tipo de base de datos como `postgresql`.
+ **Consulta SQL**: especifique instrucciones de consulta SQL, como las operaciones SELECT y JOIN. Las consultas de SQL deben ser inferiores a 32 KB. Amazon Kendra rastreará todo el contenido de la base de datos que coincida con su consulta.
+ **Modo de sincronización**: especifique cómo Amazon Kendra debe actualizarse el índice cuando cambie el contenido de la fuente de datos. Al sincronizar el origen de datos con Amazon Kendra por primera vez, todo el contenido se rastrea y se indexa de forma predeterminada. Debe ejecutar una sincronización completa de los datos si la sincronización inicial falló, incluso si no selecciona la sincronización completa como opción de modo de sincronización. Puede elegir entre las siguientes opciones:
  + `FORCED_FULL_CRAWL` para volver a indexar todo el contenido, reemplazando el contenido existente cada vez que el origen de datos se sincronice con el índice.
  + `FULL_CRAWL` para indexar solo el contenido nuevo, modificado y eliminado cada vez que el origen de datos se sincronice con el índice. Amazon Kendra puede utilizar el mecanismo del origen de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido modificado desde la última sincronización.
  + `CHANGE_LOG` para indexar solo el contenido nuevo y modificado cada vez que el origen de datos se sincronice con el índice. Amazon Kendra puede utilizar el mecanismo del origen de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido modificado desde la última sincronización.
+ **Nombre secreto de recurso de Amazon (ARN): proporcione** el nombre de recurso de Amazon (ARN) de un Secrets Manager secreto que contenga las credenciales de autenticación que creó en su cuenta. Aurora(PostgreSQL) El secreto se almacena en una estructura JSON con las siguientes claves:

  ```
  {
      "user name": "database user name",
      "password": "password"
  }
  ```
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).
+ **IAMrol**: especifique `RoleArn` cuándo llama `CreateDataSource` para proporcionar un IAM rol con permisos para acceder a su Secrets Manager secreto y para llamar al público requerido APIs para el conector y. Aurora(PostgreSQL) Amazon Kendra Para obtener más información, consulte [Roles de IAM para orígenes de datos de Aurora(PostgreSQL)](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds).

También puede añadir las siguientes características opcionales:
+  **Nube privada virtual (VPC)**: especifique a `VpcConfiguration` cuándo llamar a `CreateDataSource`. Para obtener más información, consulte [¿Se está configurando Amazon Kendra para usar un Amazon VPC](vpc-configuration.md).
+  **Filtros de inclusión y exclusión**: puede especificar si desea incluir contenido específico mediante el usuario IDs, los grupos, la fuente URLs, las marcas horarias y las zonas horarias. 
+  **Filtrado de contexto de usuario y control de acceso**: si hay una lista de control de acceso (ACL) para los documentos, Amazon Kendra la rastreará. La información de la ACL se utiliza para filtrar los resultados de búsqueda en función del acceso del usuario o su grupo a los documentos. Para obtener más información, consulte [Filtrado de contexto de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#datasource-context-filter).
+  **Asignaciones de campos**: elija asignar los campos del origen de datos de Aurora(PostgreSQL) a los campos de índice de Amazon Kendra. Para obtener más información, consulte [Asignación de campos de origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/field-mapping.html).
**nota**  
El campo del cuerpo del documento o el cuerpo del documento equivalente de sus documentos es obligatorio Amazon Kendra para poder buscarlos. Debe asignar el nombre del campo del cuerpo del documento en el origen de datos al nombre del campo del índice `_document_body`. Todos los demás campos son opcionales.

Para obtener una lista de otras claves JSON importantes que debe configurar, consulte [Aurora Esquema de plantillas (PostgreSQL)](ds-schemas.md#ds-aurora-postgresql-schema).

------

## Notas

+ Las filas de la base de datos eliminadas no se registrarán cuando se Amazon Kendra compruebe si hay contenido actualizado.
+ El tamaño de los nombres y valores de los campos de una fila de la base de datos no puede superar los 400 KB.
+ Si tiene una gran cantidad de datos en la fuente de datos de la base de datos y no desea Amazon Kendra indexar todo el contenido de la base de datos después de la primera sincronización, puede optar por sincronizar solo los documentos nuevos, modificados o eliminados.
+ Como práctica recomendada, proporcione credenciales de base Amazon Kendra de datos de solo lectura.
+ Como práctica recomendada, evite añadir tablas con datos confidenciales o información de identificación personal (PII).

# Amazon FSx(Windows)


Amazon FSx(Windows) es un sistema de servidor de archivos totalmente gestionado y basado en la nube que ofrece capacidades de almacenamiento compartido. Si es usuario de Amazon FSx (Windows), puede utilizarlo Amazon Kendra para indexar su fuente de datos Amazon FSx (Windows).

**nota**  
Amazon Kendraahora es compatible con un conector actualizado Amazon FSx (Windows).  
La consola se ha actualizado de forma automática. Todos los conectores nuevos que cree en la consola utilizarán la arquitectura actualizada. Si usa la API, ahora debe usar el objeto [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_TemplateConfiguration.html) en lugar del objeto `FSxConfiguration` para configurar el conector.  
Los conectores configurados con la antigua arquitectura de consola y API seguirán funcionando tal y como estaban configurados. Sin embargo, no podrá editarlos ni actualizarlos. Si desea editar o actualizar la configuración de un conector, deberá crear uno nuevo.  
Se recomienda migrar el flujo de trabajo de los conectores a la versión actualizada. Está previsto que la compatibilidad para los conectores configurados con la arquitectura anterior finalice en junio de 2024. 

Puede conectarse Amazon Kendra a su fuente de datos Amazon FSx (Windows) mediante la [Amazon Kendraconsola](https://console.aws.amazon.com/kendra/) o la [https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html](https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html)API.

Para solucionar problemas del conector de fuente de datos Amazon Kendra Amazon FSx (Windows), consulte[Solución de problemas con los orígenes de datos](troubleshooting-data-sources.md).

**Topics**
+ [

## Características admitidas
](#supported-features-fsx)
+ [

## Requisitos previos
](#prerequisites-fsx)
+ [

## Instrucciones de conexión
](#data-source-procedure-fsx)
+ [

## Más información
](#fsx-learn-more)

## Características admitidas


Amazon KendraAmazon FSxEl conector de fuente de datos (Windows) admite las siguientes funciones:
+ Asignaciones de campos
+ Control de acceso de usuarios
+ Rastreo de identidades de usuarios
+ Filtros de inclusión y exclusión
+ Sincronizaciones completas e incrementales del contenido
+ Nube privada virtual (VPC)

## Requisitos previos


Antes de poder utilizarla Amazon Kendra para indexar su fuente de datos Amazon FSx (Windows), compruebe los detalles de su fuente de datos Amazon FSx (Windows) yCuentas de AWS.

En **el Amazon FSx caso de (Windows), asegúrese de que dispone** de:
+ Configure Amazon FSx (Windows) con permisos de lectura y montaje.
+ Haber anotado el ID del sistema de archivos. Puede encontrar el identificador de su sistema de archivos en el panel de sistemas de archivos de la consola Amazon FSx (Windows).
+ Configuró una nube privada virtual utilizando el Amazon VPC lugar donde reside su sistema de archivos Amazon FSx (Windows).
+ Apuntó sus credenciales de autenticación Amazon FSx (de Windows) para una cuenta Active Directory de usuario. Esto incluye el nombre de usuario de Active Directory con el nombre de dominio de DNS (por ejemplo, *user@corp.example.com*) y la contraseña.
**nota**  
Utilice únicamente las credenciales necesarias para que el conector funcione. No utilice credenciales con privilegios como las de administrador del dominio.
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).
+ Ha comprobado que cada documento es único en Amazon FSx (Windows) y en otras fuentes de datos que vaya a utilizar para el mismo índice. Cada origen de datos que desee utilizar para un índice no debe contener el mismo documento en varios orígenes de datos. IDs Los documentos son globales para un índice y deben ser únicos por índice.

**En el tuyoCuenta de AWS, asegúrate de tener:**
+ [Creó un Amazon Kendra índice](https://docs.aws.amazon.com/kendra/latest/dg/create-index.html) y, si usa la API, anotó el ID del índice.
+ [Creó un IAM rol](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds) para su fuente de datos y, si usa la API, anotó el ARN del IAM rol.
**nota**  
Si cambias el tipo de autenticación y las credenciales, debes actualizar tu IAM rol para acceder al ID AWS Secrets Manager secreto correcto.
+ Guardó sus credenciales de autenticación Amazon FSx (Windows) en un AWS Secrets Manager secreto y, si utiliza la API, anotó el ARN del secreto.
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).

Si no tiene un IAM rol o secreto existente, puede usar la consola para crear un nuevo IAM rol y Secrets Manager secreto al conectar su fuente de datos Amazon FSx (Windows) aAmazon Kendra. Si utiliza la API, debe proporcionar el ARN de un IAM rol y un Secrets Manager secreto existentes y un ID de índice.

## Instrucciones de conexión


Para conectarse Amazon Kendra a su fuente de datos Amazon FSx (Windows), debe proporcionar los detalles necesarios de su fuente de datos Amazon FSx (Windows) para que Amazon Kendra pueda acceder a sus datos. Si aún no lo ha configurado Amazon FSx (Windows)Amazon Kendra, consulte[Requisitos previos](#prerequisites-fsx).

------
#### [ Console ]

**Para conectarse Amazon Kendra a su sistema de archivos Amazon FSx (Windows)** 

1. Inicie sesión en la [Amazon Kendraconsola Consola de administración de AWS y ábrala](https://console.aws.amazon.com/kendra/).

1. En el panel de navegación izquierdo, elija **Índices** y, a continuación, elija el índice que desee usar de la lista de índices.
**nota**  
Puede elegir configurar o editar los ajustes de **Control de acceso de usuarios** en la **Configuración del índice**. 

1. En la página **Introducción**, seleccione **Agregar origen de datos**.

1. En la página **Agregar origen de datos**, seleccione el **Conector de Amazon FSx (Windows)** y, a continuación, seleccione **Agregar conector**. Si usa la versión 2 (si corresponde), elija el **Conector de Amazon FSx (Windows)** con la etiqueta “V2.0”.

1. En la página **Especificar detalles del origen de datos**, introduzca la siguiente información:

   1. En **Nombre y descripción**, en **Nombre del origen de datos**: introduzca un nombre para el origen de datos. Puede incluir guiones, pero no espacios.

   1. (Opcional)** Descripción**: introduzca una descripción opcional para el origen de datos.

   1. En **Idioma predeterminado**: elija un idioma para filtrar los documentos para el índice. A menos que especifique lo contrario, el idioma predeterminado es el inglés. El idioma especificado en los metadatos del documento anula el idioma seleccionado.

   1. En **Etiquetas**, para **añadir una nueva etiqueta**: incluye etiquetas opcionales para buscar y filtrar tus recursos o realizar un seguimiento de tus AWS costes.

   1. Elija **Siguiente**.

1. En la página **Definir acceso y seguridad**, introduzca la siguiente información:

   1. **Amazon FSxID del sistema de archivos (Windows)**: seleccione en el menú desplegable su ID de sistema de archivos existente, obtenido de Amazon FSx (Windows). O bien, cree un [sistema de archivos de Amazon FSx (Windows)](https://console.aws.amazon.com/fsx/). Puede encontrar el ID de su sistema de archivos en el panel de sistemas de archivos de la consola Amazon FSx (Windows).

   1. **Autorización**: active o desactive la información de la lista de control de acceso (ACL) para los documentos, si tiene una ACL y desea usarla para el control de acceso. La ACL especifica a qué documentos pueden acceder los usuarios y los grupos. La información de la ACL se utiliza para filtrar los resultados de búsqueda en función del acceso del usuario o su grupo a los documentos. Para obtener más información, consulte [Filtrado de contexto de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#context-filter-user-incl-datasources).

   1. **Autenticación**: elija un AWS Secrets Manager secreto existente o cree uno nuevo para almacenar las credenciales del sistema de archivos. Si decide crear un secreto nuevo, se abrirá una ventana de secreto de AWS Secrets Manager.

      Proporcione un secreto que almacene las credenciales de autenticación del nombre de usuario y contraseña. El nombre de usuario debe incluir su nombre de dominio de DNS. Por ejemplo, *user@corp.example.com*.

      Guarde y agregue el secreto.

   1. **Virtual Private Cloud (VPC)**: debe seleccionar un Amazon VPC lugar en el que resida su Amazon FSx (Windows). Incluya la subred de VPC y los grupos de seguridad. Consulte [Configurar](https://docs.aws.amazon.com/kendra/latest/dg/vpc-configuration.html) un. Amazon VPC

   1. **IAMrol**: elija un IAM rol existente o cree uno nuevo IAM para acceder a las credenciales del repositorio y al contenido del índice.
**nota**  
IAMlos roles utilizados para los índices no se pueden usar para las fuentes de datos. Si no está seguro de si un rol existente se utiliza para un índice o para las preguntas frecuentes, elija **Crear un nuevo rol** para evitar errores.

   1. Elija **Siguiente**.

1. En la página **Configurar ajustes de sincronización**, introduzca la siguiente información:

   1. **Ámbito de sincronización, patrones regex**: añada patrones de expresiones regulares para incluir o excluir determinados archivos.

   1. **Modo de sincronización**: elija cómo desea actualizar el índice cuando cambie el contenido del origen de datos. Al sincronizar la fuente de datos Amazon Kendra por primera vez, todo el contenido se rastrea e indexa de forma predeterminada. Debe ejecutar una sincronización completa de los datos si la sincronización inicial falló, incluso si no selecciona la sincronización completa como opción de modo de sincronización.
      + Sincronización completa: se vuelve a indexar todo el contenido, reemplazando el contenido existente cada vez que el origen de datos se sincronice con el índice.
      + Sincronización nueva, modificada o eliminada: indexe solo el contenido nuevo, modificado y eliminado cada vez que la fuente de datos se sincronice con el índice. Amazon Kendrapuede usar el mecanismo de la fuente de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido que ha cambiado desde la última sincronización.

   1. **Programación de ejecución de sincronización**: en **Frecuencia**, elija la frecuencia con la que desea sincronizar el contenido del origen de datos y actualizar el índice.

   1. Elija **Siguiente**.

1. En la página **Establecer asignaciones de campos**, especifique la siguiente información:

   1. Seleccione entre los campos predeterminados Amazon Kendra generados de sus archivos que desee asignar a su índice. Para agregar campos de origen de datos personalizados, cree un nombre de campo de índice para asignarlos y el tipo de datos del campo.

   1. Elija **Siguiente**.

1. En la página **Revisar y crear**, compruebe que la información que ha introducido es correcta y, a continuación, seleccione **Añadir origen de datos**. También puede elegir editar la información desde esta página. El origen de datos aparecerá en la página **Orígenes de datos** una vez que el origen de datos se haya agregado correctamente.

------
#### [ API ]

**Para conectarse Amazon Kendra a su sistema de archivos Amazon FSx (Windows)**

Debe especificar un JSON del [esquema del origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/ds-schemas.html#ds-fsx-schema) mediante la API [https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html](https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html). Debe proporcionar la siguiente información:
+ **Origen de datos**: defina el tipo de origen de datos como `FSX` cuando utilice el esquema JSON [https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html](https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html). Además, defina el origen de datos como `TEMPLATE` al llamar a la API [https://docs.aws.amazon.com/kendra/latest/dg/API_CreateDataSource.html](https://docs.aws.amazon.com/kendra/latest/dg/API_CreateDataSource.html).
+ **ID del sistema de archivos**: el identificador del sistema de archivos Amazon FSx (Windows). Puede encontrar el ID del sistema de archivos en el panel de Sistemas de archivos de la consola de Amazon FSx (Windows).
+ **Tipo de sistema de archivos**: especifique el tipo de sistema de archivos como `WINDOWS`.
+  **Nube privada virtual (VPC)**: especifique a `VpcConfiguration` cuándo llamar a `CreateDataSource`. Para obtener más información, consulte [¿Se está configurando Amazon Kendra para usar un Amazon VPC](vpc-configuration.md).
**nota**  
Debe seleccionar el lugar en el que Amazon VPC reside su Amazon FSx (Windows). Incluya la subred de VPC y los grupos de seguridad.
+ **Modo de sincronización**: especifique cómo Amazon Kendra debe actualizarse el índice cuando cambie el contenido de la fuente de datos. Al sincronizar el origen de datos con Amazon Kendra por primera vez, todo el contenido se rastrea y se indexa de forma predeterminada. Debe ejecutar una sincronización completa de los datos si la sincronización inicial falló, incluso si no selecciona la sincronización completa como opción de modo de sincronización. Puede elegir entre las siguientes opciones:
  + `FORCED_FULL_CRAWL` para volver a indexar todo el contenido, reemplazando el contenido existente cada vez que el origen de datos se sincronice con el índice.
  + `FULL_CRAWL` para indexar solo el contenido nuevo, modificado y eliminado cada vez que el origen de datos se sincronice con el índice. Amazon Kendra puede utilizar el mecanismo del origen de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido modificado desde la última sincronización.
+ **Rastreador de identidades**: especifique si se debe activar el rastreador de identidades de Amazon Kendra. El rastreador de identidades utiliza la información de la lista de control de acceso (ACL) de los documentos para filtrar los resultados de la búsqueda en función del acceso del usuario o del grupo a los documentos. Si tiene una ACL para sus documentos y decide utilizarla, también puede optar por activar el rastreador de identidades para configurar el [filtrado Amazon Kendra de los resultados de búsqueda según el contexto del usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#context-filter-user-incl-datasources). De lo contrario, si el rastreador de identidades está desactivado, todos los documentos se pueden buscar públicamente. Si quieres usar el control de acceso para tus documentos y el rastreador de identidad está desactivado, también puedes usar la [PutPrincipalMapping](https://docs.aws.amazon.com/kendra/latest/APIReference/API_PutPrincipalMapping.html)API para cargar información de acceso de usuarios y grupos para filtrar el contexto de los usuarios.
+ **Nombre secreto de recurso de Amazon (ARN): proporcione** el nombre de recurso de Amazon (ARN) de un Secrets Manager secreto que contenga las credenciales de autenticación de su Amazon FSx cuenta (Windows). El secreto se almacena en una estructura JSON con las siguientes claves:

  ```
  {
      "username": "user@corp.example.com",
      "password": "password"
  }
  ```
+ **IAMrol**: especifique `RoleArn` cuándo debe llamar `CreateDataSource` para proporcionar un IAM rol con permisos para acceder a su Secrets Manager secreto y para llamar al público requerido APIs para el conector Amazon FSx (Windows) y. Amazon Kendra Para obtener más información, consulte las [IAMfunciones de las fuentes de datos Amazon FSx (Windows)](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds).

También puede añadir las siguientes características opcionales:
+ **Filtros de inclusión y exclusión**: especifique si desea incluir o excluir determinados archivos.
**nota**  
La mayoría de los orígenes de datos utilizan patrones de expresiones regulares, que son patrones de inclusión o exclusión denominados filtros. Si especifica un filtro de inclusión, solo se indexará el contenido que coincida con el filtro de inclusión. Los documentos que no coincidan con el filtro de inclusión no se indexan. Si especifica un filtro de inclusión y exclusión, los documentos que coincidan con el filtro de exclusión no se indexarán, aunque coincidan con el filtro de inclusión.
+ **Lista de control de acceso (ACL)**: especifique si se va a rastrear la información de la ACL para los documentos, si tiene una ACL y desea usarla para el control de acceso. La ACL especifica a qué documentos pueden acceder los usuarios y los grupos. La información de la ACL se utiliza para filtrar los resultados de búsqueda en función del acceso del usuario o su grupo a los documentos. Para obtener más información, consulte [Filtrado de contexto de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#context-filter-user-incl-datasources).
**nota**  
Para probar el filtrado de contexto de usuario con un usuario, debe incluir el nombre de dominio DNS como parte del nombre de usuario al realizar la consulta. Debe disponer de permisos administrativos del dominio de Active Directory. También puede probar el filtrado de contexto de usuario con el nombre de un grupo.
+  **Asignaciones de campos**: elija asignar los campos de la fuente de datos Amazon FSx (Windows) a los campos de índice. Amazon Kendra Para obtener más información, consulte [Asignación de campos de origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/field-mapping.html).
**nota**  
El campo del cuerpo del documento o el cuerpo del documento equivalente de sus documentos es obligatorio Amazon Kendra para poder buscarlos. Debe asignar el nombre del campo del cuerpo del documento en el origen de datos al nombre del campo del índice `_document_body`. Todos los demás campos son opcionales.

Para obtener una lista de otras claves JSON importantes que debe configurar, consulte el [Esquema de plantilla de Amazon FSx (Windows)](https://docs.aws.amazon.com/kendra/latest/dg/ds-schemas.html#ds-fsx-windows-schema).

------

## Más información


Para obtener más información sobre la integración Amazon Kendra con su fuente de datos Amazon FSx (Windows), consulte:
+ [Busque de forma segura datos no estructurados en los sistemas de archivos de Windows con el Amazon Kendra conector para Amazon FSx (Windows) para Windows File Server](https://aws.amazon.com/blogs/machine-learning/securely-search-unstructured-data-on-windows-file-systems-with-amazon-kendra-connector-for-amazon-fsx-for-windows-file-server/).

# Amazon FSx(NetApp DISPONIBLE)


Amazon FSx(NetApp ONTAP) es un sistema de servidor de archivos totalmente gestionado y basado en la nube que ofrece capacidades de almacenamiento compartido. Si es usuario de Amazon FSx (NetApp ONTAP), puede utilizarlo Amazon Kendra para indexar su fuente de datos Amazon FSx (NetApp ONTAP).

Puede conectarse Amazon Kendra a su fuente de datos Amazon FSx (NetApp ONTAP) mediante la [Amazon Kendraconsola](https://console.aws.amazon.com/kendra/) o la API. [https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html](https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html)

Para solucionar problemas del conector de fuente de datos Amazon Kendra Amazon FSx (NetApp ONTAP), consulte. [Solución de problemas con los orígenes de datos](troubleshooting-data-sources.md)

**Topics**
+ [

## Características admitidas
](#supported-features-fsx-ontap)
+ [

## Requisitos previos
](#prerequisites-fsx-ontap)
+ [

## Instrucciones de conexión
](#data-source-procedure-fsx-ontap)

## Características admitidas


Amazon KendraAmazon FSxEl conector de fuente de datos (NetApp ONTAP) admite las siguientes funciones:
+ Asignaciones de campos
+ Control de acceso de usuarios
+ Filtros de inclusión y exclusión
+ Sincronizaciones completas e incrementales del contenido
+ Nube privada virtual (VPC)

## Requisitos previos


Antes de poder utilizarla Amazon Kendra para indexar su fuente de datos Amazon FSx (NetApp ONTAP), compruebe los detalles de su Amazon FSx (NetApp ONTAP) y. Cuentas de AWS

**Para Amazon FSx (NetApp ONTAP), asegúrese** de tener:
+ Configure Amazon FSx (NetApp ONTAP) con permisos de lectura y montaje.
+ Haber anotado el ID del sistema de archivos. Puede encontrar el ID de su sistema de archivos en el panel de sistemas de archivos de la consola Amazon FSx (NetApp ONTAP).
+ Haber anotado el ID de la máquina virtual de almacenamiento (SVM) que se utiliza con el sistema de archivos. Para encontrar su ID de SVM, vaya al panel de sistemas de archivos de la consola Amazon FSx (NetApp ONTAP), seleccione su ID de sistema de archivos y, a continuación, seleccione Máquinas virtuales de **almacenamiento**.
+ Configuró una nube privada virtual utilizando el Amazon VPC lugar donde reside su sistema de archivos Amazon FSx (NetApp ONTAP).
+ Apuntó sus credenciales de autenticación Amazon FSx (NetApp ONTAP) para una cuenta de Active Directory usuario. Esto incluye el nombre de usuario de Active Directory con el nombre de dominio de DNS (por ejemplo, *user@corp.example.com*) y la contraseña. Si utiliza el protocolo Network File System (NFS) para su sistema de archivos Amazon FSx (NetApp ONTAP), las credenciales de autenticación incluyen un identificador izquierdo, un identificador derecho y una clave previamente compartida.
**nota**  
Utilice únicamente las credenciales necesarias para que el conector funcione. No utilice credenciales con privilegios como las de administrador del dominio.
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).
+ Ha marcado que cada documento es único en Amazon FSx (NetApp ONTAP) y en otras fuentes de datos que vaya a utilizar para el mismo índice. Cada origen de datos que desee utilizar para un índice no debe contener el mismo documento en varios orígenes de datos. IDs Los documentos son globales para un índice y deben ser únicos por índice.

**En el tuyoCuenta de AWS, asegúrate de tener:**
+ [Creó un Amazon Kendra índice](https://docs.aws.amazon.com/kendra/latest/dg/create-index.html) y, si usa la API, anotó el ID del índice.
+ [Creó un IAM rol](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds) para su fuente de datos y, si usa la API, anotó el ARN del IAM rol.
**nota**  
Si cambias el tipo de autenticación y las credenciales, debes actualizar tu IAM rol para acceder al ID AWS Secrets Manager secreto correcto.
+ Guardó sus credenciales de autenticación Amazon FSx (NetApp ONTAP) en un AWS Secrets Manager secreto y, si utiliza la API, anotó el ARN del secreto.
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).

Si no tiene un IAM rol o secreto existente, puede usar la consola para crear un nuevo IAM rol y un Secrets Manager secreto al conectar su fuente de datos Amazon FSx (NetApp ONTAP). Amazon Kendra Si utiliza la API, debe proporcionar el ARN de un IAM rol y un Secrets Manager secreto existentes y un ID de índice.

## Instrucciones de conexión


Para conectarse Amazon Kendra a su fuente de datos Amazon FSx (NetApp ONTAP), debe proporcionar los detalles necesarios de su fuente de datos Amazon FSx (NetApp ONTAP) para que Amazon Kendra pueda acceder a sus datos. Si aún no ha configurado Amazon FSx (NetApp ONTAP) paraAmazon Kendra, consulte. [Requisitos previos](#prerequisites-fsx-ontap)

------
#### [ Console ]

**Para conectarse Amazon Kendra a su sistema de Amazon FSx archivos (NetApp ONTAP)** 

1. Inicie sesión en la [Amazon Kendraconsola Consola de administración de AWS](https://console.aws.amazon.com/kendra/) y ábrala.

1. En el panel de navegación izquierdo, elija **Índices** y, a continuación, elija el índice que desee usar de la lista de índices.
**nota**  
Puede elegir configurar o editar los ajustes de **Control de acceso de usuarios** en la **Configuración del índice**. 

1. En la página **Introducción**, seleccione **Agregar origen de datos**.

1. En la página **Agregar fuente de datos**, elija el **conector Amazon FSx (NetApp ONTAP)** y, a continuación, elija **Agregar conector**. Si utiliza la versión 2 (si corresponde), elija el **conector Amazon FSx (NetApp ONTAP)** con la etiqueta «V2.0".

1. En la página **Especificar detalles del origen de datos**, introduzca la siguiente información:

   1. En **Nombre y descripción**, en **Nombre del origen de datos**: introduzca un nombre para el origen de datos. Puede incluir guiones, pero no espacios.

   1. (Opcional)** Descripción**: introduzca una descripción opcional para el origen de datos.

   1. En **Idioma predeterminado**: elija un idioma para filtrar los documentos para el índice. A menos que especifique lo contrario, el idioma predeterminado es el inglés. El idioma especificado en los metadatos del documento anula el idioma seleccionado.

   1. En **Etiquetas**, para **añadir una nueva etiqueta**: incluya etiquetas opcionales para buscar y filtrar sus recursos o realizar un seguimiento de sus costes. AWS

   1. Elija **Siguiente**.

1. En la página **Definir acceso y seguridad**, introduzca la siguiente información:

   1. **Origen**: proporcione la información de su sistema de archivos.
      + **Protocolo del sistema de archivos**: elija el protocolo de su sistema de archivos Amazon FSx (NetApp ONTAP). Puede elegir entre el protocolo Common Internet File System (CIFS) o el protocolo Network File System (NFS) para Linux.
      + **Amazon FSxID del sistema de archivos (NetApp ONTAP): seleccione en el menú desplegable el ID** de su sistema de archivos actual, obtenido de (ONTAP). Amazon FSx NetApp O bien, cree un sistema de archivos [Amazon FSx(ONTAP) NetApp ](https://console.aws.amazon.com/fsx/). Puede encontrar el ID del sistema de archivos en el panel de sistemas de archivos de la consola Amazon FSx (NetApp ONTAP).
      + **ID de SVM** (Amazon FSx(NetApp ONTAP) NetApp ONTAP solo para): proporcione el ID de la máquina virtual de almacenamiento (SVM) de su (ONTAP). Amazon FSx NetApp NetApp ONTAP **Para encontrar su ID de SVM, vaya al panel de sistemas de archivos de la consola Amazon FSx (NetApp ONTAP), seleccione su ID de sistema de archivos y seleccione Máquinas virtuales de almacenamiento.**

   1. **Autorización**: active o desactive la información de la lista de control de acceso (ACL) para los documentos, si tiene una ACL y desea usarla para el control de acceso. La ACL especifica a qué documentos pueden acceder los usuarios y los grupos. La información de la ACL se utiliza para filtrar los resultados de búsqueda en función del acceso del usuario o su grupo a los documentos. Para obtener más información, consulte [Filtrado de contexto de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#context-filter-user-incl-datasources).

   1. **Autenticación**: elija un AWS Secrets Manager secreto existente o cree uno nuevo para almacenar las credenciales del sistema de archivos. Si decide crear un secreto nuevo, se abrirá una ventana de secreto de AWS Secrets Manager.

      Proporcione un secreto que almacene las credenciales de autenticación del nombre de usuario y contraseña. El nombre de usuario debe incluir su nombre de dominio de DNS. Por ejemplo, *user@corp.example.com*.

      Si utiliza el protocolo NFS para su sistema de archivos Amazon FSx (NetApp ONTAP), proporcione un secreto que almacene sus credenciales de autenticación: el ID izquierdo, el ID derecho y la clave previamente compartida.

      Guarde y agregue el secreto.

   1. **Virtual Private Cloud (VPC)**: debe seleccionar un Amazon VPC lugar en el que resida su Amazon FSx (ONTAP). NetApp Incluya la subred de VPC y los grupos de seguridad. [Consulte Configuración de un. Amazon VPC](https://docs.aws.amazon.com/kendra/latest/dg/vpc-configuration.html)

   1. **IAMrol**: elija un IAM rol existente o cree uno nuevo IAM para acceder a las credenciales del repositorio y al contenido del índice.
**nota**  
IAMlos roles utilizados para los índices no se pueden usar para las fuentes de datos. Si no está seguro de si un rol existente se utiliza para un índice o para las preguntas frecuentes, elija **Crear un nuevo rol** para evitar errores.

   1. Elija **Siguiente**.

1. En la página **Configurar ajustes de sincronización**, introduzca la siguiente información:

   1. **Ámbito de sincronización, patrones regex**: añada patrones de expresiones regulares para incluir o excluir determinados archivos.

   1. **Modo de sincronización**: elija cómo desea actualizar el índice cuando cambie el contenido del origen de datos. Al sincronizar la fuente de datos Amazon Kendra por primera vez, todo el contenido se rastrea e indexa de forma predeterminada. Debe ejecutar una sincronización completa de los datos si la sincronización inicial falló, incluso si no selecciona la sincronización completa como opción de modo de sincronización.
      + Sincronización completa: se vuelve a indexar todo el contenido, reemplazando el contenido existente cada vez que el origen de datos se sincronice con el índice.
      + Sincronización nueva, modificada o eliminada: indexe solo el contenido nuevo, modificado y eliminado cada vez que la fuente de datos se sincronice con el índice. Amazon Kendrapuede usar el mecanismo de la fuente de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido que ha cambiado desde la última sincronización.

   1. **Programación de ejecución de sincronización**: en **Frecuencia**, elija la frecuencia con la que desea sincronizar el contenido del origen de datos y actualizar el índice.

   1. Elija **Siguiente**.

1. En la página **Establecer asignaciones de campos**, especifique la siguiente información:

   1. Seleccione entre los campos predeterminados Amazon Kendra generados de sus archivos que desee asignar a su índice. Para agregar campos de origen de datos personalizados, cree un nombre de campo de índice para asignarlos y el tipo de datos del campo.

   1. Elija **Siguiente**.

1. En la página **Revisar y crear**, compruebe que la información que ha introducido es correcta y, a continuación, seleccione **Añadir origen de datos**. También puede elegir editar la información desde esta página. El origen de datos aparecerá en la página **Orígenes de datos** una vez que el origen de datos se haya agregado correctamente.

------
#### [ API ]

**Para conectarse Amazon Kendra a su sistema de archivos Amazon FSx (NetApp ONTAP)**

Debe especificar un JSON del [esquema del origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/ds-schemas.html#ds-fsx-ontap-schema) mediante la API [https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html](https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html). Debe proporcionar la siguiente información:
+ **Origen de datos**: defina el tipo de origen de datos como `FSXONTAP` cuando utilice el esquema JSON [https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html](https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html). Además, defina el origen de datos como `TEMPLATE` al llamar a la API [https://docs.aws.amazon.com/kendra/latest/dg/API_CreateDataSource.html](https://docs.aws.amazon.com/kendra/latest/dg/API_CreateDataSource.html).
+ **ID del sistema de archivos**: el identificador del sistema de archivos Amazon FSx (NetApp ONTAP). Puede encontrar el ID del sistema de archivos en el panel de sistemas de archivos de la consola Amazon FSx (NetApp ONTAP).
+ **ID de SVM**: el ID de la máquina virtual de almacenamiento (SVM) utilizada con el sistema de archivos. Para encontrar su ID de SVM, vaya al panel de sistemas de archivos de la consola Amazon FSx (NetApp ONTAP), seleccione su ID de sistema de archivos y, a continuación, seleccione Máquinas virtuales de **almacenamiento**.
+ **Tipo de protocolo**: especifique si usa el protocolo Common Internet File System (CIFS) o el protocolo Network File System (NFS) para Linux.
+ **Tipo de sistema de archivos**: especifique el tipo de sistema de archivos como `FSXONTAP`.
+  **Nube privada virtual (VPC)**: especifique a `VpcConfiguration` cuándo llamar a `CreateDataSource`. Para obtener más información, consulte [¿Se está configurando Amazon Kendra para usar un Amazon VPC](vpc-configuration.md).
**nota**  
Debe seleccionar un Amazon VPC lugar en el que resida su Amazon FSx (NetApp ONTAP). Incluya la subred de VPC y los grupos de seguridad.
+ **Nombre secreto de recurso de Amazon (ARN): proporcione** el nombre de recurso de Amazon (ARN) de un Secrets Manager secreto que contenga las credenciales de autenticación de su Amazon FSx cuenta (ONTAP). NetApp El secreto se almacena en una estructura JSON con las siguientes claves:

  ```
  {
      "username": "user@corp.example.com",
      "password": "password"
  }
  ```

  Si utiliza el protocolo NFS para su sistema de archivos Amazon FSx (NetApp ONTAP), el secreto se almacena en una estructura JSON con las siguientes claves:

  ```
  {
      "leftId": "left ID",
      "rightId": "right ID",
      "preSharedKey": "pre-shared key"
  }
  ```
+ **IAMrol**: especifique `RoleArn` cuándo llama `CreateDataSource` para proporcionar a un IAM rol con permisos para acceder a su Secrets Manager secreto y para llamar al público requerido APIs para el conector Amazon FSx (NetApp ONTAP) y. Amazon Kendra Para obtener más información, consulte las [IAMfunciones de las fuentes de datos Amazon FSx (NetApp ONTAP).](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds)

También puede añadir las siguientes características opcionales:
+ **Modo de sincronización**: especifique cómo Amazon Kendra debe actualizarse el índice cuando cambie el contenido de la fuente de datos. Al sincronizar el origen de datos con Amazon Kendra por primera vez, todo el contenido se rastrea y se indexa de forma predeterminada. Debe ejecutar una sincronización completa de los datos si la sincronización inicial falló, incluso si no selecciona la sincronización completa como opción de modo de sincronización. Puede elegir entre las siguientes opciones:
  + `FORCED_FULL_CRAWL` para volver a indexar todo el contenido, reemplazando el contenido existente cada vez que el origen de datos se sincronice con el índice.
  + `FULL_CRAWL` para indexar solo el contenido nuevo, modificado y eliminado cada vez que el origen de datos se sincronice con el índice. Amazon Kendra puede utilizar el mecanismo del origen de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido modificado desde la última sincronización.
+ **Filtros de inclusión y exclusión**: especifique si desea incluir o excluir determinados archivos.
**nota**  
La mayoría de los orígenes de datos utilizan patrones de expresiones regulares, que son patrones de inclusión o exclusión denominados filtros. Si especifica un filtro de inclusión, solo se indexará el contenido que coincida con el filtro de inclusión. Los documentos que no coincidan con el filtro de inclusión no se indexan. Si especifica un filtro de inclusión y exclusión, los documentos que coincidan con el filtro de exclusión no se indexarán, aunque coincidan con el filtro de inclusión.
+ **Lista de control de acceso (ACL)**: especifique si se va a rastrear la información de la ACL para los documentos, si tiene una ACL y desea usarla para el control de acceso. La ACL especifica a qué documentos pueden acceder los usuarios y los grupos. La información de la ACL se utiliza para filtrar los resultados de búsqueda en función del acceso del usuario o su grupo a los documentos. Para obtener más información, consulte [Filtrado de contexto de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#context-filter-user-incl-datasources).
**nota**  
Para probar el filtrado de contexto de usuario con un usuario, debe incluir el nombre de dominio DNS como parte del nombre de usuario al realizar la consulta. Debe disponer de permisos administrativos del dominio de Active Directory. También puede probar el filtrado de contexto de usuario con el nombre de un grupo.
+  **Asignaciones de campos**: elija asignar los campos de la fuente de datos Amazon FSx (NetApp ONTAP) a los campos de índice. Amazon Kendra Para obtener más información, consulte [Asignación de campos de origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/field-mapping.html).
**nota**  
El campo del cuerpo del documento o el cuerpo del documento equivalente de sus documentos es obligatorio Amazon Kendra para poder buscarlos. Debe asignar el nombre del campo del cuerpo del documento en el origen de datos al nombre del campo del índice `_document_body`. Todos los demás campos son opcionales.

Para ver una lista de otras claves JSON importantes que hay que configurar, consulte el [esquema de plantillas Amazon FSx (NetApp ONTAP)](https://docs.aws.amazon.com/kendra/latest/dg/ds-schemas.html#ds-fsx-ontap-schema).

------

# Amazon RDS/Aurora


Puede indexar los documentos que están almacenados en una base de datos mediante un origen de datos de base de datos. Después de proporcionar la información de conexión a la base de datos, Amazon Kendra conecta e indexa los documentos.

Amazon Kendraadmite las siguientes bases de datos:
+ Amazon Aurora MySQL
+ Amazon Aurora PostgreSQL
+ Amazon RDSpara MySQL
+ Amazon RDSpara PostgreSQL

**nota**  
No se admiten las bases de datos Aurora sin servidor.

**importante**  
Está previsto que este RDS/Aurora conector de Amazon deje de estar en desuso a finales de 2023.  
Amazon Kendraahora es compatible con los nuevos conectores de fuentes de datos de bases de datos. Para mejorar la experiencia, le recomendamos que elija uno de los siguientes nuevos conectores para su caso de uso:  
[Aurora(MySQL)](https://docs.aws.amazon.com/kendra/latest/dg/data-source-aurora-mysql.html)
[Aurora(PostgreSQL)](https://docs.aws.amazon.com/kendra/latest/dg/data-source-aurora-postgresql.html)
[Amazon RDS(MySQL)](https://docs.aws.amazon.com/kendra/latest/dg/data-source-rds-mysql.html)
[Amazon RDS(Microsoft SQL Server)](https://docs.aws.amazon.com/kendra/latest/dg/data-source-rds-ms-sql-server.html)
[Amazon RDS(Oracle)](https://docs.aws.amazon.com/kendra/latest/dg/data-source-rds-oracle.html)
[Amazon RDS(PostgreSQL)](https://docs.aws.amazon.com/kendra/latest/dg/data-source-rds-postgresql.html)
[IBM DB2](https://docs.aws.amazon.com/kendra/latest/dg/data-source-ibm-db2.html)
[Microsoft SQL Server](https://docs.aws.amazon.com/kendra/latest/dg/data-source-ms-sql-server.html)
[MySQL](https://docs.aws.amazon.com/kendra/latest/dg/data-source-mysql.html)
[Oracle Database](https://docs.aws.amazon.com/kendra/latest/dg/data-source-oracle-database.html)
[PostgreSQL](https://docs.aws.amazon.com/kendra/latest/dg/data-source-postgresql.html)

Puede conectarse Amazon Kendra a la fuente de datos de su base de datos mediante la [Amazon Kendraconsola](https://console.aws.amazon.com/kendra/) y la [DatabaseConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_DatabaseConfiguration.html)API.

Para solucionar problemas del conector de fuentes Amazon Kendra de datos de su base de datos, consulte[Solución de problemas con los orígenes de datos](troubleshooting-data-sources.md).

**Topics**
+ [

## Características admitidas
](#supported-features-database)
+ [

## Requisitos previos
](#prerequisites-database)
+ [

## Instrucciones de conexión
](#data-source-procedure-database)

## Características admitidas


Amazon Kendrael conector de fuente de datos de base de datos admite las siguientes funciones:
+ Asignaciones de campos
+ Filtrado de contexto de usuario
+ Nube privada virtual (VPC)

## Requisitos previos


Antes de poder usarlo Amazon Kendra para indexar la fuente de datos de la base de datos, realice estos cambios en la base de datos y en AWS las cuentas.

**En la base de datos, asegúrese de que:**
+ Ha apuntado las credenciales de autenticación básica del nombre de usuario y la contraseña de la base de datos.
+ Ha copiado el nombre de host, el número de puerto, la dirección de host, el nombre de la base de datos y el nombre de la tabla de datos que contiene los datos del documento. En el caso de PostgreSQL, la tabla de datos debe ser una tabla pública o un esquema público.
**nota**  
El host y el puerto indican Amazon Kendra dónde encontrar el servidor de base de datos en Internet. El nombre de la base de datos y el nombre de la tabla indican Amazon Kendra dónde encontrar los datos del documento en el servidor de la base de datos.
+ Ha copiado los nombres de las columnas de la tabla de datos que contienen los datos del documento. Debe incluir el ID del documento, el cuerpo del documento, las columnas para detectar si un documento ha cambiado (por ejemplo, la columna actualizada por última vez) y las columnas opcionales de la tabla de datos que se asignan a campos de índice personalizados. También puede asignar cualquiera de los [nombres de campo reservados de Amazon Kendra](https://docs.aws.amazon.com/kendra/latest/dg/hiw-document-attributes.html#index-reserved-fields) a una columna de la tabla.
+ Se ha copiado la información del tipo de motor de base de datos, por ejemplo, si se utiliza Amazon RDS para MySQL u otro tipo.
+ Ha comprobado que cada documento es único en la base de datos y en otros orígenes de datos que vaya a utilizar para el mismo índice. Cada origen de datos que desee utilizar para un índice no debe contener el mismo documento en varios orígenes de datos. IDs Los documentos son globales para un índice y deben ser únicos por índice.

**En el tuyoCuenta de AWS, asegúrate de tener:**
+ [Creó un Amazon Kendra índice](https://docs.aws.amazon.com/kendra/latest/dg/create-index.html) y, si usa la API, anotó el ID del índice.
+ [Creó un IAM rol](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds) para su fuente de datos y, si usa la API, anotó el ARN del IAM rol.
**nota**  
Si cambias el tipo de autenticación y las credenciales, debes actualizar tu IAM rol para acceder al ID AWS Secrets Manager secreto correcto.
+ Ha guardado sus credenciales de autenticación de la base de datos en un secreto de AWS Secrets Manager y, si utiliza la API, ha anotado el ARN del secreto.
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).

Si no tiene un IAM rol o secreto existente, puede usar la consola para crear un nuevo IAM rol y un Secrets Manager secreto al conectar la fuente de datos de la base de datosAmazon Kendra. Si utiliza la API, debe proporcionar el ARN de un IAM rol y un Secrets Manager secreto existentes y un ID de índice.

## Instrucciones de conexión


Para conectarse Amazon Kendra a la fuente de datos de la base de datos, debe proporcionar los detalles necesarios de la fuente de datos de la base de datos para Amazon Kendra poder acceder a los datos. Si aún no ha configurado la base de datos paraAmazon Kendra, consulte[Requisitos previos](#prerequisites-database).

------
#### [ Console ]

**Para conectarse Amazon Kendra a una base de datos** 

1. Inicie sesión en la [Amazon Kendraconsola Consola de administración de AWS y ábrala](https://console.aws.amazon.com/kendra/).

1. En el panel de navegación izquierdo, elija **Índices** y, a continuación, elija el índice que desee usar de la lista de índices.
**nota**  
Puede elegir configurar o editar los ajustes de **Control de acceso de usuarios** en la **Configuración del índice**. 

1. En la página **Introducción**, seleccione **Agregar origen de datos**.

1. En la página **Agregar origen de datos**, elija **Conector de base de datos** y, a continuación, elija **Agregar origen de datos**. Si usa la versión 2 (si corresponde), elija el **Conector de base de datos** con la etiqueta “V2.0”.

1. En la página **Especificar detalles del origen de datos**, introduzca la siguiente información:

   1. En **Nombre y descripción**, en **Nombre del origen de datos**: introduzca un nombre para el origen de datos. Puede incluir guiones, pero no espacios.

   1. (Opcional)** Descripción**: introduzca una descripción opcional para el origen de datos.

   1. En **Idioma predeterminado**: elija un idioma para filtrar los documentos para el índice. A menos que especifique lo contrario, el idioma predeterminado es el inglés. El idioma especificado en los metadatos del documento anula el idioma seleccionado.

   1. En **Etiquetas**, para **añadir una nueva etiqueta**: incluye etiquetas opcionales para buscar y filtrar tus recursos o realizar un seguimiento de tus AWS costes.

   1. Elija **Siguiente**.

1. En la página **Definir acceso y seguridad**, introduzca la siguiente información:

   1. **Punto final**: un nombre de host DNS, una IPv4 dirección o una IPv6 dirección.

   1. **Puerto**: un número de puerto.

   1. **Base de datos**: nombre de la base de datos.

   1. **Nombre de tabla**: nombre de la tabla.

   1. En **Tipo de autenticación**, elija entre **Existente** y **Nuevo** para almacenar las credenciales de autenticación de la base de datos. Si decide crear un secreto nuevo, se abrirá una ventana de secreto de AWS Secrets Manager. 

      1. Introduzca la siguiente información en la **ventana Crear un secreto de AWS Secrets Manager**:

        1. **Nombre del secreto**: un nombre para su secreto. El prefijo «AmazonKendra-database-» se añade automáticamente a su nombre secreto.

        1. En **Nombre de usuario** y **Contraseña**: introduzca los valores de las credenciales de autenticación de su cuenta de base de datos.

        1. Seleccione **Guardar autenticación**.

   1. **Nube privada virtual (VPC)**: puede optar por utilizar una VPC. Si es así, debe agregar **Subredes** y **Grupos de seguridad de VPC**.
**nota**  
Debe utilizar una subred privada. Si la instancia de RDS está en una subred pública en la VPC, puede crear una subred privada que tenga acceso saliente a una puerta de enlace NAT en la subred pública. Las subredes proporcionadas en la configuración de VPC deben estar en Oeste de EE. UU. (Oregón), Este de EE. UU. (Norte de Virginia), Europa (Irlanda).

   1. **IAMrol**: elija un IAM rol existente o cree uno nuevo IAM para acceder a las credenciales del repositorio y al contenido del índice.
**nota**  
IAMlos roles utilizados para los índices no se pueden usar para las fuentes de datos. Si no está seguro de si un rol existente se utiliza para un índice o para las preguntas frecuentes, elija **Crear un nuevo rol** para evitar errores.

   1. Elija **Siguiente**.

1. En la página **Configurar ajustes de sincronización**, introduzca la siguiente información:

   1. Seleccione entre **Aurora MySQL**, **MySQL**, **Aurora PostgreSQL** y **PostgreSQL** según el caso de uso.

   1. **Incluir los identificadores SQL entre comillas dobles**: seleccione esta opción para incluir los identificadores SQL entre comillas dobles. Por ejemplo, “columnName”.

   1. **Columna ACL** y **columnas de detección de cambios**: configure las columnas que se Amazon Kendra utilizan para la detección de cambios (por ejemplo, la columna actualizada por última vez) y su lista de control de acceso.

   1. En el **programa de ejecución sincronizado**, para **Frecuencia**: elija la frecuencia con la que Amazon Kendra se sincronizará con la fuente de datos.

   1. Elija **Siguiente**.

1. En la página **Establecer asignaciones de campos**, especifique la siguiente información:

   1. **Amazon Kendraasignaciones de campos predeterminadas: seleccione entre las** fuentes de datos predeterminadas Amazon Kendra generadas los campos que desee asignar a su índice. Debe agregar los valores de la **Columna de base de datos** para `document_id` y `document_body` 

   1.  **Asignaciones de campo personalizado**: para agregar campos de origen de datos personalizados a fin de crear un nombre de campo de índice al que asignarlos y el tipo de datos del campo.

   1. Elija **Siguiente**.

1. En la página **Revisar y crear**, compruebe que la información que ha introducido es correcta y, a continuación, seleccione **Añadir origen de datos**. También puede elegir editar la información desde esta página. El origen de datos aparecerá en la página **Orígenes de datos** una vez que el origen de datos se haya agregado correctamente.

------
#### [ API ]

**Para conectarse Amazon Kendra a una base de datos**

Debe especificar la siguiente [DatabaseConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_DatabaseConfiguration.html)API:
+ **ColumnConfiguration**—Información sobre dónde debe obtener el índice la información del documento de la base de datos. Para obtener más información, consulte [ColumnConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_ColumnConfiguration.html). Debe especificar los campos `DocumentDataColumnName` (cuerpo del documento o texto principal), `DocumentIdColumnName` y `ChangeDetectingColumn` (por ejemplo, la columna actualizada por última vez). La columna asignada al campo `DocumentIdColumnName` debe ser una columna de números enteros. En el siguiente ejemplo se muestra una configuración simple de columnas para un origen de datos de base de datos: 

  ```
  "ColumnConfiguration": {
      "ChangeDetectingColumns": [
          "LastUpdateDate",
          "LastUpdateTime"
      ],
      "DocumentDataColumnName": "TextColumn",
      "DocumentIdColumnName": "IdentifierColumn",
      "DocoumentTitleColumnName": "TitleColumn",
      "FieldMappings": [
          {
              "DataSourceFieldName": "AbstractColumn",
              "IndexFieldName": "Abstract"
          }
      ]
  }
  ```
+ **ConnectionConfiguration**—Información de configuración necesaria para conectarse a una base de datos. Para obtener más información, consulte [ConnectionConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_ConnectionConfiguration.html).
+ **DatabaseEngineType**—El tipo de motor de base de datos que ejecuta la base de datos. El `DatabaseHost` campo `ConnectionConfiguration` debe ser el punto final Amazon Relational Database Service (Amazon RDS) de la instancia de la base de datos. No utilice el punto de conexión del clúster.
+ **Nombre secreto de recurso de Amazon (ARN)**: proporcione el nombre de recurso de Amazon (ARN) de un Secrets Manager secreto que contenga las credenciales de autenticación de su cuenta de base de datos. El secreto se almacena en una estructura JSON con las siguientes claves:

  ```
  {
      "username": "user name",
      "password": "password"
  }
  ```

  En el siguiente ejemplo se muestra una configuración de base de datos que incluye el ARN secreto.

  ```
  "DatabaseConfiguration": {
  "ConnectionConfiguration": {
  "DatabaseHost": "host.subdomain.domain.tld",
          "DatabaseName": "DocumentDatabase",
          "DatabasePort": 3306,
          "SecretArn": "arn:aws:secretmanager:region:account ID:secret/secret name",
          "TableName": "DocumentTable"
      }
  }
  ```
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).
+ **IAMrol**: especifique `RoleArn` cuándo llama `CreateDataSource` para proporcionar un IAM rol con permisos para acceder a su Secrets Manager secreto y para llamar al público APIs requerido para el conector de base de datos y. Amazon Kendra Para obtener más información, consulte [Roles de IAM para orígenes de datos de base de datos](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds).

También puede añadir las siguientes características opcionales:
+ **Nube privada virtual (VPC)**: especifique `VpcConfiguration` como parte de la configuración del origen de datos. Consulte [Configuración de Amazon Kendra para utilizar una VPC](https://docs.aws.amazon.com/kendra/latest/dg/vpc-configuration.html).
**nota**  
Debe utilizar solo una subred privada. Si la instancia de RDS está en una subred pública en la VPC, puede crear una subred privada que tenga acceso saliente a una puerta de enlace NAT en la subred pública. Las subredes proporcionadas en la configuración de VPC deben estar en Oeste de EE. UU. (Oregón), Este de EE. UU. (Norte de Virginia), Europa (Irlanda).
+  **Asignaciones de campos**: elija asignar los campos del origen de datos de base de datos a los campos de índice de Amazon Kendra. Para obtener más información, consulte [Asignación de campos de origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/field-mapping.html).
**nota**  
El campo del cuerpo del documento o el cuerpo del documento equivalente de sus documentos es obligatorio Amazon Kendra para poder buscarlos. Debe asignar el nombre del campo del cuerpo del documento en el origen de datos al nombre del campo del índice `_document_body`. Todos los demás campos son opcionales.
+  **Filtrado de contexto de usuario y control de acceso**: si hay una lista de control de acceso (ACL) para los documentos, Amazon Kendra la rastreará. La información de la ACL se utiliza para filtrar los resultados de búsqueda en función del acceso del usuario o su grupo a los documentos. Para obtener más información, consulte [Filtrado de contexto de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#datasource-context-filter).

------

# Amazon RDS(Microsoft SQL Server)


**nota**  
Amazon RDSEl conector (Microsoft SQL Server) seguirá siendo totalmente compatible con los clientes actuales hasta el 31 de mayo de 2026. Si bien este conector ya no está disponible para los nuevos usuarios, los usuarios actuales pueden seguir utilizándolo sin interrupción. Desarrollamos de forma continua nuestra cartera de conectores para ofrecer soluciones más escalables y personalizables. Para futuras integraciones, le recomendamos que valore el marco de conectores personalizados de Amazon Kendra[1], diseñado de manera más flexible para una variedad más amplia de casos de uso empresariales.

SQL Server es un sistema de administración de bases de datos desarrollado por Microsoft. Amazon RDSfor SQL Server facilita la configuración, el funcionamiento y el escalado de las implementaciones de SQL Server en la nube. Si es un usuario Amazon RDS (Microsoft SQL Server), puede utilizarlo Amazon Kendra para indexar su fuente de datos Amazon RDS (Microsoft SQL Server). El conector de fuente de datos Amazon Kendra JDBC es compatible con Microsoft SQL Server 2019.

Puede conectarse Amazon Kendra a su fuente de datos Amazon RDS (Microsoft SQL Server) mediante la [Amazon Kendraconsola](https://console.aws.amazon.com/kendra/) y la [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html)API.

Para solucionar problemas de su conector de fuente de datos Amazon Kendra Amazon RDS (Microsoft SQL Server), consulte[Solución de problemas con los orígenes de datos](troubleshooting-data-sources.md).

**Topics**
+ [

## Características admitidas
](#supported-features-rds-ms-sql-server)
+ [

## Requisitos previos
](#prerequisites-rds-ms-sql-server)
+ [

## Instrucciones de conexión
](#data-source-procedure-rds-ms-sql-server)
+ [

## Notas
](#rds-ms-sql-server-notes)

## Características admitidas

+ Asignaciones de campo
+ Filtrado de contexto de usuario
+ Filtros de inclusión/exclusión
+ Sincronizaciones completas e incrementales del contenido
+ Nube privada virtual (VPC)

## Requisitos previos


Antes de que pueda Amazon Kendra utilizarla para indexar su fuente de datos Amazon RDS (Microsoft SQL Server), realice estos cambios en su Amazon RDS (Microsoft SQL Server) y en sus AWS cuentas.

**En Amazon RDS (Microsoft SQL Server), asegúrese de tener:**
+ Ha anotado el nombre de usuario y contraseña de la base de datos.
**importante**  
Como práctica recomendada, proporcione credenciales de base Amazon Kendra de datos de solo lectura.
+ Ha copiado la URL, el puerto y la instancia del host de la base de datos.
+ Marcó que cada documento es único en Amazon RDS (Microsoft SQL Server) y en otras fuentes de datos que planea usar para el mismo índice. Cada origen de datos que desee utilizar para un índice no debe contener el mismo documento en varios orígenes de datos. IDs Los documentos son globales en relación con un índice y deben ser únicos por índice.

**En el tuyoCuenta de AWS, asegúrate de tener:**
+ [Creó un Amazon Kendra índice](https://docs.aws.amazon.com/kendra/latest/dg/create-index.html) y, si usa la API, anotó el ID del índice.
+ [Creó un IAM rol](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds) para su fuente de datos y, si usa la API, anotó el ARN del IAM rol.
**nota**  
Si cambias el tipo de autenticación y las credenciales, debes actualizar tu IAM rol para acceder al ID AWS Secrets Manager secreto correcto.
+ Guardó sus credenciales de autenticación Amazon RDS (Microsoft SQL Server) en AWS Secrets Manager secreto y, si utiliza la API, anotó el ARN del secreto.
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).

Si no tiene un IAM rol o secreto existente, puede usar la consola para crear un nuevo IAM rol y Secrets Manager secreto al conectar su fuente de datos Amazon RDS (Microsoft SQL Server) aAmazon Kendra. Si utiliza la API, debe proporcionar el ARN de un IAM rol y un Secrets Manager secreto existentes y un ID de índice.

## Instrucciones de conexión


Para conectarse Amazon Kendra a su fuente de datos Amazon RDS (Microsoft SQL Server), debe proporcionar detalles de sus credenciales Amazon RDS (Microsoft SQL Server) para Amazon Kendra poder acceder a sus datos. Si aún no lo ha configurado Amazon RDS (Microsoft SQL Server), Amazon Kendra consulte[Requisitos previos](#prerequisites-rds-ms-sql-server).

------
#### [ Console ]

**Para conectarse Amazon Kendra a Amazon RDS (Microsoft SQL Server)** 

1. Inicie sesión en la [Amazon Kendraconsola Consola de administración de AWS y ábrala](https://console.aws.amazon.com/kendra/).

1. En el panel de navegación izquierdo, elija **Índices** y, a continuación, elija el índice que desee usar de la lista de índices.
**nota**  
Puede elegir configurar o editar los ajustes de **Control de acceso de usuarios** en la **Configuración del índice**. 

1. En la página **Introducción**, seleccione **Agregar origen de datos**.

1. En la página **Agregar origen de datos**, seleccione el **Conector de Amazon RDS (Microsoft SQL Server)** y, a continuación, seleccione **Agregar conector**. Si usa la versión 2 (si corresponde), elija el **Conector de Amazon RDS (Microsoft SQL Server)** con la etiqueta “V2.0”.

1. En la página **Especificar detalles del origen de datos**, introduzca la siguiente información:

   1. En **Nombre y descripción**, en **Nombre del origen de datos**: introduzca un nombre para el origen de datos. Puede incluir guiones, pero no espacios.

   1. (Opcional)** Descripción**: introduzca una descripción opcional para el origen de datos.

   1. En **Idioma predeterminado**: elija un idioma para filtrar los documentos para el índice. A menos que especifique lo contrario, el idioma predeterminado es el inglés. El idioma especificado en los metadatos del documento anula el idioma seleccionado.

   1. En **Etiquetas**, para **añadir una nueva etiqueta**: incluye etiquetas opcionales para buscar y filtrar tus recursos o realizar un seguimiento de tus AWS costes.

   1. Elija **Siguiente**.

1. En la página **Definir acceso y seguridad**, introduzca la siguiente información:

   1. En **Origen**, introduzca la siguiente información:

   1.  **Host**: introduzca el nombre del host de la base de datos.

   1.  **Puerto**: introduzca el puerto de la base de datos.

   1.  **Instancia**: introduzca la instancia de la base de datos.

   1. **Habilitar la ubicación del certificado SSL**: elija introducir la Amazon S3 ruta al archivo de certificado SSL.

   1. En **Autenticación**, introduzca la siguiente información:

      1. **AWS Secrets Managersecreto**: elija un secreto existente o cree uno nuevo Secrets Manager para almacenar sus credenciales de autenticación Amazon RDS (Microsoft SQL Server). Si decide crear un secreto nuevo, se abrirá una ventana de secreto de AWS Secrets Manager.

        1. Introduzca la siguiente información en la **ventana Crear un secreto de AWS Secrets Manager**:

           1. **Nombre del secreto**: un nombre para su secreto. El prefijo 'AmazonKendra- Amazon RDS (Microsoft SQL Server) -' se añade automáticamente a su nombre secreto.

           1. Para el **nombre de usuario** y la **contraseña de la base de datos**: introduzca los valores de las credenciales de autenticación que ha copiado de la base de datos. 

        1. Seleccione **Save**.

   1. **Nube privada virtual (VPC)**: puede optar por utilizar una VPC. Si es así, debe agregar **Subredes** y **Grupos de seguridad de VPC**.

   1. **IAMrol**: elija un IAM rol existente o cree uno nuevo IAM para acceder a las credenciales del repositorio y al contenido del índice.
**nota**  
IAMlos roles utilizados para los índices no se pueden usar para las fuentes de datos. Si no está seguro de si un rol existente se utiliza para un índice o para las preguntas frecuentes, elija **Crear un nuevo rol** para evitar errores.

   1. Elija **Siguiente**.

1. En la página **Configurar ajustes de sincronización**, introduzca la siguiente información:

   1. En **Ámbito de sincronización**, seleccione de entre las siguientes opciones:
      + **Consulta SQL**: introduzca instrucciones de consulta SQL, como las operaciones SELECT y JOIN. Las consultas de SQL deben ser inferiores a 32 KB. Amazon Kendra rastreará todo el contenido de la base de datos que coincida con su consulta.
**nota**  
Si el nombre de una tabla incluye caracteres especiales (no alfanuméricos), debe utilizar corchetes alrededor del nombre de la tabla. Por ejemplo, *select \$1 from [my-database-table]*
      + **Columna de clave principal**: proporcione la clave principal de la tabla de la base de datos. Esto identifica una tabla dentro de la base de datos.
      + **Columna de título**: proporcione el nombre de la columna del título del documento en la tabla de la base de datos.
      + **Columna de cuerpo**: proporcione el nombre de la columna del cuerpo del documento en la tabla de la base de datos.

   1. En **Configuración adicional (*opcional*)**, elija una de las siguientes opciones para sincronizar contenido específico en lugar de sincronizar todos los archivos:
      + **Columnas de detección de cambios**: introduzca los nombres de las columnas que se Amazon Kendra utilizarán para detectar cambios en el contenido. Amazon Kendravolverá a indexar el contenido cuando se produzca un cambio en alguna de estas columnas.
      + ** IDsColumna de usuario**: introduzca el nombre de la columna que contiene el usuario IDs al que se le permitirá acceder al contenido.
      + **Columna de grupos**: introduzca el nombre de la columna que contiene los grupos a los que se dará acceso al contenido.
      + ** URLsColumna de origen**: introduzca el nombre de la columna que contiene el origen que se va URLs a indexar.
      + **Columna de marcas de tiempo**: introduzca el nombre de la columna que contiene las marcas de tiempo. Amazon Kendrautiliza la información de las marcas de tiempo para detectar cambios en el contenido y sincronizar solo el contenido modificado. 
      + **Columna de zonas horarias**: introduzca el nombre de la columna que contiene las zonas horarias del contenido que se va a rastrear.
      + **Formato de marcas temporales**: introduzca el nombre de la columna que contiene los formatos de marcas temporales que se deben utilizar para detectar cambios en el contenido y volver a sincronizar su contenido.

   1. **Modo de sincronización**: elija cómo desea actualizar el índice cuando cambie el contenido del origen de datos. Al sincronizar la fuente de datos Amazon Kendra por primera vez, todo el contenido se rastrea e indexa de forma predeterminada. Debe ejecutar una sincronización completa de los datos si la sincronización inicial falló, incluso si no selecciona la sincronización completa como opción de modo de sincronización.
      + Sincronización completa: se vuelve a indexar todo el contenido, reemplazando el contenido existente cada vez que el origen de datos se sincronice con el índice.
      + Sincronización de lo nuevo y modificado: se indexa solo el contenido nuevo y modificado cada vez que el origen de datos se sincroniza con el índice. Amazon Kendra puede utilizar el mecanismo del origen de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido modificado desde la última sincronización.
      + Sincronización nueva, modificada o eliminada: indexe solo el contenido nuevo, modificado y eliminado cada vez que la fuente de datos se sincronice con el índice. Amazon Kendrapuede usar el mecanismo de la fuente de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido que ha cambiado desde la última sincronización.

   1. En **Programa de ejecución de sincronización**, en **Frecuencia**: la frecuencia con la que Amazon Kendra se sincronizará con el origen de datos.

   1. Elija **Siguiente**.

1. En la página **Establecer asignaciones de campos**, especifique la siguiente información:

   1. Seleccione uno de los campos de fuente de datos predeterminados generados (**Documento IDs****, Títulos** de documentos y **Fuente URLs**) que desee mapear para Amazon Kendra indexarlos.

   1.  **Agregar campo**: para agregar campos de origen de datos personalizados para crear un nombre de campo de índice al que asignarlos y el tipo de datos del campo.

   1. Elija **Siguiente**.

1. En la página **Revisar y crear**, compruebe que la información que ha introducido es correcta y, a continuación, seleccione **Añadir origen de datos**. También puede elegir editar la información desde esta página. El origen de datos aparecerá en la página **Orígenes de datos** una vez que el origen de datos se haya agregado correctamente.

------
#### [ API ]

**Para conectarse Amazon Kendra a Amazon RDS (Microsoft SQL Server)**

Debe especificar lo siguiente mediante la [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html)API:
+ **Origen de datos**: defina el tipo de origen de datos como `JDBC` cuando utilice el esquema JSON [https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html](https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html). Además, defina el origen de datos como `TEMPLATE` al llamar a la API [https://docs.aws.amazon.com/kendra/latest/dg/API_CreateDataSource.html](https://docs.aws.amazon.com/kendra/latest/dg/API_CreateDataSource.html).
+ **Tipo de base de datos**: debe especificar el tipo de base de datos como `sqlserver`.
+ **Consulta SQL**: especifique instrucciones de consulta SQL, como las operaciones SELECT y JOIN. Las consultas de SQL deben ser inferiores a 32 KB. Amazon Kendra rastreará todo el contenido de la base de datos que coincida con su consulta.
**nota**  
Si el nombre de una tabla incluye caracteres especiales (no alfanuméricos), debe utilizar corchetes alrededor del nombre de la tabla. Por ejemplo, *select \$1 from [my-database-table]*
+ **Modo de sincronización**: especifique cómo Amazon Kendra debe actualizarse el índice cuando cambie el contenido de la fuente de datos. Al sincronizar el origen de datos con Amazon Kendra por primera vez, todo el contenido se rastrea y se indexa de forma predeterminada. Debe ejecutar una sincronización completa de los datos si la sincronización inicial falló, incluso si no selecciona la sincronización completa como opción de modo de sincronización. Puede elegir entre las siguientes opciones:
  + `FORCED_FULL_CRAWL` para volver a indexar todo el contenido, reemplazando el contenido existente cada vez que el origen de datos se sincronice con el índice.
  + `FULL_CRAWL` para indexar solo el contenido nuevo, modificado y eliminado cada vez que el origen de datos se sincronice con el índice. Amazon Kendra puede utilizar el mecanismo del origen de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido modificado desde la última sincronización.
  + `CHANGE_LOG` para indexar solo el contenido nuevo y modificado cada vez que el origen de datos se sincronice con el índice. Amazon Kendra puede utilizar el mecanismo del origen de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido modificado desde la última sincronización.
+ **Nombre de recurso secreto de Amazon (ARN): proporcione** el nombre de recurso de Amazon (ARN) de un Secrets Manager secreto que contenga las credenciales de autenticación que creó en su cuenta (Amazon RDSMicrosoft SQL Server). El secreto se almacena en una estructura JSON con las siguientes claves:

  ```
  {
      "user name": "database user name",
      "password": "password"
  }
  ```
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).
+ **IAMrol**: especifique `RoleArn` cuándo llama `CreateDataSource` para proporcionar un IAM rol con permisos para acceder a su Secrets Manager secreto y para llamar al público requerido APIs para el conector Amazon RDS (Microsoft SQL Server) yAmazon Kendra. Para obtener más información, consulte [IAMfunciones para las fuentes de datos Amazon RDS (Microsoft SQL Server)](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds).

También puede añadir las siguientes características opcionales:
+  **Nube privada virtual (VPC)**: especifique a `VpcConfiguration` cuándo llamar a `CreateDataSource`. Para obtener más información, consulte [¿Se está configurando Amazon Kendra para usar un Amazon VPC](vpc-configuration.md).
+  **Filtros de inclusión y exclusión**: puede especificar si desea incluir contenido específico mediante el usuario IDs, los grupos, la fuente URLs, las marcas horarias y las zonas horarias. 
+  **Filtrado de contexto de usuario y control de acceso**: si hay una lista de control de acceso (ACL) para los documentos, Amazon Kendra la rastreará. La información de la ACL se utiliza para filtrar los resultados de búsqueda en función del acceso del usuario o su grupo a los documentos. Para obtener más información, consulte [Filtrado de contexto de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#datasource-context-filter).
+  **Asignaciones de campos**: elija asignar los campos de la fuente de datos (de Amazon RDS Microsoft SQL Server) a los campos de índice. Amazon Kendra Para obtener más información, consulte [Asignación de campos de origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/field-mapping.html).
**nota**  
El campo del cuerpo del documento o el cuerpo del documento equivalente de sus documentos es obligatorio Amazon Kendra para poder buscarlos. Debe asignar el nombre del campo del cuerpo del documento en el origen de datos al nombre del campo del índice `_document_body`. Todos los demás campos son opcionales.

Para obtener una lista de otras claves JSON importantes que debe configurar, consulte [Amazon RDS Esquema de plantillas (Microsoft SQL Server)](ds-schemas.md#ds-rds-ms-sql-server-schema).

------

## Notas

+ Las filas de la base de datos eliminadas no se registrarán cuando se Amazon Kendra compruebe si hay contenido actualizado.
+ El tamaño de los nombres y valores de los campos de una fila de la base de datos no puede superar los 400 KB.
+ Si tiene una gran cantidad de datos en la fuente de datos de la base de datos y no desea Amazon Kendra indexar todo el contenido de la base de datos después de la primera sincronización, puede optar por sincronizar solo los documentos nuevos, modificados o eliminados.
+ Como práctica recomendada, proporcione credenciales de base Amazon Kendra de datos de solo lectura.
+ Como práctica recomendada, evite añadir tablas con datos confidenciales o información de identificación personal (PII).

# Amazon RDS(MySQL)


**nota**  
El conector de Amazon RDS(MySQL) seguirá siendo totalmente compatible con los clientes actuales hasta el 31 de mayo de 2026. Si bien este conector ya no está disponible para los nuevos usuarios, los usuarios actuales pueden seguir utilizándolo sin interrupción. Desarrollamos de forma continua nuestra cartera de conectores para ofrecer soluciones más escalables y personalizables. Para futuras integraciones, le recomendamos que valore el marco de conectores personalizados de Amazon Kendra[1], diseñado de manera más flexible para una variedad más amplia de casos de uso empresariales.

Amazon RDS(Amazon Relational Database Service) es un servicio web que facilita la configuración, el funcionamiento y el escalado de una base de datos relacional en AWS la nube. Si es un Amazon RDS usuario, puede utilizarlo Amazon Kendra para indexar su fuente de Amazon RDS(MySQL) datos. El conector de la fuente de Amazon Kendra datos admite las versiones Amazon RDS MySql 5.6, 5.7 y 8.0.

Puede conectarse Amazon Kendra a su fuente Amazon RDS(MySQL) de datos mediante la [Amazon Kendraconsola](https://console.aws.amazon.com/kendra/) y la [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html)API.

Para solucionar problemas del conector de la fuente de Amazon Kendra Amazon RDS(MySQL) datos, consulte[Solución de problemas con los orígenes de datos](troubleshooting-data-sources.md).

**Topics**
+ [

## Características admitidas
](#supported-features-rds-mysql)
+ [

## Requisitos previos
](#prerequisites-rds-mysql)
+ [

## Instrucciones de conexión
](#data-source-procedure-rds-mysql)
+ [

## Notas
](#rds-mysql-notes)

## Características admitidas

+ Asignaciones de campo
+ Filtrado de contexto de usuario
+ Filtros de inclusión/exclusión
+ Sincronizaciones completas e incrementales del contenido
+ Nube privada virtual (VPC)

## Requisitos previos


Antes de poder utilizarla Amazon Kendra para indexar la fuente de Amazon RDS(MySQL) datos, realice estos cambios en sus AWS cuentas Amazon RDS(MySQL) y.

**En Amazon RDS(MySQL), asegúrese de que**:
+ Ha anotado el nombre de usuario y contraseña de la base de datos.
**importante**  
Como práctica recomendada, proporcione credenciales de base Amazon Kendra de datos de solo lectura.
+ Ha copiado la URL, el puerto y la instancia del host de la base de datos. Puede encontrar esta información en la Amazon RDS consola.
+ Ha comprobado que cada documento es único en Amazon RDS(MySQL) y en otros orígenes de datos que vaya a utilizar para el mismo índice. Cada origen de datos que desee utilizar para un índice no debe contener el mismo documento en varios orígenes de datos. IDs Los documentos son globales para un índice y deben ser únicos por índice.

**En el tuyoCuenta de AWS, asegúrate de tener:**
+ [Creó un Amazon Kendra índice](https://docs.aws.amazon.com/kendra/latest/dg/create-index.html) y, si usa la API, anotó el ID del índice.
+ [Creó un IAM rol](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds) para su fuente de datos y, si usa la API, anotó el ARN del IAM rol.
**nota**  
Si cambias el tipo de autenticación y las credenciales, debes actualizar tu IAM rol para acceder al ID AWS Secrets Manager secreto correcto.
+ Ha guardado sus credenciales de autenticación de Amazon RDS(MySQL) en un secreto de AWS Secrets Manager y, si utiliza la API, ha anotado el ARN del secreto.
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).

Si no tiene un IAM rol o secreto existente, puede usar la consola para crear un nuevo IAM rol y un Secrets Manager secreto al conectar su fuente de Amazon RDS(MySQL) datosAmazon Kendra. Si utiliza la API, debe proporcionar el ARN de un IAM rol y un Secrets Manager secreto existentes y un ID de índice.

## Instrucciones de conexión


Para conectarse Amazon Kendra a su fuente de Amazon RDS(MySQL) datos, debe proporcionar los detalles de sus Amazon RDS(MySQL) credenciales para que Amazon Kendra pueda acceder a sus datos. Si aún no lo ha configuradoAmazon RDS(MySQL), Amazon Kendra consulte[Requisitos previos](#prerequisites-rds-mysql).

------
#### [ Console ]

**Para conectarse Amazon Kendra a Amazon RDS(MySQL)** 

1. Inicie sesión en la [Amazon Kendraconsola Consola de administración de AWS y ábrala](https://console.aws.amazon.com/kendra/).

1. En el panel de navegación izquierdo, elija **Índices** y, a continuación, elija el índice que desee usar de la lista de índices.
**nota**  
Puede elegir configurar o editar los ajustes de **Control de acceso de usuarios** en la **Configuración del índice**. 

1. En la página **Introducción**, seleccione **Agregar origen de datos**.

1. En la página **Agregar origen de datos**, seleccione el **Conector de Amazon RDS(MySQL)** y, a continuación, seleccione **Agregar conector**. Si usa la versión 2 (si corresponde), elija el **Conector de Amazon RDS(MySQL)** con la etiqueta “V2.0”.

1. En la página **Especificar detalles del origen de datos**, introduzca la siguiente información:

   1. En **Nombre y descripción**, en **Nombre del origen de datos**: introduzca un nombre para el origen de datos. Puede incluir guiones, pero no espacios.

   1. (Opcional)** Descripción**: introduzca una descripción opcional para el origen de datos.

   1. En **Idioma predeterminado**: elija un idioma para filtrar los documentos para el índice. A menos que especifique lo contrario, el idioma predeterminado es el inglés. El idioma especificado en los metadatos del documento anula el idioma seleccionado.

   1. En **Etiquetas**, para **añadir una nueva etiqueta**: incluye etiquetas opcionales para buscar y filtrar tus recursos o realizar un seguimiento de tus AWS costes.

   1. Elija **Siguiente**.

1. En la página **Definir acceso y seguridad**, introduzca la siguiente información:

   1. En **Origen**, introduzca la siguiente información:

   1.  **Host**: ingrese la URL del host de la base de datos, por ejemplo: `http://instance URL.region.rds.amazonaws.com`.

   1.  **Puerto**: ingrese el puerto de la base de datos, por ejemplo, `5432`.

   1.  **Instancia**: ingrese la instancia de la base de datos, por ejemplo `postgres`.

   1. **Habilitar la ubicación del certificado SSL**: elija introducir la Amazon S3 ruta al archivo de certificado SSL.

   1. En **Autenticación**, introduzca la siguiente información:

      1. **AWS Secrets Managersecreto**: elija un secreto existente o cree uno nuevo Secrets Manager para almacenar sus credenciales de Amazon RDS(MySQL) autenticación. Si decide crear un secreto nuevo, se abrirá una ventana de secreto de AWS Secrets Manager.

        1. Introduzca la siguiente información en la **ventana Crear un secreto de AWS Secrets Manager**:

           1. **Nombre del secreto**: un nombre para su secreto. El prefijo 'AmazonKendra- Amazon RDS(MySQL) -' se añade automáticamente a tu nombre secreto.

           1. Para el **nombre de usuario** y la **contraseña de la base de datos**: introduzca los valores de las credenciales de autenticación que ha copiado de la base de datos. 

        1. Seleccione **Save**.

   1. **Nube privada virtual (VPC)**: puede optar por utilizar una VPC. Si es así, debe agregar **Subredes** y **Grupos de seguridad de VPC**.

   1. **IAMrol**: elige un IAM rol existente o crea uno nuevo IAM para acceder a las credenciales del repositorio y al contenido del índice.
**nota**  
IAMlos roles utilizados para los índices no se pueden usar para las fuentes de datos. Si no está seguro de si un rol existente se utiliza para un índice o para las preguntas frecuentes, elija **Crear un nuevo rol** para evitar errores.

   1. Elija **Siguiente**.

1. En la página **Configurar ajustes de sincronización**, introduzca la siguiente información:

   1. En **Ámbito de sincronización**, seleccione de entre las siguientes opciones:
      + **Consulta SQL**: introduzca instrucciones de consulta SQL, como las operaciones SELECT y JOIN. Las consultas SQL deben tener menos de 32 KB. Las consultas SQL deben tener menos de 32 KB y no contener puntos y comas (;). Amazon Kendrarastreará todo el contenido de la base de datos que coincida con su consulta.
      + **Columna de clave principal**: proporcione la clave principal de la tabla de la base de datos. Esto identifica una tabla dentro de la base de datos.
      + **Columna de título**: proporcione el nombre de la columna del título del documento en la tabla de la base de datos.
      + **Columna de cuerpo**: proporcione el nombre de la columna del cuerpo del documento en la tabla de la base de datos.

   1. En **Configuración adicional (*opcional*)**, elija una de las siguientes opciones para sincronizar contenido específico en lugar de sincronizar todos los archivos:
      + **Columnas de detección de cambios**: introduzca los nombres de las columnas que se Amazon Kendra utilizarán para detectar cambios en el contenido. Amazon Kendravolverá a indexar el contenido cuando se produzca un cambio en alguna de estas columnas.
      + ** IDsColumna de usuarios**: introduzca el nombre de la columna que contiene el usuario IDs al que se le permitirá acceder al contenido.
      + **Columna de grupos**: introduzca el nombre de la columna que contiene los grupos a los que se dará acceso al contenido.
      + ** URLsColumna de origen**: introduzca el nombre de la columna que contiene el origen que se va URLs a indexar.
      + **Columna de marcas de tiempo**: introduzca el nombre de la columna que contiene las marcas de tiempo. Amazon Kendrautiliza la información de las marcas de tiempo para detectar cambios en el contenido y sincronizar solo el contenido modificado. 
      + **Columna de zonas horarias**: introduzca el nombre de la columna que contiene las zonas horarias del contenido que se va a rastrear.
      + **Formato de marcas temporales**: introduzca el nombre de la columna que contiene los formatos de marcas temporales que se deben utilizar para detectar cambios en el contenido y volver a sincronizar su contenido.

   1. **Modo de sincronización**: elija cómo desea actualizar el índice cuando cambie el contenido del origen de datos. Al sincronizar la fuente de datos Amazon Kendra por primera vez, todo el contenido se rastrea e indexa de forma predeterminada. Debe ejecutar una sincronización completa de los datos si la sincronización inicial falló, incluso si no selecciona la sincronización completa como opción de modo de sincronización.
      + Sincronización completa: se vuelve a indexar todo el contenido, reemplazando el contenido existente cada vez que el origen de datos se sincronice con el índice.
      + Sincronización de lo nuevo y modificado: se indexa solo el contenido nuevo y modificado cada vez que el origen de datos se sincroniza con el índice. Amazon Kendra puede utilizar el mecanismo del origen de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido modificado desde la última sincronización.
      + Sincronización nueva, modificada o eliminada: indexe solo el contenido nuevo, modificado y eliminado cada vez que la fuente de datos se sincronice con el índice. Amazon Kendrapuede usar el mecanismo de la fuente de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido que ha cambiado desde la última sincronización.

   1. En **Programa de ejecución de sincronización**, en **Frecuencia**: la frecuencia con la que Amazon Kendra se sincronizará con el origen de datos.

   1. Elija **Siguiente**.

1. En la página **Establecer asignaciones de campos**, especifique la siguiente información:

   1. Seleccione uno de los campos de fuente de datos predeterminados generados (**Documento IDs****, Títulos** de documentos y **Fuente URLs**) que desee mapear para Amazon Kendra indexarlos.

   1.  **Agregar campo**: para agregar campos de origen de datos personalizados para crear un nombre de campo de índice al que asignarlos y el tipo de datos del campo.

   1. Elija **Siguiente**.

1. En la página **Revisar y crear**, compruebe que la información que ha introducido es correcta y, a continuación, seleccione **Añadir origen de datos**. También puede elegir editar la información desde esta página. El origen de datos aparecerá en la página **Orígenes de datos** una vez que el origen de datos se haya agregado correctamente.

------
#### [ API ]

**Para conectarse a Amazon Kendra Amazon RDS(MySQL)**

Debe especificar lo siguiente mediante la [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html)API:
+ **Origen de datos**: defina el tipo de origen de datos como `JDBC` cuando utilice el esquema JSON [https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html](https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html). Además, defina el origen de datos como `TEMPLATE` al llamar a la API [https://docs.aws.amazon.com/kendra/latest/dg/API_CreateDataSource.html](https://docs.aws.amazon.com/kendra/latest/dg/API_CreateDataSource.html).
+ **Tipo de base de datos**: debe especificar el tipo de base de datos como `mySql`.
+ **Consulta SQL**: especifique instrucciones de consulta SQL, como las operaciones SELECT y JOIN. Las consultas de SQL deben ser inferiores a 32 KB. Amazon Kendra rastreará todo el contenido de la base de datos que coincida con su consulta.
+ **Modo de sincronización**: especifique cómo Amazon Kendra debe actualizarse el índice cuando cambie el contenido de la fuente de datos. Al sincronizar el origen de datos con Amazon Kendra por primera vez, todo el contenido se rastrea y se indexa de forma predeterminada. Debe ejecutar una sincronización completa de los datos si la sincronización inicial falló, incluso si no selecciona la sincronización completa como opción de modo de sincronización. Puede elegir entre las siguientes opciones:
  + `FORCED_FULL_CRAWL` para volver a indexar todo el contenido, reemplazando el contenido existente cada vez que el origen de datos se sincronice con el índice.
  + `FULL_CRAWL` para indexar solo el contenido nuevo, modificado y eliminado cada vez que el origen de datos se sincronice con el índice. Amazon Kendra puede utilizar el mecanismo del origen de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido modificado desde la última sincronización.
  + `CHANGE_LOG` para indexar solo el contenido nuevo y modificado cada vez que el origen de datos se sincronice con el índice. Amazon Kendra puede utilizar el mecanismo del origen de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido modificado desde la última sincronización.
+ **Nombre secreto de recurso de Amazon (ARN): proporcione** el nombre de recurso de Amazon (ARN) de un Secrets Manager secreto que contenga las credenciales de autenticación que creó en su cuenta. Amazon RDS(MySQL) El secreto se almacena en una estructura JSON con las siguientes claves:

  ```
  {
      "user name": "database user name",
      "password": "password"
  }
  ```
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).
+ **IAMrol**: especifique `RoleArn` cuándo llama `CreateDataSource` para proporcionar un IAM rol con permisos para acceder a su Secrets Manager secreto y para llamar al público requerido APIs para el conector y. Amazon RDS(MySQL) Amazon Kendra Para obtener más información, consulte [Roles de IAM para orígenes de datos de Amazon RDS(MySQL)](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds).

También puede añadir las siguientes características opcionales:
+  **Nube privada virtual (VPC)**: especifique a `VpcConfiguration` cuándo llamar a `CreateDataSource`. Para obtener más información, consulte [¿Se está configurando Amazon Kendra para usar un Amazon VPC](vpc-configuration.md).
+  **Filtros de inclusión y exclusión**: puede especificar si desea incluir contenido específico mediante el usuario IDs, los grupos, la fuente URLs, las marcas horarias y las zonas horarias. 
+  **Asignaciones de campos**: elija asignar los campos del origen de datos de Amazon RDS(MySQL) a los campos de índice de Amazon Kendra. Para obtener más información, consulte [Asignación de campos de origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/field-mapping.html).
**nota**  
El campo del cuerpo del documento o el cuerpo del documento equivalente de sus documentos es obligatorio Amazon Kendra para poder buscarlos. Debe asignar el nombre del campo del cuerpo del documento en el origen de datos al nombre del campo del índice `_document_body`. Todos los demás campos son opcionales.
+  **Filtrado de contexto de usuario y control de acceso**: si hay una lista de control de acceso (ACL) para los documentos, Amazon Kendra la rastreará. La información de la ACL se utiliza para filtrar los resultados de búsqueda en función del acceso del usuario o su grupo a los documentos. Para obtener más información, consulte [Filtrado de contexto de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#datasource-context-filter).

Para obtener una lista de otras claves JSON importantes que debe configurar, consulte [Amazon RDS Esquema de plantillas (MySQL)](ds-schemas.md#ds-rds-mysql-schema).

------

## Notas

+ Las filas de la base de datos eliminadas no se registrarán cuando se Amazon Kendra compruebe si hay contenido actualizado.
+ El tamaño de los nombres y valores de los campos de una fila de la base de datos no puede superar los 400 KB.
+ Si tiene una gran cantidad de datos en la fuente de datos de la base de datos y no desea Amazon Kendra indexar todo el contenido de la base de datos después de la primera sincronización, puede optar por sincronizar solo los documentos nuevos, modificados o eliminados.
+ Como práctica recomendada, proporcione credenciales de base Amazon Kendra de datos de solo lectura.
+ Como práctica recomendada, evite añadir tablas con datos confidenciales o información de identificación personal (PII).

# Amazon RDS(Oracle)


**nota**  
El conector de Amazon RDS(Oracle) seguirá siendo totalmente compatible con los clientes actuales hasta el 31 de mayo de 2026. Si bien este conector ya no está disponible para los nuevos usuarios, los usuarios actuales pueden seguir utilizándolo sin interrupción. Desarrollamos de forma continua nuestra cartera de conectores para ofrecer soluciones más escalables y personalizables. Para futuras integraciones, le recomendamos que valore el marco de conectores personalizados de Amazon Kendra[1], diseñado de manera más flexible para una variedad más amplia de casos de uso empresariales.

Amazon RDS(Amazon Relational Database Service) es un servicio web que facilita la configuración, el funcionamiento y el escalado de una base de datos relacional en AWS la nube. Si es un Amazon RDS(Oracle) usuario, puede utilizarlo Amazon Kendra para indexar su fuente de Amazon RDS(Oracle) datos. El conector Amazon Kendra Amazon RDS(Oracle) de fuente de datos es compatible con Amazon RDS Oracle Database 21c, Oracle Database 19c y Oracle Database 12c.

Puede conectarse Amazon Kendra a su fuente de Amazon RDS(Oracle) datos mediante la [Amazon Kendraconsola y la API](https://console.aws.amazon.com/kendra/). [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html)

Para solucionar problemas del conector de la fuente de Amazon Kendra Amazon RDS(Oracle) datos, consulte[Solución de problemas con los orígenes de datos](troubleshooting-data-sources.md).

**Topics**
+ [

## Características admitidas
](#supported-features-rds-oracle)
+ [

## Requisitos previos
](#prerequisites-rds-oracle)
+ [

## Instrucciones de conexión
](#data-source-procedure-rds-oracle)
+ [

## Notas
](#rds-oracle-notes)

## Características admitidas

+ Asignaciones de campo
+ Filtrado de contexto de usuario
+ Filtros de inclusión/exclusión
+ Sincronizaciones completas e incrementales del contenido
+ Nube privada virtual (VPC)

## Requisitos previos


Antes de poder utilizarla Amazon Kendra para indexar la fuente de Amazon RDS(Oracle) datos, realice estos cambios en sus AWS cuentas Amazon RDS(Oracle) y.

**En Amazon RDS(Oracle), asegúrese de que**:
+ Ha anotado el nombre de usuario y contraseña de la base de datos.
**importante**  
Como práctica recomendada, proporcione credenciales de base Amazon Kendra de datos de solo lectura.
+ Ha copiado la URL, el puerto y la instancia del host de la base de datos.
+ Ha comprobado que cada documento es único en Amazon RDS(Oracle) y en otros orígenes de datos que vaya a utilizar para el mismo índice. Cada origen de datos que desee utilizar para un índice no debe contener el mismo documento en varios orígenes de datos. IDs Los documentos son globales para un índice y deben ser únicos por índice.

**En el tuyoCuenta de AWS, asegúrate de tener:**
+ [Creó un Amazon Kendra índice](https://docs.aws.amazon.com/kendra/latest/dg/create-index.html) y, si usa la API, anotó el ID del índice.
+ [Creó un IAM rol](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds) para su fuente de datos y, si usa la API, anotó el ARN del IAM rol.
**nota**  
Si cambias el tipo de autenticación y las credenciales, debes actualizar tu IAM rol para acceder al ID AWS Secrets Manager secreto correcto.
+ Ha guardado sus credenciales de autenticación de Amazon RDS(Oracle) en un secreto de AWS Secrets Manager y, si utiliza la API, ha anotado el ARN del secreto.
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).

Si no tiene un IAM rol o secreto existente, puede usar la consola para crear un nuevo IAM rol y un Secrets Manager secreto al conectar su fuente de Amazon RDS(Oracle) datosAmazon Kendra. Si utiliza la API, debe proporcionar el ARN de un IAM rol y un Secrets Manager secreto existentes y un ID de índice.

## Instrucciones de conexión


Para conectarse Amazon Kendra a su fuente de Amazon RDS(Oracle) datos, debe proporcionar los detalles de sus Amazon RDS(Oracle) credenciales para Amazon Kendra poder acceder a sus datos. Si aún no lo ha configuradoAmazon RDS(Oracle), Amazon Kendra consulte[Requisitos previos](#prerequisites-rds-oracle).

------
#### [ Console ]

**Para conectarse Amazon Kendra a Amazon RDS(Oracle)** 

1. Inicie sesión en la [Amazon Kendraconsola Consola de administración de AWS y ábrala](https://console.aws.amazon.com/kendra/).

1. En el panel de navegación izquierdo, elija **Índices** y, a continuación, elija el índice que desee usar de la lista de índices.
**nota**  
Puede elegir configurar o editar los ajustes de **Control de acceso de usuarios** en la **Configuración del índice**. 

1. En la página **Introducción**, seleccione **Agregar origen de datos**.

1. En la página **Agregar origen de datos**, seleccione el **Conector de Amazon RDS(Oracle)** y, a continuación, seleccione **Agregar conector**. Si usa la versión 2 (si corresponde), elija el **Conector de Amazon RDS(Oracle)** con la etiqueta “V2.0”.

1. En la página **Especificar detalles del origen de datos**, introduzca la siguiente información:

   1. En **Nombre y descripción**, en **Nombre del origen de datos**: introduzca un nombre para el origen de datos. Puede incluir guiones, pero no espacios.

   1. (Opcional)** Descripción**: introduzca una descripción opcional para el origen de datos.

   1. En **Idioma predeterminado**: elija un idioma para filtrar los documentos para el índice. A menos que especifique lo contrario, el idioma predeterminado es el inglés. El idioma especificado en los metadatos del documento anula el idioma seleccionado.

   1. En **Etiquetas**, para **añadir una nueva etiqueta**: incluye etiquetas opcionales para buscar y filtrar tus recursos o realizar un seguimiento de tus AWS costes.

   1. Elija **Siguiente**.

1. En la página **Definir acceso y seguridad**, introduzca la siguiente información:

   1. En **Origen**, introduzca la siguiente información:

   1.  **Host**: introduzca el nombre del host de la base de datos.

   1.  **Puerto**: introduzca el puerto de la base de datos.

   1.  **Instancia**: introduzca la instancia de la base de datos.

   1. **Habilitar la ubicación del certificado SSL**: elija introducir la Amazon S3 ruta al archivo de certificado SSL.

   1. En **Autenticación**, introduzca la siguiente información:

      1. **AWS Secrets Managersecreto**: elija un secreto existente o cree uno nuevo Secrets Manager para almacenar sus credenciales de Amazon RDS(Oracle) autenticación. Si decide crear un secreto nuevo, se abrirá una ventana de secreto de AWS Secrets Manager.

        1. Introduzca la siguiente información en la **ventana Crear un secreto de AWS Secrets Manager**:

           1. **Nombre del secreto**: un nombre para su secreto. El prefijo 'AmazonKendra- Amazon RDS(Oracle) -' se añade automáticamente a tu nombre secreto.

           1. Para el **nombre de usuario** y la **contraseña de la base de datos**: introduzca los valores de las credenciales de autenticación que ha copiado de la base de datos. 

        1. Seleccione **Save**.

   1. **Nube privada virtual (VPC)**: puede optar por utilizar una VPC. Si es así, debe agregar **Subredes** y **Grupos de seguridad de VPC**.

   1. **IAMrol**: elige un IAM rol existente o crea uno nuevo IAM para acceder a las credenciales del repositorio y al contenido del índice.
**nota**  
IAMlos roles utilizados para los índices no se pueden usar para las fuentes de datos. Si no está seguro de si un rol existente se utiliza para un índice o para las preguntas frecuentes, elija **Crear un nuevo rol** para evitar errores.

   1. Elija **Siguiente**.

1. En la página **Configurar ajustes de sincronización**, introduzca la siguiente información:

   1. En **Ámbito de sincronización**, seleccione de entre las siguientes opciones:
      + **Consulta SQL**: introduzca instrucciones de consulta SQL, como las operaciones SELECT y JOIN. Las consultas de SQL deben ser inferiores a 32 KB. Amazon Kendra rastreará todo el contenido de la base de datos que coincida con su consulta.
      + **Columna de clave principal**: proporcione la clave principal de la tabla de la base de datos. Esto identifica una tabla dentro de la base de datos.
      + **Columna de título**: proporcione el nombre de la columna del título del documento en la tabla de la base de datos.
      + **Columna de cuerpo**: proporcione el nombre de la columna del cuerpo del documento en la tabla de la base de datos.

   1. En **Configuración adicional (*opcional*)**, elija una de las siguientes opciones para sincronizar contenido específico en lugar de sincronizar todos los archivos:
      + **Columnas de detección de cambios**: introduzca los nombres de las columnas que se Amazon Kendra utilizarán para detectar cambios en el contenido. Amazon Kendravolverá a indexar el contenido cuando se produzca un cambio en alguna de estas columnas.
      + ** IDsColumna de usuarios**: introduzca el nombre de la columna que contiene el usuario IDs al que se le permitirá acceder al contenido.
      + **Columna de grupos**: introduzca el nombre de la columna que contiene los grupos a los que se dará acceso al contenido.
      + ** URLsColumna de origen**: introduzca el nombre de la columna que contiene el origen que se va URLs a indexar.
      + **Columna de marcas de tiempo**: introduzca el nombre de la columna que contiene las marcas de tiempo. Amazon Kendrautiliza la información de las marcas de tiempo para detectar cambios en el contenido y sincronizar solo el contenido modificado. 
      + **Columna de zonas horarias**: introduzca el nombre de la columna que contiene las zonas horarias del contenido que se va a rastrear.
      + **Formato de marcas temporales**: introduzca el nombre de la columna que contiene los formatos de marcas temporales que se deben utilizar para detectar cambios en el contenido y volver a sincronizar su contenido.

   1. **Modo de sincronización**: elija cómo desea actualizar el índice cuando cambie el contenido del origen de datos. Al sincronizar la fuente de datos Amazon Kendra por primera vez, todo el contenido se rastrea e indexa de forma predeterminada. Debe ejecutar una sincronización completa de los datos si la sincronización inicial falló, incluso si no selecciona la sincronización completa como opción de modo de sincronización.
      + Sincronización completa: se vuelve a indexar todo el contenido, reemplazando el contenido existente cada vez que el origen de datos se sincronice con el índice.
      + Sincronización de lo nuevo y modificado: se indexa solo el contenido nuevo y modificado cada vez que el origen de datos se sincroniza con el índice. Amazon Kendra puede utilizar el mecanismo del origen de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido modificado desde la última sincronización.
      + Sincronización nueva, modificada o eliminada: indexe solo el contenido nuevo, modificado y eliminado cada vez que la fuente de datos se sincronice con el índice. Amazon Kendrapuede usar el mecanismo de la fuente de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido que ha cambiado desde la última sincronización.

   1. En **Programa de ejecución de sincronización**, en **Frecuencia**: la frecuencia con la que Amazon Kendra se sincronizará con el origen de datos.

   1. Elija **Siguiente**.

1. En la página **Establecer asignaciones de campos**, especifique la siguiente información:

   1. Seleccione uno de los campos de fuente de datos predeterminados generados (**Documento IDs****, Títulos** de documentos y **Fuente URLs**) que desee mapear para Amazon Kendra indexarlos.

   1.  **Agregar campo**: para agregar campos de origen de datos personalizados para crear un nombre de campo de índice al que asignarlos y el tipo de datos del campo.

   1. Elija **Siguiente**.

1. En la página **Revisar y crear**, compruebe que la información que ha introducido es correcta y, a continuación, seleccione **Añadir origen de datos**. También puede elegir editar la información desde esta página. El origen de datos aparecerá en la página **Orígenes de datos** una vez que el origen de datos se haya agregado correctamente.

------
#### [ API ]

**Para conectarse a Amazon Kendra Amazon RDS(Oracle)**

Debe especificar lo siguiente mediante la [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html)API:
+ **Origen de datos**: defina el tipo de origen de datos como `JDBC` cuando utilice el esquema JSON [https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html](https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html). Además, defina el origen de datos como `TEMPLATE` al llamar a la API [https://docs.aws.amazon.com/kendra/latest/dg/API_CreateDataSource.html](https://docs.aws.amazon.com/kendra/latest/dg/API_CreateDataSource.html).
+ **Tipo de base de datos**: debe especificar el tipo de base de datos como `oracle`.
+ **Consulta SQL**: especifique instrucciones de consulta SQL, como las operaciones SELECT y JOIN. Las consultas de SQL deben ser inferiores a 32 KB. Amazon Kendra rastreará todo el contenido de la base de datos que coincida con su consulta.
+ **Modo de sincronización**: especifique cómo Amazon Kendra debe actualizarse el índice cuando cambie el contenido de la fuente de datos. Al sincronizar el origen de datos con Amazon Kendra por primera vez, todo el contenido se rastrea y se indexa de forma predeterminada. Debe ejecutar una sincronización completa de los datos si la sincronización inicial falló, incluso si no selecciona la sincronización completa como opción de modo de sincronización. Puede elegir entre las siguientes opciones:
  + `FORCED_FULL_CRAWL` para volver a indexar todo el contenido, reemplazando el contenido existente cada vez que el origen de datos se sincronice con el índice.
  + `FULL_CRAWL` para indexar solo el contenido nuevo, modificado y eliminado cada vez que el origen de datos se sincronice con el índice. Amazon Kendra puede utilizar el mecanismo del origen de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido modificado desde la última sincronización.
  + `CHANGE_LOG` para indexar solo el contenido nuevo y modificado cada vez que el origen de datos se sincronice con el índice. Amazon Kendra puede utilizar el mecanismo del origen de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido modificado desde la última sincronización.
+ **Nombre secreto de recurso de Amazon (ARN): proporcione** el nombre de recurso de Amazon (ARN) de un Secrets Manager secreto que contenga las credenciales de autenticación que creó en su cuenta. Amazon RDS(Oracle) El secreto se almacena en una estructura JSON con las siguientes claves:

  ```
  {
      "user name": "database user name",
      "password": "password"
  }
  ```
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).
+ **IAMrol**: especifique `RoleArn` cuándo llama `CreateDataSource` para proporcionar un IAM rol con permisos para acceder a su Secrets Manager secreto y para llamar al público requerido APIs para el conector y. Amazon RDS(Oracle) Amazon Kendra Para obtener más información, consulte [Roles de IAM para orígenes de datos de Amazon RDS(Oracle)](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds).

También puede añadir las siguientes características opcionales:
+  **Nube privada virtual (VPC)**: especifique a `VpcConfiguration` cuándo llamar a `CreateDataSource`. Para obtener más información, consulte [¿Se está configurando Amazon Kendra para usar un Amazon VPC](vpc-configuration.md).
+  **Filtros de inclusión y exclusión**: puede especificar si desea incluir contenido específico mediante el usuario IDs, los grupos, la fuente URLs, las marcas horarias y las zonas horarias. 
+  **Filtrado de contexto de usuario y control de acceso**: si hay una lista de control de acceso (ACL) para los documentos, Amazon Kendra la rastreará. La información de la ACL se utiliza para filtrar los resultados de búsqueda en función del acceso del usuario o su grupo a los documentos. Para obtener más información, consulte [Filtrado de contexto de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#datasource-context-filter).
+  **Asignaciones de campos**: elija asignar los campos del origen de datos de Amazon RDS(Oracle) a los campos de índice de Amazon Kendra. Para obtener más información, consulte [Asignación de campos de origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/field-mapping.html).
**nota**  
El campo del cuerpo del documento o el cuerpo del documento equivalente de sus documentos es obligatorio Amazon Kendra para poder buscarlos. Debe asignar el nombre del campo del cuerpo del documento en el origen de datos al nombre del campo del índice `_document_body`. Todos los demás campos son opcionales.

Para obtener una lista de otras claves JSON importantes que debe configurar, consulte [Amazon RDS Esquema de plantillas (Oracle)](ds-schemas.md#ds-rds-oracle-schema).

------

## Notas

+ Las filas de la base de datos eliminadas no se registrarán cuando se Amazon Kendra compruebe si hay contenido actualizado.
+ El tamaño de los nombres y valores de los campos de una fila de la base de datos no puede superar los 400 KB.
+ Si tiene una gran cantidad de datos en la fuente de datos de la base de datos y no desea Amazon Kendra indexar todo el contenido de la base de datos después de la primera sincronización, puede optar por sincronizar solo los documentos nuevos, modificados o eliminados.
+ Como práctica recomendada, proporcione credenciales de base Amazon Kendra de datos de solo lectura.
+ Como práctica recomendada, evite añadir tablas con datos confidenciales o información de identificación personal (PII).

# Amazon RDS(PostgreSQL)


**nota**  
El conector de Amazon RDS(PostgreSQL) seguirá siendo totalmente compatible con los clientes actuales hasta el 31 de mayo de 2026. Si bien este conector ya no está disponible para los nuevos usuarios, los usuarios actuales pueden seguir utilizándolo sin interrupción. Desarrollamos de forma continua nuestra cartera de conectores para ofrecer soluciones más escalables y personalizables. Para futuras integraciones, le recomendamos que valore el marco de conectores personalizados de Amazon Kendra[1], diseñado de manera más flexible para una variedad más amplia de casos de uso empresariales.

Amazon RDSes un servicio web que facilita la configuración, el funcionamiento y el escalado de una base de datos relacional en la AWS nube. Si es un Amazon RDS usuario, puede usarlo Amazon Kendra para indexar su fuente de Amazon RDS(PostgreSQL) datos. El conector Amazon Kendra Amazon RDS(PostgreSQL) de fuente de datos es compatible con PostgreSQL 9.6.

Puede conectarse Amazon Kendra a su fuente de Amazon RDS(PostgreSQL) datos mediante la [Amazon Kendraconsola](https://console.aws.amazon.com/kendra/) y la [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html)API.

Para solucionar problemas del conector de la fuente de Amazon Kendra Amazon RDS(PostgreSQL) datos, consulte[Solución de problemas con los orígenes de datos](troubleshooting-data-sources.md).

**Topics**
+ [

## Características admitidas
](#supported-features-rds-postgresql)
+ [

## Requisitos previos
](#prerequisites-rds-postgresql)
+ [

## Instrucciones de conexión
](#data-source-procedure-rds-postgresql)
+ [

## Notas
](#rds-postgresql-notes)

## Características admitidas

+ Asignaciones de campo
+ Filtrado de contexto de usuario
+ Filtros de inclusión/exclusión
+ Sincronizaciones completas e incrementales del contenido
+ Nube privada virtual (VPC)

## Requisitos previos


Antes de poder utilizarla Amazon Kendra para indexar la fuente de Amazon RDS(PostgreSQL) datos, realice estos cambios en sus AWS cuentas Amazon RDS(PostgreSQL) y.

**En Amazon RDS(PostgreSQL), asegúrese de que**:
+ Ha anotado el nombre de usuario y contraseña de la base de datos.
**importante**  
Como práctica recomendada, proporcione credenciales de base Amazon Kendra de datos de solo lectura.
+ Ha copiado la URL, el puerto y la instancia del host de la base de datos. Puede encontrar esta información en la Amazon RDS consola.
+ Ha comprobado que cada documento es único en Amazon RDS(PostgreSQL) y en otros orígenes de datos que vaya a utilizar para el mismo índice. Cada origen de datos que desee utilizar para un índice no debe contener el mismo documento en varios orígenes de datos. IDs Los documentos son globales para un índice y deben ser únicos por índice.

**En el tuyoCuenta de AWS, asegúrate de tener:**
+ [Creó un Amazon Kendra índice](https://docs.aws.amazon.com/kendra/latest/dg/create-index.html) y, si usa la API, anotó el ID del índice.
+ [Creó un IAM rol](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds) para su fuente de datos y, si usa la API, anotó el ARN del IAM rol.
**nota**  
Si cambias el tipo de autenticación y las credenciales, debes actualizar tu IAM rol para acceder al ID AWS Secrets Manager secreto correcto.
+ Ha guardado sus credenciales de autenticación de Amazon RDS(PostgreSQL) en un secreto de AWS Secrets Manager y, si utiliza la API, ha anotado el ARN del secreto.
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).

Si no tiene un IAM rol o secreto existente, puede usar la consola para crear un nuevo IAM rol y un Secrets Manager secreto al conectar su fuente de Amazon RDS(PostgreSQL) datosAmazon Kendra. Si utiliza la API, debe proporcionar el ARN de un IAM rol y un Secrets Manager secreto existentes y un ID de índice.

## Instrucciones de conexión


Para conectarse Amazon Kendra a su fuente de Amazon RDS(PostgreSQL) datos, debe proporcionar los detalles de sus Amazon RDS(PostgreSQL) credenciales para Amazon Kendra poder acceder a sus datos. Si aún no lo ha configuradoAmazon RDS(PostgreSQL), Amazon Kendra consulte[Requisitos previos](#prerequisites-rds-postgresql).

------
#### [ Console ]

**Para conectarse Amazon Kendra a Amazon RDS(PostgreSQL)** 

1. Inicie sesión en la [Amazon Kendraconsola Consola de administración de AWS y ábrala](https://console.aws.amazon.com/kendra/).

1. En el panel de navegación izquierdo, elija **Índices** y, a continuación, elija el índice que desee usar de la lista de índices.
**nota**  
Puede elegir configurar o editar los ajustes de **Control de acceso de usuarios** en la **Configuración del índice**. 

1. En la página **Introducción**, seleccione **Agregar origen de datos**.

1. En la página **Agregar origen de datos**, seleccione el **Conector de Amazon RDS(PostgreSQL)** y, a continuación, seleccione **Agregar conector**. Si usa la versión 2 (si corresponde), elija el **Conector de Amazon RDS(PostgreSQL)** con la etiqueta “V2.0”.

1. En la página **Especificar detalles del origen de datos**, introduzca la siguiente información:

   1. En **Nombre y descripción**, en **Nombre del origen de datos**: introduzca un nombre para el origen de datos. Puede incluir guiones, pero no espacios.

   1. (Opcional)** Descripción**: introduzca una descripción opcional para el origen de datos.

   1. En **Idioma predeterminado**: elija un idioma para filtrar los documentos para el índice. A menos que especifique lo contrario, el idioma predeterminado es el inglés. El idioma especificado en los metadatos del documento anula el idioma seleccionado.

   1. En **Etiquetas**, para **añadir una nueva etiqueta**: incluye etiquetas opcionales para buscar y filtrar tus recursos o realizar un seguimiento de tus AWS costes.

   1. Elija **Siguiente**.

1. En la página **Definir acceso y seguridad**, introduzca la siguiente información:

   1. En **Origen**, introduzca la siguiente información:

   1.  **Host**: ingrese la URL del host de la base de datos, por ejemplo: `http://instance URL.region.rds.amazonaws.com`.

   1.  **Puerto**: ingrese el puerto de la base de datos, por ejemplo, `5432`.

   1.  **Instancia**: ingrese la instancia de la base de datos, por ejemplo `postgres`.

   1. **Habilitar la ubicación del certificado SSL**: elija introducir la Amazon S3 ruta al archivo de certificado SSL.

   1. En **Autenticación**, introduzca la siguiente información:

      1. **AWS Secrets Managersecreto**: elija un secreto existente o cree uno nuevo Secrets Manager para almacenar sus credenciales de Amazon RDS(PostgreSQL) autenticación. Si decide crear un secreto nuevo, se abrirá una ventana de secreto de AWS Secrets Manager.

        1. Introduzca la siguiente información en la **ventana Crear un secreto de AWS Secrets Manager**:

           1. **Nombre del secreto**: un nombre para su secreto. El prefijo 'AmazonKendra- Amazon RDS(PostgreSQL) -' se añade automáticamente a tu nombre secreto.

           1. Para el **nombre de usuario** y la **contraseña de la base de datos**: introduzca los valores de las credenciales de autenticación que ha copiado de la base de datos. 

        1. Seleccione **Save**.

   1. **Nube privada virtual (VPC)**: puede optar por utilizar una VPC. Si es así, debe agregar **Subredes** y **Grupos de seguridad de VPC**.

   1. **IAMrol**: elige un IAM rol existente o crea uno nuevo IAM para acceder a las credenciales del repositorio y al contenido del índice.
**nota**  
IAMlos roles utilizados para los índices no se pueden usar para las fuentes de datos. Si no está seguro de si un rol existente se utiliza para un índice o para las preguntas frecuentes, elija **Crear un nuevo rol** para evitar errores.

   1. Elija **Siguiente**.

1. En la página **Configurar ajustes de sincronización**, introduzca la siguiente información:

   1. En **Ámbito de sincronización**, seleccione de entre las siguientes opciones:
      + **Consulta SQL**: introduzca instrucciones de consulta SQL, como las operaciones SELECT y JOIN. Las consultas SQL deben tener menos de 32 KB. Las consultas SQL deben tener menos de 32 KB y no contener puntos y comas (;). Amazon Kendrarastreará todo el contenido de la base de datos que coincida con su consulta.
      + **Columna de clave principal**: proporcione la clave principal de la tabla de la base de datos. Esto identifica una tabla dentro de la base de datos.
      + **Columna de título**: proporcione el nombre de la columna del título del documento en la tabla de la base de datos.
      + **Columna de cuerpo**: proporcione el nombre de la columna del cuerpo del documento en la tabla de la base de datos.

   1. En **Configuración adicional (*opcional*)**, elija una de las siguientes opciones para sincronizar contenido específico en lugar de sincronizar todos los archivos:
      + **Columnas de detección de cambios**: introduzca los nombres de las columnas que se Amazon Kendra utilizarán para detectar cambios en el contenido. Amazon Kendravolverá a indexar el contenido cuando se produzca un cambio en alguna de estas columnas.
      + ** IDsColumna de usuarios**: introduzca el nombre de la columna que contiene el usuario IDs al que se le permitirá acceder al contenido.
      + **Columna de grupos**: introduzca el nombre de la columna que contiene los grupos a los que se dará acceso al contenido.
      + ** URLsColumna de origen**: introduzca el nombre de la columna que contiene el origen que se va URLs a indexar.
      + **Columna de marcas de tiempo**: introduzca el nombre de la columna que contiene las marcas de tiempo. Amazon Kendrautiliza la información de las marcas de tiempo para detectar cambios en el contenido y sincronizar solo el contenido modificado. 
      + **Columna de zonas horarias**: introduzca el nombre de la columna que contiene las zonas horarias del contenido que se va a rastrear.
      + **Formato de marcas temporales**: introduzca el nombre de la columna que contiene los formatos de marcas temporales que se deben utilizar para detectar cambios en el contenido y volver a sincronizar su contenido.

   1. **Modo de sincronización**: elija cómo desea actualizar el índice cuando cambie el contenido del origen de datos. Al sincronizar la fuente de datos Amazon Kendra por primera vez, todo el contenido se rastrea e indexa de forma predeterminada. Debe ejecutar una sincronización completa de los datos si la sincronización inicial falló, incluso si no selecciona la sincronización completa como opción de modo de sincronización.
      + Sincronización completa: se vuelve a indexar todo el contenido, reemplazando el contenido existente cada vez que el origen de datos se sincronice con el índice.
      + Sincronización de lo nuevo y modificado: se indexa solo el contenido nuevo y modificado cada vez que el origen de datos se sincroniza con el índice. Amazon Kendra puede utilizar el mecanismo del origen de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido modificado desde la última sincronización.
      + Sincronización nueva, modificada o eliminada: indexe solo el contenido nuevo, modificado y eliminado cada vez que la fuente de datos se sincronice con el índice. Amazon Kendrapuede usar el mecanismo de la fuente de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido que ha cambiado desde la última sincronización.

   1. En **Programa de ejecución de sincronización**, en **Frecuencia**: la frecuencia con la que Amazon Kendra se sincronizará con el origen de datos.

   1. Elija **Siguiente**.

1. En la página **Establecer asignaciones de campos**, especifique la siguiente información:

   1. Seleccione uno de los campos de fuente de datos predeterminados generados (**Documento IDs****, Títulos** de documentos y **Fuente URLs**) que desee mapear para Amazon Kendra indexarlos.

   1.  **Agregar campo**: para agregar campos de origen de datos personalizados para crear un nombre de campo de índice al que asignarlos y el tipo de datos del campo.

   1. Elija **Siguiente**.

1. En la página **Revisar y crear**, compruebe que la información que ha introducido es correcta y, a continuación, seleccione **Añadir origen de datos**. También puede elegir editar la información desde esta página. El origen de datos aparecerá en la página **Orígenes de datos** una vez que el origen de datos se haya agregado correctamente.

------
#### [ API ]

**Para conectarse a Amazon Kendra Amazon RDS(PostgreSQL)**

Debe especificar lo siguiente mediante la [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html)API:
+ **Origen de datos**: defina el tipo de origen de datos como `JDBC` cuando utilice el esquema JSON [https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html](https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html). Además, defina el origen de datos como `TEMPLATE` al llamar a la API [https://docs.aws.amazon.com/kendra/latest/dg/API_CreateDataSource.html](https://docs.aws.amazon.com/kendra/latest/dg/API_CreateDataSource.html).
+ **Tipo de base de datos**: debe especificar el tipo de base de datos como `postgresql`.
+ **Consulta SQL**: especifique instrucciones de consulta SQL, como las operaciones SELECT y JOIN. Las consultas de SQL deben ser inferiores a 32 KB. Amazon Kendra rastreará todo el contenido de la base de datos que coincida con su consulta.
+ **Modo de sincronización**: especifique cómo Amazon Kendra debe actualizarse el índice cuando cambie el contenido de la fuente de datos. Al sincronizar el origen de datos con Amazon Kendra por primera vez, todo el contenido se rastrea y se indexa de forma predeterminada. Debe ejecutar una sincronización completa de los datos si la sincronización inicial falló, incluso si no selecciona la sincronización completa como opción de modo de sincronización. Puede elegir entre las siguientes opciones:
  + `FORCED_FULL_CRAWL` para volver a indexar todo el contenido, reemplazando el contenido existente cada vez que el origen de datos se sincronice con el índice.
  + `FULL_CRAWL` para indexar solo el contenido nuevo, modificado y eliminado cada vez que el origen de datos se sincronice con el índice. Amazon Kendra puede utilizar el mecanismo del origen de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido modificado desde la última sincronización.
  + `CHANGE_LOG` para indexar solo el contenido nuevo y modificado cada vez que el origen de datos se sincronice con el índice. Amazon Kendra puede utilizar el mecanismo del origen de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido modificado desde la última sincronización.
+ **Nombre secreto de recurso de Amazon (ARN): proporcione** el nombre de recurso de Amazon (ARN) de un Secrets Manager secreto que contenga las credenciales de autenticación que creó en su cuenta. Amazon RDS(PostgreSQL) El secreto se almacena en una estructura JSON con las siguientes claves:

  ```
  {
      "user name": "database user name",
      "password": "password"
  }
  ```
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).
+ **IAMrol**: especifique `RoleArn` cuándo llama `CreateDataSource` para proporcionar un IAM rol con permisos para acceder a su Secrets Manager secreto y para llamar al público requerido APIs para el conector y. Amazon RDS(PostgreSQL) Amazon Kendra Para obtener más información, consulte [Roles de IAM para orígenes de datos de Amazon RDS(PostgreSQL)](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds).

También puede añadir las siguientes características opcionales:
+  **Nube privada virtual (VPC)**: especifique a `VpcConfiguration` cuándo llamar a `CreateDataSource`. Para obtener más información, consulte [¿Se está configurando Amazon Kendra para usar un Amazon VPC](vpc-configuration.md).
+  **Filtros de inclusión y exclusión**: puede especificar si desea incluir contenido específico mediante el usuario IDs, los grupos, la fuente URLs, las marcas horarias y las zonas horarias.
+  **Filtrado de contexto de usuario y control de acceso**: si hay una lista de control de acceso (ACL) para los documentos, Amazon Kendra la rastreará. La información de la ACL se utiliza para filtrar los resultados de búsqueda en función del acceso del usuario o su grupo a los documentos. Para obtener más información, consulte [Filtrado de contexto de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#datasource-context-filter).
+  **Asignaciones de campos**: elija asignar los campos del origen de datos de Amazon RDS(PostgreSQL) a los campos de índice de Amazon Kendra. Para obtener más información, consulte [Asignación de campos de origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/field-mapping.html).
**nota**  
El campo del cuerpo del documento o el cuerpo del documento equivalente de sus documentos es obligatorio Amazon Kendra para poder buscarlos. Debe asignar el nombre del campo del cuerpo del documento en el origen de datos al nombre del campo del índice `_document_body`. Todos los demás campos son opcionales.

Para obtener una lista de otras claves JSON importantes que debe configurar, consulte [Amazon RDS Esquema de plantillas (PostgreSQL)](ds-schemas.md#ds-rds-postgresql-schema).

------

## Notas

+ Las filas de la base de datos eliminadas no se registrarán cuando se Amazon Kendra compruebe si hay contenido actualizado.
+ El tamaño de los nombres y valores de los campos de una fila de la base de datos no puede superar los 400 KB.
+ Si tiene una gran cantidad de datos en la fuente de datos de la base de datos y no desea Amazon Kendra indexar todo el contenido de la base de datos después de la primera sincronización, puede optar por sincronizar solo los documentos nuevos, modificados o eliminados.
+ Como práctica recomendada, proporcione credenciales de base Amazon Kendra de datos de solo lectura.
+ Como práctica recomendada, evite añadir tablas con datos confidenciales o información de identificación personal (PII).

# Amazon S3


Amazon S3 es un servicio de almacenamiento de objetos que almacena datos como objetos dentro de cubos. Puedes usarlo Amazon Kendra para indexar el repositorio de documentos de tu Amazon S3 depósito.

**aviso**  
Amazon Kendra no utiliza una política de bucket que conceda permisos a un Amazon Kendra director para interactuar con un bucket de S3. En su lugar, usa IAM roles. Asegúrate de Amazon Kendra no incluirlo como miembro de confianza en tu política de grupos para evitar problemas de seguridad de los datos si se conceden permisos accidentalmente a directores arbitrarios. Sin embargo, puede añadir una política de bucket para utilizar un bucket de Amazon S3 en distintas cuentas. Para obtener más información, consulte [Políticas para usar Amazon S3 en varias cuentas](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds-s3-cross-accounts) (en la pestaña de roles de IAM de S3, en la sección **Roles de IAM para orígenes de datos**). Para obtener información sobre las IAM funciones de las fuentes de datos de S3, consulte las [IAM funciones](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds-s3).

**nota**  
Amazon Kendra ahora es compatible con un Amazon S3 conector actualizado.  
La consola se ha actualizado de forma automática. Todos los conectores nuevos que cree en la consola utilizarán la arquitectura actualizada. Si usa la API, ahora debe usar el objeto [https://docs.aws.amazon.com/kendra/latest/APIReference/API_TemplateConfiguration.html](https://docs.aws.amazon.com/kendra/latest/APIReference/API_TemplateConfiguration.html) en lugar del objeto `S3DataSourceConfiguration` para configurar el conector.  
Los conectores configurados con la antigua arquitectura de consola y API seguirán funcionando tal y como estaban configurados. Sin embargo, no podrá editarlos ni actualizarlos. Si desea editar o actualizar la configuración de un conector, deberá crear uno nuevo.  
Se recomienda migrar el flujo de trabajo de los conectores a la versión actualizada. Está previsto que la compatibilidad para los conectores configurados con la arquitectura anterior finalice en junio de 2024.

Puede conectarse a su fuente de Amazon S3 datos mediante la [Amazon Kendra consola](https://console.aws.amazon.com/kendra/) o la [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_TemplateConfiguration.html)API.

**nota**  
Para generar un informe de estado de sincronización para su fuente de Amazon S3 datos, consulte [Solución de problemas con las fuentes de datos](https://docs.aws.amazon.com/kendra/latest/dg/troubleshooting-data-sources.html#troubleshooting-data-sources-sync-status-manifest).

Para solucionar problemas del conector de fuente de datos Amazon Kendra S3, consulte[Solución de problemas con los orígenes de datos](troubleshooting-data-sources.md).

**Topics**
+ [

## Características admitidas
](#supported-features-s3)
+ [

## Requisitos previos
](#prerequisites-s3)
+ [

## Instrucciones de conexión
](#data-source-procedure-s3)
+ [

# Creación de una fuente Amazon S3 de datos
](create-ds-s3.md)
+ [

# Amazon S3 metadatos del documento
](s3-metadata.md)
+ [

# Control de acceso a las fuentes de Amazon S3 datos
](s3-acl.md)
+ [

# Amazon VPC Utilizándolo con una fuente Amazon S3 de datos
](s3-vpc-example-1.md)

## Características admitidas

+ Asignaciones de campo
+ Control de acceso de usuarios
+ Filtros de inclusión/exclusión
+ Sincronizaciones completas e incrementales del contenido
+ Nube privada virtual (VPC)

## Requisitos previos


Antes de poder utilizarla Amazon Kendra para indexar la fuente de datos de S3, realice estos cambios en su S3 y en sus AWS cuentas.

**En S3, asegúrese de que**:
+ Copiaste el nombre de tu Amazon S3 bucket.
**nota**  
El depósito debe estar en la misma región que el Amazon Kendra índice y el índice debe tener permiso para acceder al depósito que contiene los documentos.
+ Ha comprobado que cada documento es único en S3 y en otros orígenes de datos que vaya a utilizar para el mismo índice. Cada origen de datos que desee utilizar para un índice no debe contener el mismo documento en varios orígenes de datos. IDs Los documentos son globales con respecto a un índice y deben ser únicos por índice.

**En su AWS cuenta, asegúrese de tener:**
+ [Creó un Amazon Kendra índice](https://docs.aws.amazon.com/kendra/latest/dg/create-index.html) y, si utiliza la API, anotó el ID del índice.
+ [Creó un IAM rol](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds) para su fuente de datos y, si usa la API, anotó el ARN del IAM rol.

Si no tiene un IAM rol existente, puede usar la consola para crear un nuevo IAM rol al conectar su fuente de datos de S3. Amazon Kendra Si utiliza la API, debe proporcionar el ARN de un IAM rol existente y un ID de índice.

## Instrucciones de conexión


Para conectarse Amazon Kendra a la fuente de datos de S3, debe proporcionar los detalles necesarios de la fuente de datos de S3 para Amazon Kendra poder acceder a los datos. Si aún no ha configurado S3 para Amazon Kendra, consulte[Requisitos previos](#prerequisites-s3).

------
#### [ Console ]

**Para conectarse Amazon Kendra a Amazon S3 ** 

1. Inicie sesión en la [Amazon Kendra consola Consola de administración de AWS y ábrala](https://console.aws.amazon.com/kendra/).

1. En el panel de navegación izquierdo, elija **Índices** y, a continuación, elija el índice que desee usar de la lista de índices.
**nota**  
Puede elegir configurar o editar los ajustes de **Control de acceso de usuarios** en la **Configuración del índice**. 

1. En la página **Introducción**, seleccione **Agregar origen de datos**.

1. En la página **Agregar origen de datos**, seleccione el **Conector de S3** y, a continuación, seleccione **Agregar conector**. Si usa la versión 2 (si corresponde), elija el **Conector de S3** con la etiqueta “V2.0”.

1. En la página **Especificar detalles del origen de datos**, introduzca la siguiente información:

   1. En **Nombre y descripción**, en **Nombre del origen de datos**: introduzca un nombre para el origen de datos. Puede incluir guiones, pero no espacios.

   1. (Opcional)** Descripción**: introduzca una descripción opcional para el origen de datos.

   1. En **Idioma predeterminado**: elija un idioma para filtrar los documentos para el índice. A menos que especifique lo contrario, el idioma predeterminado es el inglés. El idioma especificado en los metadatos del documento anula el idioma seleccionado.

   1. En **Etiquetas**, para **añadir una nueva etiqueta**: incluye etiquetas opcionales para buscar y filtrar tus recursos o realizar un seguimiento de tus AWS costes.

   1. Elija **Siguiente**.

1. En la página **Definir acceso y seguridad**, introduzca la siguiente información opcional:

   1. **IAM rol**: elija un IAM rol existente o cree uno nuevo IAM para acceder a las credenciales de su repositorio e indexar el contenido.
**nota**  
IAM los roles utilizados para los índices no se pueden usar para las fuentes de datos. Si no está seguro de si un rol existente se utiliza para un índice o para las preguntas frecuentes, elija **Crear un nuevo rol** para evitar errores.

   1. **Nube privada virtual (VPC)**: puede optar por utilizar una VPC. Si es así, debe agregar **Subredes** y **Grupos de seguridad de VPC**.

   1. Elija **Siguiente**.

1. En la página **Configurar ajustes de sincronización**, introduzca la siguiente información:

   1. En **Ubicación de origen de datos**: especifique la ruta al bucket de Amazon S3 donde se almacenan los datos. Seleccione **Examinar S3** para elegir el bucket de S3.

   1. En **Tamaño máximo de archivo**: especifique un límite en MB para rastrear solo los archivos que estén por debajo de este límite. El tamaño máximo de archivo Amazon Kendra permitido es de 50 MB.

   1. Para **los archivos de metadatos (opcionales), prefija la ubicación de la carpeta**: especifique la ruta a la carpeta en la que se almacenan sus metadatos fields/attributes y los de otros documentos. Seleccione **Examinar S3** para localizar la carpeta de metadatos.

   1. (Opcional) En **Ubicación del archivo de configuración de la lista de control de acceso**: especifique la ruta al archivo que contiene una estructura JSON de sus usuarios y su acceso a los documentos. Seleccione **Examinar S3** para localizar el archivo de la ACL.

   1. (Opcional) **Seleccionar clave de descifrado**: seleccione esta opción para usar una clave de descifrado. Puede elegir usar una clave de AWS KMS existente.

   1. (Opcional) En **Configuración adicional**: agregue patrones para incluir o excluir determinados archivos. Todas las rutas se expresan con relación al bucket de S3 de ubicación del origen de datos.

   1. **Modo de sincronización**: elija cómo desea actualizar el índice cuando cambie el contenido del origen de datos. Al sincronizar la fuente de datos Amazon Kendra por primera vez, todo el contenido se rastrea e indexa de forma predeterminada. Debe ejecutar una sincronización completa de los datos si la sincronización inicial falló, incluso si no selecciona la sincronización completa como opción de modo de sincronización.
      + Sincronización completa: se vuelve a indexar todo el contenido, reemplazando el contenido existente cada vez que el origen de datos se sincronice con el índice.
      + Sincronización nueva, modificada o eliminada: indexe solo el contenido nuevo, modificado y eliminado cada vez que la fuente de datos se sincronice con el índice. Amazon Kendra puede usar el mecanismo de la fuente de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido que ha cambiado desde la última sincronización.

   1. En **Programación de ejecución de sincronización**, en **Frecuencia**: elija la frecuencia con la que desea sincronizar el contenido del origen de datos y actualizar el índice.

   1. Elija **Siguiente**.

1. En la página **Establecer asignaciones de campos**, especifique la siguiente información opcional:

   1. **Asignaciones de campos predeterminadas: seleccione entre las** fuentes de datos predeterminadas Amazon Kendra generadas los campos que desee asignar a su índice. 

   1.  **Agregar campo**: elija esta opción para agregar campos de origen de datos personalizados para crear un nombre de campo de índice al que asignarlos y el tipo de datos del campo.

   1. Elija **Siguiente**.

1. En la página **Revisar y crear**, compruebe que la información que ha introducido es correcta y, a continuación, seleccione **Añadir origen de datos**. También puede elegir editar la información desde esta página. El origen de datos aparecerá en la página **Orígenes de datos** una vez que el origen de datos se haya agregado correctamente.

------
#### [ API ]

**Para conectarse a Amazon Kendra Amazon S3**

Debe especificar un JSON del [esquema del origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/ds-schemas.html) mediante la API [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_TemplateConfiguration.html). Debe proporcionar la siguiente información:
+ **Origen de datos**: defina el tipo de origen de datos como `S3` cuando utilice el esquema JSON [https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html](https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html). Además, defina el origen de datos como `TEMPLATE` al llamar a la API [https://docs.aws.amazon.com/kendra/latest/dg/API_CreateDataSource.html](https://docs.aws.amazon.com/kendra/latest/dg/API_CreateDataSource.html).
+ **BucketName**—El nombre del depósito que contiene los documentos.
+ **Modo de sincronización**: especifique cómo Amazon Kendra debe actualizarse el índice cuando cambie el contenido de la fuente de datos. Al sincronizar el origen de datos con Amazon Kendra por primera vez, todo el contenido se rastrea y se indexa de forma predeterminada. Debe ejecutar una sincronización completa de los datos si la sincronización inicial falló, incluso si no selecciona la sincronización completa como opción de modo de sincronización. Puede elegir entre las siguientes opciones:
  + `FORCED_FULL_CRAWL` para volver a indexar todo el contenido, reemplazando el contenido existente cada vez que el origen de datos se sincronice con el índice.
  + `FULL_CRAWL` para indexar solo el contenido nuevo, modificado y eliminado cada vez que el origen de datos se sincronice con el índice. Amazon Kendra puede utilizar el mecanismo del origen de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido modificado desde la última sincronización.
+ **IAM rol**: especifique `RoleArn` cuándo llama `CreateDataSource` para proporcionar un IAM rol con permisos para acceder a su Secrets Manager secreto y para llamar al público requerido APIs para el conector S3 y. Amazon Kendra Para obtener más información, consulte [Roles de IAM para orígenes de datos de S3](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds).

También puede añadir las siguientes características opcionales:
+  **Nube privada virtual (VPC)**: especifique a `VpcConfiguration` cuándo llamar a `CreateDataSource`. Para obtener más información, consulte [¿Se está configurando Amazon Kendra para usar un Amazon VPC](vpc-configuration.md).
+  **Filtros de inclusión y exclusión**: especifique si desea incluir o excluir determinados nombres de archivos, tipos de archivos o rutas de archivos. Utilice patrones globales (patrones que pueden expandir un patrón comodín para convertirlo en una lista de nombres de rutas que coincidan con el patrón dado). Para ver ejemplos, consulte [Uso de filtros de exclusión e inclusión](https://docs.aws.amazon.com/cli/latest/reference/s3/#use-of-exclude-and-include-filters) en la referencia de comandos de la AWS CLI. 
+ **Configuración de metadatos de documentos y control de acceso**: agregue archivos de metadatos de documentos y control de acceso que contienen información como la URI de origen, el autor del documento o campos y atributos de documentos personalizados, así como los usuarios y a qué documentos pueden acceder. Cada archivo de metadatos contiene metadatos sobre un solo documento.
+  **Asignaciones de campos**: elija asignar los campos del origen de datos de S3 a los campos de índice de Amazon Kendra . Para obtener más información, consulte [Asignación de campos de origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/field-mapping.html).
**nota**  
El campo del cuerpo del documento o el cuerpo del documento equivalente de sus documentos es obligatorio Amazon Kendra para poder buscarlos. Debe asignar el nombre del campo del cuerpo del documento en el origen de datos al nombre del campo del índice `_document_body`. Todos los demás campos son opcionales.

Para obtener una lista de otras claves JSON importantes que debe configurar, consulte el [Esquema de plantilla de S3](https://docs.aws.amazon.com/kendra/latest/dg/ds-schemas.html#ds-s3-schema).

------

### Más información


Para obtener más información sobre la integración Amazon Kendra con la fuente de datos de S3, consulte:
+ [Busque respuestas con precisión mediante el conector Amazon Kendra S3 compatible con VPC](https://aws.amazon.com/blogs/machine-learning/search-for-answers-accurately-using-amazon-kendra-s3-connector-with-vpc-support/)

# Creación de una fuente Amazon S3 de datos


Los siguientes ejemplos muestran la creación de una fuente de Amazon S3 datos. En los ejemplos se supone que ya ha creado un índice y un IAM rol con permiso para leer los datos del índice. Para obtener más información sobre el IAM rol, consulte [roles de IAM acceso](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds). Para obtener más información acerca de cómo crear un índice, consulte [Creación de un índice](https://docs.aws.amazon.com/kendra/latest/dg/create-index.html).

------
#### [ CLI ]

```
aws kendra create-data-source \
 --index-id index ID \
 --name example-data-source \
 --type S3 \
 --configuration '{"S3Configuration":{"BucketName":"bucket name"}}' 
 --role-arn 'arn:aws:iam::account id:role:/role name
```

------
#### [ Python ]

El siguiente fragmento de código Python crea una fuente de Amazon S3 datos. Para ver el ejemplo completo, consulte [Introducción (AWS SDK para Python (Boto3))](gs-python.md).

```
print("Create an Amazon S3 data source.")
    
    # Provide a name for the data source
    name = "getting-started-data-source"
    # Provide an optional description for the data source
    description = "Getting started data source."
    # Provide the IAM role ARN required for data sources
    role_arn = "arn:aws:iam::${accountID}:role/${roleName}"
    # Provide the data soource connection information
    s3_bucket_name = "S3-bucket-name"
    type = "S3"
    # Configure the data source
    configuration = {"S3DataSourceConfiguration":
        {
            "BucketName": s3_bucket_name
        }
    }

    data_source_response = kendra.create_data_source(
        Configuration = configuration,
        Name = name,
        Description = description,
        RoleArn = role_arn,
        Type = type,
        IndexId = index_id
    )
```

------

La creación del origen de datos puede tardar algún tiempo. Puede supervisar el progreso mediante la [DescribeDataSource](https://docs.aws.amazon.com/kendra/latest/APIReference/API_DescribeDataSource.html)API. Cuando el estado del origen de datos es `ACTIVE`, está listo para usarse. 

Los siguientes ejemplos muestran cómo obtener el estado de un origen de datos.

------
#### [ CLI ]

```
aws kendra describe-data-source \
 --index-id index ID \
 --id data source ID
```

------
#### [ Python ]

El siguiente fragmento de código Python obtiene información sobre un origen de datos de S3. Para ver el ejemplo completo, consulte [Introducción (AWS SDK para Python (Boto3))](gs-python.md).

```
print("Wait for Amazon Kendra to create the data source.")

    while True:
        data_source_description = kendra.describe_data_source(
            Id = "data-source-id",
            IndexId = "index-id"
        )
        status = data_source_description["Status"]
        print(" Creating data source. Status: "+status)
        time.sleep(60)
        if status != "CREATING":
            break
```

------

Este origen de datos no tiene una programación, por lo que no se ejecuta automáticamente. Para indexar la fuente de datos, llame [StartDataSourceSyncJob](https://docs.aws.amazon.com/kendra/latest/APIReference/API_StartDataSourceSyncJob.html)para sincronizar el índice con la fuente de datos.

Los siguientes ejemplos muestran la sincronización de un origen de datos.

------
#### [ CLI ]

```
aws kendra start-data-source-sync-job \
 --index-id index ID \
 --id data source ID
```

------
#### [ Python ]

El siguiente fragmento de código Python sincroniza un origen de datos de Amazon S3 . Para ver el ejemplo completo, consulte [Introducción (AWS SDK para Python (Boto3))](gs-python.md).

```
print("Synchronize the data source.")

    sync_response = kendra.start_data_source_sync_job(
        Id = "data-source-id",
        IndexId = "index-id"
    )
```

------

# Amazon S3 metadatos del documento


Puede añadir metadatos (información adicional sobre un documento) a los documentos de un bucket de Amazon S3 mediante un archivo de metadatos. Cada archivo de metadatos está asociado a un documento indexado. 

Los archivos de metadatos deben almacenarse en el mismo bucket que los archivos indexados. Puede especificar una ubicación dentro del depósito para sus archivos de metadatos mediante la consola o el `S3Prefix` campo del `DocumentsMetadataConfiguration` parámetro al crear una fuente de Amazon S3 datos. Si no especifica un prefijo de Amazon S3 , los archivos de metadatos deben almacenarse en la misma ubicación que los documentos indexados.

Si especifica un Amazon S3 prefijo para los archivos de metadatos, estarán en una estructura de directorios paralela a los documentos indexados. Amazon Kendra busca sus metadatos únicamente en el directorio especificado. Si no se leen los metadatos, compruebe que la ubicación del directorio coincide con la ubicación de los metadatos.

En los siguientes ejemplos se muestra cómo la ubicación del documento indexado se asigna a la ubicación del archivo de metadatos. Tenga en cuenta que la Amazon S3 clave del documento se añade al Amazon S3 prefijo de los metadatos y, a continuación, se añade el sufijo con el sufijo `.metadata.json` para formar la ruta del archivo de metadatos. Amazon S3 La Amazon S3 clave combinada, con el Amazon S3 prefijo y el `.metadata.json` sufijo de los metadatos, no debe tener más de 1024 caracteres en total. Se recomienda mantener la Amazon S3 clave por debajo de los 1000 caracteres para tener en cuenta los caracteres adicionales al combinar la clave con el prefijo y el sufijo.

```
Bucket name:
     s3://bucketName
Document path:
     documents
Metadata path:
     none
File mapping
     s3://bucketName/documents/file.txt -> 
        s3://bucketName/documents/file.txt.metadata.json
```

```
Bucket name:
     s3://bucketName
Document path:
     documents/legal
Metadata path:
     metadata
File mapping
     s3://bucketName/documents/legal/file.txt -> 
        s3://bucketName/metadata/documents/legal/file.txt.metadata.json
```

Los metadatos del documento se definen en un archivo JSON. El archivo debe ser un archivo de texto UTF-8 sin un marcador BOM. El nombre del archivo JSON debe ser `<document>.<extension>.metadata.json`. En este ejemplo, “document” es el nombre del documento al que se aplican los metadatos y “extension” es la extensión de archivo del documento. El ID del documento debe ser único en `<document>.<extension>.metadata.json`.

El contenido del archivo JSON sigue esta plantilla. Todos attributes/fields son opcionales, por lo que no es necesario incluir todos los atributos. Debe proporcionar un valor para cada atributo que desee incluir; el valor no puede estar vacío. Si no lo especificas`_source_uri`, los enlaces que aparecen Amazon Kendra en los resultados de la búsqueda apuntan al Amazon S3 depósito que contiene el documento. `DocumentId`se asigna al campo `s3_document_id` y es la ruta absoluta al documento en S3.

```
{
    "DocumentId": "S3 document ID, the S3 path to doc",
    "Attributes": {
        "_category": "document category",
        "_created_at": "ISO 8601 encoded string",
        "_last_updated_at": "ISO 8601 encoded string",
        "_source_uri": "document URI",
        "_version": "file version",
        "_view_count": number of times document has been viewed,
        "custom attribute key": "custom attribute value",
        additional custom attributes
    },
    "AccessControlList": [
         {
             "Name": "user name",
             "Type": "GROUP | USER",
             "Access": "ALLOW | DENY"
         }
    ],
    "Title": "document title",
    "ContentType": "For example HTML | PDF. For supported content types, see [Types of documents](https://docs.aws.amazon.com/kendra/latest/dg/index-document-types.html)."
}
```

Los campos de metadatos `_created_at` y `_last_updated_at` son fechas codificadas según la norma ISO 8601. Por ejemplo, 2012-03-25T12:30:10\$101:00 es el formato de fecha y hora ISO 8601 para el 25 de marzo de 2012, a las 12.30 h (más 10 segundos) en la zona horaria de Europa Central.

Puede añadir información adicional al campo `Attributes` sobre un documento que utilice para filtrar consultas o agrupar las respuestas a las consultas. Para obtener más información, consulte [Creación de campos de documento personalizados](custom-attributes.md).

Puede utilizar el campo `AccessControlList` para filtrar la respuesta de una consulta. De esta forma, solo determinados usuarios y grupos tienen acceso a los documentos. Para obtener más información, consulte [Filtrar por contexto de usuario](user-context-filter.md).

# Control de acceso a las fuentes de Amazon S3 datos


Puede controlar el acceso a los documentos de una fuente de Amazon S3 datos mediante un archivo de configuración. El archivo se especifica en la consola o como `AccessControlListConfiguration` parámetro cuando se llama a la [UpdateDataSource](https://docs.aws.amazon.com/kendra/latest/APIReference/API_UpdateDataSource.html)API [CreateDataSource](https://docs.aws.amazon.com/kendra/latest/APIReference/API_CreateDataSource.html)o.

El archivo de configuración contiene una estructura JSON que identifica un prefijo S3 y enumera la configuración de acceso del prefijo. El prefijo puede ser una ruta o un archivo individual. Si el prefijo es una ruta, la configuración de acceso se aplica a todos los archivos de esa ruta. Hay un número máximo de prefijos S3 en el archivo de configuración JSON y un tamaño de archivo máximo predeterminado. Para obtener más información, consulte [Cuotas para Amazon Kendra](quotas.md)

En la configuración de acceso, se pueden especificar tanto los usuarios como los grupos. Cuando se consulta el índice, se especifica la información del usuario y del grupo. Para obtener más información, consulte [Filtrado por atributo de usuario](user-context-filter.md#context-filter-attribute).

La estructura JSON del archivo de configuración debe tener el siguiente formato:

```
[
    {
        "keyPrefix": "s3://BUCKETNAME/prefix1/",
        "aclEntries": [
            {
                "Name": "user1",
                "Type": "USER",
                "Access": "ALLOW"
            },
            {
                "Name": "group1",
                "Type": "GROUP",
                "Access": "DENY"
            }
        ]
    },
    {
        "keyPrefix": "s3://prefix2",
        "aclEntries": [
            {
                "Name": "user2",
                "Type": "USER",
                "Access": "ALLOW"
            },
            {
                "Name": "user1",
                "Type": "USER",
                "Access": "DENY"
            },
            {
                "Name": "group1",
                "Type": "GROUP",
                "Access": "DENY"
            }
        ]
    }
]
```

# Amazon VPC Utilizándolo con una fuente Amazon S3 de datos
Utilizándolo Amazon VPC con Amazon S3

En este tema se proporciona un step-by-step ejemplo que muestra cómo conectarse a un bucket de Amazon S3 mediante un conector de Amazon S3 a través de Amazon VPC. En el ejemplo se supone que parte de un bucket de S3 existente. Le recomendamos que cargue solo algunos documentos en su bucket de S3 para probar el ejemplo.

Puedes conectarte Amazon Kendra a tu Amazon S3 bucket a través Amazon VPC de. Para ello, debe especificar la Amazon VPC subred y los grupos de Amazon VPC seguridad al crear el conector de la fuente de Amazon S3 datos.

**importante**  
Para que un Amazon Kendra Amazon S3 conector pueda acceder a su Amazon S3 depósito, asegúrese de haber asignado un Amazon S3 punto final a su nube privada virtual (VPC).

 Amazon Kendra Para sincronizar los documentos de su Amazon S3 depósito Amazon VPC, debe completar los siguientes pasos:
+ Configura un Amazon S3 punto final para Amazon VPC. Para obtener más información sobre cómo configurar un Amazon S3 punto final, consulte los [puntos finales de puerta de enlace Amazon S3](https://docs.aws.amazon.com/vpc/latest/privatelink/vpc-endpoints-s3.html) en la *AWS PrivateLink guía*.
+ (Opcional) Comprobó las políticas de su Amazon S3 bucket para asegurarse de que se pueda acceder al Amazon S3 bucket desde la nube privada virtual (VPC) a la que lo asignó. Amazon Kendra Para obtener más información, consulte [Control del acceso desde puntos de conexión de VPC con políticas de bucket](https://docs.aws.amazon.com/AmazonS3/latest/userguide/example-bucket-policies-vpc-endpoint.html) en la *Guía del usuario de Amazon S3*.

**Topics**
+ [

## Paso 1: Configurar una Amazon VPC
](#s3-configure-vpc)
+ [

## (Opcional) Paso 2: configurar la política Amazon S3 de bucket
](#s3-configure-bucket-policy)
+ [

## Paso 3: Cree un conector de fuente Amazon S3 de datos de prueba
](#s3-connect-vpc)

## Paso 1: Configurar una Amazon VPC


Cree una red de VPC que incluya una subred privada con un punto final de Amazon S3 puerta de enlace y un grupo de seguridad Amazon Kendra para utilizarla más adelante.

**Cómo configurar una VPC con una subred privada, un punto de conexión de S3 y un grupo de seguridad**

1. Inicie sesión en Consola de administración de AWS y abra la Amazon VPC consola en. [https://console.aws.amazon.com/vpc/](https://console.aws.amazon.com/vpc/)

1. **Cree una VPC con una subred privada y un punto de conexión S3 para Amazon Kendra usar:**

   En el panel de navegación, elija **Su** y VPCs, a continuación, elija **Crear VPC**.

   1. En **Recursos para crear**, elija **VPC y más**.

   1. En **Etiqueta de nombre**, habilite **Generación automática** y, a continuación, introduzca **kendra-s3-example**.

   1. Para el **bloqueIPv4 / IPv6 CIDR**, mantenga los valores predeterminados.

   1. En **Número de zonas de disponibilidad (AZs)**, elija el **número 1**.

   1. Seleccione **Personalizar** y AZs, a continuación, seleccione una zona de disponibilidad de la lista **Primera zona de disponibilidad**.

      Amazon Kendra solo admite un conjunto específico de zonas de disponibilidad.

   1. Para **Número de subredes públicas**, elija el **número 0**.

   1. Para **Número de subredes privadas**, elija el **número 1**.

   1. Para **NAT gateways** (puertas de enlace NAT), elija **None** (Ninguna).

   1. Para los **puntos de conexión de VPC**, elija **Puerta de enlace de Amazon S3 **.

   1. Deje el resto de los ajustes con sus valores predeterminados.

   1. Seleccione **Create VPC** (Crear VPC).

      Espere a que finalice el flujo de trabajo de **Crear VPC**. A continuación, elija **Ver VPC** para comprobar la **VPC** que acaba de crear.

   Ahora ha creado una red de VPC con una subred privada que no tiene acceso a la internet pública.

1. **Copie el ID de punto de conexión de VPC de su punto de conexión de Amazon S3:**

   1. En el panel de navegación, elija **Puntos de conexión**.

   1. En la lista **Puntos de conexión**, busque el punto de conexión de Amazon S3 `kendra-s3-example-vpce-s3` que acaba de crear junto con su VPC.

   1. Anote el **ID del punto de conexión de VPC**.

   Ya ha creado un punto de conexión de puerta de enlace de Amazon S3 para acceder a su bucket de Amazon S3 a través de una subred.

1. **Cree un **grupo de seguridad** para que Amazon Kendra lo utilice:**

   1. En el panel de navegación, elija **Grupos de seguridad** y, a continuación, elija **Crear un grupo de seguridad**.

   1. En **Nombre del grupo de seguridad**, introduzca **s3-data-source-security-group**.

   1. Elija su VPC en la lista de **Amazon VPC**.

   1. Deje las **reglas de entrada** y las **reglas de salida** como predeterminadas.

   1. Elija **Creación de grupo de seguridad**.

   Ya ha creado un grupo de seguridad de VPC.

Usted asigna la subred y el grupo de seguridad que creó a su conector de fuente de datos de Amazon Kendra Amazon S3 durante el proceso de configuración del conector.

## (Opcional) Paso 2: configurar la política Amazon S3 de bucket


En este paso opcional, aprenda a configurar una política de bucket de Amazon S3 para que solo se pueda acceder a su bucket de Amazon S3 desde la VPC que asigne a Amazon Kendra.

Amazon Kendra utiliza funciones de IAM para acceder a su bucket de Amazon S3 y no requiere que configure una política de bucket de Amazon S3. Sin embargo, puede resultarle útil crear una política de bucket si quiere configurar un Amazon S3 conector mediante un bucket de Amazon S3 que tenga políticas existentes que restrinjan el acceso a él desde la Internet pública.

**Para configurar su política Amazon S3 de bucket**

1. Abra la consola de Amazon S3 en [https://console.aws.amazon.com/s3/](https://console.aws.amazon.com/s3/).

1. En el panel de navegación, elija **Buckets**.

1. Elige el nombre del bucket de Amazon S3 con el que quieres sincronizarte Amazon Kendra.

1. Seleccione la pestaña **Permisos**, desplácese hacia abajo hasta **Política de buckets** y, a continuación, haga clic en **Editar**.

1. Agregue o modifique su política de buckets para permitir el acceso solo desde el punto de conexión de VPC que creó.

   A continuación se muestra un ejemplo de política de bucket. Sustituya *`bucket-name`* y *`vpce-id`* por el nombre de su bucket de Amazon S3 y el ID del punto de conexión de Amazon S3 que indicó anteriormente.

1. Seleccione **Guardar cambios**.

Ahora solo se puede acceder a su bucket de S3 desde la VPC específica que creó.

## Paso 3: Cree un conector de fuente Amazon S3 de datos de prueba


Para probar la Amazon VPC configuración, cree un Amazon S3 conector. A continuación, configúrelo con la VPC que creó siguiendo los pasos descritos en [Amazon S3](https://docs.aws.amazon.com/kendra/latest/dg/data-source-s3.html).

Para los valores de Amazon VPC configuración, elija los valores que creó en este ejemplo:
+ **Amazon VPC(VPC)**: `kendra-s3-example-vpc`
+ **Subredes**: `kendra-s3-example-subnet-private1-[availability zone]`
+ **Grupos de seguridad**: `s3-data-source-security-group`

Espere a que termine de crearse el conector. Una vez creado el Amazon S3 conector, elija **Sincronizar ahora** para iniciar una sincronización.

La sincronización puede tardar entre varios minutos y varias horas en finalizar, según el número de documentos que haya en el Amazon S3 depósito. Para probar el ejemplo, le recomendamos que cargue solo algunos documentos en su bucket de S3. Si la configuración es correcta, en algún momento debería aparecer el **Estado de sincronización** como **Completado**.

Si encuentras algún error, consulta [Solución de problemas de Amazon VPC conexión](https://docs.aws.amazon.com/kendra/latest/dg/vpc-connector-troubleshoot.html).

# Amazon Kendra Rastreador web


Puede usar Amazon Kendra Web Crawler para rastrear e indexar páginas web.

Solo puede rastrear sitios web de cara al público o sitios web internos de la empresa que utilicen el protocolo de comunicación segura Hypertext Transfer Protocol Secure (HTTPS). Si recibe un error al rastrear un sitio web, es posible que el sitio web esté bloqueado para que no pueda rastrearse. Para rastrear sitios web internos, puede configurar un proxy web. El proxy web debe estar orientado al público. También puede utilizar la autenticación para acceder a sitios web y rastrearlos.

*Al seleccionar los sitios web que se van a indexar, se debe respetar la [Política de uso aceptable de Amazon](https://aws.amazon.com/aup/) y todas las demás condiciones de Amazon. Recuerde que solo debe usar Amazon Kendra Web Crawler para indexar sus propias páginas web o páginas web para las que tenga autorización para indexar. Para obtener información sobre cómo impedir que Amazon Kendra Web Crawler indexe sus sitios web, consulte. [Configuración del `robots.txt` archivo para Web Crawler Amazon Kendra](stop-web-crawler.md)*

**nota**  
**El uso indebido de Amazon Kendra Web Crawler para rastrear agresivamente sitios web o páginas web que no son de su propiedad no se considera un uso aceptable.**

Amazon Kendra tiene dos versiones del conector. web crawler Las características compatibles de cada versión incluyen:

**Amazon Kendra Conector Web Crawler v1.0/API [https://docs.aws.amazon.com/kendra/latest/dg/API_WebCrawlerConfiguration.html](https://docs.aws.amazon.com/kendra/latest/dg/API_WebCrawlerConfiguration.html)**
+ Proxy de web
+ Filtros de inclusión/exclusión

**Amazon Kendra Conector Web Crawler v2.0/API [https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html](https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html)**
+ Asignaciones de campo
+ Filtros de inclusión/exclusión
+ Sincronizaciones completas e incrementales del contenido
+ Proxy de web
+ Autenticación básica, NTLM/Kerberos, SAML y mediante formularios para sus sitios web
+ Nube privada virtual (VPC)

**importante**  
La creación del conector Web Crawler v2.0 no es compatible con. CloudFormation Utilice el conector Web Crawler v1.0 si necesita asistencia. CloudFormation 

Para solucionar problemas del conector de fuente de datos de su rastreador Amazon Kendra web, consulte. [Solución de problemas con los orígenes de datos](troubleshooting-data-sources.md)

**Topics**
+ [

# Amazon Kendra Conector Web Crawler v1.0
](data-source-v1-web-crawler.md)
+ [

# Amazon Kendra Conector Web Crawler v2.0
](data-source-v2-web-crawler.md)
+ [

# Configuración del `robots.txt` archivo para Web Crawler Amazon Kendra
](stop-web-crawler.md)

# Amazon Kendra Conector Web Crawler v1.0


Puede utilizar Amazon Kendra Web Crawler para rastrear e indexar páginas web.

Solo puede rastrear sitios web de cara al público y sitios web que utilicen el protocolo de comunicación segura Hypertext Transfer Protocol Secure (HTTPS). Si recibe un error al rastrear un sitio web, es posible que el sitio web esté bloqueado para que no pueda rastrearse. Para rastrear sitios web internos, puede configurar un proxy web. El proxy web debe estar orientado al público.

*Al seleccionar los sitios web que se van a indexar, se debe respetar la [Política de uso aceptable de Amazon](https://aws.amazon.com/aup/) y todas las demás condiciones de Amazon. Recuerde que solo debe usar Amazon Kendra Web Crawler para indexar sus propias páginas web o páginas web para las que tenga autorización para indexar. Para obtener información sobre cómo impedir que Amazon Kendra Web Crawler indexe sus sitios web, consulte. [Configuración del `robots.txt` archivo para Web Crawler Amazon Kendra](stop-web-crawler.md)*

**nota**  
**El uso indebido de Amazon Kendra Web Crawler para rastrear agresivamente sitios web o páginas web que no son de su propiedad no se considera un uso aceptable.**

Para solucionar problemas del conector de fuente de datos del rastreador Amazon Kendra web, consulte. [Solución de problemas con los orígenes de datos](troubleshooting-data-sources.md)

**Topics**
+ [

## Características admitidas
](#supported-features-v1-web-crawler)
+ [

## Requisitos previos
](#prerequisites-v1-web-crawler)
+ [

## Instrucciones de conexión
](#data-source-v1-procedure-web-crawler)
+ [

## Más información
](#web-crawler-learn-more)

## Características admitidas

+ Proxy de web
+ Filtros de inclusión/exclusión

## Requisitos previos


Antes de poder usarlo Amazon Kendra para indexar sus sitios web, compruebe los detalles de sus sitios web y AWS cuentas.

**Para sus sitios web, asegúrese de que:**
+ Has copiado la raíz o el mapa URLs del sitio web de los sitios web que quieres indexar.
+ **Para los sitios web que requieren una autenticación básica**: Apuntó el nombre de usuario y la contraseña y copió el nombre de host del sitio web y el número de puerto.
+ **Opcional:** copió el nombre de host del sitio web y el número de puerto si quiere usar un proxy web para conectarse a los sitios web internos que desea rastrear. El proxy web debe estar orientado al público. Amazon Kendra admite la conexión a servidores proxy web respaldados por una autenticación básica o puede conectarse sin autenticación.
+ Compruebe que cada documento de página web que desea indexar es único y que se encuentra entre otros orígenes de datos que piensa utilizar para el mismo índice. Cada origen de datos que desee utilizar para un índice no debe contener el mismo documento en varios orígenes de datos. IDs Los documentos son globales para un índice y deben ser únicos por índice.

**En su AWS cuenta, asegúrese de tener:**
+ [Creó un Amazon Kendra índice](https://docs.aws.amazon.com/kendra/latest/dg/create-index.html) y, si utiliza la API, anotó el ID del índice.
+ [Creó un IAM rol](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds) para su fuente de datos y, si usa la API, anotó el ARN del IAM rol.
**nota**  
Si cambias el tipo de autenticación y las credenciales, debes actualizar tu IAM rol para acceder al ID AWS Secrets Manager secreto correcto.
+ En el caso de los sitios web que requieren autenticación, o si utilizan un proxy web con autenticación, guardan las credenciales de autenticación en AWS Secrets Manager secreto y, si utilizan la API, anotan el ARN del secreto.
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).

Si no tiene un IAM rol o secreto existente, puede usar la consola para crear un nuevo IAM rol y un Secrets Manager secreto al conectar su fuente de web crawler datos. Amazon Kendra Si utiliza la API, debe proporcionar el ARN de un IAM rol y un Secrets Manager secreto existentes y un ID de índice.

## Instrucciones de conexión


Para conectarse Amazon Kendra a su fuente de web crawler datos, debe proporcionar los detalles necesarios de la fuente de web crawler datos para que Amazon Kendra pueda acceder a sus datos. Si aún no lo ha configuradoweb crawler, Amazon Kendra consulte[Requisitos previos](#prerequisites-v1-web-crawler).

------
#### [ Console ]

**Para conectarse Amazon Kendra a web crawler** 

1. Inicie sesión en la [Amazon Kendra consola Consola de administración de AWS y ábrala](https://console.aws.amazon.com/kendra/).

1. En el panel de navegación izquierdo, elija **Índices** y, a continuación, elija el índice que desee usar de la lista de índices.
**nota**  
Puede elegir configurar o editar los ajustes de **Control de acceso de usuarios** en la **Configuración del índice**. 

1. En la página **Introducción**, seleccione **Agregar origen de datos**.

1. En la página **Agregar origen de datos**, seleccione el **Conector Web Crawler** y, a continuación, seleccione **Agregar conector**. Si usa la versión 2 (si corresponde), elija el **Conector de Web Crawler** con la etiqueta “V2.0”.

1. En la página **Especificar detalles del origen de datos**, introduzca la siguiente información:

   1. En **Nombre y descripción**, en **Nombre del origen de datos**: introduzca un nombre para el origen de datos. Puede incluir guiones, pero no espacios.

   1. (Opcional)** Descripción**: introduzca una descripción opcional para el origen de datos.

   1. En **Idioma predeterminado**: elija un idioma para filtrar los documentos para el índice. A menos que especifique lo contrario, el idioma predeterminado es el inglés. El idioma especificado en los metadatos del documento anula el idioma seleccionado.

   1. En **Etiquetas**, para **añadir una nueva etiqueta**: incluye etiquetas opcionales para buscar y filtrar tus recursos o realizar un seguimiento de tus AWS costes.

   1. Elija **Siguiente**.

1. En la página **Definir acceso y seguridad**, introduzca la siguiente información:

   1. En **Source**, elige entre los **mapas de sitio **Source URLs** y Source** según tu caso de uso e introduce los valores de cada uno.

      Puedes añadir hasta 10 mapas de sitio de origen URLs y tres.
**nota**  
Si quieres rastrear un mapa del sitio, comprueba que la URL base o raíz sea la misma que la que URLs aparece en la página del mapa del sitio. Por ejemplo, si la URL de tu mapa del sitio es *https://example.com/sitemap-page.html*, la que URLs aparece en esta página también debería usar la URL base "https://example.com/».

   1. (Opcional) Para el **Proxy web**, introduzca la siguiente información:

      1. **Nombre de host**: el nombre de host donde se requiere el proxy web.

      1. **Número de puerto**: puerto utilizado por el protocolo de transporte de URL del host. El número de puerto debe ser un valor numérico entre 0 y 65535.

      1. Para **las credenciales del proxy web**: si su conexión de proxy web requiere autenticación, elija un secreto existente o cree uno nuevo para almacenar sus credenciales de autenticación. Si decide crear un secreto nuevo, se abrirá una ventana de secreto de AWS Secrets Manager .

      1. Introduzca la siguiente información en la **ventana Crear un secreto de AWS Secrets Manager Secrets Manager **:

         1. **Nombre del secreto**: un nombre para su secreto. El prefijo “AmazonKendra-WebCrawler-” se añade automáticamente al nombre del secreto.

         1. Para el **nombre de usuario** y la **contraseña**: introduzca estas credenciales de autenticación básicas para sus sitios web.

         1. Seleccione **Save**.

   1. (Opcional) **Hosts con autenticación**: seleccione esta opción para agregar hosts adicionales con autenticación.

   1. **IAM rol**: elige un IAM rol existente o crea uno nuevo IAM para acceder a las credenciales de tu repositorio y al contenido del índice.
**nota**  
IAM los roles utilizados para los índices no se pueden usar para las fuentes de datos. Si no está seguro de si un rol existente se utiliza para un índice o para las preguntas frecuentes, elija **Crear un nuevo rol** para evitar errores.

   1. Elija **Siguiente**.

1. En la página **Configurar ajustes de sincronización**, introduzca la siguiente información:

   1. **Rango de rastreo**: elige el tipo de páginas web que desea rastrear.

   1. **Profundidad de rastreo**: seleccione el número de niveles de la URL inicial que Amazon Kendra se deben rastrear.

   1. En **Configuración avanzada de rastreo** y **Configuración adicional**, introduzca la siguiente información:

      1. **Tamaño máximo de archivo:** tamaño máximo de página web o archivo adjunto que se deben rastrear. Mínimo 0,000001 MB (1 byte). Máximo de 50 MB.

      1. Número **máximo de enlaces por página**: número máximo de enlaces rastreados por página. Los enlaces se rastrean en orden de aparición. Mínimo 1. link/page. Maximum 1000 links/page

      1. **Limitación máxima:** número máximo de URLs rastreados por nombre de host por minuto. Mínimo 1. URLs/host name/minute. Maximum 300 URLs/host name/minute

      1. Patrones de **expresiones regulares: añada patrones** de expresiones regulares para incluir o excluir algunos. URLs Puede añadir hasta 100 patrones.

   1. **Calendario de ejecución sincronizado**, para **Frecuencia**: elija la frecuencia con la Amazon Kendra que se sincronizará con la fuente de datos.

   1. Elija **Siguiente**.

1. En la página **Revisar y crear**, compruebe que la información que ha introducido es correcta y, a continuación, seleccione **Añadir origen de datos**. También puede elegir editar la información desde esta página. El origen de datos aparecerá en la página **Orígenes de datos** una vez que el origen de datos se haya agregado correctamente.

------
#### [ API ]

**Para conectarse a Amazon Kendra web crawler**

Debe especificar lo siguiente mediante la [WebCrawlerConfiguration](https://docs.aws.amazon.com/kendra/latest/dg/API_WebCrawlerConfiguration.html)API:
+ **URLs**—Especifique la semilla o el punto URLs de partida de los sitios web o el mapa del sitio web URLs de los sitios web que desee rastrear mediante [https://docs.aws.amazon.com/kendra/latest/dg/API_SeedUrlConfiguration.html](https://docs.aws.amazon.com/kendra/latest/dg/API_SeedUrlConfiguration.html)y. [https://docs.aws.amazon.com/kendra/latest/dg/API_SiteMapsConfiguration.html](https://docs.aws.amazon.com/kendra/latest/dg/API_SiteMapsConfiguration.html)
**nota**  
Si quieres rastrear un mapa del sitio, comprueba que la URL base o raíz sea la misma que la que URLs aparece en la página del mapa del sitio. Por ejemplo, si la URL de tu mapa del sitio es *https://example.com/sitemap-page.html*, la que URLs aparece en esta página también debería usar la URL base "https://example.com/».
+ **Nombre de recurso de Amazon (ARN) secreto**: si un sitio web requiere autenticación básica, usted proporciona el nombre del host, el número de puerto y un secreto que almacena sus credenciales de autenticación básica de su nombre de usuario y contraseña. El ARN secreto se proporciona mediante la API [https://docs.aws.amazon.com/kendra/latest/dg/API_AuthenticationConfiguration.html](https://docs.aws.amazon.com/kendra/latest/dg/API_AuthenticationConfiguration.html). El secreto se almacena en una estructura JSON con las siguientes claves:

  ```
  {
      "username": "user name",
      "password": "password"
  }
  ```

  También puede proporcionar credenciales de proxy web mediante un secreto de AWS Secrets Manager . Utilice la API [https://docs.aws.amazon.com/kendra/latest/dg/API_ProxyConfiguration.html](https://docs.aws.amazon.com/kendra/latest/dg/API_ProxyConfiguration.html) para proporcionar el nombre de host y el número de puerto del sitio web y, opcionalmente, el secreto que almacena sus credenciales de proxy web.
+ **IAM rol**: especifique `RoleArn` cuándo llama `CreateDataSource` para proporcionar a un IAM rol permisos para acceder a su Secrets Manager secreto y para llamar al público requerido APIs para el conector del rastreador web y. Amazon Kendra Para obtener más información, consulte [Roles de IAM para orígenes de datos del rastreador web](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds).

También puede añadir las siguientes características opcionales:
+ **Modo de rastreo**: elija si desea rastrear solo los nombres de host de los sitios web o los nombres de host con subdominios, o también rastrear otros dominios a los que enlazan las páginas web.
+ La “profundidad” o número de niveles desde el nivel semilla hasta el nivel rastreo. Por ejemplo, la página URL semilla tiene la profundidad 1 y todos los hipervínculos de esta página que también se rastreen tienen la profundidad 2.
+ El número máximo de páginas web que URLs se pueden rastrear en una sola página web.
+ El tamaño máximo en MB de una página web a rastrear.
+ El número máximo de URLs rastreados por servidor de sitio web por minuto.
+ El host del proxy web y el número de puerto para conectarse a sitios web internos y rastrearlos. Por ejemplo, el nombre de host de *https://a.example.com/page1.html* es “a.example.com“ y el número de puerto es 443, el puerto estándar para HTTPS. Si se requieren credenciales de proxy web para conectarse a un host de sitio web, puede crear un AWS Secrets Manager que almacene las credenciales.
+ La información de autenticación para acceder y rastrear sitios web que requieren la autenticación del usuario.
+ Puede extraer las metaetiquetas HTML como campos con la herramienta de *enriquecimiento de documentos personalizados*. Para más información, consulte [Personalización de los metadatos del documento durante el proceso de ingesta](https://docs.aws.amazon.com/kendra/latest/dg/custom-document-enrichment.html). Para ver un ejemplo de cómo extraer metaetiquetas HTML, consulte los [ejemplos de CDE](https://github.com/aws-samples/amazon-kendra-cde-examples).
+  **Filtros de inclusión y exclusión**: especifique si desea incluir o excluir determinados filtros. URLs
**nota**  
La mayoría de los orígenes de datos utilizan patrones de expresiones regulares, que son patrones de inclusión o exclusión denominados filtros. Si especifica un filtro de inclusión, solo se indexará el contenido que coincida con el filtro de inclusión. Los documentos que no coincidan con el filtro de inclusión no se indexan. Si especifica un filtro de inclusión y exclusión, los documentos que coincidan con el filtro de exclusión no se indexarán, aunque coincidan con el filtro de inclusión.

------

## Más información


Para obtener más información sobre la integración Amazon Kendra con la fuente web crawler de datos, consulte:
+ [Reimagine el descubrimiento de conocimientos con Web Amazon Kendra Crawler](https://aws.amazon.com/blogs/machine-learning/reimagine-knowledge-discovery-using-amazon-kendras-web-crawler/)

# Amazon Kendra Conector Web Crawler v2.0


Puede utilizar Amazon Kendra Web Crawler para rastrear e indexar páginas web.

Solo puede rastrear sitios web de cara al público o sitios web internos de la empresa que utilicen el protocolo de comunicación segura Hypertext Transfer Protocol Secure (HTTPS). Si recibe un error al rastrear un sitio web, es posible que el sitio web esté bloqueado para que no pueda rastrearse. Para rastrear sitios web internos, puede configurar un proxy web. El proxy web debe estar orientado al público. También puede utilizar la autenticación para acceder a sitios web y rastrearlos.

Amazon Kendra Web Crawler v2.0 utiliza el paquete de rastreadores web Selenium y un controlador Chromium. Amazon Kendra actualiza automáticamente la versión de Selenium y el controlador Chromium mediante la integración continua (CI).

*Al seleccionar los sitios web que se van a indexar, se debe respetar la [Política de uso aceptable de Amazon](https://aws.amazon.com/aup/) y todas las demás condiciones de Amazon. Recuerde que solo debe usar Amazon Kendra Web Crawler para indexar sus propias páginas web o páginas web para las que tenga autorización para indexar. Para obtener información sobre cómo impedir que Amazon Kendra Web Crawler indexe sus sitios web, consulte. [Configuración del `robots.txt` archivo para Web Crawler Amazon Kendra](stop-web-crawler.md)* . El uso indebido de Amazon Kendra Web Crawler para rastrear agresivamente sitios web o páginas web que no son de su propiedad **no** se considera un uso aceptable.

Para solucionar problemas del conector de fuente de datos del rastreador Amazon Kendra web, consulte. [Solución de problemas con los orígenes de datos](troubleshooting-data-sources.md)

**nota**  
El conector Web Crawler v2.0 *no* admite el rastreo de listas de sitios web desde depósitos cifrados. AWS KMS Amazon S3 Solo admite el cifrado del lado del servidor con claves administradas. Amazon S3 

**importante**  
La creación de conectores Web Crawler v2.0 no es compatible con. CloudFormation Utilice el conector Web Crawler v1.0 si necesita asistencia. CloudFormation 

**Topics**
+ [

## Características admitidas
](#supported-features-v2-web-crawler)
+ [

## Requisitos previos
](#prerequisites-v2-web-crawler)
+ [

## Instrucciones de conexión
](#data-source-v2-procedure-web-crawler)

## Características admitidas

+ Asignaciones de campo
+ Filtros de inclusión/exclusión
+ Sincronizaciones completas e incrementales del contenido
+ Proxy de web
+ Autenticación básica, NTLM/Kerberos, SAML y mediante formularios para sus sitios web
+ Nube privada virtual (VPC)

## Requisitos previos


Antes de usarlo Amazon Kendra para indexar sus sitios web, compruebe los detalles de sus sitios web y AWS cuentas.

**Para sus sitios web, asegúrese de que:**
+ Has copiado la raíz o el mapa URLs del sitio web de los sitios web que quieres indexar. Puedes guardarlo URLs en un archivo de texto y subirlo a un Amazon S3 bucket. Cada URL del archivo de texto debe estar formateada en una línea independiente. Si quieres almacenar tus mapas de sitio en un Amazon S3 depósito, asegúrate de haber copiado el XML del mapa del sitio y de haberlo guardado en un archivo XML. También puede agrupar varios archivos XML de mapa del sitio en un archivo ZIP.
**nota**  
(local o en el servidor) Amazon Kendra comprueba si la información de punto final incluida AWS Secrets Manager es la misma que la información de punto final especificada en los detalles de configuración de la fuente de datos. Esto ayuda a evitar el [problema del suplente confuso](https://docs.aws.amazon.com/IAM/latest/UserGuide/confused-deputy.html), que es un problema de seguridad en el que un usuario no tiene permiso para realizar una acción, pero utiliza Amazon Kendra como proxy para acceder al secreto configurado y realizar la acción. Si más adelante cambia la información de punto de conexión, debe crear un nuevo secreto para sincronizar esta información.
+ **Para los sitios web que requieren autenticación básica, NTLM o Kerberos**:
  + Anote las credenciales de autenticación de su sitio web, que incluyen un nombre de usuario y una contraseña.
**nota**  
Amazon Kendra Web Crawler v2.0 admite el protocolo de autenticación NTLM, que incluye el cifrado de contraseñas, y el protocolo de autenticación Kerberos, que incluye el cifrado de contraseñas.
+ **Para los sitios web que requieren** autenticación mediante SAML o mediante formulario de inicio de sesión:
  + Anote las credenciales de autenticación de su sitio web, que incluyen un nombre de usuario y una contraseña.
  + Se copió el campo del nombre de usuario XPaths (y el botón del nombre de usuario si se utiliza SAML), el campo y el botón de la contraseña (en el lenguaje de rutas XML) y se copió la URL de la página de inicio de sesión. Puede encontrar los elementos utilizando las herramientas XPaths de desarrollador de su navegador web. XPaths suelen seguir este formato:`//tagname[@Attribute='Value']`.
**nota**  
Amazon Kendra Web Crawler v2.0 utiliza un navegador Chrome inalámbrico y la información del formulario para autenticar y autorizar el acceso con una OAuth URL protegida por la versión 2.0.
+ **Opcional**: copie el nombre del host y el número de puerto del servidor proxy web si desea utilizar un proxy web para conectarse a los sitios web internos que desea rastrear. El proxy web debe estar orientado al público. Amazon Kendra admite la conexión a servidores proxy web respaldados por una autenticación básica o puede conectarse sin autenticación.
+ **Opcional**: ha copiado el ID de subred de la nube privada virtual (VPC) si quiere usar una VPC para conectarse a los sitios web internos que desea rastrear. Para obtener más información, consulte [Configuración de un Amazon VPC](https://docs.aws.amazon.com/kendra/latest/dg/vpc-configuration.html).
+ Compruebe que cada documento de página web que desea indexar es único y que se encuentra entre otros orígenes de datos que piensa utilizar para el mismo índice. Cada origen de datos que desee utilizar para un índice no debe contener el mismo documento en varios orígenes de datos. IDs Los documentos son globales para un índice y deben ser únicos por índice.

**En su AWS cuenta, asegúrese de tener:**
+ [Creó un Amazon Kendra índice](https://docs.aws.amazon.com/kendra/latest/dg/create-index.html) y, si utiliza la API, anotó el ID del índice.
+ [Creó un IAM rol](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds) para su fuente de datos y, si usa la API, anotó el nombre del recurso de Amazon del IAM rol.
**nota**  
Si cambias el tipo de autenticación y las credenciales, debes actualizar tu IAM rol para acceder al ID AWS Secrets Manager secreto correcto.
+ En el caso de los sitios web que requieren autenticación, o si utilizan un proxy web con autenticación, guardan las credenciales de autenticación en AWS Secrets Manager secreto y, si utilizan la API, anotan el ARN del secreto.
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).

Si no tiene un IAM rol o secreto existente, puede usar la consola para crear un nuevo IAM rol y un Secrets Manager secreto al conectar su fuente de web crawler datos. Amazon Kendra Si utiliza la API, debe proporcionar el ARN de un IAM rol y un Secrets Manager secreto existentes y un ID de índice.

## Instrucciones de conexión


Para conectarse Amazon Kendra a su fuente de web crawler datos, debe proporcionar los detalles necesarios de la fuente de web crawler datos para que Amazon Kendra pueda acceder a sus datos. Si aún no lo ha configuradoweb crawler, Amazon Kendra consulte[Requisitos previos](#prerequisites-v2-web-crawler).

------
#### [ Console ]

**Para conectarse Amazon Kendra a web crawler** 

1. Inicie sesión en la [Amazon Kendra consola Consola de administración de AWS y ábrala](https://console.aws.amazon.com/kendra/).

1. En el panel de navegación izquierdo, elija **Índices** y, a continuación, elija el índice que desee usar de la lista de índices.
**nota**  
Puede elegir configurar o editar los ajustes de **Control de acceso de usuarios** en la **Configuración del índice**. 

1. En la página **Introducción**, seleccione **Agregar origen de datos**.

1. En la página **Agregar origen de datos**, seleccione el **Conector Web Crawler** y, a continuación, seleccione **Agregar conector**. Si usa la versión 2 (si corresponde), elija el **Conector de Web Crawler** con la etiqueta “V2.0”.

1. En la página **Especificar detalles del origen de datos**, introduzca la siguiente información:

   1. En **Nombre y descripción**, en **Nombre del origen de datos**: introduzca un nombre para el origen de datos. Puede incluir guiones, pero no espacios.

   1. (Opcional)** Descripción**: introduzca una descripción opcional para el origen de datos.

   1. En **Idioma predeterminado**: elija un idioma para filtrar los documentos para el índice. A menos que especifique lo contrario, el idioma predeterminado es el inglés. El idioma especificado en los metadatos del documento anula el idioma seleccionado.

   1. En **Etiquetas**, para **añadir una nueva etiqueta**: incluye etiquetas opcionales para buscar y filtrar tus recursos o realizar un seguimiento de tus AWS costes.

   1. Elija **Siguiente**.

1. En la página **Definir acceso y seguridad**, introduzca la siguiente información:

   1. **Fuente**: elige entre Fuente, **Mapas **de** sitio de origen URLs, Archivo de **origen o URLs Archivo** de mapas** de sitio de **origen**. Si opta por utilizar un archivo de texto que incluya una lista de hasta 100 semillas URLs, debe especificar la ruta al Amazon S3 depósito en el que está almacenado el archivo. Si opta por utilizar un archivo XML de mapa del sitio, debe especificar la ruta al bucket Amazon S3 en el que está almacenado el archivo. También puede agrupar varios archivos XML de mapa del sitio en un archivo ZIP. De lo contrario, puedes introducir manualmente hasta 10 semillas o puntos de partida URLs y hasta tres mapas del sitio URLs.
**nota**  
Si quieres rastrear un mapa del sitio, comprueba que la URL base o raíz sea la misma que la que URLs aparece en la página del mapa del sitio. Por ejemplo, si la URL de tu mapa del sitio es *https://example.com/sitemap-page.html*, la que URLs aparece en esta página también debería usar la URL base "https://example.com/».

      Si sus sitios web requieren autenticación para acceder a ellos, puede elegir entre autenticación básica, NTLM/Kerberos, SAML o de formulario. En caso contrario, elija la opción de no autenticación.
**nota**  
Si más adelante quieres editar la fuente de datos para cambiar la raíz URLs con la autenticación a los mapas de sitio, debes crear una nueva fuente de datos. Amazon Kendra configura la fuente de datos con la información de URLs punto final que figura en el Secrets Manager secreto para la autenticación y, por lo tanto, no puede volver a configurar la fuente de datos al cambiar a mapas de sitio.

      1. **AWS Secrets Manager secreto**: si sus sitios web requieren la misma autenticación para acceder a los sitios web, elija un secreto existente o cree uno nuevo Secrets Manager para almacenar las credenciales de su sitio web. Si decides crear un secreto nuevo, se abrirá una ventana AWS Secrets Manager secreta.

        Si eligió la autenticación **Básica** o **NTLM/Kerberos**, introduzca un nombre para el secreto, además del nombre de usuario y la contraseña. El protocolo de autenticación NTLM incluye el hash de contraseñas y el protocolo de autenticación de Kerberos incluye el cifrado de contraseñas.

        Si eligió la autenticación **SAML** o **Formularios**, introduzca un nombre para el secreto, además del nombre de usuario y la contraseña. XPath Utilízalo para el campo de nombre de usuario (y XPath para el botón de nombre de usuario si utilizas SAML). XPaths Utilícelo para el campo y el botón de contraseña y para la URL de la página de inicio de sesión. Puede encontrar los elementos XPaths (lenguaje de rutas XML) utilizando las herramientas de desarrollo de su navegador web. XPaths suelen seguir este formato:`//tagname[@Attribute='Value']`.

   1. **Proxy web** (opcional): introduzca el nombre de host y el número de puerto del servidor proxy que desee utilizar para conectarse a sitios web internos. Por ejemplo, el nombre de host de *https://a.example.com/page1.html* es “a.example.com“ y el número de puerto es 443, el puerto estándar para HTTPS. Si se requieren credenciales de proxy web para conectarse a un servidor de sitios web, puede crear uno AWS Secrets Manager que almacene las credenciales.

   1. **Nube privada virtual (VPC)**: puede optar por utilizar una VPC. Si es así, debe agregar **Subredes** y **Grupos de seguridad de VPC**.

   1. **IAM rol**: elija un IAM rol existente o cree uno nuevo IAM para acceder a las credenciales de su repositorio e indexar el contenido.
**nota**  
IAM los roles utilizados para los índices no se pueden usar para las fuentes de datos. Si no está seguro de si un rol existente se utiliza para un índice o para las preguntas frecuentes, elija **Crear un nuevo rol** para evitar errores.

   1. Elija **Siguiente**.

1. En la página **Configurar ajustes de sincronización**, introduzca la siguiente información:

   1. **Ámbito de sincronización**: establezca límites para el rastreo de páginas web, incluidos sus dominios, tamaños de archivo y enlaces, y filtre URLs mediante patrones de expresiones regulares.

      1. (Opcional) **Rango de dominios de rastreo**: elija si desea rastrear solo los dominios del sitio web, los dominios con subdominios o rastrear también otros dominios a los que enlazan las páginas web. De forma predeterminada, Amazon Kendra solo rastrea los dominios de los sitios web que deseas rastrear.

      1. (Opcional) **Configuración adicional**: configure los siguientes ajustes:
         + **Profundidad de rastreo**: la “profundidad” o el número de niveles desde el nivel inicial hasta el de rastreo. Por ejemplo, la página URL semilla tiene la profundidad 1 y todos los hipervínculos de esta página que también se rastreen tienen la profundidad 2.
         + **Tamaño máximo de archivo:** tamaño máximo en MB de una página web o archivo adjunto que se deben rastrear.
         + Número **máximo de enlaces por página**: el número máximo de enlaces que URLs se pueden rastrear en una sola página web.
         + **Limitación máxima de la velocidad de rastreo**: número máximo de URLs rastreados por servidor de sitio web por minuto.
         + **Archivos**: elija rastrear los archivos a los que enlazan las páginas web.
         + **Rastrear e indexar URLs**: añada patrones de expresiones regulares para incluir o excluir el rastreo de determinadas URLs páginas web con direcciones URL y la indexación de cualquier hipervínculo.

   1. **Modo de sincronización**: elija cómo desea actualizar el índice cuando cambie el contenido del origen de datos. Al sincronizar la fuente de datos Amazon Kendra por primera vez, todo el contenido se rastrea e indexa de forma predeterminada. Debe ejecutar una sincronización completa de los datos si la sincronización inicial falló, incluso si no selecciona la sincronización completa como opción de modo de sincronización.
      + Sincronización completa: se vuelve a indexar todo el contenido, reemplazando el contenido existente cada vez que el origen de datos se sincronice con el índice.
      + Sincronización nueva, modificada o eliminada: indexe solo el contenido nuevo, modificado y eliminado cada vez que la fuente de datos se sincronice con el índice. Amazon Kendra puede usar el mecanismo de la fuente de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido que ha cambiado desde la última sincronización.

   1. **Programa de ejecución de sincronización**: en **Frecuencia**, elija la frecuencia con la que Amazon Kendra se sincronizará con el origen de datos.

   1. Elija **Siguiente**.

1. En la página **Establecer asignaciones de campos**, especifique la siguiente información:

   1. Seleccione entre los campos predeterminados Amazon Kendra generados por las páginas web y los archivos que desee asignar a su índice.

   1. Elija **Siguiente**.

1. En la página **Revisar y crear**, compruebe que la información que ha introducido es correcta y, a continuación, seleccione **Añadir origen de datos**. También puede elegir editar la información desde esta página. El origen de datos aparecerá en la página **Orígenes de datos** una vez que el origen de datos se haya agregado correctamente.

------
#### [ API ]

**Para conectarse Amazon Kendra a web crawler**

Debe especificar un JSON del [esquema del origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/ds-schemas.html#ds-web-crawler-schema) mediante la API [https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html](https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html). Debe proporcionar la siguiente información:
+ **Origen de datos**: defina el tipo de origen de datos como `WEBCRAWLERV2` cuando utilice el esquema JSON [https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html](https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html). Además, defina el origen de datos como `TEMPLATE` al llamar a la API [https://docs.aws.amazon.com/kendra/latest/dg/API_CreateDataSource.html](https://docs.aws.amazon.com/kendra/latest/dg/API_CreateDataSource.html).
+ **URLs**—Especifique la semilla o el punto URLs de partida de los sitios web o el mapa del sitio web URLs de los sitios web que desee rastrear. Puedes especificar la ruta a un Amazon S3 depósito que almacene tu lista de semillas. URLs Cada URL del archivo de texto para semillas URLs debe estar formateada en una línea independiente. También puedes especificar la ruta a un Amazon S3 depósito que almacene los archivos XML del mapa del sitio. Puede agrupar varios archivos de mapa del sitio en un archivo ZIP y almacenar el archivo ZIP en su bucket de Amazon S3 .
**nota**  
Si quieres rastrear un mapa del sitio, comprueba que la URL base o raíz sea la misma que la que URLs aparece en la página de tu mapa del sitio. Por ejemplo, si la URL de tu mapa del sitio es *https://example.com/sitemap-page.html*, la que URLs aparece en esta página también debería usar la URL base "https://example.com/».
+ **Modo de sincronización**: especifique cómo Amazon Kendra debe actualizarse el índice cuando cambie el contenido de la fuente de datos. Al sincronizar el origen de datos con Amazon Kendra por primera vez, todo el contenido se rastrea y se indexa de forma predeterminada. Debe ejecutar una sincronización completa de los datos si la sincronización inicial falló, incluso si no selecciona la sincronización completa como opción de modo de sincronización. Puede elegir entre las siguientes opciones:
  + `FORCED_FULL_CRAWL` para volver a indexar todo el contenido, reemplazando el contenido existente cada vez que el origen de datos se sincronice con el índice.
  + `FULL_CRAWL` para indexar solo el contenido nuevo, modificado y eliminado cada vez que el origen de datos se sincronice con el índice. Amazon Kendra puede utilizar el mecanismo del origen de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido modificado desde la última sincronización.
+ **Autenticación**: si sus sitios web requieren la misma autenticación, especifique autenticación `BasicAuth`, `NTLM_Kerberos`, `SAML` o `Form`. Si sus sitios web no requieren autenticación, especifique `NoAuthentication`.
+ **Nombre de recurso de Amazon (ARN) secreto**: si sus sitios web requieren autenticación básica, NTLM o Kerberos, debe proporcionar un secreto que almacene las credenciales de autenticación de su nombre de usuario y contraseña. Debe proporcionar el nombre de recurso de Amazon (ARN) de un secreto de AWS Secrets Manager . El secreto se almacena en una estructura JSON con las siguientes claves:

  ```
  {
      "seedUrlsHash": "Hash representation of all seed URLs",
      "userName": "user name",
      "password": "password"
  }
  ```

  Si sus sitios web requieren autenticación SAML, el secreto se almacena en una estructura JSON con las siguientes claves:

  ```
  {
      "seedUrlsHash": "Hash representation of all seed URLs",                                
      "userName": "user name",
      "password": "password",
      "userNameFieldXpath": "XPath for user name field",
      "userNameButtonXpath": "XPath for user name button",
      "passwordFieldXpath": "XPath for password field",
      "passwordButtonXpath": "XPath for password button",
      "loginPageUrl": "Full URL for website login page"
  }
  ```

  Si sus sitios web requieren autenticación de formularios, el secreto se almacena en una estructura JSON con las siguientes claves:

  ```
  {
      "seedUrlsHash": "Hash representation of all seed URLs",
      "userName": "user name",
      "password": "password",
      "userNameFieldXpath": "XPath for user name field",
      "passwordFieldXpath": "XPath for password field",
      "passwordButtonXpath": "XPath for password button",
      "loginPageUrl": "Full URL for website login page"
  }
  ```

  Puede encontrar los elementos XPaths (XML Path Language) mediante las herramientas de desarrollo de su navegador web. XPaths suelen seguir este formato:`//tagname[@Attribute='Value']`.

  También puede proporcionar credenciales de proxy web mediante un secreto de AWS Secrets Manager .
+ **IAM rol**: especifique `RoleArn` cuándo llama `CreateDataSource` para proporcionar un IAM rol con permisos para acceder a su Secrets Manager secreto y para llamar al público requerido APIs para el conector del rastreador web y. Amazon Kendra Para obtener más información, consulte [Roles de IAM para orígenes de datos del rastreador web](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds).

También puede añadir las siguientes características opcionales:
+  **Nube privada virtual (VPC)**: especifique a `VpcConfiguration` cuándo llamar a `CreateDataSource`. Para obtener más información, consulte [¿Se está configurando Amazon Kendra para usar un Amazon VPC](vpc-configuration.md).
+ **Rango de dominios**: elija si desea rastrear solo los dominios web con subdominios o rastrear también otros dominios a los que enlazan las páginas web. De forma predeterminada, Amazon Kendra solo rastrea los dominios de los sitios web que desea rastrear.
+ La “profundidad” o número de niveles desde el nivel semilla hasta el nivel rastreo. Por ejemplo, la página URL semilla tiene la profundidad 1 y todos los hipervínculos de esta página que también se rastreen tienen la profundidad 2.
+ El número máximo de páginas web que URLs se pueden rastrear en una sola página web.
+ Tamaño máximo (en MB) de una página web o un archivo adjunto que se van a rastrear.
+ El número máximo de URLs rastreados por servidor de sitio web por minuto.
+ El host del proxy web y el número de puerto para conectarse a sitios web internos y rastrearlos. Por ejemplo, el nombre de host de *https://a.example.com/page1.html* es “a.example.com“ y el número de puerto es 443, el puerto estándar para HTTPS. Si se requieren credenciales de proxy web para conectarse a un host de sitio web, puede crear un AWS Secrets Manager que almacene las credenciales.
+ **Filtros de inclusión y exclusión**: especifique si desea incluir o excluir el rastreo URLs e indexación de algunos hipervínculos de estas páginas web con URL.
**nota**  
La mayoría de los orígenes de datos utilizan patrones de expresiones regulares, que son patrones de inclusión o exclusión denominados filtros. Si especifica un filtro de inclusión, solo se indexará el contenido que coincida con el filtro de inclusión. Los documentos que no coincidan con el filtro de inclusión no se indexan. Si especifica un filtro de inclusión y exclusión, los documentos que coincidan con el filtro de exclusión no se indexarán, aunque coincidan con el filtro de inclusión.
+ **Asignaciones de campos**: elija asignar los campos de las páginas web y los archivos de páginas web a los campos de índice. Amazon Kendra Para obtener más información, consulte [Asignación de campos de origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/field-mapping.html).

Para obtener una lista de otras claves JSON importantes que debe configurar, consulte el [Esquema de plantilla de Web Crawler de Amazon Kendra](https://docs.aws.amazon.com/kendra/latest/dg/ds-schemas.html#ds-schema-web-crawler).

------

# Configuración del `robots.txt` archivo para Web Crawler Amazon Kendra
Configuración del `robots.txt` archivo para Amazon Kendra Web Crawler

Amazon Kendra es un servicio de búsqueda inteligente que AWS los clientes utilizan para indexar y buscar los documentos que elijan. Para indexar documentos en la web, los clientes pueden utilizar un rastreador Amazon Kendra web, que indica qué URL deben indexarse y otros parámetros operativos. Amazon Kendra los clientes deben obtener una autorización antes de indexar cualquier sitio web en particular.

Amazon Kendra Web Crawler respeta las directivas estándar de robots.txt, como `Allow` y. `Disallow` Puede modificar el `robots.txt` archivo de su sitio web para controlar la forma en que Amazon Kendra Web Crawler lo rastrea.

## Configurar el modo en que Amazon Kendra Web Crawler accede a su sitio web


Puede controlar la forma en que el Amazon Kendra Web Crawler indexa su sitio web mediante directivas y directivas. `Allow` `Disallow` También puede controlar qué páginas web se indexan y qué páginas web no se rastrean.

**Para permitir que Amazon Kendra Web Crawler rastree todas las páginas web excepto las no permitidas, utilice la siguiente directiva:**

```
User-agent: amazon-kendra    # Amazon Kendra Web Crawler
Disallow: /credential-pages/ # disallow access to specific pages
```

**Para permitir que Amazon Kendra Web Crawler rastree solo páginas web específicas, utilice la siguiente directiva:**

```
User-agent: amazon-kendra    # Amazon Kendra Web Crawler
Allow: /pages/ # allow access to specific pages
```

**Para permitir que Amazon Kendra Web Crawler rastree todo el contenido del sitio web e impedir que otros robots rastreen, utilice la siguiente directiva:**

```
User-agent: amazon-kendra # Amazon Kendra Web Crawler
Allow: / # allow access to all pages
User-agent: * # any (other) robot
Disallow: / # disallow access to any pages
```

## Impedir que Amazon Kendra Web Crawler rastree tu sitio web


Puede impedir que Amazon Kendra Web Crawler indexe su sitio web mediante esta directiva. `Disallow` También puede controlar qué páginas web se rastrean y cuáles no.

**Para evitar que Amazon Kendra Web Crawler rastree el sitio web, utilice la siguiente directiva:**

```
User-agent: amazon-kendra # Amazon Kendra Web Crawler
Disallow: / # disallow access to any pages
```

[Si tiene alguna pregunta o duda sobre Amazon Kendra Web Crawler, puede ponerse en contacto con el AWS equipo de soporte.](https://aws.amazon.com/contact-us/?nc1=f_m)

# Box


Box es un servicio de almacenamiento en la nube que ofrece capacidades de alojamiento de archivos. Puedes usarlo Amazon Kendra para indexar el contenido de tu Box, incluidos comentarios, tareas y enlaces web.

Puedes conectarte Amazon Kendra a tu fuente de datos de Box mediante la [Amazon Kendraconsola](https://console.aws.amazon.com/kendra/) y la [BoxConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_BoxConfiguration.html)API.

Para solucionar problemas del conector de fuente de datos de Amazon Kendra Box, consulta[Solución de problemas con los orígenes de datos](troubleshooting-data-sources.md).

**Topics**
+ [

## Características admitidas
](#supported-features-box)
+ [

## Requisitos previos
](#prerequisites-box)
+ [

## Instrucciones de conexión
](#data-source-procedure-box)
+ [

## Más información
](#box-learn-more)
+ [

## Notas
](#box-notes)

## Características admitidas


Amazon KendraEl conector de fuente de datos de Box admite las siguientes funciones:
+ Asignaciones de campos
+ Control de acceso de usuarios
+ Filtros de inclusión/exclusión
+ Sincronizaciones completas e incrementales del contenido y del registro de cambios
+ Nube privada virtual (VPC)

## Requisitos previos


Antes de poder utilizarla Amazon Kendra para indexar tu fuente de datos de Box, realiza estos cambios en Box y en tus AWS cuentas.

**En Box, asegúrese de que:**
+ Tiene una cuenta Box Enterprise o Box Enterprise Plus.
+ Ha configurado una aplicación personalizada de Box en la consola para desarrolladores de Box con autenticación del servidor mediante tokens web JSON (JWT). Consulte la [documentación de Box sobre la creación de una aplicación personalizada y la](https://developer.box.com/guides/applications/app-types/platform-apps/) [documentación de Box sobre la configuración de JWT Auth](https://developer.box.com/guides/authentication/jwt/) para obtener más información.
+ Ha establecido el **nivel de acceso de la aplicación** en **App \$1 Enterprise Access** y le ha permitido **Realizar llamadas a la API utilizando el encabezado como usuario**.
+ Ha usado el usuario administrador para agregar los siguientes **Ámbitos de aplicación** en su aplicación Box:
  + Escribir todos los archivos y carpetas almacenados en un Box
  + Administración de usuarios
  + Administrar grupos
  + Administrar propiedades empresariales
+ Un par de Public/Private claves configurado incluye un ID de cliente, un secreto de cliente, un ID de clave pública, un ID de clave privada, una contraseña y un ID empresarial para usar como credenciales de autenticación. Consulte [Par de claves pública y privada](https://developer.box.com/guides/authentication/jwt/jwt-setup/#public-and-private-key-pair) para obtener más detalles.
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).
+ Ha copiado el ID empresarial de Box de la configuración de la consola para desarrolladores de Box o de la aplicación Box. Por ejemplo, *801234567*.
+ Ha comprobado que cada documento es único en Box y en otros orígenes de datos que vaya a utilizar para el mismo índice. Cada origen de datos que desee utilizar para un índice no debe contener el mismo documento en varios orígenes de datos. IDs Los documentos son globales para un índice y deben ser únicos por índice.

**En el tuyoCuenta de AWS, asegúrate de tener:**
+ [Creó un Amazon Kendra índice](https://docs.aws.amazon.com/kendra/latest/dg/create-index.html) y, si usa la API, anotó el ID del índice.
+ [Creó un IAM rol](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds) para su fuente de datos y, si usa la API, anotó el ARN del IAM rol.
**nota**  
Si cambias el tipo de autenticación y las credenciales, debes actualizar tu IAM rol para acceder al ID AWS Secrets Manager secreto correcto.
+ Ha guardado sus credenciales de autenticación de Box en un secreto de AWS Secrets Manager y, si utiliza la API, ha anotado el ARN del secreto.
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).

Si no tiene un IAM rol o secreto existente, puede usar la consola para crear un nuevo IAM rol y un Secrets Manager secreto al conectar su fuente de datos de BoxAmazon Kendra. Si utiliza la API, debe proporcionar el ARN de un IAM rol y un Secrets Manager secreto existentes y un ID de índice.

## Instrucciones de conexión


Para conectarse Amazon Kendra a su fuente de datos de Box, debe proporcionar los detalles necesarios de su fuente de datos de Box para que Amazon Kendra pueda acceder a sus datos. Si todavía no has configurado Box forAmazon Kendra, consulta[Requisitos previos](#prerequisites-box).

------
#### [ Console ]

**Para conectarse Amazon Kendra a Box** 

1. Inicia sesión en la [Amazon Kendraconsola Consola de administración de AWS](https://console.aws.amazon.com/kendra/) y ábrela.

1. En el panel de navegación izquierdo, elija **Índices** y, a continuación, elija el índice que desee usar de la lista de índices.
**nota**  
Puede elegir configurar o editar los ajustes de **Control de acceso de usuarios** en la **Configuración del índice**. 

1. En la página **Introducción**, seleccione **Agregar origen de datos**.

1. En la página **Agregar origen de datos**, seleccione el **Conector de Box** y, a continuación, seleccione **Agregar conector**. Si usa la versión 2 (si corresponde), elija el **Conector de Box** con la etiqueta “V2.0”.

1. En la página **Especificar detalles del origen de datos**, introduzca la siguiente información:

   1. En **Nombre y descripción**, en **Nombre del origen de datos**: introduzca un nombre para el origen de datos. Puede incluir guiones, pero no espacios.

   1. (Opcional)** Descripción**: introduzca una descripción opcional para el origen de datos.

   1. En **Idioma predeterminado**: elija un idioma para filtrar los documentos para el índice. A menos que especifique lo contrario, el idioma predeterminado es el inglés. El idioma especificado en los metadatos del documento anula el idioma seleccionado.

   1. En **Etiquetas**, para **añadir una nueva etiqueta**: incluye etiquetas opcionales para buscar y filtrar tus recursos o realizar un seguimiento de tus AWS costes.

   1. Elija **Siguiente**.

1. En la página **Definir acceso y seguridad**, introduzca la siguiente información:

   1. **ID empresarial de Box**: introduzca el ID empresarial de Box. Por ejemplo, *801234567*.

   1. **Autorización**: active o desactive la información de la lista de control de acceso (ACL) para los documentos, si tiene una ACL y desea usarla para el control de acceso. La ACL especifica a qué documentos pueden acceder los usuarios y los grupos. La información de la ACL se utiliza para filtrar los resultados de búsqueda en función del acceso del usuario o su grupo a los documentos. Para obtener más información, consulte [Filtrado de contexto de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#context-filter-user-incl-datasources).

   1. **AWS Secrets Managersecreto**: elija un secreto existente o cree uno nuevo Secrets Manager para almacenar sus credenciales de autenticación de Box. Si decide crear un secreto nuevo, se abrirá una ventana de secreto de AWS Secrets Manager.

      1. **Nombre del secreto**: un nombre para su secreto. El prefijo «AmazonKendra-Box» se añade automáticamente a su nombre secreto.

      1. Para el **identificador de cliente****, el secreto** de cliente, el **identificador de clave pública**, el **identificador de clave privada** y la **contraseña,** introduzca los valores de la Public/Private clave que configuró en Box.

      1. Agregue y guarde el secreto.

   1. **Nube privada virtual (VPC)**: puede optar por utilizar una VPC. Si es así, debe agregar **Subredes** y **Grupos de seguridad de VPC**.

   1. **Rastreador de identidades**: especifique si se debe activar el rastreador de identidades de Amazon Kendra. El rastreador de identidades utiliza la información de la lista de control de acceso (ACL) de los documentos para filtrar los resultados de la búsqueda en función del acceso del usuario o del grupo a los documentos. Si tiene una ACL para sus documentos y decide utilizarla, también puede optar por activar el rastreador de identidades para configurar el [filtrado Amazon Kendra de los resultados de búsqueda por contexto de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#context-filter-user-incl-datasources). De lo contrario, si el rastreador de identidades está desactivado, todos los documentos se pueden buscar públicamente. Si quieres usar el control de acceso para tus documentos y el rastreador de identidad está desactivado, también puedes usar la [PutPrincipalMapping](https://docs.aws.amazon.com/kendra/latest/APIReference/API_PutPrincipalMapping.html)API para cargar información de acceso de usuarios y grupos para filtrar el contexto de los usuarios.

   1. **IAMrol**: elija un IAM rol existente o cree uno nuevo IAM para acceder a las credenciales del repositorio y al contenido del índice.
**nota**  
IAMlos roles utilizados para los índices no se pueden usar para las fuentes de datos. Si no está seguro de si un rol existente se utiliza para un índice o para las preguntas frecuentes, elija **Crear un nuevo rol** para evitar errores.

   1. Elija **Siguiente**.

1. En la página **Configurar ajustes de sincronización**, introduzca la siguiente información:

   1. **Archivos de Box**: elija si desea rastrear los enlaces web, los comentarios y las tareas.

   1. En **Configuración adicional**: añada patrones de expresión regular para incluir o excluir determinado contenido.

   1. **Modo de sincronización**: elija cómo desea actualizar el índice cuando cambie el contenido del origen de datos. Al sincronizar la fuente de datos Amazon Kendra por primera vez, todo el contenido se rastrea e indexa de forma predeterminada. Debe ejecutar una sincronización completa de los datos si la sincronización inicial falló, incluso si no selecciona la sincronización completa como opción de modo de sincronización.
      + Sincronización completa: se vuelve a indexar todo el contenido, reemplazando el contenido existente cada vez que el origen de datos se sincronice con el índice.
      + Sincronización nueva y modificada: indexe solo el contenido nuevo y modificado cada vez que la fuente de datos se sincronice con el índice. Amazon Kendrapuede usar el mecanismo de la fuente de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido que ha cambiado desde la última sincronización.
      + Sincronización nueva y modificada: se indexa solo contenido nuevo y modificado cada vez que el origen de datos se sincronice con el índice. Amazon Kendra puede utilizar el mecanismo del origen de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido modificado desde la última sincronización.

   1. En **Programación de ejecución de sincronización** en **Frecuencia**: elija la frecuencia con la que desea sincronizar el contenido del origen de datos y actualizar el índice.

   1. Elija **Siguiente**.

1. En la página **Establecer asignaciones de campos**, especifique la siguiente información:

   1. **Campos de fuente de datos predeterminados**: seleccione entre los campos de fuente de datos predeterminados Amazon Kendra generados que desee asignar a su índice.

   1.  **Agregar campo**: para agregar campos de origen de datos personalizados para crear un nombre de campo de índice al que asignarlos y el tipo de datos del campo.

   1. Elija **Siguiente**.

1. En la página **Revisar y crear**, compruebe que la información que ha introducido es correcta y, a continuación, seleccione **Añadir origen de datos**. También puede elegir editar la información desde esta página. El origen de datos aparecerá en la página **Orígenes de datos** una vez que el origen de datos se haya agregado correctamente.

------
#### [ API ]

**Para conectarse Amazon Kendra a Box**

Debe especificar lo siguiente mediante la [BoxConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_BoxConfiguration.html)API:

**ID empresarial de Box**: proporcione el ID empresarial de Box. Puede encontrar el ID empresarial en la configuración de la consola para desarrolladores de Box o al configurar una aplicación en Box.
+ **Nombre secreto del recurso de Amazon (ARN): proporciona** el nombre del recurso de Amazon (ARN) de un Secrets Manager secreto que contenga las credenciales de autenticación de tu cuenta de Box. El secreto se almacena en una estructura JSON con las siguientes claves:

  ```
  {
      "clientID": "client-id",
      "clientSecret": "client-secret",
      "publicKeyID": "public-key-id",
      "privateKey": "private-key",
      "passphrase": "pass-phrase"
  }
  ```
+ **IAMrol**: especifique `RoleArn` cuándo llama `CreateDataSource` para proporcionar un IAM rol con permisos para acceder a su Secrets Manager secreto y para llamar al público requerido APIs para el conector de Box y. Amazon Kendra Para obtener más información, consulte [Roles de IAM para orígenes de datos de Box](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds).

También puede añadir las siguientes características opcionales:
+ **Nube privada virtual (VPC)**: especifique `VpcConfiguration` como parte de la configuración del origen de datos. Consulte [Configuración de Amazon Kendra para utilizar una VPC](https://docs.aws.amazon.com/kendra/latest/dg/vpc-configuration.html). 
+  **Registro de cambios**: si Amazon Kendra debe utilizar el mecanismo de registro de cambios del origen de datos de Box para determinar si un documento debe actualizarse en el índice.
**nota**  
Utilice el registro de cambios si no quiere que Amazon Kendra digitalice todos los documentos. Si el registro de cambios es grande, es posible que se Amazon Kendra tarde menos en escanear los documentos de la fuente de datos de Box que en procesar el registro de cambios. Si está sincronizando el origen de datos de Box con su índice por primera vez, se escanean todos los documentos. 
+  **Comentarios, tareas y enlaces web**: especifique si desea rastrear este tipo de contenido.
**nota**  
La mayoría de los orígenes de datos utilizan patrones de expresiones regulares, que son patrones de inclusión o exclusión denominados filtros. Si especifica un filtro de inclusión, solo se indexará el contenido que coincida con el filtro de inclusión. Los documentos que no coincidan con el filtro de inclusión no se indexan. Si especifica un filtro de inclusión y exclusión, los documentos que coincidan con el filtro de exclusión no se indexarán, aunque coincidan con el filtro de inclusión.
+  **Filtros de inclusión y exclusión**: especifique si desea incluir o excluir determinados archivos y carpetas de Box.
**nota**  
La mayoría de los orígenes de datos utilizan patrones de expresiones regulares, que son patrones de inclusión o exclusión denominados filtros. Si especifica un filtro de inclusión, solo se indexará el contenido que coincida con el filtro de inclusión. Los documentos que no coincidan con el filtro de inclusión no se indexan. Si especifica un filtro de inclusión y exclusión, los documentos que coincidan con el filtro de exclusión no se indexarán, aunque coincidan con el filtro de inclusión.
+  **Filtrado de contexto de usuario y control de acceso**: si hay una lista de control de acceso (ACL) para los documentos, Amazon Kendra la rastreará. La información de la ACL se utiliza para filtrar los resultados de búsqueda en función del acceso del usuario o su grupo a los documentos. Para obtener más información, consulte [Filtrado de contexto de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#datasource-context-filter).
+  **Asignaciones de campos**: elija asignar los campos del origen de datos de Box a los campos de índice de Amazon Kendra. Para obtener más información, consulte [Asignación de campos de origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/field-mapping.html).
**nota**  
El campo del cuerpo del documento o el cuerpo del documento equivalente de sus documentos es obligatorio Amazon Kendra para poder buscarlos. Debe asignar el nombre del campo del cuerpo del documento en el origen de datos al nombre del campo del índice `_document_body`. Todos los demás campos son opcionales.

------

## Más información


Para obtener más información sobre la integración Amazon Kendra con la fuente de datos de Box, consulte:
+ [Cómo empezar con el conector Amazon Kendra Box](https://aws.amazon.com/blogs/machine-learning/getting-started-with-the-amazon-kendra-box-connector/)

## Notas

+ Cuando las listas de control de acceso (ACLs) están habilitadas, la opción «Sincronizar solo contenido nuevo o modificado» no está disponible debido a las limitaciones de la API de Box. Recomendamos usar los modos «Sincronización completa» o «Sincronización de contenido nuevo, modificado o eliminado» en su lugar, o desactivarlos ACLs si necesita usar este modo de sincronización.

# Confluence


Confluence es una herramienta colaborativa de gestión del trabajo diseñada para compartir, almacenar y trabajar en la planificación de proyectos, el desarrollo de software y la gestión de productos. Amazon Kendra es compatible con Confluence Server/Data Center y Confluence Cloud. Puedes utilizarla Amazon Kendra para indexar las siguientes entidades de Confluence:
+ **Espacios**: áreas designadas de nivel superior para organizar el contenido relacionado. Cada espacio sirve como un contenedor y puede contener varias páginas, blogs y archivos adjuntos.
+ **Páginas**: documentos individuales dentro de un espacio donde los usuarios crean y administran contenido. Las páginas pueden contener texto, imágenes, tablas y elementos multimedia, y pueden tener subpáginas anidadas. Cada página se considera un único documento.
+ **Blogs**: contenido similar a las páginas, que normalmente se utiliza para actualizaciones o anuncios. Cada publicación de blog se considera un único documento.
+ **Comentarios**: permite a los usuarios dar su opinión o participar en debates sobre contenido específico en las páginas o publicaciones del blog.
+ **Archivos adjuntos**: archivos subidos a páginas o publicaciones de blog en Confluence, como imágenes, documentos u otros tipos de archivos.

De forma predeterminada, Amazon Kendra no indexa los archivos ni los espacios personales de Confluence. Puede elegir indexarlos al crear el origen de datos. Si no quieres Amazon Kendra indexar un espacio, márcalo como privado en Confluence.

Puedes conectarte Amazon Kendra a tu fuente de datos de Confluence mediante la [Amazon Kendra consola](https://console.aws.amazon.com/kendra/), la [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_TemplateConfiguration.html)API o la [ConfluenceConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_ConfluenceConfiguration.html)API.

Amazon Kendra tiene dos versiones del conector de Confluence. Se admiten las siguientes características.

****Conector Confluence V2.0/API [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_TemplateConfiguration.html)****
+ Asignaciones de campos
+ Control de acceso de usuarios
+ Patrones de inclusión/exclusión
+ Sincronizaciones completas e incrementales del contenido
+ Nube privada virtual (VPC)

**El **conector [ConfluenceConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_ConfluenceConfiguration.html)V1.0/API de Confluence (ya no es compatible**)**
+ Asignaciones de campos
+ Control de acceso de usuarios
+ Filtros de inclusión/exclusión
+ (Solo Confluence Server) Nube privada virtual (VPC)

**nota**  
El conector ConfluenceConfiguration V1.0/API de Confluence finalizó en 2023. Recomendamos migrar o utilizar el conector V2.0/API de Confluence. TemplateConfiguration 

Para solucionar problemas del conector de fuente de datos de Amazon Kendra Confluence, consulte. [Solución de problemas con los orígenes de datos](troubleshooting-data-sources.md)

**Topics**
+ [

## ACLs en Confluence Connector
](#data-source-confluence-acls)
+ [

# Confluence Connector V2.0
](data-source-v2-confluence.md)
+ [

# Confluence Connector V1.0
](data-source-v1-confluence.md)

## ACLs en Confluence Connector


Los conectores permiten rastrear las listas de control de acceso (ACLs) e identificar la información, cuando corresponde, en función de la fuente de datos. Si indexa documentos sin ella ACLs, todos los documentos se consideran públicos. La indexación de los documentos ACLs garantiza la seguridad de los datos.

El conector de Amazon Kendra Confluence escanea los espacios para recopilar páginas y publicaciones de blog junto con sus páginas. ACLs Si no se aplica ninguna restricción en una página o blog, el conector hereda los permisos de su espacio. Si se aplica una restricción específica de usuario o grupo a una página, solo esos usuarios podrán acceder a esa página. Si la página está anidada, hereda los permisos de la página principal si no se aplican restricciones. Se aplica un modelo de permisos similar a los blogs; sin embargo, Confluence no es compatible con blogs anidados.

Además, el conector de Amazon Kendra Confluence rastrea la información principal del usuario (alias de usuario local, configuraciones de identidad de grupos locales y grupos federados) y sus permisos para cada espacio configurado. 

**nota**  
El conector de Confluence Cloud no es compatible con el rastreo de macros, pizarras o bases de datos. 

El conector de Amazon Kendra Confluence actualiza los cambios de la ACL cada vez que rastrea el contenido de la fuente de datos. Para garantizar que los usuarios correctos tengan acceso al contenido correcto, vuelva a sincronizar el origen de datos periódicamente para capturar cualquier actualización de las ACL.

# Confluence Connector V2.0


Confluence es una herramienta colaborativa de gestión del trabajo diseñada para compartir, almacenar y trabajar en la planificación de proyectos, el desarrollo de software y la gestión de productos. Puedes usarlo Amazon Kendra para indexar tus espacios, páginas (incluidas las páginas anidadas), blogs, comentarios y archivos adjuntos de páginas y blogs indexados de Confluence.

Para solucionar problemas del conector de fuentes de datos de Amazon Kendra Confluence, consulte. [Solución de problemas con los orígenes de datos](troubleshooting-data-sources.md)

**Topics**
+ [

## Características admitidas
](#supported-features-v2-confluence)
+ [

## Requisitos previos
](#prerequisites-v2-confluence)
+ [

## Instrucciones de conexión
](#data-source-procedure-v2-confluence)

## Características admitidas


Amazon Kendra El conector de fuente de datos de Confluence admite las siguientes funciones:
+ Asignaciones de campos
+ Control de acceso de usuarios
+ Patrones de inclusión/exclusión
+ Sincronizaciones completas e incrementales del contenido
+ Nube privada virtual (VPC)

## Requisitos previos


Antes de que puedas usarlo Amazon Kendra para indexar tu fuente de datos de Confluence, realiza estos cambios en Confluence y en tus cuentas. AWS 

**En Confluence, asegúrese de que:**
+ Ha copiado la URL de la instancia de Confluence. Por ejemplo:*https://example.confluence.com*, o*https://www.example.confluence.com/*, o. *https:// atlassian.net/* La URL de la instancia de Confluence se debe conectar a Amazon Kendra.

  Si utilizas Confluence Cloud, la URL de tu host debe terminar en. *atlassian.net/*
**nota**  
**No** se admiten los siguientes formatos de URL:  
*https://example.confluence.com/xyz*
*https://www.example.confluence.com//wiki/spacekey/xxx*
*https://atlassian.net/xyz*
**nota**  
(local o en el servidor) Amazon Kendra comprueba si la información de punto final incluida AWS Secrets Manager es la misma que la información de punto final especificada en los detalles de configuración de la fuente de datos. Esto ayuda a evitar el [problema del suplente confuso](https://docs.aws.amazon.com/IAM/latest/UserGuide/confused-deputy.html), que es un problema de seguridad en el que un usuario no tiene permiso para realizar una acción, pero utiliza Amazon Kendra como proxy para acceder al secreto configurado y realizar la acción. Si más adelante cambia la información de punto de conexión, debe crear un nuevo secreto para sincronizar esta información.
+ Configure las credenciales de autenticación básica que contienen un nombre de usuario (ID de correo electrónico para iniciar sesión en Confluence) y una contraseña (token de API de Confluence como contraseña). Consulte [Administración de tokens de API para la cuenta de Atlassian](https://support.atlassian.com/atlassian-account/docs/manage-api-tokens-for-your-atlassian-account/#Create-an-API-token).
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).
+ **Opcional:** credenciales OAuth 2.0 configuradas que contienen una clave de aplicación de Confluence, un secreto de la aplicación de Confluence, un token de acceso de Confluence y un token de actualización de Confluence para poder conectarte a tu instancia de Confluence. Amazon Kendra Si el token de acceso caduca, puede usar el token de actualización para regenerar el token de acceso y actualizar el par de tokens. También puede repetir el proceso de autorización. [Para obtener más información sobre los tokens de acceso, consulta Administrar los tokens de acceso. OAuth ](https://support.atlassian.com/confluence-cloud/docs/manage-oauth-access-tokens/)
+ (Solo para Confluence Server/Data Center) **Opcional:** se configuró un token de acceso personal (PAT) en Confluence. Consulte [Uso de tokens de acceso personal](https://confluence.atlassian.com/enterprise/using-personal-access-tokens-1026032365.html).

**En el tuyo Cuenta de AWS, asegúrate de tener:**
+ [Creó un Amazon Kendra índice](https://docs.aws.amazon.com/kendra/latest/dg/create-index.html) y, si usa la API, anotó el ID del índice.
+ [Creó un IAM rol](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds) para su fuente de datos y, si usa la API, anotó el ARN del IAM rol.
**nota**  
Si cambias el tipo de autenticación y las credenciales, debes actualizar tu IAM rol para acceder al ID AWS Secrets Manager secreto correcto.
+ Ha guardado sus credenciales de autenticación de Confluence en un secreto de AWS Secrets Manager y, si utiliza la API, ha anotado el ARN del secreto.
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).

Si no tienes un IAM rol o un secreto existente, puedes usar la consola para crear un nuevo IAM rol y un Secrets Manager secreto al conectar tu fuente de datos de Confluence. Amazon Kendra Si utiliza la API, debe proporcionar el ARN de un IAM rol y un Secrets Manager secreto existentes y un ID de índice.

## Instrucciones de conexión


Para conectarte Amazon Kendra a tu fuente de datos de Confluence, debes proporcionar los detalles necesarios de tu fuente de datos de Confluence para que Amazon Kendra puedas acceder a tus datos. Si aún no has configurado Confluence para consultarlo. Amazon Kendra [Requisitos previos](#prerequisites-v2-confluence)

------
#### [ Console ]

**Para conectarse a Amazon Kendra Confluence** 

1. Inicia sesión en la [Amazon Kendra consola Consola de administración de AWS](https://console.aws.amazon.com/kendra/) y ábrela.

1. En el panel de navegación izquierdo, elija **Índices** y, a continuación, elija el índice que desee usar de la lista de índices.
**nota**  
Puede elegir configurar o editar los ajustes de **Control de acceso de usuarios** en la **Configuración del índice**. 

1. En la página **Introducción**, seleccione **Agregar origen de datos**.

1. En la página **Agregar origen de datos**, seleccione el **Conector de Confluence** y, a continuación, seleccione **Agregar conector**. Si usa la versión 2 (si corresponde), elija el **Conector de Confluence** con la etiqueta “V2.0”.

1. En la página **Especificar detalles del origen de datos**, introduzca la siguiente información:

   1. En **Nombre y descripción**, en **Nombre del origen de datos**: introduzca un nombre para el origen de datos. Puede incluir guiones, pero no espacios.

   1. (Opcional)** Descripción**: introduzca una descripción opcional para el origen de datos.

   1. En **Idioma predeterminado**: elija un idioma para filtrar los documentos para el índice. A menos que especifique lo contrario, el idioma predeterminado es el inglés. El idioma especificado en los metadatos del documento anula el idioma seleccionado.

   1. En **Etiquetas**, para **añadir una nueva etiqueta**: incluye etiquetas opcionales para buscar y filtrar tus recursos o realizar un seguimiento de tus AWS costes.

   1. Elija **Siguiente**.

1. En la página **Definir acceso y seguridad**, introduzca la siguiente información:

   1. **En **Fuente**, selecciona **Confluence Cloud o Confluence** Center. Server/Data **

   1. **URL de Confluence**: introduzca la URL del host de Confluence. Por ejemplo, *https://example.confluence.com*.

   1. **Ubicación del certificado SSL (solo para Confluence Server/Data Center): *opcional*:** introduce la Amazon S3 ruta del archivo de certificado SSL para Confluence Server.

   1. (Solo para Confluence Server/Data Center) **Proxy web: *opcional*:** introduce el nombre del servidor del proxy web (sin el `https://` protocolo `http://` OR) y el número de puerto (puerto utilizado por el protocolo de transporte de URL del host). El número de puerto debe ser un valor numérico entre 0 y 65535.

   1. **Autorización**: active o desactive la información de la lista de control de acceso (ACL) para los documentos, si tiene una ACL y desea usarla para el control de acceso. La ACL especifica a qué documentos pueden acceder los usuarios y los grupos. La información de la ACL se utiliza para filtrar los resultados de búsqueda en función del acceso del usuario o su grupo a los documentos. Para obtener más información, consulte [Filtrado de contexto de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#context-filter-user-incl-datasources).

   1. **Autenticación****: elige entre la **autenticación básica**, la autenticación **Oauth 2.0 o (solo para Confluence Server/Data Center) la autenticación** mediante token de acceso personal.**

   1. **Secreto de AWS Secrets Manager **: elija un secreto existente o cree un nuevo secreto de Secrets Manager para almacenar sus credenciales de autenticación de Confluence. Si decide crear un secreto nuevo, se abrirá una ventana de secreto de AWS Secrets Manager . En la ventana, introduzca la siguiente información:

      1. **Nombre del secreto**: un nombre para su secreto. El prefijo «AmazonKendra-Confluence» se añade automáticamente a tu nombre secreto.

      1. Si usa la **autenticación básica**: introduzca el nombre de secreto, el nombre de usuario y la contraseña (el token de la API de Confluence es la contraseña) que ha configurado en Confluence.

         Si utilizas la **autenticación OAuth2 .0**: introduce el nombre secreto, la clave de la aplicación, el secreto de la aplicación, el token de acceso y el token de actualización que configuraste en Confluence.

         (Solo en Confluence Server/Data Center) Si utilizas la **autenticación con token de acceso personal: introduce el nombre secreto y el token** de Confluence que configuraste en tu Confluence.

      1. Guarde y agregue el secreto.

   1. **Nube privada virtual (VPC)**: puede optar por utilizar una VPC. Si es así, debe agregar **Subredes** y **Grupos de seguridad de VPC**.

   1. **Rastreador de identidades**: especifique si se debe activar el rastreador de identidades de Amazon Kendra. El rastreador de identidades utiliza la información de la lista de control de acceso (ACL) de los documentos para filtrar los resultados de la búsqueda en función del acceso del usuario o del grupo a los documentos. Si tienes una ACL para tus documentos y decides utilizarla, también puedes optar por activar el rastreador de identidades para configurar el filtrado Amazon Kendra de los resultados de búsqueda por [contexto de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#context-filter-user-incl-datasources). De lo contrario, si el rastreador de identidades está desactivado, todos los documentos se pueden buscar públicamente. Si quieres usar el control de acceso para tus documentos y el rastreador de identidad está desactivado, también puedes usar la [PutPrincipalMapping](https://docs.aws.amazon.com/kendra/latest/APIReference/API_PutPrincipalMapping.html)API para cargar información de acceso de usuarios y grupos para filtrar el contexto de los usuarios.

   1. **IAM rol**: elija un IAM rol existente o cree uno nuevo IAM para acceder a las credenciales del repositorio y al contenido del índice.
**nota**  
IAM los roles utilizados para los índices no se pueden usar para las fuentes de datos. Si no está seguro de si un rol existente se utiliza para un índice o para las preguntas frecuentes, elija **Crear un nuevo rol** para evitar errores.

   1. Elija **Siguiente**.

1. En la página **Configurar ajustes de sincronización**, introduzca la siguiente información:

   1. En **Ámbito de sincronización**, en **Sincronizar contenido**: elija sincronizar desde los siguientes tipos de contenido: páginas, comentarios de página, archivos adjuntos de página, blogs, comentarios de blog, archivos adjuntos de blog, espacios personales y espacios archivados.
**nota**  
Los comentarios de página y los archivos adjuntos de página solo se pueden seleccionar si elige sincronizar las **Páginas**. Los comentarios de blog y los archivos adjuntos de blog solo se pueden seleccionar si elige sincronizar los **Blogs**.
**importante**  
Si no especifica un patrón de regex de la tecla espacio en la **Configuración adicional**, se rastrearán todas las páginas y blogs de forma predeterminada.

   1. En **Configuración adicional**, en **Tamaño máximo de archivo**: especifique el límite de tamaño de archivo MBs que se Amazon Kendra rastreará. Amazon Kendra rastreará solo los archivos que se encuentren dentro del límite de tamaño que usted defina. El tamaño de archivo predeterminado es de 50 MB. El tamaño máximo del archivo debe ser mayor que 0 MB y menor o igual que 50 MB.

      En **Patrones de regex de espacios**: especifique si desea incluir o excluir espacios específicos del índice mediante:
      + Tecla espaciadora (por ejemplo,*my-space-123*)
**nota**  
Si no especifica un patrón de regex de la tecla de espacio, se rastrearán todas las páginas y blogs de forma predeterminada.
      + URL (por ejemplo,*.\$1/MySite/MyDocuments/*)
      + Tipo de archivo (por ejemplo,*.\$1\$1.pdf, .\$1\$1.txt*)

      En **Patrones de regex de títulos de entidades**: especifique patrones de expresiones regulares para incluir o excluir determinados blogs, páginas, comentarios y archivos adjuntos por título.
**nota**  
Si quiere incluir o excluir el rastreo de una página o subpágina específica, puede usar los patrones de regex del título de la página.

   1. **Modo de sincronización**: elija cómo desea actualizar el índice cuando cambie el contenido del origen de datos. Al sincronizar el origen de datos con Amazon Kendra por primera vez, todo el contenido se rastrea y se indexa de forma predeterminada. Debe ejecutar una sincronización completa de los datos si la sincronización inicial falló, incluso si no selecciona la sincronización completa como opción de modo de sincronización.
      + Sincronización completa: se vuelve a indexar todo el contenido, reemplazando el contenido existente cada vez que el origen de datos se sincronice con el índice.
      + Sincronización nueva, modificada o eliminada: indexe solo el contenido nuevo, modificado y eliminado cada vez que la fuente de datos se sincronice con el índice. Amazon Kendra puede usar el mecanismo de la fuente de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido que ha cambiado desde la última sincronización.

   1. En **Programación de ejecución de sincronización**, en **Frecuencia**: elija la frecuencia con la que desea sincronizar el contenido del origen de datos y actualizar el índice.

   1. Elija **Siguiente**.

1. En la página **Establecer asignaciones de campos**, especifique la siguiente información:

   1. Seleccione uno de los campos de fuente de datos predeterminados Amazon Kendra generados que desee asignar a su índice. Para agregar campos de origen de datos personalizados, cree un nombre de campo de índice para asignarlos y el tipo de datos del campo.

   1. Elija **Siguiente**.

1. En la página **Revisar y crear**, compruebe que la información que ha introducido es correcta y, a continuación, seleccione **Añadir origen de datos**. También puede elegir editar la información desde esta página. El origen de datos aparecerá en la página **Orígenes de datos** una vez que el origen de datos se haya agregado correctamente.

------
#### [ API ]

**Para conectarte Amazon Kendra a Confluence**

Debe especificar un JSON del [esquema del origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/ds-schemas.html#ds-confluence-schema) mediante la API [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html). Debe proporcionar la siguiente información:
+ **Origen de datos**: defina el tipo de origen de datos como `CONFLUENCEV2` cuando utilice el esquema JSON [https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html](https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html). Además, defina el origen de datos como `TEMPLATE` al llamar a la API [https://docs.aws.amazon.com/kendra/latest/dg/API_CreateDataSource.html](https://docs.aws.amazon.com/kendra/latest/dg/API_CreateDataSource.html).
+ **URL del host**: especifique la instancia de URL del host de Confluence. Por ejemplo, *https://example.confluence.com*.
+ **Modo de sincronización**: especifique cómo Amazon Kendra debe actualizar el índice cuando cambie el contenido del origen de datos. Cuando sincronizas tu fuente de datos Amazon Kendra por primera vez, todo el contenido se rastrea e indexa de forma predeterminada. Debe ejecutar una sincronización completa de los datos si la sincronización inicial falló, incluso si no selecciona la sincronización completa como opción de modo de sincronización. Puede elegir entre las siguientes opciones:
  + `FORCED_FULL_CRAWL` para volver a indexar todo el contenido, reemplazando el contenido existente cada vez que el origen de datos se sincronice con el índice.
  + `FULL_CRAWL`para indexar solo el contenido nuevo, modificado y eliminado cada vez que la fuente de datos se sincronice con el índice. Amazon Kendra puede usar el mecanismo de la fuente de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido que ha cambiado desde la última sincronización.
+ **Tipo de autenticación**: especifique el tipo de autenticación, ya sea `Basic`, `OAuth2` o `Personal-token` (solo Confluence Server).
+ (Opcional, solo para Confluence Server) **Ubicación del certificado SSL**: especifique el `S3bucketName` y `s3certificateName` que utilizó para almacenar su certificado SSL.
+ **Nombre secreto de recurso de Amazon (ARN)**: proporciona el nombre de recurso de Amazon (ARN) de un Secrets Manager secreto que contenga las credenciales de autenticación que configuraste en Confluence. Si utiliza la autenticación básica, el secreto se almacena en una estructura JSON con las siguientes claves: 

  ```
  {
      "username": "email ID or user name",
      "password": "Confluence API token"
  }
  ```

  Si utilizas la autenticación OAuth 2.0, el secreto se almacena en una estructura JSON con las siguientes claves:

  ```
  {
      "confluenceAppKey": "app key",
      "confluenceAppSecret": "app secret",
      "confluenceAccessToken": "access token",
      "confluenceRefreshToken": "refresh token"
  }
  ```

  (Solo para el servidor Confluence) Si utiliza la autenticación básica, el secreto se almacena en una estructura JSON con las siguientes claves:

  ```
  {
      "hostUrl": "Confluence Server host URL",
      "username": "Confluence Server user name",
      "password": "Confluence Server password"
  }
  ```

  (Solo para el servidor Confluence) Si utiliza la autenticación con token de acceso personal, el secreto se almacena en una estructura JSON con las siguientes claves:

  ```
  {
      "hostUrl": "Confluence Server host URL",
      "patToken": "personal access token"
  }
  ```
+ **IAM rol**: especifica `RoleArn` cuándo llamas `CreateDataSource` para proporcionar a un IAM rol permisos para acceder a tu Secrets Manager secreto y para llamar al público requerido APIs para el conector de Confluence y. Amazon Kendra Para obtener más información, consulte [Roles de IAM para orígenes de datos de Confluence](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds).

También puede añadir las siguientes características opcionales:
+  **Nube privada virtual (VPC)**: especifique a `VpcConfiguration` cuándo llamar a `CreateDataSource`. Para obtener más información, consulte [¿Se está configurando Amazon Kendra para usar un Amazon VPC](vpc-configuration.md).
+  **Tamaño de archivo**: especifique el tamaño de archivo máximo que se va a rastrear.
+  **Tipos de documento o contenido**: especifique si se van a rastrear las páginas, los comentarios de página, los archivos adjuntos de página, los blogs, los comentarios de blog, los archivos adjuntos de blog, espacios y los espacios archivados.
+ **Filtros de inclusión y exclusión**: especifique si desea incluir o excluir determinados espacios, páginas o blogs y sus comentarios y archivos adjuntos.
**nota**  
La mayoría de los orígenes de datos utilizan patrones de expresiones regulares, que son patrones de inclusión o exclusión denominados filtros. Si especifica un filtro de inclusión, solo se indexará el contenido que coincida con el filtro de inclusión. Los documentos que no coincidan con el filtro de inclusión no se indexan. Si especifica un filtro de inclusión y exclusión, los documentos que coincidan con el filtro de exclusión no se indexarán, aunque coincidan con el filtro de inclusión.
+ **Proxy web**: especifique la información de su proxy web si desea conectarse a la instancia de la URL de Confluence a través de un proxy web. Puede utilizar esta opción para Confluence Server.
+ **Lista de control de acceso (ACL)**: especifique si se va a rastrear la información de la ACL para los documentos, si tiene una ACL y desea usarla para el control de acceso. La ACL especifica a qué documentos pueden acceder los usuarios y los grupos. La información de la ACL se utiliza para filtrar los resultados de búsqueda en función del acceso del usuario o su grupo a los documentos. Para obtener más información, consulte [Filtrado de contexto de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#context-filter-user-incl-datasources).
+ **Rastreador de identidades**: especifique si se debe activar el rastreador de identidades de Amazon Kendra. El rastreador de identidades utiliza la información de la lista de control de acceso (ACL) de los documentos para filtrar los resultados de la búsqueda en función del acceso del usuario o del grupo a los documentos. Si tienes una ACL para tus documentos y decides utilizarla, también puedes optar por activar el rastreador de identidades para configurar el [filtrado Amazon Kendra de los resultados de búsqueda por contexto de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#context-filter-user-incl-datasources). De lo contrario, si el rastreador de identidades está desactivado, todos los documentos se pueden buscar públicamente. Si quieres usar el control de acceso para tus documentos y el rastreador de identidad está desactivado, también puedes usar la [PutPrincipalMapping](https://docs.aws.amazon.com/kendra/latest/APIReference/API_PutPrincipalMapping.html)API para cargar información de acceso de usuarios y grupos para filtrar el contexto de los usuarios.
+  **Asignaciones de campos**: elija asignar los campos del origen de datos de Confluence a los campos de índice de Amazon Kendra . Para obtener más información, consulte [Asignación de campos de origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/field-mapping.html).
**nota**  
El campo del cuerpo del documento o el cuerpo del documento equivalente de sus documentos es obligatorio Amazon Kendra para poder buscarlos. Debe asignar el nombre del campo del cuerpo del documento en el origen de datos al nombre del campo del índice `_document_body`. Todos los demás campos son opcionales.

Para obtener una lista de otras claves JSON importantes que debe configurar, consulte el [Esquema de plantilla de Confluence](https://docs.aws.amazon.com/kendra/latest/dg/ds-schemas.html#ds-confluence-schema).

------

### Notas

+ El token de acceso personal (PAT) no está disponible para Confluence Cloud.

# Confluence Connector V1.0


Confluence es una herramienta colaborativa de gestión del trabajo diseñada para compartir, almacenar y trabajar en la planificación de proyectos, el desarrollo de software y la gestión de productos. Puedes usarlo Amazon Kendra para indexar tus espacios de Confluence, páginas (incluidas las páginas anidadas), blogs y comentarios y archivos adjuntos de páginas y blogs indexados.

**nota**  
El conector ConfluenceConfiguration V1.0/API de Confluence finalizó en 2023. Recomendamos migrar o utilizar el conector V2.0/API de Confluence. TemplateConfiguration 

Para solucionar problemas del conector de fuente de datos de Amazon Kendra Confluence, consulte. [Solución de problemas con los orígenes de datos](troubleshooting-data-sources.md)

**Topics**
+ [

## Características admitidas
](#supported-features-v1-confluence)
+ [

## Requisitos previos
](#prerequisites-v1-confluence)
+ [

## Instrucciones de conexión
](#data-source-procedure-v1-confluence)
+ [

## Más información
](#confluence-v1-learn-more)

## Características admitidas


Amazon Kendra El conector de fuente de datos de Confluence admite las siguientes funciones:
+ Asignaciones de campos
+ Control de acceso de usuarios
+ Filtros de inclusión/exclusión
+ (Solo para Confluence Server) Nube privada virtual (VPC)

## Requisitos previos


Antes de que puedas usarlo Amazon Kendra para indexar tu fuente de datos de Confluence, realiza estos cambios en Confluence y en tus cuentas. AWS 

**En Confluence, asegúrese de que:**
+ Has concedido Amazon Kendra permisos para ver todo el contenido de tu instancia de Confluence de la siguiente manera:
  + Convirtiéndose Amazon Kendra en miembro de un `confluence-administrators` grupo.
  + Ha otorgado permisos de administrador del sitio para todos los espacios, blogs y páginas existentes.
+ Ha copiado la dirección URL de la instancia de Confluence.
+ **Para los usuarios de SSO (inicio de sesión único):** ha activado la **página Mostrar al iniciar sesión** para el nombre de usuario y la contraseña al configurar los **Métodos de autenticación** de Confluence en el centro de datos de Confluence.
+ **Para Confluence Server**
  + Ha apuntado sus credenciales de autenticación básica, que incluyen el nombre de usuario y la contraseña de su cuenta administrativa de Confluence para conectarse a Amazon Kendra.
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).
  + **Opcional:** ha generado un token de acceso personal en la cuenta de Confluence para conectarse a Amazon Kendra. Para obtener más información, consulte la [Documentación de Confluence sobre la generación de tokens de acceso personal](https://confluence.atlassian.com/enterprise/using-personal-access-tokens-1026032365.html).
+ **Para Confluence Cloud**
  + Ha apuntado sus credenciales de autenticación básica, que incluyen el nombre de usuario y la contraseña de su cuenta administrativa de Confluence para conectarse a Amazon Kendra.
+ Ha comprobado que cada documento es único en Confluence y en otros orígenes de datos que vaya a utilizar para el mismo índice. Cada origen de datos que desee utilizar para un índice no debe contener el mismo documento en varios orígenes de datos. IDs Los documentos son globales en relación con un índice y deben ser únicos por índice.

**En el tuyo Cuenta de AWS, asegúrate de tener:**
+ [Creó un Amazon Kendra índice](https://docs.aws.amazon.com/kendra/latest/dg/create-index.html) y, si usa la API, anotó el ID del índice.
+ [Creó un IAM rol](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds) para su fuente de datos y, si usa la API, anotó el ARN del IAM rol.
**nota**  
Si cambias el tipo de autenticación y las credenciales, debes actualizar tu IAM rol para acceder al ID AWS Secrets Manager secreto correcto.
+ Ha guardado sus credenciales de autenticación de Confluence en un secreto de AWS Secrets Manager y, si utiliza la API, ha anotado el ARN del secreto.
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).

Si no tienes un IAM rol o un secreto existente, puedes usar la consola para crear un nuevo IAM rol y un Secrets Manager secreto al conectar tu fuente de datos de Confluence. Amazon Kendra Si utiliza la API, debe proporcionar el ARN de un IAM rol y un Secrets Manager secreto existentes y un ID de índice.

## Instrucciones de conexión


Para conectarte Amazon Kendra a tu fuente de datos de Confluence, debes proporcionar los detalles de tus credenciales de Confluence para que Amazon Kendra puedas acceder a tus datos. Si aún no has configurado Confluence para consultarlo. Amazon Kendra [Requisitos previos](#prerequisites-v1-confluence)

------
#### [ Console ]

**Para conectarse a Amazon Kendra Confluence** 

1. Inicia sesión en la consola AWS de administración y abre la [Amazon Kendra consola](https://console.aws.amazon.com/kendra/).

1. En el panel de navegación izquierdo, elija **Índices** y, a continuación, elija el índice que desee usar de la lista de índices.
**nota**  
Puede elegir configurar o editar los ajustes de **Control de acceso de usuarios** en la **Configuración del índice**. 

1. En la página **Introducción**, seleccione **Agregar origen de datos**.

1. En la página **Agregar origen de datos**, elija el **Confluence Connector V1.0** y, a continuación, elija **Agregar origen de datos**.

1. En la página **Especificar detalles del origen de datos**, introduzca la siguiente información:

   1. En **Nombre y descripción**, en **Nombre del origen de datos**: introduzca un nombre para el origen de datos. Puede incluir guiones, pero no espacios.

   1. (Opcional)** Descripción**: introduzca una descripción opcional para el origen de datos.

   1. En **Idioma predeterminado**: elija un idioma para filtrar los documentos para el índice. A menos que especifique lo contrario, el idioma predeterminado es el inglés. El idioma especificado en los metadatos del documento anula el idioma seleccionado.

   1. En **Etiquetas**, para **añadir una nueva etiqueta**: incluya etiquetas opcionales para buscar y filtrar sus recursos o realizar un seguimiento de sus AWS costes.

   1. Elija **Siguiente**.

1. En la página **Definir acceso y seguridad**, introduzca la siguiente información:

   1. Elija entre **Confluence Cloud** y **Confluence Server**.

   1. Si elige **Confluence Cloud**, introduzca la siguiente información:

      1. **URL de Confluence**: la URL de Confluence.

      1. **AWS Secrets Manager secreto**: elige un secreto existente o crea uno nuevo para almacenar tus Secrets Manager credenciales de autenticación de Confluence. Si decide crear un secreto nuevo, se abrirá una ventana de secreto de AWS Secrets Manager .

         1. Introduzca la siguiente información en la **ventana Crear un secreto de AWS Secrets Manager **:

           1. **Nombre del secreto**: un nombre para su secreto. El prefijo «AmazonKendra-Confluence» se añade automáticamente a tu nombre secreto.

           1. Para el **Nombre de usuario** y la **Contraseña**: introduzca su nombre de usuario y contraseña de Confluence.

           1. Seleccione **Guardar autenticación**.

   1. Si elige **Confluence Server**, introduzca la siguiente información:

      1. **URL de Confluence**: su nombre de usuario y contraseña de Confluence.

      1. (Opcional) Para el **Proxy web**, introduzca la siguiente información:

         1.  **Nombre de host**: nombre de host de su cuenta de Confluence.

         1.  **Número de puerto**: puerto utilizado por el protocolo de transporte de URL del host.

      1. Para la **Autenticación**, elija la **Autenticación básica** o **Token de acceso personal** (solo Confluence Server).

      1. **AWS Secrets Manager secreto**: elige un secreto existente o crea uno nuevo para almacenar tus credenciales de autenticación de Secrets Manager Confluence. Si decide crear un secreto nuevo, se abrirá una ventana de secreto de AWS Secrets Manager .

         1. Introduzca la siguiente información en la **ventana Crear un secreto de AWS Secrets Manager **:

           1. **Nombre del secreto**: un nombre para su secreto. El prefijo «AmazonKendra-Confluence» se añade automáticamente a tu nombre secreto.

           1. Para el **Nombre de usuario** y la **Contraseña**: introduzca los valores de las credenciales de autenticación que ha configurado en Confluence. Si usa la autenticación básica, utilice su nombre de usuario (ID de correo electrónico) y contraseña (token de API) de Confluence. Si usa un token de acceso personal, introduzca los detalles del **Token de acceso personal** que ha configurado en la cuenta de Confluence.

           1. Guarde y agregue el secreto.

   1. **IAM rol**: elige un IAM rol existente o crea uno nuevo IAM para acceder a las credenciales del repositorio y al contenido del índice.
**nota**  
IAM los roles utilizados para los índices no se pueden usar para las fuentes de datos. Si no está seguro de si un rol existente se utiliza para un índice o para las preguntas frecuentes, elija **Crear un nuevo rol** para evitar errores.

   1. Elija **Siguiente**.

1. En la página **Configurar ajustes de sincronización**, introduzca la siguiente información:

   1. En **Incluir espacios personales** e **Incluir espacios archivados**: elija los tipos de espacio opcionales que desee incluir en este origen de datos.

   1. En **Configuración adicional**: especifique los patrones de expresión regular para incluir o excluir cierto contenido. Puede agregar hasta 100 patrones.

   1. También puede elegir **Rastrear archivos adjuntos dentro de los espacios elegidos.**

   1. **Calendario de ejecución sincronizado**, para **Frecuencia**: elija la frecuencia con la que Amazon Kendra se sincronizará con la fuente de datos.

   1. Elija **Siguiente**.

1. En la página **Establecer asignaciones de campos**, especifique la siguiente información:

   1. Para **espacio**, **página** o **blog**: seleccione entre los campos de fuente de datos predeterminados Amazon Kendra generados o las **asignaciones de campos sugeridas adicionales para agregar campos** de índice.

   1.  **Agregar campo**: para agregar campos de origen de datos personalizados para crear un nombre de campo de índice al que asignarlos y el tipo de datos del campo.

   1. Elija **Siguiente**.

1. En la página **Revisar y crear**, compruebe que la información que ha introducido es correcta y, a continuación, seleccione **Añadir origen de datos**. También puede elegir editar la información desde esta página. El origen de datos aparecerá en la página **Orígenes de datos** una vez que el origen de datos se haya agregado correctamente.

------
#### [ API ]

**Para conectarse a Confluence Amazon Kendra **

Debes especificar lo siguiente mediante la [ConfluenceConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_ConfluenceConfiguration.html)API:
+ **Versión de Confluence**: especifique la versión de la instancia de Confluence que está utilizando como `CLOUD` o `SERVER`.
+ **Nombre secreto de recurso de Amazon (ARN)**: proporciona el nombre de recurso de Amazon (ARN) de un Secrets Manager secreto que contenga tus credenciales de autenticación de Confluence.

  Si usa Confluence Server, puede usar el nombre de usuario y la contraseña de Confluence o el token de acceso personal como credenciales de autenticación.

  Si usa su nombre de usuario y contraseña de Confluence como credenciales de autenticación, guarda las siguientes credenciales como una estructura JSON en el secreto de Secrets Manager :

  ```
  {
      "username": "user name",
      "password": "password"
  }
  ```

  Si utilizas un token de acceso personal para conectarte a Confluence Server Amazon Kendra, guardas las siguientes credenciales como una estructura JSON en tu secreto: Secrets Manager 

  ```
  {
      "patToken": "personal access token"
  }
  ```

  Si usa Confluence Cloud, utiliza su nombre de usuario de Confluence y un token de API, configurado en Confluence, como contraseña. Guardas las siguientes credenciales como una estructura JSON en tu Secrets Manager secreto:

  ```
  {
      "username": "user name",
      "password": "API token"
  }
  ```
+ **IAM rol**: especifica `RoleArn` cuándo llamas `CreateDataSource` para proporcionar un IAM rol con permisos para acceder a tu Secrets Manager secreto y para llamar al público requerido APIs para el conector de Confluence y. Amazon Kendra Para obtener más información, consulte [Roles de IAM para orígenes de datos de Confluence](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds).

También puede añadir las siguientes características opcionales:
+ **Proxy web**: si conectarse a la instancia de la URL de Confluence a través de un proxy web. Puede utilizar esta opción para Confluence Server.
+ (Solo para Confluence Server) **Nube privada virtual (VPC)**: especifique `VpcConfiguration` como parte de la configuración del origen de datos. Consulte [Configuración Amazon Kendra para usar una VPC](https://docs.aws.amazon.com/kendra/latest/dg/vpc-configuration.html).
+  **Filtros de inclusión y exclusión**: especifique patrones de expresiones regulares para incluir o excluir determinados espacios, publicaciones de blog, páginas y archivos adjuntos. Si decide indexar los archivos adjuntos, solo se indexarán los adjuntos de las páginas y blogs indexados.
**nota**  
La mayoría de los orígenes de datos utilizan patrones de expresiones regulares, que son patrones de inclusión o exclusión denominados filtros. Si especifica un filtro de inclusión, solo se indexará el contenido que coincida con el filtro de inclusión. Los documentos que no coincidan con el filtro de inclusión no se indexan. Si especifica un filtro de inclusión y exclusión, los documentos que coincidan con el filtro de exclusión no se indexarán, aunque coincidan con el filtro de inclusión.
+  **Asignaciones de campos**: elija asignar los campos del origen de datos de Confluence a los campos de índice de Amazon Kendra . Para obtener más información, consulte [Asignación de campos de origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/field-mapping.html).
**nota**  
El campo del cuerpo del documento o el cuerpo del documento equivalente de sus documentos es obligatorio Amazon Kendra para poder buscarlos. Debe asignar el nombre del campo del cuerpo del documento en el origen de datos al nombre del campo del índice `_document_body`. Todos los demás campos son opcionales.
+  **Filtrado de contexto de usuario y control de acceso**: si hay una lista de control de acceso (ACL) para los documentos,Amazon Kendra la rastreará. La información de la ACL se utiliza para filtrar los resultados de búsqueda en función del acceso del usuario o su grupo a los documentos. Para obtener más información, consulte [Filtrado de contexto de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#datasource-context-filter).

------

## Más información


Para obtener más información sobre la integración Amazon Kendra con tu fuente de datos de Confluence, consulta:
+ [Configuración del conector de Amazon Kendra Confluence Server](https://aws.amazon.com/blogs/machine-learning/configuring-your-amazon-kendra-confluence-server-connector/)

# Conector de orígenes de datos personalizados


Utilice un origen de datos personalizado cuando tenga un repositorio para el que Amazon Kendra aún no proporcione un conector de origen de datos. Puede usarlo para ver las mismas métricas del historial de ejecución que proporcionan los orígenes de datos de Amazon Kendra, aunque no pueda utilizarlos para sincronizar los repositorios. Utilícelo para crear una experiencia de supervisión de sincronización coherente entre los orígenes de datos de Amazon Kendra y los personalizados. En concreto, utilice un origen de datos personalizado para ver las métricas de sincronización de un conector de origen de datos que haya creado con las API [BatchPutDocument](https://docs.aws.amazon.com/kendra/latest/APIReference/API_BatchPutDocument.html) y [BatchDeleteDocument](https://docs.aws.amazon.com/kendra/latest/APIReference/API_BatchDeleteDocument.html).

Para solucionar problemas del conector de origen de datos personalizado de Amazon Kendra, consulte [Solución de problemas con los orígenes de datos](troubleshooting-data-sources.md).

Al crear un origen de datos personalizado, tiene el control total sobre cómo se seleccionan los documentos que se van a indexar. Amazon Kendra solo proporciona información de métricas que se puede utilizar para monitorizar los trabajos de sincronización del origen de datos. Debe crear y ejecutar el rastreador que determina los documentos que indexa su origen de datos.

Debe especificar el título principal de los documentos mediante el objeto [Document](https://docs.aws.amazon.com/kendra/latest/APIReference/API_Document.html) y `_source_uri` en [DocumentAttribute](https://docs.aws.amazon.com/kendra/latest/APIReference/API_DocumentAttribute.html) para poder incluir `DocumentTitle` y `DocumentURI` en la respuesta del resultado de la `Query`.

Puede crear un identificador para su origen de datos personalizado mediante la consola o mediante la API [CreateDataSource](https://docs.aws.amazon.com/kendra/latest/APIReference/API_CreateDataSource.html). Para usar la consola, asigne un nombre al origen de datos y, si lo desea, una descripción y etiquetas de recursos. Una vez creado el origen de datos, se muestra el ID correspondiente. Copie este ID para usarlo cuando sincronice el origen de datos con el índice.

![\[Form for specifying data source details, including name, description, and optional tags.\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/images/CustomDataSource.png)


También puede crear un origen de datos personalizada mediante la API `CreateDataSource`. La API devuelve un ID para usarlo al sincronizar el origen de datos. Cuando utiliza la API `CreateDataSource` para crear un origen de datos personalizado, no puede configurar los parámetros `Configuration`, `RoleArn` o `Schedule`. Si establece estos parámetros, Amazon Kendra devuelve una excepción `ValidationException`.

Para usar un origen de datos personalizado, cree una aplicación que se encargue de actualizar el índice de Amazon Kendra. La aplicación depende del rastreador que cree. El rastreador lee los documentos del repositorio y determina cuáles se deben enviar a Amazon Kendra. La aplicación debe realizar los pasos siguientes: 

1. Rastrear el repositorio y hacer una lista de los documentos del repositorio que se han agregado, actualizado o eliminado.

1. Llamar a la API [StartDataSourceSyncJob](https://docs.aws.amazon.com/kendra/latest/APIReference/API_StartDataSourceSyncJob.html) para indicar que se está iniciando un trabajo de sincronización. Se proporciona un ID de origen de datos para identificar el origen de datos que se está sincronizando. Amazon Kendra devuelve un ID de ejecución para identificar un trabajo de sincronización concreto.

1. Llamar a la API [BatchDeleteDocument](https://docs.aws.amazon.com/kendra/latest/APIReference/API_BatchDeleteDocument.html) para eliminar documentos del índice. Se proporciona el ID del origen de datos y el ID de ejecución para identificar el origen de datos que se está sincronizando y el trabajo al que está asociada esta actualización.

1. Llamar a la API [StopDataSourceSyncJob](https://docs.aws.amazon.com/kendra/latest/APIReference/API_StopDataSourceSyncJob.html) para indicar el final del trabajo de sincronización. Después de llamar a la API `StopDataSourceSyncJob`, el ID de ejecución asociado deja de ser válido.

1. Llamar a la API [ListDataSourceSyncJobs](https://docs.aws.amazon.com/kendra/latest/APIReference/API_ListDataSourceSyncJobs.html) con los identificadores del índice y del origen de datos para enumerar los trabajos de sincronización del origen de datos y ver las métricas correspondientes.

Tras finalizar un trabajo de sincronización, se puede iniciar uno nuevo. Puede transcurrir un tiempo antes de que todos los documentos enviados se añadan al índice. Use la API `ListDataSourceSyncJobs` para ver el estado del trabajo de sincronización. Si el `Status` devuelto para el trabajo de sincronización es `SYNCING_INDEXING`, algunos documentos aún se están indexando. Se puede iniciar un nuevo trabajo de sincronización cuando el estado del trabajo anterior sea `FAILED` o `SUCCEEDED`.

Después de llamar a la API `StopDataSourceSyncJob`, no se puede usar un identificador de trabajo de sincronización en una llamada a las API `BatchPutDocument` o `BatchDeleteDocument`. Si lo hace, todos los documentos enviados se devolverán en el mensaje de respuesta `FailedDocuments` de la API.

## Atributos obligatorios


Al enviar un documento a Amazon Kendra mediante la API `BatchPutDocument`, cada documento requiere dos atributos para identificar el origen de datos y la ejecución de sincronización a la que pertenece. Debe proporcionar los dos atributos siguientes para asignar correctamente los documentos del origen de datos personalizado a un índice de Amazon Kendra:
+ `_data_source_id`: el identificador del origen de datos. Este se devuelve al crear el origen de datos con la consola o la API `CreateDataSource`.
+ `_data_source_sync_job_execution_id`: el identificador de la ejecución de sincronización. Se devuelve al iniciar la sincronización del índice con la API `StartDataSourceSyncJob`.

El siguiente es el JSON necesario para indexar un documento mediante un origen de datos personalizado.

```
{
    "Documents": [
        {
            "Attributes": [
                {
                    "Key": "_data_source_id",
                    "Value": {
                        "StringValue": "data source identifier"
                    }
                },
                {
                    "Key": "_data_source_sync_job_execution_id",
                    "Value": {
                        "StringValue": "sync job identifier"
                    }
                }
            ],
            "Blob": "document content",
            "ContentType": "content type",
            "Id": "document identifier",
            "Title": "document title"
        }
    ],
    "IndexId": "index identifier",
    "RoleArn": "IAM role ARN"
}
```

Al eliminar un documento del índice mediante la API `BatchDeleteDocument`, se deben especificar los dos campos siguientes en el parámetro `DataSourceSyncJobMetricTarget`:
+ `DataSourceId`: el identificador del origen de datos. Este se devuelve al crear el origen de datos con la consola o la API `CreateDataSource`.
+ `DataSourceSyncJobId`: el identificador de la ejecución de sincronización. Se devuelve al iniciar la sincronización del índice con la API `StartDataSourceSyncJob`.

El siguiente es el JSON necesario para eliminar un documento del índice mediante la API `BatchDeleteDocument`.

```
{
    "DataSourceSyncJobMetricTarget": {
        "DataSourceId": "data source identifier",
        "DataSourceSyncJobId": "sync job identifier"
    },
    "DocumentIdList": [
        "document identifier"
    ],
    "IndexId": "index identifier"
}
```

## Visualización de métricas


Una vez finalizado un trabajo de sincronización, se puede usar la API [DataSourceSyncJobMetrics](https://docs.aws.amazon.com/kendra/latest/APIReference/API_DataSourceSyncJobMetrics.html) para obtener las métricas asociadas al trabajo de sincronización. Utilícela para supervisar las sincronizaciones de sus orígenes de datos personalizados.

Si se envía el mismo documento varias veces, ya sea como parte de la API `BatchPutDocument`, la API `BatchDeleteDocument` o si el documento se envía tanto para su adición como para su eliminación, el documento solo se cuenta una vez en las métricas.
+ `DocumentsAdded`: la cantidad de documentos enviados mediante la API `BatchPutDocument` asociada a este trabajo de sincronización agregados al índice por primera vez. Si un documento se envía para agregarlo más de una vez en una sincronización, el documento solo se cuenta una vez en las métricas.
+ `DocumentsDeleted`: la cantidad de documentos enviados mediante la API `BatchDeleteDocument` asociada a este trabajo de sincronización eliminados del índice. Si un documento se envía para eliminarlo más de una vez en una sincronización, el documento solo se cuenta una vez en las métricas.
+ `DocumentsFailed`: el número de documentos asociados a este trabajo de sincronización que no se pudieron indexar. Se trata de documentos que fueron aceptados por Amazon Kendra para su indexación, pero que no se pudieron indexar ni eliminar. Si un documento no es aceptado por Amazon Kendra, el identificador del documento se devuelve en la propiedad de respuesta `FailedDocuments` de las API `BatchPutDocument` y `BatchDeleteDocument`.
+ `DocumentsModified`: la cantidad de documentos modificados enviados mediante la API `BatchPutDocument` asociada a este trabajo de sincronización que se modificaron en el índice de Amazon Kendra.

Amazon Kendra también emite métricas de Amazon CloudWatch al indexar los documentos. Para obtener más información, consulte [Monitorización de Amazon Kendra con Amazon CloudWatch](https://docs.aws.amazon.com/kendra/latest/dg/cloudwatch-metrics.html).

Amazon Kendra no devuelve la métrica `DocumentsScanned` de los orígenes de datos personalizados. También emite las métricas de CloudWatch que figuran en el documento [Métricas de los orígenes de datos de Amazon Kendra](https://docs.aws.amazon.com/kendra/latest/dg/cloudwatch-metrics.html#cloudwatch-metrics-data-source).

## Más información


Para obtener más información acerca de la integración de Amazon Kendra con el origen de datos personalizado, consulte:
+ [Agregar orígenes de datos personalizados a Amazon Kendra](https://aws.amazon.com/blogs/machine-learning/adding-custom-data-sources-to-amazon-kendra/)

# Origen de datos personalizado (Java)


El código siguiente proporciona un ejemplo de implementación de un origen de datos personalizado mediante Java. El programa crea primero un origen de datos personalizado y, a continuación, sincroniza los documentos recién agregados al índice con dicho origen.

El código siguiente muestra la creación y el uso de un origen de datos personalizado. Al utilizar un origen de datos personalizado en la aplicación, no es necesario crear un nuevo origen de datos (un proceso único) cada vez que se sincronice el índice con él. Se utiliza el ID de índice y el ID del origen de datos para sincronizar los datos.

```
package com.amazonaws.kendra;

import java.util.concurrent.TimeUnit;
import software.amazon.awssdk.services.kendra.KendraClient;
import csoftware.amazon.awssdk.services.kendra.model.BatchPutDocumentRequest;
import csoftware.amazon.awssdk.services.kendra.model.BatchPutDocumentResponse;
import software.amazon.awssdk.services.kendra.model.CreateDataSourceRequest;
import software.amazon.awssdk.services.kendra.model.CreateDataSourceResponse;
import software.amazon.awssdk.services.kendra.model.DataSourceType;
import software.amazon.awssdk.services.kendra.model.Document;
import software.amazon.awssdk.services.kendra.model.ListDataSourceSyncJobsRequest;
import software.amazon.awssdk.services.kendra.model.ListDataSourceSyncJobsResponse;
import software.amazon.awssdk.services.kendra.model.StartDataSourceSyncJobRequest;
import software.amazon.awssdk.services.kendra.model.StartDataSourceSyncJobResponse;
import software.amazon.awssdk.services.kendra.model.StopDataSourceSyncJobRequest;
import software.amazon.awssdk.services.kendra.model.StopDataSourceSyncJobResponse;

public class SampleSyncForCustomDataSource {
  public static void main(String[] args) {
    KendraClient kendra = KendraClient.builder().build();

    String myIndexId = "yourIndexId";
    String dataSourceName = "custom data source";
    String dataSourceDescription = "Amazon Kendra custom data source connector"
	
    // Create custom data source
    CreateDataSourceRequest createDataSourceRequest = CreateDataSourceRequest
        .builder()
        .indexId(myIndexId)
        .name(dataSourceName)
        .description(dataSourceDescription)
        .type(DataSourceType.CUSTOM)
        .build();
    	
    CreateDataSourceResponse createDataSourceResponse = kendra.createDataSource(createDataSourceRequest);
    System.out.println(String.format("Response of creating data source: %s", createDataSourceResponse));
	
    // Get the data source ID from createDataSourceResponse
    String dataSourceId = createDataSourceResponse.Id();

    // Wait for the custom data source to become active
    System.out.println(String.format("Waiting for Amazon Kendra to create the data source %s", dataSourceId));
    // You can use the DescribeDataSource API to check the status
    DescribeDataSourceRequest describeDataSourceRequest = DescribeDataSourceRequest
        .builder()
        .indexId(myIndexId)
        .id(dataSourceId)
        .build();

    while (true) {
        DescribeDataSourceResponse describeDataSourceResponse = kendra.describeDataSource(describeDataSourceRequest);

        DataSourceStatus status = describeDataSourceResponse.status();
        System.out.println(String.format("Creating data source. Status: %s", status));
        if (status != DataSourceStatus.CREATING) {
            break;
        }
        
        TimeUnit.SECONDS.sleep(60);
    }
    
    // Start syncing yor data source by calling StartDataSourceSyncJob and providing your index ID 
    // and your custom data source ID
    System.out.println(String.format("Synchronize the data source %s", dataSourceId));
    StartDataSourceSyncJobRequest startDataSourceSyncJobRequest = StartDataSourceSyncJobRequest
        .builder()
        .indexId(myIndexId)
        .id(dataSourceId)
        .build();
    StartDataSourceSyncJobResponse startDataSourceSyncJobResponse = kendra.startDataSourceSyncJob(startDataSourceSyncJobRequest);
    
    // Get the  sync job execution ID from startDataSourceSyncJobResponse
    String executionId = startDataSourceSyncJobResponse.ExecutionId();
	System.out.println(String.format("Waiting for the data source to sync with the index %s for execution ID %s", indexId, startDataSourceSyncJobResponse.executionId()));
    
    // Add 2 documents uploaded to S3 bucket to your index using the BatchPutDocument API
    // The added documents should sync with your custom data source
    Document pollyDoc = Document
        .builder()
        .s3Path(
            S3Path.builder()
            .bucket("amzn-s3-demo-bucket")
            .key("what_is_Amazon_Polly.docx")
            .build())
        .title("What is Amazon Polly?")
        .id("polly_doc_1")
        .build();
    
    Document rekognitionDoc = Document
        .builder()
        .s3Path(
            S3Path.builder()
            .bucket("amzn-s3-demo-bucket")
            .key("what_is_amazon_rekognition.docx")
            .build())
        .title("What is Amazon rekognition?")
        .id("rekognition_doc_1")
        .build();
    
    BatchPutDocumentRequest batchPutDocumentRequest = BatchPutDocumentRequest
        .builder()
        .indexId(myIndexId)
        .documents(pollyDoc, rekognitionDoc)
        .build();
    
    BatchPutDocumentResponse result = kendra.batchPutDocument(batchPutDocumentRequest);
    System.out.println(String.format("BatchPutDocument result: %s", result));
    
    // Once custom data source synced, stop the sync job using the StopDataSourceSyncJob API
    StopDataSourceSyncJobResponse stopDataSourceSyncJobResponse = kendra.stopDataSourceSyncJob(
        StopDataSourceSyncJobRequest()
            .indexId(myIndexId)
            .id(dataSourceId)
    );
	
	// List your sync jobs
    ListDataSourceSyncJobsRequest listDataSourceSyncJobsRequest = ListDataSourceSyncJobsRequest
        .builder()
        .indexId(myIndexId)
        .id(dataSourceId)
        .build();
    
    while (true) {
        ListDataSourceSyncJobsResponse listDataSourceSyncJobsResponse = kendra.listDataSourceSyncJobs(listDataSourceSyncJobsRequest);
        DataSourceSyncJob job = listDataSourceSyncJobsResponse.history().get(0);
        System.out.println(String.format("Status: %s", job.status()));
    }
  }
}
```

# Dropbox


Dropbox es un servicio de alojamiento de archivos que ofrece servicios de almacenamiento en la nube, organización de documentos y creación de plantillas de documentos. Si eres usuario de Dropbox, puedes usarlo Amazon Kendra para indexar tus archivos de Dropbox, Dropbox Paper, las plantillas de Dropbox Paper y los accesos directos a páginas web almacenados. También puedes configurarlos Amazon Kendra para indexar archivos específicos de Dropbox, Dropbox Paper, plantillas de Dropbox Paper y accesos directos a páginas web almacenados.

Amazon Kendraes compatible con Dropbox y Dropbox Advanced para Dropbox Business.

Puedes conectarte Amazon Kendra a tu fuente de datos de Dropbox mediante la [Amazon Kendraconsola](https://console.aws.amazon.com/kendra/) y la [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_TemplateConfiguration.html)API.

Para solucionar problemas del conector de fuentes de datos de Amazon Kendra Dropbox, consulta[Solución de problemas con los orígenes de datos](troubleshooting-data-sources.md).

**Topics**
+ [

## Características admitidas
](#supported-features-dropbox)
+ [

## Requisitos previos
](#prerequisites-dropbox)
+ [

## Instrucciones de conexión
](#data-source-procedure-dropbox)
+ [

## Más información
](#dropbox-learn-more)
+ [

## Notas
](#dropbox-notes)

## Características admitidas


Amazon KendraEl conector de fuentes de datos de Dropbox admite las siguientes funciones:
+ Asignaciones de campos
+ Control de acceso de usuarios
+ Filtros de inclusión/exclusión
+ Sincronizaciones completas e incrementales del contenido
+ Nube privada virtual (VPC)

## Requisitos previos


Antes de poder utilizarla Amazon Kendra para indexar tu fuente de datos de Dropbox, realiza estos cambios en tu Dropbox y en tus AWS cuentas.

**En Dropbox, asegúrese de que:**
+ Ha creado una cuenta de Dropbox Advanced y configurado un usuario administrador.
+ Ha configurado una aplicación de Dropbox con un **Nombre de aplicación** único y ha activado **Acceso limitado**. Consulte la [Documentación de Dropbox sobre la creación de una aplicación](https://www.dropbox.com/developers/reference/getting-started#app%20console).
+ Ha activado los permisos **Full Dropbox** en la consola de Dropbox y agregado los siguientes permisos:
  + files.content.read
  + files.metadata.read
  + sharing.read
  + file\$1requests.read
  + groups.read
  + team\$1info.read
  + team\$1data.content.read
+ Ha apuntado la clave de la aplicación de Dropbox, el secreto de la aplicación de Dropbox y el token de acceso a Dropbox como credenciales de autenticación básica.
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).
+ Ha generado y copiado un token de acceso temporal OAuth 2.0 para la aplicación de Dropbox. Este token es temporal y caduca a las 4 horas. Consulta la [documentación de Dropbox sobre la OAuth autenticación](https://developers.dropbox.com/oauth-guide).
**nota**  
Se recomienda crear un token de acceso actualizado de Dropbox que no caduque nunca, en lugar de utilizar un token de acceso único que caduca a las 4 horas. Un token de acceso actualizado es permanente y nunca caduca, por lo que se podrá seguir sincronizando el origen de datos en el futuro.
+ **Recomendado:** Has configurado un token de actualización permanente de Dropbox que nunca caduque Amazon Kendra para poder seguir sincronizando tu fuente de datos sin interrupciones. Consulte la [Documentación de Dropbox sobre los tokens de actualización](https://developers.dropbox.com/oauth-guide).
+ Ha comprobado que cada documento es único en Dropbox y en otros orígenes de datos que vaya a utilizar para el mismo índice. Cada origen de datos que desee utilizar para un índice no debe contener el mismo documento en varios orígenes de datos. IDs Los documentos son globales en relación con un índice y deben ser únicos por índice.

**En el tuyoCuenta de AWS, asegúrate de tener:**
+ [Creó un Amazon Kendra índice](https://docs.aws.amazon.com/kendra/latest/dg/create-index.html) y, si usa la API, anotó el ID del índice.
+ [Creó un IAM rol](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds) para su fuente de datos y, si usa la API, anotó el ARN del IAM rol.
**nota**  
Si cambias el tipo de autenticación y las credenciales, debes actualizar tu IAM rol para acceder al ID AWS Secrets Manager secreto correcto.
+ Ha guardado sus credenciales de autenticación de Dropbox en un secreto de AWS Secrets Manager y, si utiliza la API, ha anotado el ARN del secreto.
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).

Si no tienes un IAM rol o secreto existente, puedes usar la consola para crear un nuevo IAM rol y un Secrets Manager secreto al conectar tu fuente de datos de DropboxAmazon Kendra. Si utiliza la API, debe proporcionar el ARN de un IAM rol y un Secrets Manager secreto existentes y un ID de índice.

## Instrucciones de conexión


Para conectarte Amazon Kendra a tu fuente de datos de Dropbox, debes proporcionar los detalles necesarios de tu fuente de datos de Dropbox para que Amazon Kendra puedas acceder a tus datos. Si aún no has configurado Dropbox paraAmazon Kendra, consulta[Requisitos previos](#prerequisites-dropbox).

------
#### [ Console ]

**Para conectarte Amazon Kendra a Dropbox** 

1. Inicia sesión en la [Amazon Kendraconsola Consola de administración de AWS](https://console.aws.amazon.com/kendra/) y ábrela.

1. En el panel de navegación izquierdo, elija **Índices** y, a continuación, elija el índice que desee usar de la lista de índices.
**nota**  
Puede elegir configurar o editar los ajustes de **Control de acceso de usuarios** en la **Configuración del índice**. 

1. En la página **Introducción**, seleccione **Agregar origen de datos**.

1. En la página **Agregar origen de datos**, elija el **Conector de Dropbox** y, a continuación, elija **Agregar conector**. Si usa la versión 2 (si corresponde), elija el **Conector de Dropbox** con la etiqueta “V2.0”.

1. En la página **Especificar detalles del origen de datos**, introduzca la siguiente información:

   1. En **Nombre y descripción**, en **Nombre del origen de datos**: introduzca un nombre para el origen de datos. Puede incluir guiones, pero no espacios.

   1. (Opcional)** Descripción**: introduzca una descripción opcional para el origen de datos.

   1. En **Idioma predeterminado**: elija un idioma para filtrar los documentos para el índice. A menos que especifique lo contrario, el idioma predeterminado es el inglés. El idioma especificado en los metadatos del documento anula el idioma seleccionado.

   1. En **Etiquetas**, para **añadir una nueva etiqueta**: incluye etiquetas opcionales para buscar y filtrar tus recursos o realizar un seguimiento de tus AWS costes.

   1. Elija **Siguiente**.

1. En la página **Definir acceso y seguridad**, introduzca la siguiente información:

   1. **Autorización**: active o desactive la información de la lista de control de acceso (ACL) para los documentos, si tiene una ACL y desea usarla para el control de acceso. La ACL especifica a qué documentos pueden acceder los usuarios y los grupos. La información de la ACL se utiliza para filtrar los resultados de búsqueda en función del acceso del usuario o su grupo a los documentos. Para obtener más información, consulte [Filtrado de contexto de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#context-filter-user-incl-datasources).

   1. **Tipo de token de autenticación**: elija un token permanente (recomendado) o un token de acceso temporal.

   1. **AWS Secrets Managersecreto**: elige un secreto existente o crea uno nuevo Secrets Manager para almacenar tus credenciales de autenticación de Dropbox. Si decide crear un secreto nuevo, se abrirá una ventana de secreto de AWS Secrets Manager.

      1. Introduzca la siguiente información en la **ventana Crear un secreto de AWS Secrets Manager**:

         1. **Nombre del secreto**: un nombre para su secreto. El prefijo «AmazonKendra-Dropbox» se añade automáticamente a tu nombre secreto.

         1. Para obtener la información sobre la **Clave de la aplicación**, el **Secreto de la aplicación** y el token (permanente o temporal): introduzca los valores de las credenciales de autenticación que ha configurado en Dropbox.

      1. Guarde y agregue el secreto.

   1. **Nube privada virtual (VPC)**: puede optar por utilizar una VPC. Si es así, debe agregar **Subredes** y **Grupos de seguridad de VPC**.

   1. **Rastreador de identidades**: especifique si se debe activar el rastreador de identidades de Amazon Kendra. El rastreador de identidades utiliza la información de la lista de control de acceso (ACL) de los documentos para filtrar los resultados de la búsqueda en función del acceso del usuario o del grupo a los documentos. Si tienes una ACL para tus documentos y decides utilizarla, también puedes optar por activar el rastreador de identidades para configurar el filtrado Amazon Kendra de los resultados de búsqueda según el [contexto del usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#context-filter-user-incl-datasources). De lo contrario, si el rastreador de identidades está desactivado, todos los documentos se pueden buscar públicamente. Si quieres usar el control de acceso para tus documentos y el rastreador de identidad está desactivado, también puedes usar la [PutPrincipalMapping](https://docs.aws.amazon.com/kendra/latest/APIReference/API_PutPrincipalMapping.html)API para cargar información de acceso de usuarios y grupos para filtrar el contexto de los usuarios.

   1. **IAMrol**: elija un IAM rol existente o cree uno nuevo IAM para acceder a las credenciales del repositorio y al contenido del índice.
**nota**  
IAMlos roles utilizados para los índices no se pueden usar para las fuentes de datos. Si no está seguro de si un rol existente se utiliza para un índice o para las preguntas frecuentes, elija **Crear un nuevo rol** para evitar errores.

   1. Elija **Siguiente**.

1. En la página **Configurar ajustes de sincronización**, introduzca la siguiente información:

   1. Para **Seleccionar entidades o tipos de contenido**: elija las entidades de Dropbox o tipos de contenido que desea rastrear.

   1. En **Configuración adicional** para **Patrones regex**: agregue patrones de expresiones regulares para incluir o excluir determinados archivos.

   1. **Modo de sincronización**: elija cómo desea actualizar el índice cuando cambie el contenido del origen de datos. Al sincronizar la fuente de datos Amazon Kendra por primera vez, todo el contenido se rastrea e indexa de forma predeterminada. Debe ejecutar una sincronización completa de los datos si la sincronización inicial falló, incluso si no selecciona la sincronización completa como opción de modo de sincronización.
      + Sincronización completa: se vuelve a indexar todo el contenido, reemplazando el contenido existente cada vez que el origen de datos se sincronice con el índice.
      + Sincronización de lo nuevo y modificado: se indexa solo el contenido nuevo y modificado cada vez que el origen de datos se sincroniza con el índice. Amazon Kendra puede utilizar el mecanismo del origen de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido modificado desde la última sincronización.
      + Sincronización nueva, modificada o eliminada: indexe solo el contenido nuevo, modificado y eliminado cada vez que la fuente de datos se sincronice con el índice. Amazon Kendrapuede usar el mecanismo de la fuente de datos para rastrear los cambios en el contenido e indexar el contenido que ha cambiado desde la última sincronización.

   1. En **Programación de ejecución de sincronización**, en **Frecuencia**: elija la frecuencia con la que desea sincronizar el contenido del origen de datos y actualizar el índice.

   1. Elija **Siguiente**.

1. En la página **Establecer asignaciones de campos**, especifique la siguiente información:

   1. **Plantillas de **archivos**, **Dropbox Paper** y Dropbox Paper**: selecciona uno de los campos de fuentes de datos predeterminados Amazon Kendra generados que quieras asignar a tu índice. 

   1.  **Agregar campo**: para agregar campos de origen de datos personalizados para crear un nombre de campo de índice al que asignarlos y el tipo de datos del campo.

   1. Elija **Siguiente**.

1. En la página **Revisar y crear**, compruebe que la información que ha introducido es correcta y, a continuación, seleccione **Añadir origen de datos**. También puede elegir editar la información desde esta página. El origen de datos aparecerá en la página **Orígenes de datos** una vez que el origen de datos se haya agregado correctamente.

------
#### [ API ]

**Para conectarte Amazon Kendra a Dropbox**

Debe especificar un JSON del [esquema del origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/ds-schemas.html#ds-dropbox-schema) mediante la API [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_TemplateConfiguration.html). Debe proporcionar la siguiente información:
+ **Origen de datos**: defina el tipo de origen de datos como `DROPBOX` cuando utilice el esquema JSON [https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html](https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html). Además, defina el origen de datos como `TEMPLATE` al llamar a la API [https://docs.aws.amazon.com/kendra/latest/dg/API_CreateDataSource.html](https://docs.aws.amazon.com/kendra/latest/dg/API_CreateDataSource.html).
+ **Modo de sincronización**: especifica cómo Amazon Kendra debes actualizar tu índice cuando cambia el contenido de la fuente de datos. Al sincronizar el origen de datos con Amazon Kendra por primera vez, todo el contenido se rastrea y se indexa de forma predeterminada. Debe ejecutar una sincronización completa de los datos si la sincronización inicial falló, incluso si no selecciona la sincronización completa como opción de modo de sincronización. Puede elegir entre las siguientes opciones:
  + `FORCED_FULL_CRAWL` para volver a indexar todo el contenido, reemplazando el contenido existente cada vez que el origen de datos se sincronice con el índice.
  + `FULL_CRAWL` para indexar solo el contenido nuevo, modificado y eliminado cada vez que el origen de datos se sincronice con el índice. Amazon Kendra puede utilizar el mecanismo del origen de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido modificado desde la última sincronización.
  + `CHANGE_LOG` para indexar solo el contenido nuevo y modificado cada vez que el origen de datos se sincronice con el índice. Amazon Kendra puede utilizar el mecanismo del origen de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido modificado desde la última sincronización.
+ **Tipo de token de acceso**: especifique si desea utilizar un token de acceso permanente o temporal para el secreto de AWS Secrets Manager que almacena las credenciales de autenticación.
**nota**  
Se recomienda crear un token de acceso actualizado que no caduque nunca en Dropbox, en lugar de utilizar un token de acceso único que caduca a las 4 horas. Debe crear una aplicación y un token de acceso de actualización en la consola para desarrolladores de Dropbox y proporcionar el token de acceso en su secreto.
+ **Nombre secreto del recurso de Amazon (ARN): proporciona** el nombre del recurso de Amazon (ARN) de un Secrets Manager secreto que contenga las credenciales de autenticación de tu cuenta de Dropbox. El secreto se almacena en una estructura JSON con las siguientes claves:

  ```
  {
      "appKey": "Dropbox app key",
      "appSecret": "Dropbox app secret",
      "accesstoken": "temporary access token or refresh access token"
  }
  ```
+ **Rastreador de identidades**: especifique si se debe activar el rastreador de identidades de Amazon Kendra. El rastreador de identidades utiliza la información de la lista de control de acceso (ACL) de los documentos para filtrar los resultados de la búsqueda en función del acceso del usuario o del grupo a los documentos. Si tienes una ACL para tus documentos y decides utilizarla, también puedes optar por activar el rastreador de identidades para configurar el [filtrado Amazon Kendra de los resultados de búsqueda según el contexto del usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#context-filter-user-incl-datasources). De lo contrario, si el rastreador de identidades está desactivado, todos los documentos se pueden buscar públicamente. Si quieres usar el control de acceso para tus documentos y el rastreador de identidad está desactivado, también puedes usar la [PutPrincipalMapping](https://docs.aws.amazon.com/kendra/latest/APIReference/API_PutPrincipalMapping.html)API para cargar información de acceso de usuarios y grupos para filtrar el contexto de los usuarios.
+ **IAMrol**: especifica `RoleArn` cuándo llamas `CreateDataSource` para proporcionar a un IAM rol permisos para acceder a tu Secrets Manager secreto y para llamar al público requerido APIs para el conector de Dropbox y. Amazon Kendra Para obtener más información, consulte [Roles de IAM para orígenes de datos de Dropbox](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds).

También puede añadir las siguientes características opcionales:
+  **Nube privada virtual (VPC)**: especifique a `VpcConfiguration` cuándo llamar a `CreateDataSource`. Para obtener más información, consulte [¿Se está configurando Amazon Kendra para usar un Amazon VPC](vpc-configuration.md).
+ **Tipos de documento o contenido**: especifique si se van a rastrear los archivos de su Dropbox, los documentos de Dropbox Paper, las plantillas de Dropbox Paper y los accesos directos a páginas web almacenados en su Dropbox.
+ **Filtros de inclusión y exclusión**: especifique si desea incluir o excluir determinados archivos.
**nota**  
La mayoría de los orígenes de datos utilizan patrones de expresiones regulares, que son patrones de inclusión o exclusión denominados filtros. Si especifica un filtro de inclusión, solo se indexará el contenido que coincida con el filtro de inclusión. Los documentos que no coincidan con el filtro de inclusión no se indexan. Si especifica un filtro de inclusión y exclusión, los documentos que coincidan con el filtro de exclusión no se indexarán, aunque coincidan con el filtro de inclusión.
+ **Lista de control de acceso (ACL)**: especifique si se va a rastrear la información de la ACL para los documentos, si tiene una ACL y desea usarla para el control de acceso. La ACL especifica a qué documentos pueden acceder los usuarios y los grupos. La información de la ACL se utiliza para filtrar los resultados de búsqueda en función del acceso del usuario o su grupo a los documentos. Para obtener más información, consulte [Filtrado de contexto de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#context-filter-user-incl-datasources).
+  **Asignaciones de campos**: elija asignar los campos del origen de datos de Dropbox a los campos de índice de Amazon Kendra. Para obtener más información, consulte [Asignación de campos de origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/field-mapping.html).
**nota**  
El campo del cuerpo del documento o el cuerpo del documento equivalente de tus documentos es obligatorio Amazon Kendra para poder buscarlos. Debe asignar el nombre del campo del cuerpo del documento en el origen de datos al nombre del campo del índice `_document_body`. Todos los demás campos son opcionales.

Para obtener una lista de otras claves JSON importantes que debe configurar, consulte el [Esquema de plantilla de Dropbox](https://docs.aws.amazon.com/kendra/latest/dg/ds-schemas.html#ds-dropbox-schema).

------

## Más información


Para obtener más información acerca de la integración de Amazon Kendra con el origen de datos de Dropbox, consulte:
+ [Indexar el contenido de Dropbox mediante el conector de Dropbox para Amazon Kendra](https://aws.amazon.com/blogs/machine-learning/index-your-dropbox-content-using-the-dropbox-connector-for-amazon-kendra/)

## Notas

+ Cuando las listas de control de acceso (ACLs) están habilitadas, la opción «Sincronizar solo el contenido nuevo o modificado» no está disponible debido a las limitaciones de la API de Dropbox. Te recomendamos usar los modos «Sincronización completa» o «Sincronización de contenido nuevo, modificado o eliminado» en su lugar, o desactivarlos ACLs si necesitas usar este modo de sincronización.

# Drupal


**nota**  
El conector de Drupal seguirá siendo totalmente compatible con los clientes actuales hasta el 31 de mayo de 2026. Si bien este conector ya no está disponible para los nuevos usuarios, los usuarios actuales pueden seguir utilizándolo sin interrupciones. Desarrollamos de forma continua nuestra cartera de conectores para ofrecer soluciones más escalables y personalizables. Para futuras integraciones, le recomendamos que valore el marco de conectores personalizados de Amazon Kendra[1], diseñado de manera más flexible para una variedad más amplia de casos de uso empresariales.

Drupal es un sistema de administración de contenidos (CMS) de código abierto que se puede utilizar para crear sitios web y aplicaciones web. Puedes usarlo Amazon Kendra para indexar lo siguiente en Drupal:
+ Contenido: artículos, páginas básicas, bloques básicos, tipos de contenido definidos por el usuario, tipos de bloques definidos por el usuario, tipos de contenido personalizados, tipos de bloques personalizados
+ Comentario: para cualquier tipo de contenido y tipo de bloque
+ Adjuntos: para cualquier tipo de contenido y tipo de bloque

Puedes conectarte Amazon Kendra a tu fuente de datos de Drupal mediante la [Amazon Kendraconsola](https://console.aws.amazon.com/kendra/) o la [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html)API.

Para solucionar problemas de su conector de fuente de datos de Amazon Kendra Drupal, consulte. [Solución de problemas con los orígenes de datos](troubleshooting-data-sources.md)

**Topics**
+ [

## Características admitidas
](#supported-features-drupal)
+ [

## Requisitos previos
](#prerequisites-drupal)
+ [

## Instrucciones de conexión
](#data-source-procedure-drupal)
+ [

## Notas
](#drupal-notes)

## Características admitidas


Amazon KendraEl conector de fuente de datos de Drupal admite las siguientes funciones:
+ Asignaciones de campos
+ Filtrado de contexto de usuario
+ Filtros de inclusión/exclusión
+ Sincronizaciones completas e incrementales del contenido
+ Nube privada virtual (VPC)

## Requisitos previos


Antes de que pueda utilizarla Amazon Kendra para indexar su fuente de datos de Drupal, realice estos cambios en su Drupal y en sus cuentas. AWS

**En Drupal, asegúrese de que:**
+ Ha creado una cuenta de Drupal (Standard) Suite y un usuario con un rol de administrador.
+ Ha copiado el nombre de su sitio de Drupal y configurado una URL de host. Por ejemplo, *https://<hostname>/<drupalsitename>*.
+ Ha configurado credenciales de autenticación básicas que contienen un nombre de usuario (nombre de usuario de inicio de sesión en el sitio web de Drupal) y una contraseña (contraseña del sitio web de Drupal).
+ **Recomendado: configuré** un token de credenciales OAuth 2.0. Use este token junto con la contraseña de Drupal, el ID de cliente, el secreto de cliente, el nombre de usuario (nombre de usuario de inicio de sesión en el sitio web de Drupal) y la contraseña (contraseña del sitio web de Drupal) para conectarse a Amazon Kendra.
+ Ha añadido los siguientes permisos a la cuenta de Drupal utilizando un rol de administrador:
  + administer blocks
  + administer block\$1content display
  + administer block\$1content fields
  + administer block\$1content form display
  + administer views
  + view user email addresses
  + view own unpublished content
  + view page revisions
  + view article revisions
  + view all revisions
  + view the administration theme
  + access content
  + access content overview
  + access comments
  + search content
  + access files overview
  + access contextual links
**nota**  
Si hay tipos de contenido definidos por el usuario o tipos de bloques definidos por el usuario, o si se añaden vistas y bloques al sitio web de Drupal, se les debe proporcionar acceso de administrador.

**En el tuyoCuenta de AWS, asegúrate de tener:**
+ [Creó un Amazon Kendra índice](https://docs.aws.amazon.com/kendra/latest/dg/create-index.html) y, si usa la API, anotó el ID del índice.
+ [Creó un IAM rol](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds) para su fuente de datos y, si usa la API, anotó el ARN del IAM rol.
**nota**  
Si cambias el tipo de autenticación y las credenciales, debes actualizar tu IAM rol para acceder al ID AWS Secrets Manager secreto correcto.
+ Ha guardado sus credenciales de autenticación de Drupal en un secreto de AWS Secrets Manager y, si utiliza la API, ha anotado el ARN del secreto.
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).

Si no tienes un IAM rol o secreto existente, puedes usar la consola para crear un nuevo IAM rol y un Secrets Manager secreto al conectar tu fuente de datos de Drupal. Amazon Kendra Si utiliza la API, debe proporcionar el ARN de un IAM rol y un Secrets Manager secreto existentes y un ID de índice.

## Instrucciones de conexión


Para conectarse Amazon Kendra a su fuente de datos de Drupal, debe proporcionar los detalles de sus credenciales de Drupal para que Amazon Kendra pueda acceder a sus datos. Si aún no ha configurado Drupal, consulte. Amazon Kendra [Requisitos previos](#prerequisites-drupal)

------
#### [ Console ]

**Para conectarse a Amazon Kendra Drupal** 

1. Inicia sesión en la [Amazon Kendraconsola Consola de administración de AWS](https://console.aws.amazon.com/kendra/) y ábrela.

1. En el panel de navegación izquierdo, elija **Índices** y, a continuación, elija el índice que desee usar de la lista de índices.
**nota**  
Puede elegir configurar o editar los ajustes de **Control de acceso de usuarios** en la **Configuración del índice**. 

1. En la página **Introducción**, seleccione **Agregar origen de datos**.

1. En la página **Agregar origen de datos**, seleccione **Conector de Drupal** y, a continuación, seleccione **Agregar conector**. Si usa la versión 2 (si corresponde), elija el **Conector de Drupal** con la etiqueta “V2.0”.

1. En la página **Especificar detalles del origen de datos**, introduzca la siguiente información:

   1. En **Nombre y descripción**, en **Nombre del origen de datos**: introduzca un nombre para el origen de datos. Puede incluir guiones, pero no espacios.

   1. (Opcional)** Descripción**: introduzca una descripción opcional para el origen de datos.

   1. En **Idioma predeterminado**: elija un idioma para filtrar los documentos para el índice. A menos que especifique lo contrario, el idioma predeterminado es el inglés. El idioma especificado en los metadatos del documento anula el idioma seleccionado.

   1. En **Etiquetas**, para **añadir una nueva etiqueta**: incluye etiquetas opcionales para buscar y filtrar tus recursos o realizar un seguimiento de tus AWS costes.

   1. Elija **Siguiente**.

1. En la página **Definir acceso y seguridad**, introduzca la siguiente información:

   1. En **Origen**, en **URL de host**: la URL de host del sitio de Drupal. Por ejemplo, *https://<hostname>/<drupalsitename>*.

   1. En **Ubicación del certificado SSL**: introduzca la ruta al certificado SSL almacenado en el bucket de Amazon S3.

   1. **Autorización**: active o desactive la información de la lista de control de acceso (ACL) para los documentos, si tiene una ACL y desea usarla para el control de acceso. La ACL especifica a qué documentos pueden acceder los usuarios y los grupos. La información de la ACL se utiliza para filtrar los resultados de búsqueda en función del acceso del usuario o su grupo a los documentos. Para obtener más información, consulte [Filtrado de contexto de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#context-filter-user-incl-datasources).

   1. Para la **autenticación**: elija entre la **autenticación básica** y la **autenticación OAuth 2.0** según su caso de uso.

   1. **AWS Secrets Managersecreto**: elija un secreto existente o cree uno nuevo para almacenar sus Secrets Manager credenciales de autenticación de Drupal. Si decide crear un secreto nuevo, se abrirá una ventana de secreto de AWS Secrets Manager.

      1. Introduzca la siguiente información en la **ventana Crear un secreto de AWS Secrets Manager**:

         1. Si ha elegido la **Autenticación básica**, introduzca un **Nombre del secreto**, el **Nombre de usuario** (nombre de usuario del sitio de Drupal) y la **Contraseña** (contraseña del sitio de Drupal) que ha copiado y seleccione **Guardar y agregar secreto**.

         1. **Si ha elegido la **autenticación OAuth 2.0**, introduzca un **nombre secreto, un nombre** de **usuario (nombre** de usuario del sitio de Drupal), una **contraseña (contraseña** del sitio de Drupal), un **ID de cliente** y un **secreto de cliente** generados en su cuenta de Drupal y seleccione Guardar y añadir secreto.**

      1. Seleccione **Save**.

   1. **Nube privada virtual (VPC)**: puede optar por utilizar una VPC. Si es así, debe agregar **Subredes** y **Grupos de seguridad de VPC**.

   1. **Rastreador de identidades**: especifique si se debe activar el rastreador de identidades de Amazon Kendra. El rastreador de identidades utiliza la información de la lista de control de acceso (ACL) de los documentos para filtrar los resultados de la búsqueda en función del acceso del usuario o del grupo a los documentos. Si tiene una ACL para sus documentos y decide utilizarla, también puede optar por activar el rastreador de identidades para configurar el [filtrado Amazon Kendra de los resultados de búsqueda según el contexto de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#context-filter-user-incl-datasources). De lo contrario, si el rastreador de identidades está desactivado, todos los documentos se pueden buscar públicamente. Si quieres usar el control de acceso para tus documentos y el rastreador de identidad está desactivado, también puedes usar la [PutPrincipalMapping](https://docs.aws.amazon.com/kendra/latest/APIReference/API_PutPrincipalMapping.html)API para cargar información de acceso de usuarios y grupos para filtrar el contexto de los usuarios.

   1. **IAMrol**: elija un IAM rol existente o cree uno nuevo IAM para acceder a las credenciales del repositorio y al contenido del índice.
**nota**  
IAMlos roles utilizados para los índices no se pueden usar para las fuentes de datos. Si no está seguro de si un rol existente se utiliza para un índice o para las preguntas frecuentes, elija **Crear un nuevo rol** para evitar errores.

   1. Elija **Siguiente**.

1. En la página **Configurar ajustes de sincronización**, introduzca la siguiente información:

   1. En **Ámbito de sincronización**, seleccione de entre las siguientes opciones:
**nota**  
Si elige rastrear **Artículos**, **Páginas básicas** y **Bloques básicos**, sus campos predeterminados se sincronizarán automáticamente. También puede optar por sincronizar los comentarios, archivos adjuntos, campos personalizados y otras entidades personalizadas.

      1. En **Entidades seleccionadas**:
        +  **Artículos**: elija si desea rastrear los **Artículos**, sus **Comentarios** y sus **Archivos adjuntos**.
        + **Páginas básicas**: elija si desea rastrear las **Páginas básicas**, sus **Comentarios** y sus **Archivos adjuntos**.
        + **Bloques básicos**: elija si desea rastrear los **Bloques básicos**, sus **Comentarios** y sus **Archivos adjuntos**.
        + También puede optar por añadir **Tipos de contenido personalizados** y **Bloques personalizados**.

   1. En **Configuración adicional (opcional)**:
      + En **Patrón regex**: agregue patrones de expresiones regulares para incluir o excluir títulos de entidades y nombres de archivos específicos. Puede añadir hasta 100 patrones.

   1. **Modo de sincronización**: elija cómo desea actualizar el índice cuando cambie el contenido del origen de datos. Al sincronizar la fuente de datos Amazon Kendra por primera vez, todo el contenido se rastrea e indexa de forma predeterminada. Debe ejecutar una sincronización completa de los datos si la sincronización inicial falló, incluso si no selecciona la sincronización completa como opción de modo de sincronización.
      + Sincronización completa: se vuelve a indexar todo el contenido, reemplazando el contenido existente cada vez que el origen de datos se sincronice con el índice.
      + Sincronización nueva, modificada o eliminada: indexe solo el contenido nuevo, modificado y eliminado cada vez que la fuente de datos se sincronice con el índice. Amazon Kendrapuede usar el mecanismo de la fuente de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido que ha cambiado desde la última sincronización.

   1. En **Programa de ejecución de sincronización**, **Frecuencia**: la frecuencia con la que Amazon Kendra se sincronizará con el origen de datos.

   1. Elija **Siguiente**.

1. En la página **Establecer asignaciones de campos**, especifique la siguiente información:

   1. Para el **contenido**, **los comentarios** y **los archivos adjuntos**: seleccione uno de los campos de fuente de datos predeterminados Amazon Kendra generados que desee asignar a su índice. 

   1.  **Agregar campo**: para agregar campos de origen de datos personalizados para crear un nombre de campo de índice al que asignarlos y el tipo de datos del campo.

   1. Elija **Siguiente**.

1. En la página **Revisar y crear**, compruebe que la información que ha introducido es correcta y, a continuación, seleccione **Añadir origen de datos**. También puede elegir editar la información desde esta página. El origen de datos aparecerá en la página **Orígenes de datos** una vez que el origen de datos se haya agregado correctamente.

------
#### [ API ]

**Para conectarse a Amazon Kendra Drupal**

Debe especificar un JSON del [esquema del origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/ds-schemas.html#ds-drupal-schema) mediante la API [https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html](https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html). Debe proporcionar la siguiente información:
+ **Origen de datos**: defina el tipo de origen de datos como `DRUPAL` cuando utilice el esquema JSON [https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html](https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html). Además, defina el origen de datos como `TEMPLATE` al llamar a la API [https://docs.aws.amazon.com/kendra/latest/dg/API_CreateDataSource.html](https://docs.aws.amazon.com/kendra/latest/dg/API_CreateDataSource.html).
+ **Modo de sincronización**: especifique cómo Amazon Kendra debe actualizarse el índice cuando cambie el contenido de la fuente de datos. Al sincronizar el origen de datos con Amazon Kendra por primera vez, todo el contenido se rastrea y se indexa de forma predeterminada. Debe ejecutar una sincronización completa de los datos si la sincronización inicial falló, incluso si no selecciona la sincronización completa como opción de modo de sincronización. Puede elegir entre las siguientes opciones:
  + `FORCED_FULL_CRAWL` para volver a indexar todo el contenido, reemplazando el contenido existente cada vez que el origen de datos se sincronice con el índice.
  + `FULL_CRAWL` para indexar solo el contenido nuevo, modificado y eliminado cada vez que el origen de datos se sincronice con el índice. Amazon Kendra puede utilizar el mecanismo del origen de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido modificado desde la última sincronización.
  + `CHANGE_LOG` para indexar solo el contenido nuevo y modificado cada vez que el origen de datos se sincronice con el índice. Amazon Kendra puede utilizar el mecanismo del origen de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido modificado desde la última sincronización.
+ **Nombre secreto del recurso de Amazon (ARN)**: proporciona el nombre del recurso de Amazon (ARN) de un Secrets Manager secreto que contenga las credenciales de autenticación que creaste en tu cuenta de Drupal. 

  Si utiliza la autenticación básica, el secreto se almacena en una estructura JSON con las siguientes claves: 

  ```
  {
      "username": "user name",
      "password": "password"
  }
  ```

  Si utilizas la autenticación OAuth 2.0, el secreto se almacena en una estructura JSON con las siguientes claves: 

  ```
  {
      "username": "user name",
      "password": "password",
      "clientId": "client id",
      "clientSecret": "client secret"
  }
  ```
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).
+ **IAMrol**: especifique `RoleArn` cuándo llama `CreateDataSource` para proporcionar a un IAM rol permisos para acceder a su Secrets Manager secreto y para llamar al público requerido APIs para el conector de Drupal y. Amazon Kendra Para obtener más información, consulte [Roles de IAM para orígenes de datos de Drupal](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds).

También puede añadir las siguientes características opcionales:
+  **Nube privada virtual (VPC)**: especifique a `VpcConfiguration` cuándo llamar a `CreateDataSource`. Para obtener más información, consulte [¿Se está configurando Amazon Kendra para usar un Amazon VPC](vpc-configuration.md).
+  **Filtros de inclusión y exclusión**: puede especificar si desea incluir contenido, comentarios y archivos adjuntos. También puede especificar patrones de expresiones regulares para incluir o excluir contenido, comentarios y archivos adjuntos.
**nota**  
La mayoría de los orígenes de datos utilizan patrones de expresiones regulares, que son patrones de inclusión o exclusión denominados filtros. Si especifica un filtro de inclusión, solo se indexará el contenido que coincida con el filtro de inclusión. Los documentos que no coincidan con el filtro de inclusión no se indexan. Si especifica un filtro de inclusión y exclusión, los documentos que coincidan con el filtro de exclusión no se indexarán, aunque coincidan con el filtro de inclusión.
+ **Rastreador de identidades**: especifique si se debe activar el rastreador de identidades de Amazon Kendra. El rastreador de identidades utiliza la información de la lista de control de acceso (ACL) de los documentos para filtrar los resultados de la búsqueda en función del acceso del usuario o del grupo a los documentos. Si tiene una ACL para sus documentos y decide utilizarla, también puede optar por activar el rastreador de identidades para configurar el [filtrado Amazon Kendra de los resultados de búsqueda por contexto de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#context-filter-user-incl-datasources). De lo contrario, si el rastreador de identidades está desactivado, todos los documentos se pueden buscar públicamente. Si quieres usar el control de acceso para tus documentos y el rastreador de identidad está desactivado, también puedes usar la [PutPrincipalMapping](https://docs.aws.amazon.com/kendra/latest/APIReference/API_PutPrincipalMapping.html)API para cargar información de acceso de usuarios y grupos para filtrar el contexto de los usuarios.
+  **Asignaciones de campos**: elija asignar los campos del origen de datos de Drupal a los campos de índice de Amazon Kendra. Para obtener más información, consulte [Asignación de campos de origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/field-mapping.html).
**nota**  
El campo del cuerpo del documento o el cuerpo del documento equivalente de sus documentos es obligatorio Amazon Kendra para poder buscarlos. Debe asignar el nombre del campo del cuerpo del documento en el origen de datos al nombre del campo del índice `_document_body`. Todos los demás campos son opcionales.

Para obtener una lista de otras claves JSON importantes que debe configurar, consulte [Esquema de plantilla de Drupal](ds-schemas.md#ds-drupal-schema).

------

## Notas

+ Drupal no APIs tiene límites de regulación oficiales.
+ Java no SDKs está disponible para Drupal.
+ Los datos de Drupal solo se pueden obtener mediante API JSON nativas.
+ No se pueden rastrear los tipos de contenido que no estén asociados a ninguna **Vista** de Drupal.
+ Necesita acceso de administrador para rastrear los datos de los **Bloques** de Drupal.
+ No hay ninguna API JSON disponible para crear el tipo de contenido definido por el usuario mediante verbos HTTP.
+ El cuerpo del documento y los comentarios de los **Artículos**, las **Páginas básicas**, los **Bloques básicos**, el tipo de contenido definido por el usuario y el tipo de bloque definido por el usuario se muestran en formato HTML. Si el contenido HTML no está bien formado, las etiquetas relacionadas con el HTML aparecerán en el cuerpo del documento y en los comentarios y estarán visibles en los resultados de búsqueda de Amazon Kendra.
+ No se incorporarán los tipos de contenido ni los tipos de **bloques** sin descripción o cuerpo. Amazon Kendra Solo **los comentarios** y **archivos adjuntos** de este tipo de **contenido** o tipo de **bloque** se incorporarán a tu Amazon Kendra índice.

# GitHub


GitHub es un servicio de alojamiento web para el desarrollo de software que proporciona servicios de almacenamiento y administración de códigos con control de versiones. Puede utilizarlos Amazon Kendra para indexar los archivos de repositorio de GitHub Enterprise Cloud (SaaS) y GitHub Enterprise Server (On Prem), las solicitudes de emisión y extracción, los comentarios de las solicitudes de emisión y extracción y los archivos adjuntos de comentarios de las solicitudes de emisión y extracción. También se puede optar por incluir o excluir determinados archivos.

**nota**  
Amazon Kendraahora es compatible con un conector actualizado GitHub .  
La consola se ha actualizado de forma automática. Todos los conectores nuevos que cree en la consola utilizarán la arquitectura actualizada. Si usa la API, ahora debe usar el objeto [https://docs.aws.amazon.com/kendra/latest/APIReference/API_TemplateConfiguration.html](https://docs.aws.amazon.com/kendra/latest/APIReference/API_TemplateConfiguration.html) en lugar del objeto `GitHubConfiguration` para configurar el conector.  
Los conectores configurados con la antigua arquitectura de consola y API seguirán funcionando tal y como estaban configurados. Sin embargo, no podrá editarlos ni actualizarlos. Si desea editar o actualizar la configuración de un conector, deberá crear uno nuevo.  
Se recomienda migrar el flujo de trabajo de los conectores a la versión actualizada. Está previsto que la compatibilidad para los conectores configurados con la arquitectura anterior finalice en junio de 2024.

Puede conectarse Amazon Kendra a su fuente GitHub de datos mediante la [Amazon Kendraconsola](https://console.aws.amazon.com/kendra/) y la [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_TemplateConfiguration.html)API.

Para solucionar problemas del conector de la fuente de Amazon Kendra GitHub datos, consulte[Solución de problemas con los orígenes de datos](troubleshooting-data-sources.md).

**Topics**
+ [

## Características admitidas
](#supported-features-github)
+ [

## Requisitos previos
](#prerequisites-github)
+ [

## Instrucciones de conexión
](#data-source-procedure-github)
+ [

## Más información
](#github-learn-more)

## Características admitidas


Amazon KendraGitHub el conector de fuente de datos admite las siguientes funciones:
+ Asignaciones de campos
+ Control de acceso de usuarios
+ Filtros de inclusión/exclusión
+ Sincronizaciones completas e incrementales del contenido
+ Nube privada virtual (VPC)

## Requisitos previos


Antes de poder utilizarla Amazon Kendra para indexar la fuente de GitHub datos, realice estos cambios en sus AWS cuentas GitHub y.

**En GitHub, asegúrate de tener:**
+ Creó un GitHub usuario con permisos administrativos para la GitHub organización.
+ Ha configurado un token de acceso personal en GitHub para usarlo como credenciales de autenticación. Consulte la [Documentación de GitHub sobre cómo crear un token de acceso personal](https://docs.github.com/en/authentication/keeping-your-account-and-data-secure/creating-a-personal-access-token).
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).
+ **Recomendado:** configuré un OAuth token para las credenciales de autenticación. Utilice un OAuth token para mejorar los límites de aceleración de la API y el rendimiento del conector. Consulte [GitHub la documentación sobre la OAuth autorización](https://docs.github.com/en/rest/apps/oauth-applications?apiVersion=2022-11-28#about-oauth-apps-and-oauth-authorizations-of-github-apps).
+  GitHub Apuntó la URL del host del tipo de GitHub servicio que utiliza. Por ejemplo, la URL del host de GitHub la nube podría ser *https://api.github.com* y la URL del host GitHub del servidor podría ser*https://on-prem-host-url/api/v3/*.
+ Apuntó el nombre de su organización para GitHub la cuenta de GitHub Enterprise Cloud (SaaS) o la cuenta de GitHub Enterprise Server (local) a la que desea conectarse. Para encontrar el nombre de su organización, inicie sesión en el GitHub escritorio y seleccione **Sus organizaciones** en el menú desplegable de su imagen de perfil.
+ **Opcional (solo para servidores):** generó un certificado SSL y copió la ruta al certificado almacenado en un Amazon S3 depósito. Utilízalo para conectarte GitHub si necesitas una conexión SSL segura. Puede generar simplemente un certificado autofirmado X509 en cualquier ordenador mediante OpenSSL. Para ver un ejemplo del uso de OpenSSL para crear un certificado X509, consulte [Crear y firmar un certificado X509](https://docs.aws.amazon.com/elasticbeanstalk/latest/dg/configuring-https-ssl.html).
+ Se han añadido los siguientes permisos:

  **Para la nube GitHub empresarial (SaaS)**
  + `repo:status`— Otorga read/write acceso a los estados de las confirmaciones en los repositorios públicos y privados. Este ámbito solo es necesario para conceder a otros usuarios o servicios el acceso a los estados de confirmación de los repositorios privados sin conceder acceso al código.
  + `repo_deployment`: otorga acceso a los estados de implementación de los repositorios públicos y privados. Este ámbito solo es necesario para otorgar a otros usuarios o servicios acceso a los estados de implementación, sin otorgar acceso al código.
  + `public_repo`: limita el acceso a los repositorios públicos. Esto incluye el read/write acceso al código, los estados de confirmación, los proyectos de repositorios, los colaboradores y los estados de despliegue de repositorios y organizaciones públicos. También es obligatorio para los repositorios públicos destacados.
  + `repo:invite`— Otorga accept/decline la posibilidad de invitar a colaborar en un repositorio. Este ámbito solo es necesario para otorgar a otros usuarios o servicios acceso a las invitaciones sin otorgar acceso al código.
  + `security_events`: otorga acceso de lectura y escritura a los eventos de seguridad en la API de escaneo de código. Este ámbito solo es necesario para otorgar a otros usuarios o servicios acceso a los eventos de seguridad sin otorgar acceso al código.
  + `read:org`: otorga acceso de solo lectura a la membresía de la organización, los proyectos de la organización y la membresía del equipo.
  + `user:email`: otorga acceso de lectura a las direcciones de correo electrónico de los usuarios. Amazon Kendra lo requiere para rastrear. ACLs
  + `user:follow`: otorga acceso para seguir o dejar de seguir a otros usuarios. Amazon Kendra lo requiere para rastrear. ACLs
  + `read:user`: otorga acceso para leer los datos del perfil de un usuario. Amazon Kendra lo requiere para rastrear. ACLs
  + `workflow`: otorga la posibilidad de añadir y actualizar los archivos de flujo de trabajo de acciones de GitHub . Los archivos de flujo de trabajo se pueden archivar sin este ámbito si el mismo archivo (con la misma ruta y el mismo contenido) existe en otra rama del mismo repositorio.

  Para obtener más información, consulte Ámbitos de [ OAuth las aplicaciones en Docs](https://docs.github.com/en/apps/oauth-apps/building-oauth-apps/scopes-for-oauth-apps). GitHub

  **Para GitHub Enterprise Server (local)**
  + `repo:status`— Otorga read/write acceso a los estados de las confirmaciones en los repositorios públicos y privados. Este ámbito solo es necesario para conceder a otros usuarios o servicios el acceso a los estados de confirmación de los repositorios privados sin conceder acceso al código.
  + `repo_deployment`: otorga acceso a los estados de implementación de los repositorios públicos y privados. Este ámbito solo es necesario para otorgar a otros usuarios o servicios acceso a los estados de implementación, sin otorgar acceso al código.
  + `public_repo`: limita el acceso a los repositorios públicos. Esto incluye el read/write acceso al código, los estados de confirmación, los proyectos de repositorios, los colaboradores y los estados de despliegue de repositorios y organizaciones públicos. También es obligatorio para los repositorios públicos destacados.
  + `repo:invite`— Otorga accept/decline la posibilidad de invitar a colaborar en un repositorio. Este ámbito solo es necesario para otorgar a otros usuarios o servicios acceso a las invitaciones sin otorgar acceso al código.
  + `security_events`: otorga acceso de lectura y escritura a los eventos de seguridad en la API de escaneo de código. Este ámbito solo es necesario para otorgar a otros usuarios o servicios acceso a los eventos de seguridad sin otorgar acceso al código.
  + `read:user`: otorga acceso para leer los datos del perfil de un usuario. Amazon Q Business lo requiere para rastrear ACLs.
  + `user:email`: otorga acceso de lectura a las direcciones de correo electrónico de los usuarios. Amazon Q Business lo requiere para rastrear ACLs.
  + `user:follow`: otorga acceso para seguir o dejar de seguir a otros usuarios. Amazon Q Business lo requiere para rastrear ACLs.
  + `site_admin`— Otorga a los administradores del sitio acceso a los puntos finales de la API de administración de servidores GitHub empresariales.
  + `workflow`: otorga la posibilidad de añadir y actualizar los archivos de flujo de trabajo de acciones de GitHub . Los archivos de flujo de trabajo se pueden archivar sin este ámbito si el mismo archivo (con la misma ruta y el mismo contenido) existe en otra rama del mismo repositorio.

  Para obtener más información, consulte [Ámbitos de OAuth las aplicaciones](https://docs.github.com/en/apps/oauth-apps/building-oauth-apps/scopes-for-oauth-apps) en GitHub Docs y [Descripción de los ámbitos de OAuth las aplicaciones en Developer](https://developer.github.com/enterprise/2.16/apps/building-oauth-apps/understanding-scopes-for-oauth-apps/#available-scopes). GitHub
+ Has marcado que cada documento es único en GitHub las demás fuentes de datos que planeas utilizar para el mismo índice y entre ellas. Cada origen de datos que desee utilizar para un índice no debe contener el mismo documento en varios orígenes de datos. IDs Los documentos son globales en relación con un índice y deben ser únicos por índice.

**En el tuyoCuenta de AWS, asegúrate de tener:**
+ [Creó un Amazon Kendra índice](https://docs.aws.amazon.com/kendra/latest/dg/create-index.html) y, si usa la API, anotó el ID del índice.
+ [Creó un IAM rol](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds) para su fuente de datos y, si usa la API, anotó el ARN del IAM rol.
**nota**  
Si cambias el tipo de autenticación y las credenciales, debes actualizar tu IAM rol para acceder al ID AWS Secrets Manager secreto correcto.
+ Guardó sus credenciales de GitHub autenticación en un AWS Secrets Manager secreto y, si usa la API, anotó el ARN del secreto.
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).

Si no tiene un IAM rol o secreto existente, puede usar la consola para crear un nuevo IAM rol y un Secrets Manager secreto al conectar su fuente de GitHub datos. Amazon Kendra Si utiliza la API, debe proporcionar el ARN de un IAM rol y un Secrets Manager secreto existentes y un ID de índice.

## Instrucciones de conexión


Para conectarse Amazon Kendra a su fuente de GitHub datos, debe proporcionar los detalles necesarios de la fuente de GitHub datos para que Amazon Kendra pueda acceder a sus datos. Si aún no lo ha configurado GitHub Amazon Kendra, consulte[Requisitos previos](#prerequisites-github).

------
#### [ Console ]

**Para conectarse Amazon Kendra a GitHub** 

1. Inicie sesión en la [Amazon Kendraconsola Consola de administración de AWS y ábrala](https://console.aws.amazon.com/kendra/).

1. En el panel de navegación izquierdo, elija **Índices** y, a continuación, elija el índice que desee usar de la lista de índices.
**nota**  
Puede elegir configurar o editar los ajustes de **Control de acceso de usuarios** en la **Configuración del índice**. 

1. En la página **Introducción**, seleccione **Agregar origen de datos**.

1. En la página **Agregar origen de datos**, seleccione el **Conector de GitHub ** y, a continuación, seleccione **Agregar conector**. Si usa la versión 2 (si corresponde), elija el **Conector de GitHub ** con la etiqueta “V2.0”.

1. En la página **Especificar detalles del origen de datos**, introduzca la siguiente información:

   1. En **Nombre y descripción**, en **Nombre del origen de datos**: introduzca un nombre para el origen de datos. Puede incluir guiones, pero no espacios.

   1. (Opcional)** Descripción**: introduzca una descripción opcional para el origen de datos.

   1. En **Idioma predeterminado**: elija un idioma para filtrar los documentos para el índice. A menos que especifique lo contrario, el idioma predeterminado es el inglés. El idioma especificado en los metadatos del documento anula el idioma seleccionado.

   1. En **Etiquetas**, para **añadir una nueva etiqueta**: incluye etiquetas opcionales para buscar y filtrar tus recursos o realizar un seguimiento de tus AWS costes.

   1. Elija **Siguiente**.

1. En la página **Definir acceso y seguridad**, introduzca la siguiente información:

   1. **GitHubfuente**: elija entre **GitHub Enterprise Cloud** y **GitHubEnterprise** Server.

   1. **GitHub URL del host**: por ejemplo, la URL del host de la GitHub nube podría ser *https://api.github.com* y la URL del host GitHub del servidor podría ser. *https://on-prem-host-url/api/v3/*

   1. **GitHub nombre de la organización**: introduzca el nombre de su GitHub organización. Puedes encontrar la información de tu organización en tu GitHub cuenta.
**nota**  
GitHub El conector permite rastrear una sola organización por cada instancia del conector de la fuente de datos.

   1. **Autorización**: active o desactive la información de la lista de control de acceso (ACL) para los documentos, si tiene una ACL y desea usarla para el control de acceso. La ACL especifica a qué documentos pueden acceder los usuarios y los grupos. La información de la ACL se utiliza para filtrar los resultados de búsqueda en función del acceso del usuario o su grupo a los documentos. Para obtener más información, consulte [Filtrado de contexto de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#context-filter-user-incl-datasources).

   1. **AWS Secrets Managersecreto**: elija un secreto existente o cree uno nuevo Secrets Manager para almacenar sus credenciales de GitHub autenticación. Si decide crear un secreto nuevo, se abrirá una ventana de secreto de AWS Secrets Manager.

      1. Introduzca la siguiente información en la **ventana Crear un secreto de AWS Secrets Manager**:

         1. **Nombre del secreto**: un nombre para su secreto. El prefijo 'AmazonKendra- GitHub -' se añade automáticamente a tu nombre secreto.

         1. Para el **GitHubtoken**: introduzca el valor de la credencial de autenticación configurado en. GitHub

      1. Guarde y agregue el secreto.

   1. **Nube privada virtual (VPC)**: puede optar por utilizar una VPC. Si es así, debe agregar **Subredes** y **Grupos de seguridad de VPC**.

   1. **Rastreador de identidades**: especifique si se debe activar el rastreador de identidades de Amazon Kendra. El rastreador de identidades utiliza la información de la lista de control de acceso (ACL) de los documentos para filtrar los resultados de la búsqueda en función del acceso del usuario o del grupo a los documentos. Si tiene una ACL para sus documentos y decide utilizarla, también puede optar por activar el rastreador de identidades para configurar el [filtrado contextual Amazon Kendra de usuario de los resultados de búsqueda](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#context-filter-user-incl-datasources). De lo contrario, si el rastreador de identidades está desactivado, todos los documentos se pueden buscar públicamente. Si quieres usar el control de acceso para tus documentos y el rastreador de identidad está desactivado, también puedes usar la [PutPrincipalMapping](https://docs.aws.amazon.com/kendra/latest/APIReference/API_PutPrincipalMapping.html)API para cargar información de acceso de usuarios y grupos para filtrar el contexto de los usuarios.

   1. **IAMrol**: elija un IAM rol existente o cree uno nuevo IAM para acceder a las credenciales del repositorio y al contenido del índice.
**nota**  
IAMlos roles utilizados para los índices no se pueden usar para las fuentes de datos. Si no está seguro de si un rol existente se utiliza para un índice o para las preguntas frecuentes, elija **Crear un nuevo rol** para evitar errores.

   1. Elija **Siguiente**.

1. En la página **Configurar ajustes de sincronización**, introduzca la siguiente información:

   1. **Seleccionar repositorios**: elija rastrear todos los repositorios o algunos concretos.

      Si selecciona rastrear repositorios concretos, agregue los nombres de los repositorios y, opcionalmente, el nombre de cualquier rama específica.

   1. **Tipos de contenido**: elija los tipos de contenido que desee rastrear, entre los archivos, las publicaciones, las solicitudes de extracción de información y mucho más.

   1. **Patrones regex**: añada patrones de expresiones regulares para incluir o excluir determinados archivos.

   1. **Modo de sincronización**: elija cómo desea actualizar el índice cuando cambie el contenido del origen de datos. Al sincronizar la fuente de datos Amazon Kendra por primera vez, todo el contenido se rastrea e indexa de forma predeterminada. Debe ejecutar una sincronización completa de los datos si la sincronización inicial falló, incluso si no selecciona la sincronización completa como opción de modo de sincronización.
      + Sincronización completa: se vuelve a indexar todo el contenido, reemplazando el contenido existente cada vez que el origen de datos se sincronice con el índice.
      + Sincronización nueva y modificada: indexe solo el contenido nuevo y modificado cada vez que la fuente de datos se sincronice con el índice. Amazon Kendrapuede usar el mecanismo de la fuente de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido que ha cambiado desde la última sincronización.
      + Sincronización nueva y modificada: se indexa solo contenido nuevo y modificado cada vez que el origen de datos se sincronice con el índice. Amazon Kendra puede utilizar el mecanismo del origen de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido modificado desde la última sincronización.

   1. En **Programación de ejecución de sincronización** en **Frecuencia**: elija la frecuencia con la que desea sincronizar el contenido del origen de datos y actualizar el índice.

   1. Elija **Siguiente**.

1. En la página **Establecer asignaciones de campos**, especifique la siguiente información:

   1. **Campos de fuente de datos predeterminados**: seleccione entre los campos de fuente de datos predeterminados Amazon Kendra generados que desee asignar a su índice.

   1.  **Agregar campo**: para agregar campos de origen de datos personalizados para crear un nombre de campo de índice al que asignarlos y el tipo de datos del campo.

   1. Elija **Siguiente**.

1. En la página **Revisar y crear**, compruebe que la información que ha introducido es correcta y, a continuación, seleccione **Añadir origen de datos**. También puede elegir editar la información desde esta página. El origen de datos aparecerá en la página **Orígenes de datos** una vez que el origen de datos se haya agregado correctamente.

------
#### [ API ]

**Para conectarse a Amazon Kendra GitHub**

Debe especificar un JSON del [esquema del origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/ds-schemas.html#ds-github-schema) mediante la API [https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html](https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html). Debe proporcionar la siguiente información:
+ **Origen de datos**: defina el tipo de origen de datos como `GITHUB` cuando utilice el esquema JSON [https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html](https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html). Además, defina el origen de datos como `TEMPLATE` al llamar a la API [https://docs.aws.amazon.com/kendra/latest/dg/API_CreateDataSource.html](https://docs.aws.amazon.com/kendra/latest/dg/API_CreateDataSource.html).
+ **GitHubtipo**: especifique el tipo como `SAAS` o`ON_PREMISE`.
+ **URL del host**: especifique la URL del GitHub host o la URL del punto final de la API. Por ejemplo, si utiliza GitHub SaaS/Enterprise Cloud, la URL del host podría ser, y en el caso de los servidores GitHub locales o empresariales`https://api.github.com`, la URL del host podría ser. `https://on-prem-host-url/api/v3/`
+ **Nombre de la organización**: especifique el nombre de la organización de la cuenta. GitHub Para encontrar el nombre de su organización, inicie sesión en la GitHub computadora y seleccione **Sus organizaciones** en el menú desplegable de su imagen de perfil.
+ **Modo de sincronización**: especifique cómo Amazon Kendra debe actualizarse el índice cuando cambie el contenido de la fuente de datos. Al sincronizar el origen de datos con Amazon Kendra por primera vez, todo el contenido se rastrea y se indexa de forma predeterminada. Debe ejecutar una sincronización completa de los datos si la sincronización inicial falló, incluso si no selecciona la sincronización completa como opción de modo de sincronización. Puede elegir entre las siguientes opciones:
  + `FORCED_FULL_CRAWL` para volver a indexar todo el contenido, reemplazando el contenido existente cada vez que el origen de datos se sincronice con el índice.
  + `FULL_CRAWL` para indexar solo el contenido nuevo, modificado y eliminado cada vez que el origen de datos se sincronice con el índice. Amazon Kendra puede utilizar el mecanismo del origen de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido modificado desde la última sincronización.
  + `CHANGE_LOG` para indexar solo el contenido nuevo y modificado cada vez que el origen de datos se sincronice con el índice. Amazon Kendra puede utilizar el mecanismo del origen de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido modificado desde la última sincronización.
+ **Rastreador de identidades**: especifique si se debe activar el rastreador de identidades de Amazon Kendra. El rastreador de identidades utiliza la información de la lista de control de acceso (ACL) de los documentos para filtrar los resultados de la búsqueda en función del acceso del usuario o del grupo a los documentos. Si tiene una ACL para sus documentos y decide utilizarla, también puede optar por activar el rastreador de identidades para configurar el [filtrado Amazon Kendra de los resultados de búsqueda según el contexto del usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#context-filter-user-incl-datasources). De lo contrario, si el rastreador de identidades está desactivado, todos los documentos se pueden buscar públicamente. Si quieres usar el control de acceso para tus documentos y el rastreador de identidad está desactivado, también puedes usar la [PutPrincipalMapping](https://docs.aws.amazon.com/kendra/latest/APIReference/API_PutPrincipalMapping.html)API para cargar información de acceso de usuarios y grupos para filtrar el contexto de los usuarios.
+ **Nombre secreto de recurso de Amazon (ARN): proporcione** el nombre de recurso de Amazon (ARN) de un Secrets Manager secreto que contenga las credenciales de autenticación de su cuenta. GitHub El secreto se almacena en una estructura JSON con las siguientes claves:

  ```
  {
      "personalToken": "token"
  }
  ```
+ **IAMrol**: especifique `RoleArn` cuándo llama `CreateDataSource` para proporcionar un IAM rol con permisos para acceder a su Secrets Manager secreto y para llamar al público requerido APIs para el conector y. GitHub Amazon Kendra Para obtener más información, consulte [Roles de IAM para orígenes de datos de GitHub ](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds).

También puede añadir las siguientes características opcionales:
+  **Nube privada virtual (VPC)**: especifique a `VpcConfiguration` cuándo llamar a `CreateDataSource`. Para obtener más información, consulte [¿Se está configurando Amazon Kendra para usar un Amazon VPC](vpc-configuration.md).
**nota**  
Si usa un GitHub servidor, debe usar un Amazon VPC para conectarse a su GitHub servidor.
+  **Filtro de repositorios**: filtre los repositorios por su nombre y nombres de ramificaciones.
+  **Tipos de documentos o contenido**: especifique si desea rastrear los documentos del repositorio, los problemas, los comentarios de los problemas, los archivos adjuntos a los comentarios de los problemas, las solicitudes de extracción, los comentarios de las solicitudes de extracción o los archivos adjuntos de los comentarios de las solicitudes de extracción.
+  **Filtros de inclusión y exclusión**: especifique si desea incluir o excluir determinados archivos y carpetas.
**nota**  
La mayoría de los orígenes de datos utilizan patrones de expresiones regulares, que son patrones de inclusión o exclusión denominados filtros. Si especifica un filtro de inclusión, solo se indexará el contenido que coincida con el filtro de inclusión. Los documentos que no coincidan con el filtro de inclusión no se indexan. Si especifica un filtro de inclusión y exclusión, los documentos que coincidan con el filtro de exclusión no se indexarán, aunque coincidan con el filtro de inclusión.
+ **Lista de control de acceso (ACL)**: especifique si se va a rastrear la información de la ACL para los documentos, si tiene una ACL y desea usarla para el control de acceso. La ACL especifica a qué documentos pueden acceder los usuarios y los grupos. La información de la ACL se utiliza para filtrar los resultados de búsqueda en función del acceso del usuario o su grupo a los documentos. Para obtener más información, consulte [Filtrado de contexto de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#context-filter-user-incl-datasources).
+  **Asignaciones de campos**: elija asignar los campos de la fuente de GitHub datos a los campos de índice. Amazon Kendra Puede incluir campos de documentos, confirmaciones, problemas, archivos adjuntos de problemas, comentarios de problemas, solicitudes de extracción, archivos adjuntos de solicitudes de extracción y comentarios de solicitudes de extracción. Para obtener más información, consulte [Asignación de campos de origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/field-mapping.html).
**nota**  
El campo del cuerpo del documento o su equivalente en los documentos es obligatorio para que Amazon Kendra busque en los documentos. Debe asignar el nombre del campo del cuerpo del documento en el origen de datos al nombre del campo del índice `_document_body`. Todos los demás campos son opcionales.

Para obtener una lista de otras claves JSON importantes que debe configurar, consulte el [Esquema de plantilla de GitHub](https://docs.aws.amazon.com/kendra/latest/dg/ds-schemas.html#ds-github-schema).

------

## Más información


Para obtener más información sobre la integración Amazon Kendra con la fuente de GitHub datos, consulte:
+ [Reimagine la búsqueda en GitHub los repositorios con la potencia del conector Amazon Kendra GitHub ](https://aws.amazon.com/blogs/machine-learning/reimagine-search-on-github-repositories-with-the-power-of-the-amazon-kendra-github-connector/)

# Gmail


Gmail es un cliente de correo desarrollado por Google a través del cual se pueden enviar mensajes de correo electrónico con archivos adjuntos. Los mensajes de Gmail se pueden ordenar y almacenar en la bandeja de entrada del correo electrónico mediante carpetas y etiquetas. Puedes usarlo Amazon Kendra para indexar tus mensajes de correo electrónico y sus archivos adjuntos. También puede configurarlo Amazon Kendra para incluir o excluir mensajes de correo electrónico, archivos adjuntos de mensajes y etiquetas específicos para su indexación.

Puedes conectarte Amazon Kendra a tu fuente de datos de Gmail mediante la [Amazon Kendraconsola](https://console.aws.amazon.com/kendra/) y la [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_TemplateConfiguration.html)API.

Para solucionar problemas del conector de fuentes de datos de Amazon Kendra Gmail, consulta[Solución de problemas con los orígenes de datos](troubleshooting-data-sources.md).

**Topics**
+ [

## Características admitidas
](#supported-features-gmail)
+ [

## Requisitos previos
](#prerequisites-gmail)
+ [

## Instrucciones de conexión
](#data-source-procedure-gmail)
+ [

## Más información
](#gmail-learn-more)
+ [

## Notas
](#gmail-notes)

## Características admitidas

+ Asignaciones de campo
+ Control de acceso de usuarios
+ Filtros de inclusión/exclusión
+ Sincronizaciones completas e incrementales del contenido
+ Nube privada virtual (VPC)

## Requisitos previos


Antes de poder utilizarla Amazon Kendra para indexar tu fuente de datos de Gmail, realiza estos cambios en Gmail y en tus AWS cuentas.

**En Gmail, asegúrese de que:**
+ Ha creado una cuenta de administrador de Google Cloud Platform y un proyecto de Google Cloud.
+ Ha activado la API de Gmail y la API del SDK de administración en su cuenta de administrador.
+ Ha creado una cuenta de servicio y descargado una clave privada JSON para la cuenta de Gmail. Para obtener información sobre cómo crear una clave privada y acceder a ella, consulte la documentación de Google Cloud sobre cómo [Crear una clave de cuenta de servicio](https://cloud.google.com/iam/docs/keys-create-delete#creating) y las [Credenciales de una cuenta de servicio](https://cloud.google.com/iam/docs/service-account-creds#key-types).
+ Ha copiado el correo electrónico de su cuenta de administrador, el correo de su cuenta de servicio y su clave privada para utilizarlos como credenciales de autenticación.
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).
+ Ha añadido los siguientes ámbitos de OAuth (con un rol de administrador) para su usuario y los directorios compartidos que quiere indexar:
  + https://www.googleapis.com/auth/admin.directory.user.solo lectura
  + https://www.googleapis.com/auth/gmail.solo lectura
+ Ha comprobado que cada documento es único en Gmail y en otros orígenes de datos que vaya a utilizar para el mismo índice. Cada origen de datos que desee utilizar para un índice no debe contener el mismo documento en varios orígenes de datos. IDs Los documentos son globales para un índice y deben ser únicos por índice.

**En el tuyoCuenta de AWS, asegúrate de tener:**
+ [Creó un Amazon Kendra índice](https://docs.aws.amazon.com/kendra/latest/dg/create-index.html) y, si usa la API, anotó el ID del índice.
+ [Creó un IAM rol](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds) para su fuente de datos y, si usa la API, anotó el ARN del IAM rol.
**nota**  
Si cambias el tipo de autenticación y las credenciales, debes actualizar tu IAM rol para acceder al ID AWS Secrets Manager secreto correcto.
+ Ha guardado sus credenciales de autenticación de Gmail en un secreto de AWS Secrets Manager y, si utiliza la API, ha anotado el ARN del secreto.
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).

Si no tienes ningún IAM rol o secreto existente, puedes usar la consola para crear un nuevo IAM rol y un Secrets Manager secreto al conectar tu fuente de datos de GmailAmazon Kendra. Si utiliza la API, debe proporcionar el ARN de un IAM rol y un Secrets Manager secreto existentes y un ID de índice.

## Instrucciones de conexión


Para conectarte Amazon Kendra a tu fuente de datos de Gmail, debes proporcionar los detalles de tus credenciales de Gmail para que Amazon Kendra puedas acceder a tus datos. Si aún no has configurado Gmail paraAmazon Kendra, consulta[Requisitos previos](#prerequisites-gmail).

------
#### [ Console ]

**Para conectarte Amazon Kendra a Gmail** 

1. Inicia sesión en la [Amazon Kendraconsola Consola de administración de AWS](https://console.aws.amazon.com/kendra/) y ábrela.

1. En el panel de navegación izquierdo, elija **Índices** y, a continuación, elija el índice que desee usar de la lista de índices.
**nota**  
Puede elegir configurar o editar los ajustes de **Control de acceso de usuarios** en la **Configuración del índice**. 

1. En la página **Introducción**, seleccione **Agregar origen de datos**.

1. En la página **Agregar origen de datos**, seleccione el **Conector de Gmail** y, a continuación, seleccione **Agregar conector**. Si usa la versión 2 (si corresponde), elija el **Conector de Gmail** con la etiqueta “V2.0”.

1. En la página **Especificar detalles del origen de datos**, introduzca la siguiente información:

   1. En **Nombre y descripción**, en **Nombre del origen de datos**: introduzca un nombre para el origen de datos. Puede incluir guiones, pero no espacios.

   1. (Opcional)** Descripción**: introduzca una descripción opcional para el origen de datos.

   1. En **Idioma predeterminado**: elija un idioma para filtrar los documentos para el índice. A menos que especifique lo contrario, el idioma predeterminado es el inglés. El idioma especificado en los metadatos del documento anula el idioma seleccionado.

   1. En **Etiquetas**, para **añadir una nueva etiqueta**: incluye etiquetas opcionales para buscar y filtrar tus recursos o realizar un seguimiento de tus AWS costes.

   1. Elija **Siguiente**.

1. En la página **Definir acceso y seguridad**, introduzca la siguiente información:

   1. **Autorización**: active o desactive la información de la lista de control de acceso (ACL) para los documentos, si tiene una ACL y desea usarla para el control de acceso. La ACL especifica a qué documentos pueden acceder los usuarios y los grupos. La información de la ACL se utiliza para filtrar los resultados de búsqueda en función del acceso del usuario o su grupo a los documentos. Para obtener más información, consulte [Filtrado de contexto de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#context-filter-user-incl-datasources).

   1. En **Autenticación** por **AWSSecrets Managersecreto**: elige un secreto existente o crea uno nuevo Secrets Manager para almacenar tus credenciales de autenticación de Gmail. Si decides crear un secreto nuevo, se abrirá una ventana AWS Secrets Manager secreta.

      1. Introduzca la siguiente información en la **ventana Crear un secreto de AWS Secrets Manager**:

        1. **Nombre del secreto**: un nombre para su secreto.

        1. **Correo electrónico del cliente**: el correo electrónico del cliente que copió de su cuenta de servicio de Google.

        1. **Correo electrónico de la cuenta de administrador**: el correo electrónico de la cuenta de administrador que quiere usar.

        1. **Clave privada**: la clave privada que copió de su cuenta de servicio de Google.

        1. Guarde y agregue el secreto.

   1. **Nube privada virtual (VPC)**: puede optar por utilizar una VPC. Si es así, debe agregar **Subredes** y **Grupos de seguridad de VPC**.

   1. **IAMrol**: elige un IAM rol existente o crea uno nuevo IAM para acceder a las credenciales del repositorio y al contenido del índice.
**nota**  
IAMlos roles utilizados para los índices no se pueden usar para las fuentes de datos. Si no está seguro de si un rol existente se utiliza para un índice o para las preguntas frecuentes, elija **Crear un nuevo rol** para evitar errores.

   1. Elija **Siguiente**.

1. En la página **Configurar ajustes de sincronización**, introduzca la siguiente información:

   1. En **tipos de entidad**: elija sincronizar los archivos adjuntos de los mensajes.

   1. (Opcional) En **Configuración adicional**, introduzca la siguiente información:

      1. **Intervalo de fechas**: introduzca un intervalo de fechas para especificar la fecha de inicio y finalización de los correos electrónicos que quiera rastrear.

      1. **Dominios de correo electrónico**: incluya o excluya determinados correos electrónicos en función de los dominios de correo electrónico “para“, “de”, “cc” y “cco”.

      1. **Palabras clave en los asuntos**: incluya o excluya los correos electrónicos en función de las palabras clave de los asuntos.
**nota**  
También puede optar por incluir cualquier documento que coincida con todas las palabras clave del asunto que haya introducido.

      1. **Etiquetas**: agregue patrones de expresiones regulares para incluir o excluir etiquetas específicas del correo electrónico.

      1. **Archivos adjuntos**: agregue patrones de expresiones regulares para incluir o excluir archivos adjuntos específicos del correo electrónico.

   1. **Modo de sincronización**: elija cómo desea actualizar el índice cuando cambie el contenido del origen de datos. Al sincronizar la fuente de datos Amazon Kendra por primera vez, todo el contenido se rastrea e indexa de forma predeterminada. Debe ejecutar una sincronización completa de los datos si la sincronización inicial falló, incluso si no selecciona la sincronización completa como opción de modo de sincronización.
      + Sincronización completa: se vuelve a indexar todo el contenido, reemplazando el contenido existente cada vez que el origen de datos se sincronice con el índice.
      + Sincronización nueva, modificada o eliminada: indexe solo el contenido nuevo, modificado y eliminado cada vez que la fuente de datos se sincronice con el índice. Amazon Kendrapuede usar el mecanismo de la fuente de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido que ha cambiado desde la última sincronización.
**importante**  
Como no hay una API para actualizar los mensajes de Gmail eliminados permanentemente, una sincronización del contenido nuevo, modificado o eliminado:  
No eliminará del índice de Amazon Kendra los mensajes que se hayan eliminado permanentemente de Gmail
No sincronizará los cambios en las etiquetas de correo de Gmail
Para sincronizar los cambios en las etiquetas del origen de datos de Gmail y los mensajes de correo electrónico eliminados permanentemente con el índice de Amazon Kendra, debe realizar rastreos completos de forma periódica.

   1. En **Programación de ejecución de sincronización**, en **Frecuencia**: elija la frecuencia con la que desea sincronizar el contenido del origen de datos y actualizar el índice.

   1. Elija **Siguiente**.

1. En la página **Establecer asignaciones de campos**, especifique la siguiente información:

   1. **Campos de fuente de datos predeterminados**: seleccione entre los campos de fuente de datos predeterminados Amazon Kendra generados que desee asignar a su índice.
**nota**  
Amazon KendraEl conector de fuentes de datos de Gmail no admite la creación de campos de índice personalizados debido a las limitaciones de la API.

   1. Elija **Siguiente**.

1. En la página **Revisar y crear**, compruebe que la información que ha introducido es correcta y, a continuación, seleccione **Añadir origen de datos**. También puede elegir editar la información desde esta página. El origen de datos aparecerá en la página **Orígenes de datos** una vez que el origen de datos se haya agregado correctamente.

------
#### [ API ]

**Para conectarse Amazon Kendra a Gmail**

Debe especificar un JSON del [esquema del origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/ds-schemas.html#ds-gmail-schema) mediante la API [https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html](https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html). Debe proporcionar la siguiente información:
+ **Origen de datos**: defina el tipo de origen de datos como `GMAIL` cuando utilice el esquema JSON [https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html](https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html). Además, defina el origen de datos como `TEMPLATE` al llamar a la API [https://docs.aws.amazon.com/kendra/latest/dg/API_CreateDataSource.html](https://docs.aws.amazon.com/kendra/latest/dg/API_CreateDataSource.html).
+ **Modo de sincronización**: especifique cómo Amazon Kendra debe actualizarse el índice cuando cambie el contenido de la fuente de datos. Al sincronizar el origen de datos con Amazon Kendra por primera vez, todo el contenido se rastrea y se indexa de forma predeterminada. Debe ejecutar una sincronización completa de los datos si la sincronización inicial falló, incluso si no selecciona la sincronización completa como opción de modo de sincronización. Puede elegir entre las siguientes opciones:
  + `FORCED_FULL_CRAWL` para volver a indexar todo el contenido, reemplazando el contenido existente cada vez que el origen de datos se sincronice con el índice.
  + `FULL_CRAWL` para indexar solo el contenido nuevo, modificado y eliminado cada vez que el origen de datos se sincronice con el índice. Amazon Kendra puede utilizar el mecanismo del origen de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido modificado desde la última sincronización.
**importante**  
Como no hay una API para actualizar los mensajes de Gmail eliminados permanentemente, una sincronización del contenido nuevo, modificado o eliminado:  
No eliminará del índice de Amazon Kendra los mensajes que se hayan eliminado permanentemente de Gmail
No sincronizará los cambios en las etiquetas de correo de Gmail
Para sincronizar los cambios en la etiqueta de la fuente de datos de Gmail y los mensajes de correo electrónico eliminados permanentemente con tu Amazon Kendra índice, debes realizar rastreos completos de forma periódica.
+ **Nombre secreto del recurso de Amazon (ARN): proporciona** el nombre del recurso de Amazon (ARN) de un Secrets Manager secreto que contenga las credenciales de autenticación de tu cuenta de Gmail. El secreto se almacena en una estructura JSON con las siguientes claves:

  ```
  {
      "adminAccountEmailId": "service account email",
      "clientEmailId": "user account email",
      "privateKey": "private key"
  }
  ```
+ **IAMrol**: especifique `RoleArn` cuándo llama `CreateDataSource` para proporcionar un IAM rol con permisos para acceder a su Secrets Manager secreto y para llamar al público requerido APIs para el conector de Gmail y. Amazon Kendra Para obtener más información, consulte [Roles de IAM para orígenes de datos de Gmail](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds).

También puede añadir las siguientes características opcionales:
+  **Nube privada virtual (VPC)**: especifique a `VpcConfiguration` cuándo llamar a `CreateDataSource`. Para obtener más información, consulte [¿Se está configurando Amazon Kendra para usar un Amazon VPC](vpc-configuration.md).
+  **Filtros de inclusión y exclusión**: especifique si desea incluir o excluir determinados correos electrónicos según “para”, “de”, “cc” o “cco”.
**nota**  
La mayoría de los orígenes de datos utilizan patrones de expresiones regulares, que son patrones de inclusión o exclusión denominados filtros. Si especifica un filtro de inclusión, solo se indexará el contenido que coincida con el filtro de inclusión. Los documentos que no coincidan con el filtro de inclusión no se indexan. Si especifica un filtro de inclusión y exclusión, los documentos que coincidan con el filtro de exclusión no se indexarán, aunque coincidan con el filtro de inclusión.
+  **Filtrado de contexto de usuario y control de acceso**: si hay una lista de control de acceso (ACL) para los documentos, Amazon Kendra la rastreará. La información de la ACL se utiliza para filtrar los resultados de búsqueda en función del acceso del usuario o su grupo a los documentos. Para obtener más información, consulte [Filtrado de contexto de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#datasource-context-filter).
+  **Asignaciones de campos**: elija asignar los campos del origen de datos de Gmail a los campos de índice de Amazon Kendra. Para obtener más información, consulte [Asignación de campos de origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/field-mapping.html).
**nota**  
El campo del cuerpo del documento o el cuerpo del documento equivalente de sus documentos es obligatorio Amazon Kendra para poder buscarlos. Debe asignar el nombre del campo del cuerpo del documento en el origen de datos al nombre del campo del índice `_document_body`. Todos los demás campos son opcionales.
**nota**  
Amazon KendraEl conector de fuentes de datos de Gmail no admite la creación de campos de índice personalizados debido a las limitaciones de la API.

Para obtener una lista de otras claves JSON importantes que debe configurar, consulte el [Esquema de plantilla de Gmail](https://docs.aws.amazon.com/kendra/latest/dg/ds-schemas.html#ds-gmail-schema).

------

## Más información


Para obtener más información sobre la integración Amazon Kendra con tu fuente de datos de Gmail, consulta:
+ [Realizar una búsqueda inteligente en los correos electrónicos de Google Workspace mediante el conector de Gmail para Amazon Kendra](https://aws.amazon.com/blogs/machine-learning/perform-intelligent-search-across-emails-in-your-google-workspace-using-the-gmail-connector-for-amazon-kendra/).

## Notas

+ Como no hay una API para actualizar los mensajes de Gmail eliminados permanentemente, una `FULL_CRAWL`/**Sincronización de contenido nuevo, modificado o eliminado**:
  + No eliminará de tu Amazon Kendra índice los mensajes que se hayan eliminado permanentemente de Gmail
  + No sincronizarán los cambios en las etiquetas de correo de Gmail

  Para sincronizar los cambios en la etiqueta de la fuente de datos de Gmail y los mensajes de correo electrónico eliminados permanentemente con tu Amazon Kendra índice, debes realizar un rastreo completo de forma periódica.
+ Amazon KendraEl conector de fuentes de datos de Gmail no admite la creación de campos de índice personalizados debido a las limitaciones de la API.

# Google Drive


Google Drive es un servicio de almacenamiento de archivos basado en la nube. Amazon Kendra se puede utilizar para indexar los documentos almacenados en las carpetas de unidades compartidas, Mis unidades y Compartido conmigo del origen de datos de Google Drive. Se pueden indexar tanto los documentos de Google Workspace como los documentos que aparecen en [Tipos de documentación](https://docs.aws.amazon.com/kendra/latest/dg/index-document-types.html). También se pueden usar filtros de inclusión y exclusión para indexar el contenido por nombre de archivo, tipo de archivo y ruta de archivo.

Puedes conectarte Amazon Kendra a tu fuente de datos de Google Drive mediante la [Amazon Kendra consola](https://console.aws.amazon.com/kendra/), la [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_TemplateConfiguration.html)API o la [GoogleDriveConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_GoogleDriveConfiguration.html)API.

Amazon Kendra tiene dos versiones del conector de Google Drive. Las características compatibles de cada versión incluyen:

**Conector de Google Drive V1.0/API [GoogleDriveConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_GoogleDriveConfiguration.html)**
+ Asignaciones de campos
+ Control de acceso de usuarios
+ Filtros de inclusión/exclusión

**Conector de Google Drive V2.0/API [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_TemplateConfiguration.html)**
+ Asignaciones de campos
+ Control de acceso de usuarios
+ Filtros de inclusión/exclusión
+ Sincronizaciones completas e incrementales del contenido
+ Nube privada virtual (VPC)

**nota**  
El conector DriveConfiguration V1.0/API de Google Drive finalizó en 2023. Recomendamos migrar o utilizar el conector V2.0 o la API de Google Drive. TemplateConfiguration 

Para solucionar problemas del conector de fuentes de datos de Amazon Kendra Google Drive, consulta. [Solución de problemas con los orígenes de datos](troubleshooting-data-sources.md)

**Topics**
+ [

# Google Drive Connector V1.0
](data-source-v1-google-drive.md)
+ [

# Google Drive Connector V2.0
](data-source-v2-google-drive.md)

# Google Drive Connector V1.0


Google Drive es un servicio de almacenamiento de archivos basado en la nube. Puedes usarlo Amazon Kendra para indexar documentos y comentarios almacenados en las carpetas de unidades compartidas, Mis unidades de disco y Compartidas conmigo de tu fuente de datos de Google Drive. Se pueden indexar tanto los documentos de Google Workspace como los documentos que aparecen en [Tipos de documentación](https://docs.aws.amazon.com/kendra/latest/dg/index-document-types.html). También se pueden usar filtros de inclusión y exclusión para indexar el contenido por nombre de archivo, tipo de archivo y ruta de archivo.

**nota**  
El conector V1.0 de Google Drive y la DriveConfiguration API de Google finalizaron en 2023. Recomendamos migrar o utilizar el conector V2.0 o la API de Google Drive. TemplateConfiguration 

Para solucionar problemas del conector de fuentes de datos de Amazon Kendra Google Drive, consulta. [Solución de problemas con los orígenes de datos](troubleshooting-data-sources.md)

**Topics**
+ [

## Características admitidas
](#supported-features-v1-google-drive)
+ [

## Requisitos previos
](#prerequisites-v1-google-drive)
+ [

## Instrucciones de conexión
](#data-source-v1-procedure-google-drive)
+ [

## Más información
](#google-drive-learn-more)

## Características admitidas

+ Asignaciones de campo
+ Control de acceso de usuarios
+ Filtros de inclusión/exclusión

## Requisitos previos


Antes de poder utilizarla Amazon Kendra para indexar tu fuente de datos de Google Drive, realiza estos cambios en tu Google Drive y en tus AWS cuentas.

**En Google Drive, asegúrese de que:**
+ **Bien** se le ha concedido el acceso mediante un rol de superadministrador **o** es un usuario con privilegios administrativos. No necesita un rol de superadministrador si este le ha otorgado el acceso.
+ Ha creado una cuenta de servicio con la opción **Habilitar la delegación en todo el dominio de G Suite** activada y una clave JSON como clave privada que utiliza la cuenta.
+ Ha copiado el correo electrónico de su cuenta de usuario y el correo electrónico de su cuenta de servicio. Cuando te conectes, introduce el correo electrónico de tu cuenta de usuario como correo electrónico de cuenta de administrador y el correo de tu cuenta de servicio como correo electrónico de cliente en tu AWS Secrets Manager secreto. Amazon Kendra 
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).
+ Ha agregado la API del SDK de administración y la API de Google Drive a su cuenta.
+ Ha agregado (o has pedido a un usuario con un rol de superadministrador que agregue) los siguientes permisos a su cuenta de servicio mediante un rol de superadministrador:
  + https://www.googleapis.com/auth/drive. Solo lectura
  + https://www.googleapis.com/auth/drive.metadata.read de solo lectura
  + https://www.googleapis.com/auth/admin.directory.user.solo lectura
  + https://www.googleapis.com/auth/admin.directory.group.solo lectura
+ Ha comprobado que cada documento es único en Google Drive y en otros orígenes de datos que vaya a utilizar para el mismo índice. Cada origen de datos que desee utilizar para un índice no debe contener el mismo documento en varios orígenes de datos. IDs Los documentos son globales en relación con un índice y deben ser únicos por índice.

**En el tuyo Cuenta de AWS, asegúrate de tener:**
+ [Creó un Amazon Kendra índice](https://docs.aws.amazon.com/kendra/latest/dg/create-index.html) y, si usa la API, anotó el ID del índice.
+ [Creó un IAM rol](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds) para su fuente de datos y, si usa la API, anotó el ARN del IAM rol.
**nota**  
Si cambias el tipo de autenticación y las credenciales, debes actualizar tu IAM rol para acceder al ID AWS Secrets Manager secreto correcto.
+ Ha guardado sus credenciales de autenticación de Google Drive en un secreto de AWS Secrets Manager y, si utiliza la API, ha anotado el ARN del secreto.
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).

Si no tienes un IAM rol o un secreto existentes, puedes usar la consola para crear un nuevo IAM rol y un Secrets Manager secreto al conectar tu fuente de datos de Google Drive Amazon Kendra. Si utiliza la API, debe proporcionar el ARN de un IAM rol y un Secrets Manager secreto existentes y un ID de índice.

## Instrucciones de conexión


Para conectarte Amazon Kendra a tu fuente de datos de Google Drive, debes proporcionar los detalles necesarios de tu fuente de datos de Google Drive para que Amazon Kendra puedas acceder a tus datos. Si aún no has configurado Google Drive para Amazon Kendra ver[Requisitos previos](#prerequisites-v1-google-drive).

------
#### [ Console ]

**Para conectarse Amazon Kendra a Google Drive** 

1. Inicie sesión en la consola AWS de administración y abra la [Amazon Kendra consola](https://console.aws.amazon.com/kendra/).

1. En el panel de navegación izquierdo, elija **Índices** y, a continuación, elija el índice que desee usar de la lista de índices.
**nota**  
Puede elegir configurar o editar los ajustes de **Control de acceso de usuarios** en la **Configuración del índice**. 

1. En la página **Introducción**, seleccione **Agregar origen de datos**.

1. En la página **Agregar origen de datos**, seleccione **Google Drive Connector V1.0** y, a continuación, seleccione **Añadir conector**.

1. En la página **Especificar detalles del origen de datos**, introduzca la siguiente información:

   1. En **Nombre y descripción**, en **Nombre del origen de datos**: introduzca un nombre para el origen de datos. Puede incluir guiones, pero no espacios.

   1. (Opcional)** Descripción**: introduzca una descripción opcional para el origen de datos.

   1. En **Idioma predeterminado**: elija un idioma para filtrar los documentos para el índice. A menos que especifique lo contrario, el idioma predeterminado es el inglés. El idioma especificado en los metadatos del documento anula el idioma seleccionado.

   1. En **Etiquetas**, para **añadir una nueva etiqueta**: incluya etiquetas opcionales para buscar y filtrar sus recursos o realizar un seguimiento de sus AWS costes.

   1. Elija **Siguiente**.

1. En la página **Definir acceso y seguridad**, introduzca la siguiente información:

   1. En **Tipo de autenticación**: elija entre **Existente** y **Nuevo**. Si elige usar un secreto existente, use **Seleccionar secreto** para elegir el secreto.

   1. Si decide crear un secreto nuevo, se abrirá una opción de secreto de AWS Secrets Manager .

      1. Introduzca la siguiente información en la **ventana Crear un secreto de AWS Secrets Manager **:

        1. **Nombre del secreto**: un nombre para su secreto. El prefijo «AmazonKendra-Google Drive» se añade automáticamente a tu nombre secreto.

        1. En **Correo electrónico de la cuenta de administrador**, **Correo electrónico del cliente** y **Clave privada**: introduzca los valores de las credenciales de autenticación que generó y descargó de su cuenta de Google Drive. 

        1. Seleccione **Guardar autenticación**.

   1. **IAM rol**: elige un IAM rol existente o crea uno nuevo IAM para acceder a las credenciales de tu repositorio y al contenido del índice.
**nota**  
IAM los roles utilizados para los índices no se pueden usar para las fuentes de datos. Si no está seguro de si un rol existente se utiliza para un índice o para las preguntas frecuentes, elija **Crear un nuevo rol** para evitar errores.

   1. Elija **Siguiente**.

1. En la página **Configurar ajustes de sincronización**, introduzca la siguiente información:

   1. **Excluir cuentas de usuario**: los usuarios de Google Drive que quiere excluir del índice. Puede agregar hasta 100 cuentas de usuario.

   1. **Excluir unidades compartidas**: las unidades compartidas de Google Drive que quiere excluir del índice. Puede agregar hasta 100 unidades compartidas.

   1. **Excluir tipos de archivos**: los tipos de archivos de Google Drive que quiere excluir del índice. También puede optar por editar las selecciones de tipo MIME.

   1. **Configuración adicional**: patrones de expresión regular para incluir o excluir determinado contenido. Puede agregar hasta 100 patrones.

   1. **Frecuencia**: la frecuencia con la que Amazon Kendra se sincronizará con el origen de datos.

   1. Elija **Siguiente**.

1. En la página **Establecer asignaciones de campos**, especifique la siguiente información:

   1. Para **GoogleDrive el nombre de campo** y **otras asignaciones de campos sugeridas: seleccione entre los** campos de fuentes de datos predeterminados Amazon Kendra generados que desee asignar a su índice. 

   1.  **Agregar campo**: para agregar campos de origen de datos personalizados para crear un nombre de campo de índice al que asignarlos y el tipo de datos del campo.

   1. Elija **Siguiente**.

1. En la página **Revisar y crear**, compruebe que la información que ha introducido es correcta y, a continuación, seleccione **Añadir origen de datos**. También puede elegir editar la información desde esta página. El origen de datos aparecerá en la página **Orígenes de datos** una vez que el origen de datos se haya agregado correctamente.

------
#### [ API ]

**Para conectarse a Google Drive Amazon Kendra **

Debe especificar lo siguiente mediante la [GoogleDriveConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_GoogleDriveConfiguration.html)API:
+ **Nombre secreto del recurso de Amazon (ARN): proporciona** el nombre del recurso de Amazon (ARN) de un Secrets Manager secreto que contenga las credenciales de autenticación de tu cuenta de Google Drive. El secreto se almacena en una estructura JSON con las siguientes claves:

  ```
  {
      "clientAccount": "service account email",
      "adminAccount": "user account email"",
      "privateKey": "private key"
  }
  ```
+ **IAM rol**: especifique `RoleArn` cuándo llama `CreateDataSource` para proporcionar un IAM rol con permisos para acceder a su Secrets Manager secreto y para llamar al público requerido APIs para el conector de Google Drive y. Amazon Kendra Para obtener más información, consulte [Roles de IAM para orígenes de datos de Google Drive](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds).

También puede añadir las siguientes características opcionales:
+  **Filtros de inclusión y exclusión**: de forma predeterminada, Amazon Kendra indexa todos los documentos de Google Drive. Puede especificar si desea incluir o excluir determinado contenido en las unidades compartidas, las cuentas de usuario, los tipos MIME de documentos y los archivos. Si decide excluir las cuentas de usuario, no se indexará ninguno de los archivos de Mi unidad correspondiente a la cuenta. Los archivos compartidos con el usuario se indexan, a menos que también se excluya al propietario del archivo.
**nota**  
La mayoría de los orígenes de datos utilizan patrones de expresiones regulares, que son patrones de inclusión o exclusión denominados filtros. Si especifica un filtro de inclusión, solo se indexará el contenido que coincida con el filtro de inclusión. Los documentos que no coincidan con el filtro de inclusión no se indexan. Si especifica un filtro de inclusión y exclusión, los documentos que coincidan con el filtro de exclusión no se indexarán, aunque coincidan con el filtro de inclusión.
+  **Asignaciones de campos**: elija asignar los campos del origen de datos de Google Drive a los campos de índice de Amazon Kendra . Para obtener más información, consulte [Asignación de campos de origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/field-mapping.html).
**nota**  
El campo del cuerpo del documento o el cuerpo del documento equivalente de sus documentos es obligatorio Amazon Kendra para poder buscarlos. Debe asignar el nombre del campo del cuerpo del documento en el origen de datos al nombre del campo del índice `_document_body`. Todos los demás campos son opcionales.
+  **Filtrado de contexto de usuario y control de acceso**: si hay una lista de control de acceso (ACL) para los documentos,Amazon Kendra la rastreará. La información de la ACL se utiliza para filtrar los resultados de búsqueda en función del acceso del usuario o su grupo a los documentos. Para obtener más información, consulte [Filtrado de contexto de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#datasource-context-filter).

------

## Más información


Para obtener más información sobre la integración Amazon Kendra con tu fuente de datos de Google Drive, consulta:
+ [Cómo empezar a utilizar el conector de Amazon Kendra Google Drive](https://aws.amazon.com/blogs/machine-learning/getting-started-with-the-amazon-kendra-google-drive-connector/)

# Google Drive Connector V2.0


Google Drive es un servicio de almacenamiento de archivos basado en la nube. Puedes usarlo Amazon Kendra para indexar los documentos y comentarios almacenados en las carpetas de unidades compartidas, Mis unidades de disco y Compartidas conmigo de tu fuente de datos de Google Drive. Se pueden indexar tanto los documentos de Google Workspace como los documentos que aparecen en [Tipos de documentación](https://docs.aws.amazon.com/kendra/latest/dg/index-document-types.html). También se pueden usar filtros de inclusión y exclusión para indexar el contenido por nombre de archivo, tipo de archivo y ruta de archivo.

**nota**  
El conector V1.0 de Google Drive y la DriveConfiguration API de Google finalizaron en 2023. Recomendamos migrar o utilizar el conector V2.0 o la API de Google Drive. TemplateConfiguration 

Para solucionar problemas del conector de fuentes de datos de Amazon Kendra Google Drive, consulta. [Solución de problemas con los orígenes de datos](troubleshooting-data-sources.md)

**Topics**
+ [

## Características admitidas
](#supported-features-v2-google-drive)
+ [

## Requisitos previos
](#prerequisites-v2-google-drive)
+ [

## Instrucciones de conexión
](#data-source-procedure-v2-google-drive)
+ [

## Notas
](#google-drive-notes)

## Características admitidas

+ Asignaciones de campo
+ Control de acceso de usuarios
+ Filtros de inclusión/exclusión
+ Sincronizaciones completas e incrementales del contenido
+ Nube privada virtual (VPC)

## Requisitos previos


Antes de poder utilizarla Amazon Kendra para indexar tu fuente de datos de Google Drive, realiza estos cambios en tu Google Drive y en tus AWS cuentas.

**En Google Drive, asegúrese de que:**
+ **Bien** se le ha concedido el acceso mediante un rol de superadministrador **o** es un usuario con privilegios administrativos. No necesita un rol de superadministrador si este le ha otorgado el acceso.
+ Ha configurado las credenciales de conexión de la cuenta de servicio de Google Drive, que incluyen el correo electrónico de la cuenta de administrador, el correo electrónico del cliente (correo electrónico de la cuenta de servicio) y la clave privada. Consulte la [Documentación de Google Cloud sobre cómo crear y eliminar las claves de las cuentas de servicio](https://cloud.google.com/iam/docs/keys-create-delete).
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).
+ Creó una cuenta de servicio de Google Cloud (una cuenta con autoridad delegada para asumir una identidad de usuario) con la **opción Habilitar la delegación en todo el dominio de G Suite** para la server-to-server autenticación y, a continuación, generó una clave privada JSON con la cuenta.
**nota**  
La clave privada se debe generar después de crear la cuenta de servicio.
+ Ha agregado la API del SDK de administración y la API de Google Drive a su cuenta de usuario.
+ **Opcional:** configuré las credenciales de conexión de Google Drive OAuth 2.0 con el ID de cliente, el secreto del cliente y el token de actualización como credenciales de conexión para un usuario específico. Las necesita para rastrear los datos de las cuentas individuales. Consulta la [documentación de Google sobre el uso de la OAuth versión 2.0 para acceder APIs](https://developers.google.com/identity/protocols/oauth2).
+ Has añadido (o has pedido a un usuario con una función de superadministrador que la añada) los siguientes OAuth ámbitos a tu cuenta de servicio mediante una función de superadministrador. Estos ámbitos de API son necesarios para rastrear todos los documentos y la información de control de acceso (ACL) de todos los usuarios de un dominio de Google Workspace:
  + https://www.googleapis.com/auth/Drive.readOnly: consulta y descarga todos tus archivos de Google Drive
  + https://www.googleapis.com/auth/drive.metadata.readonly: consulta los metadatos de los archivos de Google Drive
  + https://www.googleapis.com/auth/admin.directory.group.readOnly: permite recuperar únicamente la información del grupo, el alias del grupo y los miembros. Esto es necesario para el Identity Amazon Kendra Crawler.
  + https://www.googleapis.com/auth/admin.directory.user.readOnly: permite recuperar únicamente usuarios o alias de usuario. Esto es necesario para incluir a los usuarios en el Identity Crawler y para configurarlos. Amazon Kendra ACLs
  + https://www.googleapis.com/auth/Plataforma en la nube: permite generar un token de acceso para recuperar el contenido de archivos grandes de Google Drive.
  + https://www.googleapis.com/auth/forms.body.readonly: permite obtener datos de Google Forms.

  **Para que sea compatible con la API Forms, añada el siguiente ámbito adicional:**
  + https://www.googleapis.com/auth/forms.body.solo lectura
+ Ha comprobado que cada documento es único en Google Drive y en otros orígenes de datos que vaya a utilizar para el mismo índice. Cada origen de datos que desee utilizar para un índice no debe contener el mismo documento en varios orígenes de datos. IDs Los documentos son globales en relación con un índice y deben ser únicos por índice.

**En el tuyo Cuenta de AWS, asegúrate de tener:**
+ [Creó un Amazon Kendra índice](https://docs.aws.amazon.com/kendra/latest/dg/create-index.html) y, si usa la API, anotó el ID del índice.
+ [Creó un IAM rol](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds) para su fuente de datos y, si usa la API, anotó el ARN del IAM rol.
**nota**  
Si cambias el tipo de autenticación y las credenciales, debes actualizar tu IAM rol para acceder al ID AWS Secrets Manager secreto correcto.
+ Ha guardado sus credenciales de autenticación de Google Drive en un secreto de AWS Secrets Manager y, si utiliza la API, ha anotado el ARN del secreto.
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).

Si no tienes un IAM rol o un secreto existentes, puedes usar la consola para crear un nuevo IAM rol y un Secrets Manager secreto al conectar tu fuente de datos de Google Drive Amazon Kendra. Si utiliza la API, debe proporcionar el ARN de un IAM rol y un Secrets Manager secreto existentes y un ID de índice.

## Instrucciones de conexión


Para conectarte Amazon Kendra a tu fuente de datos de Google Drive, debes proporcionar los detalles necesarios de tu fuente de datos de Google Drive para que Amazon Kendra puedas acceder a tus datos. Si aún no has configurado Google Drive para Amazon Kendra ver[Requisitos previos](#prerequisites-v2-google-drive).

------
#### [ Console ]

**Para conectarse Amazon Kendra a Google Drive** 

1. Inicia sesión en la [Amazon Kendra consola Consola de administración de AWS](https://console.aws.amazon.com/kendra/) y ábrela.

1. En el panel de navegación izquierdo, elija **Índices** y, a continuación, elija el índice que desee usar de la lista de índices.
**nota**  
Puede elegir configurar o editar los ajustes de **Control de acceso de usuarios** en la **Configuración del índice**. 

1. En la página **Introducción**, seleccione **Agregar origen de datos**.

1. En la página **Agregar origen de datos**, seleccione **Conector de Google Drive** y, a continuación, seleccione **Añadir conector**. Si usa la versión 2 (si corresponde), elija el **Conector de Google Drive** con la etiqueta “V2.0”.

1. En la página **Especificar detalles del origen de datos**, introduzca la siguiente información:

   1. En **Nombre y descripción**, en **Nombre del origen de datos**: introduzca un nombre para el origen de datos. Puede incluir guiones, pero no espacios.

   1. (Opcional)** Descripción**: introduzca una descripción opcional para el origen de datos.

   1. En **Idioma predeterminado**: elija un idioma para filtrar los documentos para el índice. A menos que especifique lo contrario, el idioma predeterminado es el inglés. El idioma especificado en los metadatos del documento anula el idioma seleccionado.

   1. En **Etiquetas**, para **añadir una nueva etiqueta**: incluye etiquetas opcionales para buscar y filtrar tus recursos o realizar un seguimiento de tus AWS costes.

   1. Elija **Siguiente**.

1. En la página **Definir acceso y seguridad**, introduzca la siguiente información:

   1. **Autorización**: active o desactive la información de la lista de control de acceso (ACL) para los documentos, si tiene una ACL y desea usarla para el control de acceso. La ACL especifica a qué documentos pueden acceder los usuarios y los grupos. La información de la ACL se utiliza para filtrar los resultados de búsqueda en función del acceso del usuario o su grupo a los documentos. Para obtener más información, consulte [Filtrado de contexto de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#context-filter-user-incl-datasources).

   1. Para la **autenticación**: elige entre la **cuenta de servicio de Google** y la **autenticación OAuth 2.0** según tu caso de uso.

   1. **AWS Secrets Manager secreto**: elige un secreto existente o crea uno nuevo Secrets Manager para almacenar tus credenciales de autenticación de Google Drive. Si decide crear un secreto nuevo, se abrirá una ventana de secreto de AWS Secrets Manager .

      1. Si ha elegido la **Cuenta de servicio de Google**, introduzca un nombre para su secreto, el ID de correo electrónico del usuario administrador o usuario de la cuenta de servicio en la configuración de su cuenta de servicio (correo electrónico de administrador), el ID de correo electrónico de la cuenta de servicio (correo electrónico del cliente) y la clave privada que ha creado en su cuenta de servicio.

         Guarde y agregue el secreto

      1. Si has elegido la **autenticación OAuth 2.0**, introduce un nombre para el secreto, el ID de cliente, el secreto de cliente y el token de actualización que creaste en tu OAuth cuenta. El ID de correo del usuario (usuario cuyos detalles de conexión están configurados) se establecerá como ACL. El conector no establece otra información user/group principal como ACL debido a las limitaciones de la API.

         Guarde y agregue el secreto.

   1. **Nube privada virtual (VPC)**: puede optar por utilizar una VPC. Si es así, debe agregar **Subredes** y **Grupos de seguridad de VPC**.

   1. (Para usuarios de autenticación de la cuenta de servicio de Google solo)

      **Rastreador de identidades**: especifique si se debe activar el rastreador de identidades de Amazon Kendra. El rastreador de identidades utiliza la información de la lista de control de acceso (ACL) de los documentos para filtrar los resultados de la búsqueda en función del acceso del usuario o del grupo a los documentos. Si tiene una ACL para sus documentos y decide utilizarla, también puede optar por activar el rastreador de identidades para configurar el [filtrado Amazon Kendra de los resultados de búsqueda según el contexto del usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#context-filter-user-incl-datasources). De lo contrario, si el rastreador de identidades está desactivado, todos los documentos se pueden buscar públicamente. Si quieres usar el control de acceso para tus documentos y el rastreador de identidad está desactivado, también puedes usar la [PutPrincipalMapping](https://docs.aws.amazon.com/kendra/latest/APIReference/API_PutPrincipalMapping.html)API para cargar información de acceso de usuarios y grupos para filtrar el contexto de los usuarios.

   1. **IAM rol**: elija un IAM rol existente o cree uno nuevo IAM para acceder a las credenciales del repositorio y al contenido del índice.
**nota**  
IAM los roles utilizados para los índices no se pueden usar para las fuentes de datos. Si no está seguro de si un rol existente se utiliza para un índice o para las preguntas frecuentes, elija **Crear un nuevo rol** para evitar errores.

   1. Elija **Siguiente**.

1. En la página **Configurar ajustes de sincronización**, introduzca la siguiente información:

   1. **Sincronizar contenido**: seleccione las opciones o el contenido que desea rastrear. Puede elegir entre rastrear Mi unidad (carpetas personales), la unidad compartida (carpetas compartidas con usted) o ambas. También puede incluir comentarios de los archivos.

   1. En **Configuración adicional (opcional)**, también puede introducir la siguiente información opcional:

      1. **Tamaño máximo de archivo**: establece el límite de tamaño máximo MBs de los archivos que se van a rastrear.

      1. **Correo electrónico del usuario**: añada los correos electrónicos de los usuarios que desee incluir o excluir.

      1. **Unidades compartidas**: añada los nombres de las unidades compartidas que desee incluir o excluir.

      1. **Tipos de MIME**: añada los tipos de MIME que desee incluir o excluir.

      1. **Patrones de expresiones regulares de entidades**: añada patrones de expresiones regulares para incluir o excluir determinados archivos adjuntos en todas las entidades compatibles. Puede añadir hasta 100 patrones.

         Puede configurar patrones de include/exclude expresiones regulares para el **nombre del archivo**, el **tipo de archivo** y la ruta **del archivo**.
         + **Nombre de archivo**: el nombre del archivo que se va a incluir o excluir. Por ejemplo, para indexar un archivo con el nombre `teamroster.txt`, proporcione `teamroster`.
         + **Tipo de archivo**: el tipo del archivo que se va a incluir o excluir. Por ejemplo, .pdf .txt o .docx.
         + **Ruta de archivo**: la ruta del archivo que se va a incluir o excluir. Por ejemplo, para indexar archivos únicamente dentro de la carpeta `Products list` de una unidad, proporcione `/Products list`.

   1. **Modo de sincronización**: elija cómo desea actualizar el índice cuando cambie el contenido del origen de datos. Al sincronizar el origen de datos con Amazon Kendra por primera vez, todo el contenido se rastrea y se indexa de forma predeterminada. Debe ejecutar una sincronización completa de los datos si la sincronización inicial falló, incluso si no selecciona la sincronización completa como opción de modo de sincronización.
      + Sincronización completa: se vuelve a indexar todo el contenido, reemplazando el contenido existente cada vez que el origen de datos se sincronice con el índice.
      + Sincronización nueva y modificada: indexe solo el contenido nuevo y modificado cada vez que la fuente de datos se sincronice con el índice. Amazon Kendra puede usar el mecanismo de la fuente de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido que ha cambiado desde la última sincronización.
      + Sincronización de lo nuevo y modificado: se indexa solo el contenido nuevo y modificado cada vez que el origen de datos se sincroniza con el índice. Amazon Kendra puede utilizar el mecanismo del origen de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido modificado desde la última sincronización.
**importante**  
La API de Google Drive no admite la recuperación de comentarios de un archivo eliminado permanentemente. Los comentarios de los archivos colocados en la papelera se pueden recuperar. Cuando un archivo quede en la papelera, el conector eliminará los comentarios del Amazon Kendra índice.

   1. En **Programación de ejecución de sincronización**, en **Frecuencia**: elija la frecuencia con la que desea sincronizar el contenido del origen de datos y actualizar el índice.

   1. En **Sincronizar el historial** de ejecuciones, elija almacenar los informes generados automáticamente en una y Amazon S3 al sincronizar la fuente de datos. Esto es útil para realizar un seguimiento de los problemas al sincronizar el origen de datos.

   1. Elija **Siguiente**.

1. En la página **Establecer asignaciones de campos**, especifique la siguiente información:

   1. Para **los archivos**: seleccione entre los campos de la fuente de datos predeterminados Amazon Kendra generados que desee asignar a su índice.
**nota**  
La API de Google Drive no admite la creación de campos personalizados. La asignación de campos personalizados no está disponible para el conector de Google Drive.

   1. Elija **Siguiente**.

1. En la página **Revisar y crear**, compruebe que la información que ha introducido es correcta y, a continuación, seleccione **Añadir origen de datos**. También puede elegir editar la información desde esta página. El origen de datos aparecerá en la página **Orígenes de datos** una vez que el origen de datos se haya agregado correctamente.

------
#### [ API ]

**Para conectarse Amazon Kendra a Google Drive**

Debe especificar un JSON del [esquema del origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/ds-schemas.html) mediante la API [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_TemplateConfiguration.html). Debe proporcionar la siguiente información:
+ **Origen de datos**: defina el tipo de origen de datos como `GOOGLEDRIVEV2` cuando utilice el esquema JSON [https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html](https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html). Además, defina el origen de datos como `TEMPLATE` al llamar a la API [https://docs.aws.amazon.com/kendra/latest/dg/API_CreateDataSource.html](https://docs.aws.amazon.com/kendra/latest/dg/API_CreateDataSource.html).
+ **Tipo de autenticación**: especifique si desea utilizar la autenticación de la cuenta de servicio o la autenticación OAuth 2.0.
+ **Modo de sincronización**: especifique cómo Amazon Kendra debe actualizarse el índice cuando cambie el contenido de la fuente de datos. Al sincronizar la fuente de datos Amazon Kendra por primera vez, todo el contenido se rastrea e indexa de forma predeterminada. Debe ejecutar una sincronización completa de los datos si la sincronización inicial falló, incluso si no selecciona la sincronización completa como opción de modo de sincronización. Puede elegir entre las siguientes opciones:
  + `FORCED_FULL_CRAWL` para volver a indexar todo el contenido, reemplazando el contenido existente cada vez que el origen de datos se sincronice con el índice.
  + `FULL_CRAWL`para indexar solo el contenido nuevo, modificado y eliminado cada vez que la fuente de datos se sincronice con el índice. Amazon Kendra puede usar el mecanismo de la fuente de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido que ha cambiado desde la última sincronización.
  + `CHANGE_LOG`para indexar solo el contenido nuevo y modificado cada vez que la fuente de datos se sincronice con el índice. Amazon Kendra puede usar el mecanismo de la fuente de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido que ha cambiado desde la última sincronización.
**importante**  
La API de Google Drive no admite la recuperación de comentarios de un archivo eliminado permanentemente. Los comentarios de los archivos colocados en la papelera se pueden recuperar. Cuando un archivo quede en la papelera, el conector eliminará los comentarios del Amazon Kendra índice.
+ **Nombre secreto del recurso de Amazon (ARN): proporciona** el nombre del recurso de Amazon (ARN) de un Secrets Manager secreto que contenga las credenciales de autenticación que creaste en tu cuenta de Google Drive. Si utiliza la autenticación de cuenta de servicio de Google, el secreto se almacena en una estructura JSON con las siguientes claves: 

  ```
  {
      "clientEmail": "user account email",
      "adminAccountEmail": "service account email",
      "privateKey": "private key"
  }
  ```

  Si utilizas la autenticación OAuth 2.0, el secreto se almacena en una estructura JSON con las siguientes claves:

  ```
  {
      "clientID": "OAuth client ID",
      "clientSecret": "client secret",
      "refreshToken": "refresh token"
  }
  ```
+ **IAM rol**: especifique `RoleArn` cuándo llama `CreateDataSource` para proporcionar a un IAM rol permisos para acceder a su Secrets Manager secreto y para llamar al público requerido APIs para el conector de Google Drive y Amazon Kendra. Para obtener más información, consulte [Roles de IAM para orígenes de datos de Google Drive](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds).

También puede añadir las siguientes características opcionales:
+  **Nube privada virtual (VPC)**: especifique a `VpcConfiguration` cuándo llamar a `CreateDataSource`. Para obtener más información, consulte [¿Se está configurando Amazon Kendra para usar un Amazon VPC](vpc-configuration.md).
+ **Mis unidades, unidades compartidas, comentarios**: puede especificar si desea rastrear este tipo de contenido.
+  **Filtros de inclusión y exclusión**: puede especificar si desea incluir o excluir determinadas cuentas de usuario, unidades compartidas y tipos MIME.
**nota**  
La mayoría de los orígenes de datos utilizan patrones de expresiones regulares, que son patrones de inclusión o exclusión denominados filtros. Si especifica un filtro de inclusión, solo se indexará el contenido que coincida con el filtro de inclusión. Los documentos que no coincidan con el filtro de inclusión no se indexan. Si especifica un filtro de inclusión y exclusión, los documentos que coincidan con el filtro de exclusión no se indexarán, aunque coincidan con el filtro de inclusión.
+ **Lista de control de acceso (ACL)**: especifique si se va a rastrear la información de la ACL para los documentos, si tiene una ACL y desea usarla para el control de acceso. La ACL especifica a qué documentos pueden acceder los usuarios y los grupos. La información de la ACL se utiliza para filtrar los resultados de búsqueda en función del acceso del usuario o su grupo a los documentos. Para obtener más información, consulte [Filtrado de contexto de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#context-filter-user-incl-datasources).
+ **Rastreador de identidades**: especifique si se debe activar el rastreador de identidades de Amazon Kendra. El rastreador de identidades utiliza la información de la lista de control de acceso (ACL) de los documentos para filtrar los resultados de la búsqueda en función del acceso del usuario o del grupo a los documentos. Si tienes una ACL para tus documentos y decides utilizarla, también puedes optar por activar el rastreador de identidades para configurar el [filtrado Amazon Kendra de los resultados de búsqueda por contexto de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#context-filter-user-incl-datasources). De lo contrario, si el rastreador de identidades está desactivado, todos los documentos se pueden buscar públicamente. Si quieres usar el control de acceso para tus documentos y el rastreador de identidad está desactivado, también puedes usar la [PutPrincipalMapping](https://docs.aws.amazon.com/kendra/latest/APIReference/API_PutPrincipalMapping.html)API para cargar información de acceso de usuarios y grupos para filtrar el contexto de los usuarios.
+  **Asignaciones de campos**: elija asignar los campos del origen de datos de Google Drive a los campos de índice de Amazon Kendra . Para obtener más información, consulte [Asignación de campos de origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/field-mapping.html).
**nota**  
El campo del cuerpo del documento o el cuerpo del documento equivalente de sus documentos es obligatorio Amazon Kendra para poder buscarlos. Debe asignar el nombre del campo del cuerpo del documento en el origen de datos al nombre del campo del índice `_document_body`. Todos los demás campos son opcionales.

Para obtener una lista de otras claves JSON importantes que debe configurar, consulte el [Esquema de plantilla de Google Drive](https://docs.aws.amazon.com/kendra/latest/dg/ds-schemas.html#ds-google-drive-schema).

------

## Notas

+ La asignación de campos personalizados no está disponible para el conector de Google Drive, ya que la interfaz de usuario de Google Drive no admite la creación de este tipo de campos.
+ La API de Google Drive no admite la recuperación de comentarios de un archivo eliminado permanentemente. Sin embargo, los comentarios de los archivos colocados en la papelera se pueden recuperar. Cuando un archivo quede en la papelera, el Amazon Kendra conector borrará los comentarios del Amazon Kendra índice.
+ La API de Google Drive no devuelve los comentarios presentes en un archivo .docx.
+ Si el permiso para un Google document concreto (documento, hoja de cálculo, diapositiva, etc.) está establecido en **Acceso general: cualquier persona con el enlace** o **Compartido con el dominio específico de su empresa**, los usuarios de búsqueda de Amazon Kendra no podrán ver el documento hasta que el usuario que realiza la consulta haya accedido al documento.

# IBM DB2


**nota**  
El conector de IBM DB2 seguirá siendo totalmente compatible con los clientes actuales hasta el 31 de mayo de 2026. Si bien este conector ya no está disponible para los nuevos usuarios, los usuarios actuales pueden seguir utilizándolo sin interrupción. Desarrollamos de forma continua nuestra cartera de conectores para ofrecer soluciones más escalables y personalizables. Para futuras integraciones, le recomendamos que valore el marco de conectores personalizados de Amazon Kendra[1], diseñado de manera más flexible para una variedad más amplia de casos de uso empresariales.

IBM DB2 es un sistema de gestión de bases de datos relacionales desarrollado por IBM. Un usuario de IBM DB2 puede usar Amazon Kendra para indexar su origen de datos de IBM DB2. El conector de fuente de Amazon Kendra IBM DB2 datos es compatible con la versión DB2 11.5.7.

Puede conectarse Amazon Kendra a su fuente de IBM DB2 datos mediante la [Amazon Kendraconsola](https://console.aws.amazon.com/kendra/) y la [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html)API.

Para solucionar problemas del conector de la fuente de Amazon Kendra IBM DB2 datos, consulte[Solución de problemas con los orígenes de datos](troubleshooting-data-sources.md).

**Topics**
+ [

## Características admitidas
](#supported-features-ibm-db2)
+ [

## Requisitos previos
](#prerequisites-ibm-db2)
+ [

## Instrucciones de conexión
](#data-source-procedure-ibm-db2)
+ [

## Notas
](#ibm-db2-notes)

## Características admitidas

+ Asignaciones de campo
+ Filtrado de contexto de usuario
+ Filtros de inclusión/exclusión
+ Sincronizaciones completas e incrementales del contenido
+ Nube privada virtual (VPC)

## Requisitos previos


Antes de poder utilizarla Amazon Kendra para indexar la fuente de IBM DB2 datos, realice estos cambios en sus AWS cuentas IBM DB2 y.

**En IBM DB2, asegúrese de que**:
+ Ha anotado el nombre de usuario y contraseña de la base de datos.
**importante**  
Como práctica recomendada, proporcione credenciales de base Amazon Kendra de datos de solo lectura.
+ Ha copiado la URL, el puerto y la instancia del host de la base de datos.
+ Ha comprobado que cada documento es único en IBM DB2 y en otros orígenes de datos que vaya a utilizar para el mismo índice. Cada origen de datos que desee utilizar para un índice no debe contener el mismo documento en varios orígenes de datos. IDs Los documentos son globales para un índice y deben ser únicos por índice.

**En el tuyoCuenta de AWS, asegúrate de tener:**
+ [Creó un Amazon Kendra índice](https://docs.aws.amazon.com/kendra/latest/dg/create-index.html) y, si usa la API, anotó el ID del índice.
+ [Creó un IAM rol](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds) para su fuente de datos y, si usa la API, anotó el ARN del IAM rol.
**nota**  
Si cambias el tipo de autenticación y las credenciales, debes actualizar tu IAM rol para acceder al ID AWS Secrets Manager secreto correcto.
+ Ha guardado sus credenciales de autenticación de IBM DB2 en un secreto de AWS Secrets Manager y, si utiliza la API, ha anotado el ARN del secreto.
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).

Si no tiene un IAM rol o secreto existente, puede usar la consola para crear un nuevo IAM rol y un Secrets Manager secreto al conectar su fuente de IBM DB2 datosAmazon Kendra. Si utiliza la API, debe proporcionar el ARN de un IAM rol y un Secrets Manager secreto existentes y un ID de índice.

## Instrucciones de conexión


Para conectarse Amazon Kendra a su fuente de IBM DB2 datos, debe proporcionar los detalles de sus IBM DB2 credenciales para que Amazon Kendra pueda acceder a sus datos. Si aún no lo ha configuradoIBM DB2, Amazon Kendra consulte[Requisitos previos](#prerequisites-ibm-db2).

------
#### [ Console ]

**Para conectarse Amazon Kendra a IBM DB2** 

1. Inicie sesión en la [Amazon Kendraconsola Consola de administración de AWS y ábrala](https://console.aws.amazon.com/kendra/).

1. En el panel de navegación izquierdo, elija **Índices** y, a continuación, elija el índice que desee usar de la lista de índices.
**nota**  
Puede elegir configurar o editar los ajustes de **Control de acceso de usuarios** en la **Configuración del índice**. 

1. En la página **Introducción**, seleccione **Agregar origen de datos**.

1. En la página **Agregar origen de datos**, seleccione el **Conector de IBM DB2** y, a continuación, seleccione **Agregar conector**. Si usa la versión 2 (si corresponde), elija el **Conector de IBM DB2** con la etiqueta “V2.0”.

1. En la página **Especificar detalles del origen de datos**, introduzca la siguiente información:

   1. En **Nombre y descripción**, en **Nombre del origen de datos**: introduzca un nombre para el origen de datos. Puede incluir guiones, pero no espacios.

   1. (Opcional)** Descripción**: introduzca una descripción opcional para el origen de datos.

   1. En **Idioma predeterminado**: elija un idioma para filtrar los documentos para el índice. A menos que especifique lo contrario, el idioma predeterminado es el inglés. El idioma especificado en los metadatos del documento anula el idioma seleccionado.

   1. En **Etiquetas**, para **añadir una nueva etiqueta**: incluye etiquetas opcionales para buscar y filtrar tus recursos o realizar un seguimiento de tus AWS costes.

   1. Elija **Siguiente**.

1. En la página **Definir acceso y seguridad**, introduzca la siguiente información:

   1. En **Origen**, introduzca la siguiente información:

   1.  **Host**: introduzca el nombre del host de la base de datos.

   1.  **Puerto**: introduzca el puerto de la base de datos.

   1.  **Instancia**: introduzca la instancia de la base de datos.

   1. **Habilitar la ubicación del certificado SSL**: elija introducir la Amazon S3 ruta al archivo de certificado SSL.

   1. En **Autenticación**, introduzca la siguiente información:

      1. **AWS Secrets Managersecreto**: elija un secreto existente o cree uno nuevo Secrets Manager para almacenar sus credenciales de IBM DB2 autenticación. Si decide crear un secreto nuevo, se abrirá una ventana de secreto de AWS Secrets Manager.

        1. Introduzca la siguiente información en la **ventana Crear un secreto de AWS Secrets Manager**:

           1. **Nombre del secreto**: un nombre para su secreto. El prefijo 'AmazonKendra- IBM DB2 -' se añade automáticamente a tu nombre secreto.

           1. Para el **nombre de usuario** y la **contraseña de la base de datos**: introduzca los valores de las credenciales de autenticación que ha copiado de la base de datos. 

        1. Seleccione **Save**.

   1. **Nube privada virtual (VPC)**: puede optar por utilizar una VPC. Si es así, debe agregar **Subredes** y **Grupos de seguridad de VPC**.

   1. **IAMrol**: elige un IAM rol existente o crea uno nuevo IAM para acceder a las credenciales del repositorio y al contenido del índice.
**nota**  
IAMlos roles utilizados para los índices no se pueden usar para las fuentes de datos. Si no está seguro de si un rol existente se utiliza para un índice o para las preguntas frecuentes, elija **Crear un nuevo rol** para evitar errores.

   1. Elija **Siguiente**.

1. En la página **Configurar ajustes de sincronización**, introduzca la siguiente información:

   1. En **Ámbito de sincronización**, seleccione de entre las siguientes opciones:
      + **Consulta SQL**: introduzca instrucciones de consulta SQL, como las operaciones SELECT y JOIN. Las consultas de SQL deben ser inferiores a 32 KB. Amazon Kendra rastreará todo el contenido de la base de datos que coincida con su consulta.
      + **Columna de clave principal**: proporcione la clave principal de la tabla de la base de datos. Esto identifica una tabla dentro de la base de datos.
      + **Columna de título**: proporcione el nombre de la columna del título del documento en la tabla de la base de datos.
      + **Columna de cuerpo**: proporcione el nombre de la columna del cuerpo del documento en la tabla de la base de datos.

   1. En **Configuración adicional (*opcional*)**, elija una de las siguientes opciones para sincronizar contenido específico en lugar de sincronizar todos los archivos:
      + **Columnas de detección de cambios**: introduzca los nombres de las columnas que se Amazon Kendra utilizarán para detectar cambios en el contenido. Amazon Kendravolverá a indexar el contenido cuando se produzca un cambio en alguna de estas columnas.
      + ** IDsColumna de usuario**: introduzca el nombre de la columna que contiene el usuario IDs al que se le permitirá acceder al contenido.
      + **Columna de grupos**: introduzca el nombre de la columna que contiene los grupos a los que se dará acceso al contenido.
      + ** URLsColumna de origen**: introduzca el nombre de la columna que contiene el origen que se va URLs a indexar.
      + **Columna de marcas de tiempo**: introduzca el nombre de la columna que contiene las marcas de tiempo. Amazon Kendrautiliza la información de las marcas de tiempo para detectar cambios en el contenido y sincronizar solo el contenido modificado. 
      + **Columna de zonas horarias**: introduzca el nombre de la columna que contiene las zonas horarias del contenido que se va a rastrear.
      + **Formato de marcas temporales**: introduzca el nombre de la columna que contiene los formatos de marcas temporales que se deben utilizar para detectar cambios en el contenido y volver a sincronizar su contenido.

   1. **Modo de sincronización**: elija cómo desea actualizar el índice cuando cambie el contenido del origen de datos. Al sincronizar la fuente de datos Amazon Kendra por primera vez, todo el contenido se rastrea e indexa de forma predeterminada. Debe ejecutar una sincronización completa de los datos si la sincronización inicial falló, incluso si no selecciona la sincronización completa como opción de modo de sincronización.
      + Sincronización completa: se vuelve a indexar todo el contenido, reemplazando el contenido existente cada vez que el origen de datos se sincronice con el índice.
      + Sincronización de lo nuevo y modificado: se indexa solo el contenido nuevo y modificado cada vez que el origen de datos se sincroniza con el índice. Amazon Kendra puede utilizar el mecanismo del origen de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido modificado desde la última sincronización.
      + Sincronización nueva, modificada o eliminada: indexe solo el contenido nuevo, modificado y eliminado cada vez que la fuente de datos se sincronice con el índice. Amazon Kendrapuede usar el mecanismo de la fuente de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido que ha cambiado desde la última sincronización.

   1. En **Programa de ejecución de sincronización**, en **Frecuencia**: la frecuencia con la que Amazon Kendra se sincronizará con el origen de datos.

   1. Elija **Siguiente**.

1. En la página **Establecer asignaciones de campos**, especifique la siguiente información:

   1. Seleccione uno de los campos de fuente de datos predeterminados generados (**Documento IDs****, Títulos** de documentos y **Fuente URLs**) que desee mapear para Amazon Kendra indexarlos.

   1.  **Agregar campo**: para agregar campos de origen de datos personalizados para crear un nombre de campo de índice al que asignarlos y el tipo de datos del campo.

   1. Elija **Siguiente**.

1. En la página **Revisar y crear**, compruebe que la información que ha introducido es correcta y, a continuación, seleccione **Añadir origen de datos**. También puede elegir editar la información desde esta página. El origen de datos aparecerá en la página **Orígenes de datos** una vez que el origen de datos se haya agregado correctamente.

------
#### [ API ]

**Para conectarse a Amazon Kendra IBM DB2**

Debe especificar lo siguiente mediante la [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html)API:
+ **Origen de datos**: defina el tipo de origen de datos como `JDBC` cuando utilice el esquema JSON [https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html](https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html). Además, defina el origen de datos como `TEMPLATE` al llamar a la API [https://docs.aws.amazon.com/kendra/latest/dg/API_CreateDataSource.html](https://docs.aws.amazon.com/kendra/latest/dg/API_CreateDataSource.html).
+ **Tipo de base de datos**: debe especificar el tipo de base de datos como `db2`.
+ **Consulta SQL**: especifique instrucciones de consulta SQL, como las operaciones SELECT y JOIN. Las consultas de SQL deben ser inferiores a 32 KB. Amazon Kendra rastreará todo el contenido de la base de datos que coincida con su consulta.
+ **Modo de sincronización**: especifique cómo Amazon Kendra debe actualizarse el índice cuando cambie el contenido de la fuente de datos. Al sincronizar el origen de datos con Amazon Kendra por primera vez, todo el contenido se rastrea y se indexa de forma predeterminada. Debe ejecutar una sincronización completa de los datos si la sincronización inicial falló, incluso si no selecciona la sincronización completa como opción de modo de sincronización. Puede elegir entre las siguientes opciones:
  + `FORCED_FULL_CRAWL` para volver a indexar todo el contenido, reemplazando el contenido existente cada vez que el origen de datos se sincronice con el índice.
  + `FULL_CRAWL` para indexar solo el contenido nuevo, modificado y eliminado cada vez que el origen de datos se sincronice con el índice. Amazon Kendra puede utilizar el mecanismo del origen de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido modificado desde la última sincronización.
  + `CHANGE_LOG` para indexar solo el contenido nuevo y modificado cada vez que el origen de datos se sincronice con el índice. Amazon Kendra puede utilizar el mecanismo del origen de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido modificado desde la última sincronización.
+ **Nombre secreto de recurso de Amazon (ARN): proporcione** el nombre de recurso de Amazon (ARN) de un Secrets Manager secreto que contenga las credenciales de autenticación que creó en su cuenta. IBM DB2 El secreto se almacena en una estructura JSON con las siguientes claves:

  ```
  {
      "user name": "database user name",
      "password": "password"
  }
  ```
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).
+ **IAMrol**: especifique `RoleArn` cuándo llama `CreateDataSource` para proporcionar un IAM rol con permisos para acceder a su Secrets Manager secreto y para llamar al público requerido APIs para el conector y. IBM DB2 Amazon Kendra Para obtener más información, consulte [Roles de IAM para orígenes de datos de IBM DB2](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds).

También puede añadir las siguientes características opcionales:
+  **Nube privada virtual (VPC)**: especifique a `VpcConfiguration` cuándo llamar a `CreateDataSource`. Para obtener más información, consulte [¿Se está configurando Amazon Kendra para usar un Amazon VPC](vpc-configuration.md).
+  **Filtros de inclusión y exclusión**: puede especificar si desea incluir contenido específico mediante el usuario IDs, los grupos, la fuente URLs, las marcas horarias y las zonas horarias. 
+  **Filtrado de contexto de usuario y control de acceso**: si hay una lista de control de acceso (ACL) para los documentos, Amazon Kendra la rastreará. La información de la ACL se utiliza para filtrar los resultados de búsqueda en función del acceso del usuario o su grupo a los documentos. Para obtener más información, consulte [Filtrado de contexto de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#datasource-context-filter).
+  **Asignaciones de campos**: elija asignar los campos del origen de datos de IBM DB2 a los campos de índice de Amazon Kendra. Para obtener más información, consulte [Asignación de campos de origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/field-mapping.html).
**nota**  
El campo del cuerpo del documento o el cuerpo del documento equivalente de sus documentos es obligatorio Amazon Kendra para poder buscarlos. Debe asignar el nombre del campo del cuerpo del documento en el origen de datos al nombre del campo del índice `_document_body`. Todos los demás campos son opcionales.

Para obtener una lista de otras claves JSON importantes que debe configurar, consulte [Esquema DB2 de plantillas de IBM](ds-schemas.md#ds-ibm-db2-schema).

------

## Notas

+ Las filas de la base de datos eliminadas no se registrarán cuando se Amazon Kendra compruebe si hay contenido actualizado.
+ El tamaño de los nombres y valores de los campos de una fila de la base de datos no puede superar los 400 KB.
+ Si tiene una gran cantidad de datos en la fuente de datos de la base de datos y no desea Amazon Kendra indexar todo el contenido de la base de datos después de la primera sincronización, puede optar por sincronizar solo los documentos nuevos, modificados o eliminados.
+ Como práctica recomendada, proporcione credenciales de base Amazon Kendra de datos de solo lectura.
+ Como práctica recomendada, evite añadir tablas con datos confidenciales o información de identificación personal (PII).

# Jira


Jira es una herramienta de gestión de proyectos para el desarrollo de software, la gestión de productos y el seguimiento de errores. Puedes usarlo Amazon Kendra para indexar tus proyectos, incidencias, comentarios, archivos adjuntos, registros de trabajo y estados de Jira.

Amazon Kendraactualmente solo es compatible con Jira Cloud.

Puedes conectarte Amazon Kendra a tu fuente de datos de Jira mediante la [Amazon Kendraconsola](https://console.aws.amazon.com/kendra/) o la [JiraConfiguration ](https://docs.aws.amazon.com/kendra/latest/APIReference/API_JiraConfiguration.html)API. Para ver una lista de las características admitidas por cada una, consulte [Características admitidas](#supported-features-jira).

Para solucionar problemas del conector de fuentes de datos de Amazon Kendra Jira, consulte. [Solución de problemas con los orígenes de datos](troubleshooting-data-sources.md)

**Topics**
+ [

## Características admitidas
](#supported-features-jira)
+ [

## Requisitos previos
](#prerequisites-jira)
+ [

## Instrucciones de conexión
](#data-source-procedure-jira)
+ [

## Más información
](#jira-learn-more)

## Características admitidas


Amazon KendraEl conector de fuente de datos de Jira admite las siguientes funciones:
+ Asignaciones de campos
+ Control de acceso de usuarios
+ Filtros de inclusión/exclusión
+ Sincronizaciones completas e incrementales del contenido
+ Nube privada virtual (VPC)

## Requisitos previos


Antes de que puedas utilizarla Amazon Kendra para indexar tu fuente de datos de Jira, realiza estos cambios en tu Jira y en tus cuentas. AWS

**En Jira, asegúrese de que:**
+ Ha configurado credenciales de autenticación del token de la API que incluyen un ID de Jira (nombre de usuario o correo electrónico) y una credencial de Jira (token de la API de Jira). Consulte la [Documentación de Atlassian sobre la administración de los tokens de API](https://support.atlassian.com/atlassian-account/docs/manage-api-tokens-for-your-atlassian-account/).
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).
+ Ha apuntado la URL de la cuenta de Jira en la configuración de su cuenta de Jira. Por ejemplo, *https://company.atlassian.net/*.
+ Ha comprobado que cada documento es único en Jira y en otros orígenes de datos que vaya a utilizar para el mismo índice. Cada origen de datos que desee utilizar para un índice no debe contener el mismo documento en varios orígenes de datos. IDs Los documentos son globales en relación con un índice y deben ser únicos por índice.

**En el tuyoCuenta de AWS, asegúrate de tener:**
+ [Creó un Amazon Kendra índice](https://docs.aws.amazon.com/kendra/latest/dg/create-index.html) y, si usa la API, anotó el ID del índice.
+ [Creó un IAM rol](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds) para su fuente de datos y, si usa la API, anotó el ARN del IAM rol.
**nota**  
Si cambias el tipo de autenticación y las credenciales, debes actualizar tu IAM rol para acceder al ID AWS Secrets Manager secreto correcto.
+ Ha guardado sus credenciales de autenticación de Jira en un secreto de AWS Secrets Manager y, si utiliza la API, ha anotado el ARN del secreto.
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).

Si no tienes un IAM rol o un secreto existentes, puedes usar la consola para crear un nuevo IAM rol y un Secrets Manager secreto al conectar tu fuente de datos de Jira. Amazon Kendra Si utiliza la API, debe proporcionar el ARN de un IAM rol y un Secrets Manager secreto existentes y un ID de índice.

## Instrucciones de conexión


Para conectarte Amazon Kendra a tu fuente de datos de Jira, debes proporcionar los detalles necesarios de tu fuente de datos de Jira para que Amazon Kendra puedas acceder a tus datos. Si aún no has configurado Jira paraAmazon Kendra, consulta. [Requisitos previos](#prerequisites-jira)

------
#### [ Console ]

**Para conectarse Amazon Kendra a Jira** 

1. Inicia sesión en la [Amazon Kendraconsola Consola de administración de AWS](https://console.aws.amazon.com/kendra/) y ábrela.

1. En el panel de navegación izquierdo, elija **Índices** y, a continuación, elija el índice que desee usar de la lista de índices.
**nota**  
Puede elegir configurar o editar los ajustes de **Control de acceso de usuarios** en la **Configuración del índice**. 

1. En la página **Introducción**, seleccione **Agregar origen de datos**.

1. En la página **Agregar origen de datos**, seleccione el **Conector de Jira** y, a continuación, seleccione **Agregar conector**. Si usa la versión 2 (si corresponde), elija el **Conector de Jira** con la etiqueta “V2.0”.

1. En la página **Especificar detalles del origen de datos**, introduzca la siguiente información:

   1. En **Nombre y descripción**, en **Nombre del origen de datos**: introduzca un nombre para el origen de datos. Puede incluir guiones, pero no espacios.

   1. (Opcional)** Descripción**: introduzca una descripción opcional para el origen de datos.

   1. En **Idioma predeterminado**: elija un idioma para filtrar los documentos para el índice. A menos que especifique lo contrario, el idioma predeterminado es el inglés. El idioma especificado en los metadatos del documento anula el idioma seleccionado.

   1. En **Etiquetas**, para **añadir una nueva etiqueta**: incluye etiquetas opcionales para buscar y filtrar tus recursos o realizar un seguimiento de tus AWS costes.

   1. Elija **Siguiente**.

1. En la página **Definir acceso y seguridad**, introduzca la siguiente información:

   1. **URL de la cuenta de Jira**: introduzca la URL de su cuenta de Jira. Por ejemplo: *https://company.atlassian.net/*.

   1. **Autorización**: active o desactive la información de la lista de control de acceso (ACL) para los documentos, si tiene una ACL y desea usarla para el control de acceso. La ACL especifica a qué documentos pueden acceder los usuarios y los grupos. La información de la ACL se utiliza para filtrar los resultados de búsqueda en función del acceso del usuario o su grupo a los documentos. Para obtener más información, consulte [Filtrado de contexto de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#context-filter-user-incl-datasources).

   1. **AWS Secrets Managersecreto**: elige un secreto existente o crea uno nuevo para almacenar tus Secrets Manager credenciales de autenticación de Jira. Si decide crear un secreto nuevo, se abrirá una ventana de secreto de AWS Secrets Manager.

      1. Introduzca la siguiente información en la **ventana Crear un secreto de AWS Secrets Manager**:

         1. **Nombre del secreto**: un nombre para su secreto. El prefijo «AmazonKendra-Jira» se añade automáticamente a tu nombre secreto.

         1. En **ID de Jira**: introduzca el nombre de usuario o el correo electrónico de Jira.

         1. En **Contraseña/token**: introduzca el token de la API de Jira configurado en Jira.

      1. Guarde y agregue el secreto.

   1. **Nube privada virtual (VPC)**: puede optar por utilizar una VPC. Si es así, debe agregar **Subredes** y **Grupos de seguridad de VPC**.

   1. **Rastreador de identidades**: especifique si se debe activar el rastreador de identidades de Amazon Kendra. El rastreador de identidades utiliza la información de la lista de control de acceso (ACL) de los documentos para filtrar los resultados de la búsqueda en función del acceso del usuario o del grupo a los documentos. Si tiene una ACL para sus documentos y decide utilizarla, también puede optar por activar el rastreador de identidades para configurar el filtrado Amazon Kendra de los resultados de búsqueda según el [contexto del usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#context-filter-user-incl-datasources). De lo contrario, si el rastreador de identidades está desactivado, todos los documentos se pueden buscar públicamente. Si quieres usar el control de acceso para tus documentos y el rastreador de identidad está desactivado, también puedes usar la [PutPrincipalMapping](https://docs.aws.amazon.com/kendra/latest/APIReference/API_PutPrincipalMapping.html)API para cargar información de acceso de usuarios y grupos para filtrar el contexto de los usuarios.

   1. **IAMrol**: elija un IAM rol existente o cree uno nuevo IAM para acceder a las credenciales del repositorio y al contenido del índice.
**nota**  
IAMlos roles utilizados para los índices no se pueden usar para las fuentes de datos. Si no está seguro de si un rol existente se utiliza para un índice o para las preguntas frecuentes, elija **Crear un nuevo rol** para evitar errores.

   1. Elija **Siguiente**.

1. En la página **Configurar ajustes de sincronización**, introduzca la siguiente información:

   1. **Seleccionar qué proyectos de Jira se van a indexar**: elija rastrear todos los proyectos o proyectos específicos.

   1. **Configuración adicional**: especifique determinados estados y tipos de problemas. Elija rastrear los comentarios, los archivos adjuntos y los registros de trabajo. Utilice patrones de expresiones regulares para incluir o excluir contenido determinado.

   1. **Modo de sincronización**: elija cómo desea actualizar el índice cuando cambie el contenido del origen de datos. Al sincronizar la fuente de datos Amazon Kendra por primera vez, todo el contenido se rastrea e indexa de forma predeterminada. Debe ejecutar una sincronización completa de los datos si la sincronización inicial falló, incluso si no selecciona la sincronización completa como opción de modo de sincronización.
      + Sincronización completa: se vuelve a indexar todo el contenido, reemplazando el contenido existente cada vez que el origen de datos se sincronice con el índice.
      + Sincronización de lo nuevo y modificado: se indexa solo el contenido nuevo y modificado cada vez que el origen de datos se sincroniza con el índice. Amazon Kendra puede utilizar el mecanismo del origen de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido modificado desde la última sincronización.
      + Sincronización nueva, modificada o eliminada: indexe solo el contenido nuevo, modificado y eliminado cada vez que la fuente de datos se sincronice con el índice. Amazon Kendrapuede usar el mecanismo de la fuente de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido que ha cambiado desde la última sincronización.

   1. En **Programación de ejecución de sincronización**, en **Frecuencia**: elija la frecuencia con la que desea sincronizar el contenido del origen de datos y actualizar el índice.

   1. Elija **Siguiente**.

1. En la página **Establecer asignaciones de campos**, especifique la siguiente información:

   1. **Campos de fuente de datos predeterminados**: seleccione entre los campos de fuente de datos predeterminados Amazon Kendra generados que desee asignar a su índice. 

   1.  **Agregar campo**: para agregar campos de origen de datos personalizados para crear un nombre de campo de índice al que asignarlos y el tipo de datos del campo.

   1. Elija **Siguiente**.

1. En la página **Revisar y crear**, compruebe que la información que ha introducido es correcta y, a continuación, seleccione **Añadir origen de datos**. También puede elegir editar la información desde esta página. El origen de datos aparecerá en la página **Orígenes de datos** una vez que el origen de datos se haya agregado correctamente.

------
#### [ API ]

**Para conectarse Amazon Kendra a Jira**

Debes especificar lo siguiente mediante la [JiraConfiguration ](https://docs.aws.amazon.com/kendra/latest/APIReference/API_JiraConfiguration.html)API:
+ **URL del origen de datos**: especifique la URL de su cuenta de Jira. Por ejemplo, *company.atlassian.net*.
+ **Nombre secreto de recurso de Amazon (ARN): proporciona** el nombre de recurso de Amazon (ARN) de un Secrets Manager secreto que contenga las credenciales de autenticación de tu cuenta de Jira. El secreto se almacena en una estructura JSON con las siguientes claves:

  ```
  {
      "jiraId": "Jira user name or email",
      "jiraCredential": "Jira API token"
  }
  ```
+ **IAMrol**: especifique `RoleArn` cuándo llama `CreateDataSource` para proporcionar un IAM rol con permisos para acceder a su Secrets Manager secreto y para llamar al público APIs requerido para el conector de Jira y. Amazon Kendra Para obtener más información, consulte [Roles de IAM para orígenes de datos de Jira](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds).

También puede añadir las siguientes características opcionales:
+ **Nube privada virtual (VPC)**: especifique `VpcConfiguration` como parte de la configuración del origen de datos. Consulte [Configuración de Amazon Kendra para utilizar una VPC](https://docs.aws.amazon.com/kendra/latest/dg/vpc-configuration.html).
+  **Registro de cambios**: si Amazon Kendra debe utilizar el mecanismo de registro de cambios del origen de datos de Jira para determinar si un documento debe actualizarse en el índice.
**nota**  
Utilice el registro de cambios si no quiere que Amazon Kendra digitalice todos los documentos. Si tu registro de cambios es grande, es posible que tardes Amazon Kendra menos en escanear los documentos de la fuente de datos de Jira que en procesar el registro de cambios. Si está sincronizando el origen de datos de Jira con su índice por primera vez, se escanean todos los documentos. 
+  **Filtros de inclusión y exclusión**: puede especificar si desea incluir o excluir determinados archivos.
**nota**  
La mayoría de los orígenes de datos utilizan patrones de expresiones regulares, que son patrones de inclusión o exclusión denominados filtros. Si especifica un filtro de inclusión, solo se indexará el contenido que coincida con el filtro de inclusión. Los documentos que no coincidan con el filtro de inclusión no se indexan. Si especifica un filtro de inclusión y exclusión, los documentos que coincidan con el filtro de exclusión no se indexarán, aunque coincidan con el filtro de inclusión.
+ **Comentarios, archivos adjuntos y registros de trabajo**: puede especificar si desea rastrear determinados comentarios, archivos adjuntos y registros de trabajo de los problemas.
+ **Proyectos, problemas y estados**: puedes especificar si deseas rastrear determinados proyectos IDs, tipos de problemas y estados.
+  **Filtrado de contexto de usuario y control de acceso**: si hay una lista de control de acceso (ACL) para los documentos, Amazon Kendra la rastreará. La información de la ACL se utiliza para filtrar los resultados de búsqueda en función del acceso del usuario o su grupo a los documentos. Para obtener más información, consulte [Filtrado de contexto de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#datasource-context-filter).
+  **Asignaciones de campos**: elija asignar los campos del origen de datos de Jira a los campos de índice de Amazon Kendra. Para obtener más información, consulte [Asignación de campos de origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/field-mapping.html).
**nota**  
El campo del cuerpo del documento o el cuerpo del documento equivalente de los documentos es obligatorio Amazon Kendra para poder buscarlos. Debe asignar el nombre del campo del cuerpo del documento en el origen de datos al nombre del campo del índice `_document_body`. Todos los demás campos son opcionales.

------

## Más información


Para obtener más información sobre la integración Amazon Kendra con tu fuente de datos de Jira, consulta:
+ [Busca tus proyectos de Jira de forma inteligente con el conector de Jira Cloud Amazon Kendra](https://aws.amazon.com/blogs/machine-learning/intelligently-search-your-jira-projects-with-amazon-kendra-jira-cloud-connector/)

# Microsoft Exchange


Microsoft Exchange es una herramienta de colaboración empresarial para mensajería, reuniones e intercambio de archivos. Si es usuario de Microsoft Exchange, puede utilizarlo Amazon Kendra para indexar su fuente de datos de Microsoft Exchange.

Puede conectarse Amazon Kendra a su fuente de datos de Microsoft Exchange mediante la [Amazon Kendraconsola](https://console.aws.amazon.com/kendra/) y la [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_TemplateConfiguration.html)API.

Para solucionar problemas del conector de fuente de datos de Amazon Kendra Microsoft Exchange, consulte[Solución de problemas con los orígenes de datos](troubleshooting-data-sources.md).

## Características admitidas

+ Asignaciones de campo
+ Control de acceso de usuarios
+ Filtros de inclusión/exclusión
+ Sincronizaciones completas e incrementales del contenido
+ Nube privada virtual (VPC)

## Requisitos previos


Antes de poder utilizarla Amazon Kendra para indexar la fuente de datos de Microsoft Exchange, realice estos cambios en su Microsoft Exchange y en sus AWS cuentas.

**En Microsoft Exchange, asegúrese de que:**
+ Ha creado una cuenta de Microsoft Exchange en Office 365.
+ Ha apuntado su ID de inquilino de Microsoft 365. Puede encontrar su ID de inquilino en las propiedades de su portal de Azure Active Directory o en su OAuth aplicación.
+ Configuró una OAuth aplicación en el portal de Azure y anotó el ID de cliente y el secreto del cliente o las credenciales del cliente. Consulte este [tutorial de Microsoft](https://learn.microsoft.com/en-us/power-apps/developer/data-platform/walkthrough-register-app-azure-active-directory) y este [ejemplo de registro de aplicación](https://learn.microsoft.com/en-us/azure/healthcare-apis/register-application) para obtener más información.
**nota**  
Al crear o registrar una aplicación en el portal de Azure, el ID del secreto representa el valor del secreto real. Debe anotar o guardar el valor del secreto real inmediatamente al crear el secreto y la aplicación. Para acceder a su secreto, seleccione el nombre de la aplicación en el portal de Azure y, a continuación, vaya a la opción de menú relativa a los certificados y secretos.  
Puede acceder a su ID de cliente seleccionando el nombre de su aplicación en el portal de Azure y, a continuación, yendo a la página de información general. El ID de la aplicación (cliente) es el ID del cliente.
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).
+ Ha agregado los siguientes permisos para la aplicación del conector:    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/data-source-exchange.html)
+ Ha comprobado que cada documento es único en Microsoft Exchange y en otros orígenes de datos que vaya a utilizar para el mismo índice. Cada origen de datos que desee utilizar para un índice no debe contener el mismo documento en varios orígenes de datos. IDs Los documentos son globales en relación con un índice y deben ser únicos por índice.

**En el tuyoCuenta de AWS, asegúrate de tener:**
+ [Creó un Amazon Kendra índice](https://docs.aws.amazon.com/kendra/latest/dg/create-index.html) y, si usa la API, anotó el ID del índice.
+ [Creó un IAM rol](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds) para su fuente de datos y, si usa la API, anotó el ARN del IAM rol.
**nota**  
Si cambias el tipo de autenticación y las credenciales, debes actualizar tu IAM rol para acceder al ID AWS Secrets Manager secreto correcto.
+ Ha guardado sus credenciales de autenticación de Microsoft Exchange en un secreto de AWS Secrets Manager y, si utiliza la API, ha anotado el ARN del secreto.
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).

Si no tiene un IAM rol o secreto existente, puede usar la consola para crear un nuevo IAM rol y Secrets Manager secreto al conectar su fuente de datos de Microsoft Exchange aAmazon Kendra. Si utiliza la API, debe proporcionar el ARN de un IAM rol y un Secrets Manager secreto existentes y un ID de índice.

## Instrucciones de conexión


Para conectarse Amazon Kendra a la fuente de datos de Microsoft Exchange, debe proporcionar los detalles necesarios de la fuente de datos de Microsoft Exchange para que Amazon Kendra pueda acceder a los datos. Si aún no ha configurado Microsoft Exchange paraAmazon Kendra, consulte[Requisitos previos](#prerequisites-exchange).

------
#### [ Console ]

**Para conectarse Amazon Kendra a Microsoft Exchange** 

1. Inicie sesión en la [Amazon Kendraconsola Consola de administración de AWS y ábrala](https://console.aws.amazon.com/kendra/).

1. En el panel de navegación izquierdo, elija **Índices** y, a continuación, elija el índice que desee usar de la lista de índices.
**nota**  
Puede elegir configurar o editar los ajustes de **Control de acceso de usuarios** en la **Configuración del índice**. 

1. En la página **Introducción**, seleccione **Agregar origen de datos**.

1. En la página **Agregar origen de datos**, elija **Conector de Microsoft Exchange** y, a continuación, elija **Agregar conector**. Si usa la versión 2 (si corresponde), elija el **Conector de Microsoft Exchange** con la etiqueta “V2.0”.

1. En la página **Especificar detalles del origen de datos**, introduzca la siguiente información:

   1. En **Nombre y descripción**, en **Nombre del origen de datos**: introduzca un nombre para el origen de datos. Puede incluir guiones, pero no espacios.

   1. (Opcional)** Descripción**: introduzca una descripción opcional para el origen de datos.

   1. En **Idioma predeterminado**: elija un idioma para filtrar los documentos para el índice. A menos que especifique lo contrario, el idioma predeterminado es el inglés. El idioma especificado en los metadatos del documento anula el idioma seleccionado.

   1. En **Etiquetas**, para **añadir una nueva etiqueta**: incluye etiquetas opcionales para buscar y filtrar tus recursos o realizar un seguimiento de tus AWS costes.

   1. Elija **Siguiente**.

1. En la página **Definir acceso y seguridad**, introduzca la siguiente información:

   1. **ID de inquilina**: introduzca su ID de inquilino de Microsoft 365. Puede encontrar su ID de inquilino en las propiedades de su portal de Azure Active Directory o en su OAuth aplicación.

   1. **Autorización**: active o desactive la información de la lista de control de acceso (ACL) para los documentos, si tiene una ACL y desea usarla para el control de acceso. La ACL especifica a qué documentos pueden acceder los usuarios y los grupos. La información de la ACL se utiliza para filtrar los resultados de búsqueda en función del acceso del usuario o su grupo a los documentos. Para obtener más información, consulte [Filtrado de contexto de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#context-filter-user-incl-datasources).

   1. **AWS Secrets Managersecreto**: elija un secreto existente o cree uno nuevo Secrets Manager para almacenar sus credenciales de autenticación de Microsoft Exchange. Si decide crear un secreto nuevo, se abrirá una ventana de secreto de AWS Secrets Manager.

      1. Introduzca la siguiente información en la **ventana Crear un secreto de AWS Secrets Manager**:

         1. **Nombre del secreto**: un nombre para su secreto. El prefijo 'AmazonKendra-Microsoft Exchange

         1. Para **ID de cliente**, **Secreto de cliente**: introduzca las credenciales de autenticación que ha configurado en Microsoft Exchange en el portal de Azure.

      1. Guarde y agregue el secreto.

   1. **Nube privada virtual (VPC)**: puede optar por utilizar una VPC. Si es así, debe agregar **Subredes** y **Grupos de seguridad de VPC**.

   1. **IAMrol**: elija un IAM rol existente o cree uno nuevo IAM para acceder a las credenciales del repositorio y al contenido del índice.
**nota**  
IAMlos roles utilizados para los índices no se pueden usar para las fuentes de datos. Si no está seguro de si un rol existente se utiliza para un índice o para las preguntas frecuentes, elija **Crear un nuevo rol** para evitar errores.

   1. Elija **Siguiente**.

1. En la página **Configurar ajustes de sincronización**, introduzca la siguiente información:

   1. **Usuario IDs**: proporcione los correos electrónicos del usuario si desea filtrar el contenido por determinados correos electrónicos.

   1. **Configuración adicional**: especifique los tipos de contenido que desee rastrear.
      + **Tipos de entidad**: puedes elegir rastrear el contenido del calendario o de los OneNotes contactos.
      + **Rastreo del calendario**: introduzca la fecha de inicio y finalización para rastrear contenido entre fechas concretas.
      + **Incluir correo electrónico**: introduzca las líneas “para”, “de” y asunto del correo electrónico para filtrar determinados correos electrónicos que quiera rastrear.
      + **Acceso a carpetas compartidas**: elija habilitar el rastreo de la lista de control de acceso para controlar el acceso a su origen de datos de Microsoft Exchange.
      + **Regex para dominios**: añada patrones de expresiones regulares para incluir o excluir ciertos dominios de correo electrónico.
      + **Patrones regex**: añada patrones de expresiones regulares para incluir o excluir determinados archivos.

   1. **Modo de sincronización**: elija cómo desea actualizar el índice cuando cambie el contenido del origen de datos. Al sincronizar la fuente de datos Amazon Kendra por primera vez, todo el contenido se rastrea e indexa de forma predeterminada. Debe ejecutar una sincronización completa de los datos si la sincronización inicial falló, incluso si no selecciona la sincronización completa como opción de modo de sincronización.
      + Sincronización completa: se vuelve a indexar todo el contenido, reemplazando el contenido existente cada vez que el origen de datos se sincronice con el índice.
      + Sincronización de lo nuevo y modificado: se indexa solo el contenido nuevo y modificado cada vez que el origen de datos se sincroniza con el índice. Amazon Kendra puede utilizar el mecanismo del origen de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido modificado desde la última sincronización.
      + Sincronización nueva, modificada o eliminada: indexe solo el contenido nuevo, modificado y eliminado cada vez que la fuente de datos se sincronice con el índice. Amazon Kendrapuede usar el mecanismo de la fuente de datos para rastrear los cambios en el contenido e indexar el contenido que ha cambiado desde la última sincronización.

   1. En **Programación de ejecución de sincronización**, en **Frecuencia**: elija la frecuencia con la que desea sincronizar el contenido del origen de datos y actualizar el índice.

   1. Elija **Siguiente**.

1. En la página **Establecer asignaciones de campos**, especifique la siguiente información:

   1. **Campos de fuente de datos predeterminados**: seleccione entre los campos de fuente de datos predeterminados Amazon Kendra generados que desee asignar a su índice.
**nota**  
El conector de fuentes de datos de Amazon Kendra Microsoft Exchange no admite asignaciones de campos personalizadas.

   1. Elija **Siguiente**.

1. En la página **Revisar y crear**, compruebe que la información que ha introducido es correcta y, a continuación, seleccione **Añadir origen de datos**. También puede elegir editar la información desde esta página. El origen de datos aparecerá en la página **Orígenes de datos** una vez que el origen de datos se haya agregado correctamente.

------
#### [ API ]

**Para conectarse Amazon Kendra a Microsoft Exchange**

Debe especificar un JSON del [esquema del origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/ds-schemas.html#ds-msexchange-schema.html) mediante la API [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_TemplateConfiguration.html). Debe proporcionar la siguiente información:
+ **Origen de datos**: defina el tipo de origen de datos como `MSEXCHANGE` cuando utilice el esquema JSON [https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html](https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html). Además, defina el origen de datos como `TEMPLATE` al llamar a la API [https://docs.aws.amazon.com/kendra/latest/dg/API_CreateDataSource.html](https://docs.aws.amazon.com/kendra/latest/dg/API_CreateDataSource.html).
+ **ID de inquilino**: puede encontrar su ID de inquilino en las propiedades de su portal de Azure Active Directory o en su OAuth aplicación.
+ **Modo de sincronización**: especifique cómo Amazon Kendra debe actualizarse el índice cuando cambie el contenido de la fuente de datos. Al sincronizar el origen de datos con Amazon Kendra por primera vez, todo el contenido se rastrea y se indexa de forma predeterminada. Debe ejecutar una sincronización completa de los datos si la sincronización inicial falló, incluso si no selecciona la sincronización completa como opción de modo de sincronización. Puede elegir entre las siguientes opciones:
  + `FORCED_FULL_CRAWL` para volver a indexar todo el contenido, reemplazando el contenido existente cada vez que el origen de datos se sincronice con el índice.
  + `FULL_CRAWL` para indexar solo el contenido nuevo, modificado y eliminado cada vez que el origen de datos se sincronice con el índice. Amazon Kendra puede utilizar el mecanismo del origen de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido modificado desde la última sincronización.
  + `CHANGE_LOG` para indexar solo el contenido nuevo y modificado cada vez que el origen de datos se sincronice con el índice. Amazon Kendra puede utilizar el mecanismo del origen de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido modificado desde la última sincronización.
+ **Nombre de recurso secreto de Amazon (ARN): proporcione** el nombre de recurso de Amazon (ARN) de un Secrets Manager secreto que contenga las credenciales de autenticación de su cuenta de Microsoft Exchange. El secreto se almacena en una estructura JSON con las siguientes claves:

  ```
  {
      "clientId": "client ID",
      "clientSecret": "client secret"
  }
  ```
+ **IAMrol**: especifique `RoleArn` cuándo llama `CreateDataSource` para proporcionar un IAM rol con permisos para acceder a su Secrets Manager secreto y para llamar al público requerido APIs para el conector de Microsoft Exchange yAmazon Kendra. Para obtener más información, consulte [Roles de IAM para orígenes de datos de Microsoft Exchange](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds).

También puede añadir las siguientes características opcionales:
+  **Nube privada virtual (VPC)**: especifique a `VpcConfiguration` cuándo llamar a `CreateDataSource`. Para obtener más información, consulte [¿Se está configurando Amazon Kendra para usar un Amazon VPC](vpc-configuration.md).
+ **Filtros de inclusión y exclusión**: especifique si desea incluir o excluir determinado contenido.
**nota**  
La mayoría de los orígenes de datos utilizan patrones de expresiones regulares, que son patrones de inclusión o exclusión denominados filtros. Si especifica un filtro de inclusión, solo se indexará el contenido que coincida con el filtro de inclusión. Los documentos que no coincidan con el filtro de inclusión no se indexan. Si especifica un filtro de inclusión y exclusión, los documentos que coincidan con el filtro de exclusión no se indexarán, aunque coincidan con el filtro de inclusión.
+ **Lista de control de acceso (ACL)**: especifique si se va a rastrear la información de la ACL para los documentos, si tiene una ACL y desea usarla para el control de acceso. La ACL especifica a qué documentos pueden acceder los usuarios y los grupos. La información de la ACL se utiliza para filtrar los resultados de búsqueda en función del acceso del usuario o su grupo a los documentos. Para obtener más información, consulte [Filtrado de contexto de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#context-filter-user-incl-datasources).
+  **Asignaciones de campos**: elija asignar los campos del origen de datos de Microsoft Exchange a los campos de índice de Amazon Kendra. Para obtener más información, consulte [Asignación de campos de origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/field-mapping.html).
**nota**  
El campo del cuerpo del documento o el cuerpo del documento equivalente de sus documentos es obligatorio Amazon Kendra para poder buscarlos. Debe asignar el nombre del campo del cuerpo del documento en el origen de datos al nombre del campo del índice `_document_body`. Todos los demás campos son opcionales.

Para obtener una lista de otras claves JSON importantes que debe configurar, consulte el [Esquema de plantilla de Microsoft Exchange](https://docs.aws.amazon.com/kendra/latest/dg/ds-schemas.html#ds-msexchange-schema).

------

## Más información


Para obtener más información sobre la integración Amazon Kendra con la fuente de datos de Microsoft Exchange, consulte:
+ [Indexar el contenido de Microsoft Exchange mediante el conector de Exchange para Amazon Kendra](https://aws.amazon.com/blogs/machine-learning/index-your-microsoft-exchange-content-using-the-exchange-connector-for-amazon-kendra/)

## Notas

+ Cuando las listas de control de acceso (ACLs) están habilitadas, la opción «Sincronizar solo contenido nuevo o modificado» no está disponible debido a las limitaciones de la API de Microsoft Exchange. En su lugar, te recomendamos usar los modos «Sincronización completa» o «Sincronización de contenido nuevo, modificado o eliminado», o desactivarlos ACLs si necesitas usar este modo de sincronización.

# Microsoft OneDrive


Microsoft OneDrive es un servicio de almacenamiento basado en la nube que puedes usar para almacenar, compartir y alojar tu contenido. Puede usarlo Amazon Kendra para indexar su fuente OneDrive de datos.

Puede conectarse Amazon Kendra a su fuente OneDrive de datos mediante la [Amazon Kendra consola](https://console.aws.amazon.com/kendra/) y la [OneDriveConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_OneDriveConfiguration.html)API.

Amazon Kendra tiene dos versiones del OneDrive conector. Las características compatibles de cada versión incluyen:

** OneDrive Conector [OneDriveConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_OneDriveConfiguration.html)V1.0/API de Microsoft**
+ Asignaciones de campo
+ Filtros de inclusión/exclusión

** OneDrive Conector [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_TemplateConfiguration.html)V2.0/API de Microsoft**
+ Filtrado de contexto de usuario
+ Rastreador de identidades de usuarios
+ Filtros de inclusión/exclusión
+ Sincronizaciones completas e incrementales del contenido
+ Nube privada virtual (VPC)

**nota**  
Está previsto que el soporte para el OneDrive conector OneDriveConfiguration V1.0/API finalice en junio de 2023. Recomendamos utilizar el OneDrive conector TemplateConfiguration V2.0/API.

Para solucionar problemas del conector de la fuente de Amazon Kendra OneDrive datos, consulte[Solución de problemas con los orígenes de datos](troubleshooting-data-sources.md).

**Topics**
+ [

# OneDrive Conector Microsoft V1.0
](data-source-v1-onedrive.md)
+ [

# OneDrive Conector Microsoft V2.0
](data-source-v2-onedrive.md)
+ [

## Más información
](#onedrive-learn-more)
+ [

## Notas
](#onedrive-notes)

# OneDrive Conector Microsoft V1.0


Microsoft OneDrive es un servicio de almacenamiento basado en la nube que puedes usar para almacenar, compartir y alojar tu contenido. Puede usarlo Amazon Kendra para indexar su fuente de OneDrive datos de Microsoft. 

**nota**  
Está previsto que el soporte para el OneDrive conector V1.0 y la OneDrive API de Microsoft finalice en junio de 2023. Recomendamos utilizar el OneDrive conector V2.0/API. TemplateConfiguration 

Para solucionar problemas del conector de la fuente de Amazon Kendra OneDrive datos, consulte[Solución de problemas con los orígenes de datos](troubleshooting-data-sources.md).

**Topics**
+ [

## Características admitidas
](#supported-features-v1-onedrive)
+ [

## Requisitos previos
](#prerequisites-v1-onedrive)
+ [

## Instrucciones de conexión
](#data-source-v1-procedure-onedrive)

## Características admitidas

+ Asignaciones de campo
+ Filtros de inclusión/exclusión

## Requisitos previos


Antes de poder utilizarla Amazon Kendra para indexar la fuente de OneDrive datos, realice estos cambios en sus AWS cuentas OneDrive y.

**En Azure Active Directory (AD), asegúrese de que:**
+ Ha creado una aplicación de Azure Active Directory (AD).
+ Ha utilizado el ID de la aplicación de AD para registrar una clave secreta para la aplicación en el sitio de AD. La clave secreta debe contener el ID de la aplicación y una clave secreta.
+ Ha copiado el dominio de AD de la organización.
+ Ha agregado los siguientes permisos de aplicación a la aplicación de AD en la opción Microsoft Graph:
  + Leer los archivos de todas las colecciones de sitios (File.Read-All)
  + Leer el perfil completo de todos los usuarios (User.Read.All)
  + Leer los datos del directorio (Directory.Read.All)
  + Leer todos los grupos (Group.Read.All)
  + Leer los elementos de todas las colecciones de sitios (Site.Read.All)
+ Ha copiado la lista de usuarios cuyos documentos se deben indexar. Puede elegir entre proporcionar una lista de nombres de usuario o puede proporcionarlos en un archivo almacenado en un Amazon S3. Después de crear el origen de datos, puede:
  + Modificar la lista de usuarios.
  + Cambie de una lista de usuarios a una lista almacenada en un Amazon S3 bucket.
  + Cambia la ubicación del Amazon S3 depósito de una lista de usuarios. Si cambia la ubicación del depósito, también debe actualizar el IAM rol de la fuente de datos para que tenga acceso al depósito.
**nota**  
Si almacena la lista de nombres de usuario en un Amazon S3 depósito, la IAM política de la fuente de datos debe proporcionar acceso al depósito y acceso a la clave con la que se cifró el depósito, si la hubiera.
+ Marcó que cada documento es único en OneDrive las demás fuentes de datos que vaya a utilizar para el mismo índice y entre ellas. Cada origen de datos que desee utilizar para un índice no debe contener el mismo documento en varios orígenes de datos. IDs Los documentos son globales en relación con un índice y deben ser únicos por índice.

**En el tuyo Cuenta de AWS, asegúrate de tener:**
+ [Creó un Amazon Kendra índice](https://docs.aws.amazon.com/kendra/latest/dg/create-index.html) y, si usa la API, anotó el ID del índice.
+ [Creó un IAM rol](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds) para su fuente de datos y, si usa la API, anotó el ARN del IAM rol.
**nota**  
Si cambias el tipo de autenticación y las credenciales, debes actualizar tu IAM rol para acceder al ID AWS Secrets Manager secreto correcto.
+ Guardó sus credenciales de OneDrive autenticación en un AWS Secrets Manager secreto y, si usa la API, anotó el ARN del secreto.
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).

Si no tiene un IAM rol o secreto existente, puede usar la consola para crear un nuevo IAM rol y un Secrets Manager secreto al conectar su fuente de OneDrive datos. Amazon Kendra Si utiliza la API, debe proporcionar el ARN de un IAM rol y un Secrets Manager secreto existentes y un ID de índice.

## Instrucciones de conexión


Para conectarse Amazon Kendra a su fuente de OneDrive datos, debe proporcionar los detalles de sus OneDrive credenciales para Amazon Kendra poder acceder a sus datos. Si aún no lo ha configurado OneDrive , Amazon Kendra consulte[Requisitos previos](#prerequisites-v1-onedrive).

------
#### [ Console ]

**Para conectarse Amazon Kendra a OneDrive** 

1. Inicie sesión en la [Amazon Kendra consola Consola de administración de AWS y ábrala](https://console.aws.amazon.com/kendra/).

1. En el panel de navegación izquierdo, elija **Índices** y, a continuación, elija el índice que desee usar de la lista de índices.
**nota**  
Puede elegir configurar o editar los ajustes de **Control de acceso de usuarios** en la **Configuración del índice**. 

1. En la página **Introducción**, seleccione **Agregar origen de datos**.

1. En la página **Agregar origen de datos**, seleccione el **Conector de OneDrive ** y, a continuación, seleccione **Agregar conector**. Si usa la versión 2 (si corresponde), elija el **Conector de OneDrive ** con la etiqueta “V2.0”.

1. En la página **Especificar detalles del origen de datos**, introduzca la siguiente información:

   1. En **Nombre y descripción**, en **Nombre del origen de datos**: introduzca un nombre para el origen de datos. Puede incluir guiones, pero no espacios.

   1. (Opcional)** Descripción**: introduzca una descripción opcional para el origen de datos.

   1. En **Idioma predeterminado**: elija un idioma para filtrar los documentos para el índice. A menos que especifique lo contrario, el idioma predeterminado es el inglés. El idioma especificado en los metadatos del documento anula el idioma seleccionado.

   1. En **Etiquetas**, para **añadir una nueva etiqueta**: incluye etiquetas opcionales para buscar y filtrar tus recursos o realizar un seguimiento de tus AWS costes.

   1. Elija **Siguiente**.

1. En la página **Definir acceso y seguridad**, introduzca la siguiente información:

   1. **OneDrive ID de inquilino**: introduzca el ID de OneDrive inquilino sin el protocolo.

   1. En **Tipo de autenticación**: elija entre **Nuevo** y **Existente**.

   1. 

      1. Si elige **Existente**, seleccione un secreto existente en **Seleccionar secreto**.

      1. Si elige **Nuevo**, introduzca la siguiente información en la sección **Nuevo secreto de AWS Secrets Manager **:

         1. **Nombre del secreto**: un nombre para su secreto. El prefijo 'AmazonKendra- OneDrive -' se añade automáticamente a su nombre secreto.

         1. **Para el **identificador de la aplicación** y **la contraseña de la aplicación**: introduzca los valores de las credenciales de autenticación de su OneDrive cuenta y, a continuación, seleccione Guardar autenticación.** 

   1. **IAM rol**: elija un IAM rol existente o cree uno nuevo IAM para acceder a las credenciales del repositorio y al contenido del índice.
**nota**  
IAM los roles utilizados para los índices no se pueden usar para las fuentes de datos. Si no está seguro de si un rol existente se utiliza para un índice o para las preguntas frecuentes, elija **Crear un nuevo rol** para evitar errores.

   1. Elija **Siguiente**.

1. En la página **Configurar ajustes de sincronización**, introduzca la siguiente información:

   1. Elija entre **Archivo de lista** y **Lista de nombres** según el caso de uso.

      1. Si elige **Archivo de lista**, introduzca la siguiente información:

         1.  **Seleccionar ubicación**: introduzca la ruta a su bucket de Amazon S3 . 

            **Añadir el archivo de lista de usuarios a Amazon S3**: seleccione esta opción para añadir los archivos de la lista de usuarios al bucket Amazon S3 . 

            **Asignaciones de grupos locales de usuarios**: seleccione esta opción para utilizar la asignación de grupos locales para filtrar el contenido.

      1. Si elige **Lista de nombres**, introduzca la siguiente información:

         1.  **Nombre de usuario**: introduzca hasta 10 unidades de usuario para indexarlas. Para añadir más de 10 usuarios, cree un archivo que contenga los nombres.

            **Añadir otro**: elija esta opción para añadir más usuarios.

            **Asignaciones de grupos locales de usuarios**: seleccione esta opción para utilizar la asignación de grupos locales para filtrar el contenido.

   1. En **Configuración adicional**: añada patrones de expresión regular para incluir o excluir determinados archivos. Puede añadir hasta 100 patrones.

   1. **Calendario de ejecución sincronizado**, para **Frecuencia**: elija la frecuencia con la Amazon Kendra que se sincronizará con la fuente de datos.

   1. Elija **Siguiente**.

1. En la página **Establecer asignaciones de campos**, especifique la siguiente información:

   1. Para los **campos de fuente de datos predeterminados** y **otras asignaciones de campos sugeridas: seleccione entre los** campos de fuente de datos predeterminados Amazon Kendra generados que desee asignar a su índice. 

   1. Elija **Siguiente**.

1. En la página **Revisar y crear**, compruebe que la información que ha introducido es correcta y, a continuación, seleccione **Añadir origen de datos**. También puede elegir editar la información desde esta página. El origen de datos aparecerá en la página **Orígenes de datos** una vez que el origen de datos se haya agregado correctamente.

------
#### [ API ]

**Para conectarse a Amazon Kendra OneDrive**

Debe especificar lo siguiente mediante la [OneDriveConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_OneDriveConfiguration.html)API:
+ **ID de inquilino**: especifique el dominio de Azure Active Directory de la organización.
+ **OneDrive Usuarios**: especifique la lista de cuentas de usuario cuyos documentos deben indexarse.
+ **Nombre secreto de recurso de Amazon (ARN): proporcione** el nombre de recurso de Amazon (ARN) de un Secrets Manager secreto que contenga las credenciales de autenticación de su cuenta. OneDrive El secreto se almacena en una estructura JSON con las siguientes claves:

  ```
  {
      "username": "OAuth client ID",
      "password": "client secret"
  }
  ```
+ **IAM rol**: especifique `RoleArn` cuándo llama `CreateDataSource` para proporcionar un IAM rol con permisos para acceder a su Secrets Manager secreto y para llamar al público requerido APIs para el conector y. OneDrive Amazon Kendra Para obtener más información, consulte [Roles de IAM para orígenes de datos de OneDrive ](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds).

También puede añadir las siguientes características opcionales:
+  **Filtros de inclusión y exclusión**: especifique si desea incluir o excluir determinados documentos.
**nota**  
La mayoría de los orígenes de datos utilizan patrones de expresiones regulares, que son patrones de inclusión o exclusión denominados filtros. Si especifica un filtro de inclusión, solo se indexará el contenido que coincida con el filtro de inclusión. Los documentos que no coincidan con el filtro de inclusión no se indexan. Si especifica un filtro de inclusión y exclusión, los documentos que coincidan con el filtro de exclusión no se indexarán, aunque coincidan con el filtro de inclusión.
+  **Asignaciones de campos**: elija asignar los campos del origen de datos de OneDrive a los campos de índice de Amazon Kendra . Para obtener más información, consulte [Asignación de campos de origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/field-mapping.html).
**nota**  
El campo del cuerpo del documento o el cuerpo del documento equivalente de sus documentos es obligatorio Amazon Kendra para poder buscarlos. Debe asignar el nombre del campo del cuerpo del documento en el origen de datos al nombre del campo del índice `_document_body`. Todos los demás campos son opcionales.
+  **Filtrado de contexto de usuario y control de acceso**: si hay una lista de control de acceso (ACL) para los documentos,Amazon Kendra la rastreará. La información de la ACL se utiliza para filtrar los resultados de búsqueda en función del acceso del usuario o su grupo a los documentos. Para obtener más información, consulte [Filtrado de contexto de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#datasource-context-filter).

------

# OneDrive Conector Microsoft V2.0


Microsoft OneDrive es un servicio de almacenamiento basado en la nube que puedes usar para almacenar, compartir y alojar tu contenido. Puede usarlo Amazon Kendra para indexar su fuente OneDrive de datos.

Puede conectarse Amazon Kendra a su fuente OneDrive de datos mediante la [Amazon Kendra consola](https://console.aws.amazon.com/kendra/) y la [OneDriveConfiguration](https://docs.aws.amazon.com/kendra/latest/dg/OneDriveConfiguration.html)API. 



**nota**  
Está previsto que el soporte para OneDrive Connector OneDriveConfiguration V1.0/API finalice en junio de 2023. Recomendamos utilizar el OneDrive conector TemplateConfiguration V2.0/API. La versión 2.0 proporciona funciones adicionales ACLs y de rastreo de identidad.

Para solucionar problemas del conector de la fuente de Amazon Kendra OneDrive datos, consulte[Solución de problemas con los orígenes de datos](troubleshooting-data-sources.md).

**Topics**
+ [

## Características admitidas
](#supported-features-v2-onedrive)
+ [

## Requisitos previos
](#prerequisites-v2-onedrive)
+ [

## Instrucciones de conexión
](#data-source-procedure-v2-onedrive)

## Características admitidas


Amazon Kendra OneDrive el conector de fuente de datos admite las siguientes funciones:
+ Asignaciones de campos
+ Control de acceso de usuarios
+ Filtros de inclusión/exclusión
+ Sincronizaciones completas e incrementales del contenido
+ Nube privada virtual (VPC)

## Requisitos previos


Antes de poder utilizarla Amazon Kendra para indexar la fuente de OneDrive datos, realice estos cambios en sus AWS cuentas OneDrive y.

**En OneDrive, asegúrate de tener:**
+ Creó una OneDrive cuenta en Office 365.
+ Ha apuntado su ID de inquilino de Microsoft 365. Puede encontrar su ID de inquilino en las propiedades de su Azure Active Directory Portal o en su OAuth aplicación.
+ Creó una OAuth aplicación en el portal de Azure y anotó el ID de cliente y el secreto del cliente o las credenciales de cliente utilizadas para la autenticación con un AWS Secrets Manager secreto. Consulte este [tutorial de Microsoft](https://learn.microsoft.com/en-us/power-apps/developer/data-platform/walkthrough-register-app-azure-active-directory) y este [ejemplo de registro de aplicación](https://learn.microsoft.com/en-us/azure/healthcare-apis/register-application) para obtener más información.
**nota**  
Al crear o registrar una aplicación en el portal de Azure, el ID del secreto representa el valor del secreto real. Debe anotar o guardar el valor del secreto real inmediatamente al crear el secreto y la aplicación. Para acceder a su secreto, seleccione el nombre de la aplicación en el portal de Azure y, a continuación, vaya a la opción de menú relativa a los certificados y secretos.  
Puede acceder a su ID de cliente seleccionando el nombre de su aplicación en el portal de Azure y, a continuación, yendo a la página de información general. El ID de la aplicación (cliente) es el ID del cliente.
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).
+ Ha utilizado el ID de la aplicación de AD para registrar una clave secreta para la aplicación en el sitio de AD. La clave secreta debe contener el ID de la aplicación y una clave secreta.
+ Ha copiado el dominio de AD de la organización.
+ Ha agregado los siguientes permisos a la aplicación de AD en la opción Microsoft Graph:
  + Leer los archivos de todas las colecciones de sitios (File.Read-All)
  + Lea los perfiles completos de todos los usuarios (User.Read.All)
  + Leer todos los grupos (Group.Read.All)
  + Lea todas las notas (Notes.Read.All)
+ Ha copiado la lista de usuarios cuyos documentos se deben indexar. Puede elegir entre proporcionar una lista de nombres de usuario o puede proporcionarlos en un archivo almacenado en un Amazon S3. Después de crear el origen de datos, puede:
  + Modificar la lista de usuarios.
  + Cambie de una lista de usuarios a una lista almacenada en un Amazon S3 bucket.
  + Cambia la ubicación del Amazon S3 depósito de una lista de usuarios. Si cambia la ubicación del depósito, también debe actualizar el IAM rol de la fuente de datos para que tenga acceso al depósito.
**nota**  
Si almacena la lista de nombres de usuario en un Amazon S3 depósito, la IAM política de la fuente de datos debe proporcionar acceso al depósito y acceso a la clave con la que se cifró el depósito, si la hubiera.  
El OneDrive conector utiliza el **correo electrónico de la información de contacto** presente en las propiedades de **usuario de Onedrive**. Asegúrese de que el usuario cuyos datos desea rastrear tenga el campo de correo electrónico configurado en la página **Información de contacto**, ya que, en el caso de los nuevos usuarios, podría estar en blanco.

**En tu AWS cuenta, asegúrate de tener:**
+ Creó un Amazon Kendra índice y, si utiliza la API, anotó el identificador del índice.
+ Creó un IAM rol para su fuente de datos y, si usa la API, anotó el ARN del IAM rol.
+ Guardó sus credenciales de OneDrive autenticación en un AWS Secrets Manager secreto y, si usa la API, anotó el ARN del secreto.

Si no tiene un IAM rol o secreto existente, puede usar la consola para crear un nuevo IAM rol y un Secrets Manager secreto al conectar su fuente de OneDrive datos. Amazon Kendra Si utiliza la API, debe proporcionar el ARN de un IAM rol y un Secrets Manager secreto existentes y un identificador de índice.

## Instrucciones de conexión


Para conectarse Amazon Kendra a su fuente de OneDrive datos, debe proporcionar los detalles de sus OneDrive credenciales para Amazon Kendra poder acceder a sus datos. Si aún no lo ha configurado OneDrive Amazon Kendra, consulte[Requisitos previos](#prerequisites-v2-onedrive).

------
#### [ Console ]

**Para conectarse Amazon Kendra a OneDrive** 

1. Inicie sesión en la [Amazon Kendra consola Consola de administración de AWS y ábrala](https://console.aws.amazon.com/kendra/).

1. En el panel de navegación izquierdo, elija **Índices** y, a continuación, elija el índice que desee usar de la lista de índices.
**nota**  
Puede elegir configurar o editar los ajustes de **Control de acceso de usuarios** en la **Configuración del índice**. 

1. En la página **Introducción**, seleccione **Agregar origen de datos**.

1. En la página **Agregar origen de datos**, seleccione el **Conector de OneDrive ** y, a continuación, seleccione **Agregar conector**. Si usa la versión 2 (si corresponde), elija el **Conector de OneDrive ** con la etiqueta “V2.0”.

1. En la página **Especificar detalles del origen de datos**, introduzca la siguiente información:

   1. En **Nombre y descripción**, en **Nombre del origen de datos**: introduzca un nombre para el origen de datos. Puede incluir guiones, pero no espacios.

   1. (Opcional)** Descripción**: introduzca una descripción opcional para el origen de datos.

   1. En **Idioma predeterminado**: elija un idioma para filtrar los documentos para el índice. A menos que especifique lo contrario, el idioma predeterminado es el inglés. El idioma especificado en los metadatos del documento anula el idioma seleccionado.

   1. En **Etiquetas**, para **añadir una nueva etiqueta**: incluye etiquetas opcionales para buscar y filtrar tus recursos o realizar un seguimiento de tus AWS costes.

   1. Elija **Siguiente**.

1. En la página **Definir acceso y seguridad**, introduzca la siguiente información:

   1. **OneDrive ID de inquilino**: introduzca el ID de OneDrive inquilino sin el protocolo.

   1. **Autorización**: active o desactive la información de la lista de control de acceso (ACL) para los documentos, si tiene una ACL y desea usarla para el control de acceso. La ACL especifica a qué documentos pueden acceder los usuarios y los grupos. La información de la ACL se utiliza para filtrar los resultados de búsqueda en función del acceso del usuario o su grupo a los documentos. Para obtener más información, consulte [Filtrado de contexto de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#context-filter-user-incl-datasources).

   1. En **Autenticación**: elija entre **Nueva** y **Existente**.

   1. 

      1. Si elige **Existente**, seleccione un secreto existente en **Seleccionar secreto**.

      1. Si elige **Nuevo**, introduzca la siguiente información en la sección **Nuevo secreto de AWS Secrets Manager **:

         1. **Nombre del secreto**: un nombre para su secreto. El prefijo 'AmazonKendra- OneDrive -' se añade automáticamente a su nombre secreto.

         1. En **ID de cliente** y **Secreto del cliente**: introduzca el ID y el secreto del cliente.

   1. **Nube privada virtual (VPC)**: puede optar por utilizar una VPC. Si es así, debe agregar **Subredes** y **Grupos de seguridad de VPC**.

   1. **Rastreador de identidades**: especifique si se debe activar el rastreador de identidades de Amazon Kendra. El rastreador de identidades utiliza la información de la lista de control de acceso (ACL) de los documentos para filtrar los resultados de la búsqueda en función del acceso del usuario o del grupo a los documentos. Si tiene una ACL para sus documentos y decide utilizarla, también puede optar por activar el rastreador de identidades para configurar el [filtrado Amazon Kendra de los resultados de búsqueda según el contexto del usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#context-filter-user-incl-datasources). De lo contrario, si el rastreador de identidades está desactivado, todos los documentos se pueden buscar públicamente. Si quieres usar el control de acceso para tus documentos y el rastreador de identidad está desactivado, también puedes usar la [PutPrincipalMapping](https://docs.aws.amazon.com/kendra/latest/APIReference/API_PutPrincipalMapping.html)API para cargar información de acceso de usuarios y grupos para filtrar el contexto de los usuarios.

   1. **IAM rol**: elija un IAM rol existente o cree uno nuevo IAM para acceder a las credenciales del repositorio y al contenido del índice.
**nota**  
IAM los roles utilizados para los índices no se pueden usar para las fuentes de datos. Si no está seguro de si un rol existente se utiliza para un índice o para las preguntas frecuentes, elija **Crear un nuevo rol** para evitar errores.

   1. Elija **Siguiente**.

1. En la página **Configurar ajustes de sincronización**, introduzca la siguiente información:

1. 

   1. Para el **ámbito de sincronización**: elija los OneDrive datos de los usuarios que desee indexar. Puede agregar un máximo de 10 usuarios de forma manual.

   1. En **Configuración adicional**: añada patrones de expresión regular para incluir o excluir determinado contenido. Puede añadir hasta 100 patrones.

   1. **Modo de sincronización**: elija cómo desea actualizar el índice cuando cambie el contenido del origen de datos. Al sincronizar la fuente de datos Amazon Kendra por primera vez, todo el contenido se rastrea e indexa de forma predeterminada. Debe ejecutar una sincronización completa de los datos si la sincronización inicial falló, incluso si no selecciona la sincronización completa como opción de modo de sincronización.
      + Sincronización completa: se vuelve a indexar todo el contenido, reemplazando el contenido existente cada vez que el origen de datos se sincronice con el índice.
      + Sincronización de lo nuevo y modificado: se indexa solo el contenido nuevo y modificado cada vez que el origen de datos se sincroniza con el índice. Amazon Kendra puede utilizar el mecanismo del origen de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido modificado desde la última sincronización.
      + Sincronización nueva, modificada o eliminada: indexe solo el contenido nuevo, modificado y eliminado cada vez que la fuente de datos se sincronice con el índice. Amazon Kendra puede usar el mecanismo de la fuente de datos para rastrear los cambios en el contenido e indexar el contenido que ha cambiado desde la última sincronización.

   1. En **Programación de ejecución de sincronización**, en **Frecuencia**: elija la frecuencia con la que desea sincronizar el contenido del origen de datos y actualizar el índice.

   1. Elija **Siguiente**.

1. En la página **Establecer asignaciones de campos**, especifique la siguiente información:

   1. **Campos de fuente de datos predeterminados**: seleccione entre los campos de fuente de datos predeterminados Amazon Kendra generados que desee asignar a su índice.

   1. Elija **Siguiente**.

1. En la página **Revisar y crear**, compruebe que la información que ha introducido es correcta y, a continuación, seleccione **Añadir origen de datos**. También puede elegir editar la información desde esta página. El origen de datos aparecerá en la página **Orígenes de datos** una vez que el origen de datos se haya agregado correctamente.

------
#### [ API ]

**Para conectarse a Amazon Kendra OneDrive**

Debe especificar un JSON del [esquema del origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/ds-schemas.html#ds-onedrive-schema) mediante la API [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_TemplateConfiguration.html). Debe proporcionar la siguiente información:
+ **Origen de datos**: defina el tipo de origen de datos como `ONEDRIVEV2` cuando utilice el esquema JSON [https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html](https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html). Además, defina el origen de datos como `TEMPLATE` al llamar a la API [https://docs.aws.amazon.com/kendra/latest/dg/API_CreateDataSource.html](https://docs.aws.amazon.com/kendra/latest/dg/API_CreateDataSource.html).
+ **ID de inquilino**: especifique el ID de inquilino de Microsoft 365. Puede encontrar su ID de inquilino en las propiedades de su portal de Azure Active Directory o en su OAuth aplicación.
+ **Modo de sincronización**: especifique cómo Amazon Kendra debe actualizarse el índice cuando cambie el contenido de la fuente de datos. Al sincronizar el origen de datos con Amazon Kendra por primera vez, todo el contenido se rastrea y se indexa de forma predeterminada. Debe ejecutar una sincronización completa de los datos si la sincronización inicial falló, incluso si no selecciona la sincronización completa como opción de modo de sincronización. Puede elegir entre las siguientes opciones:
  + `FORCED_FULL_CRAWL` para volver a indexar todo el contenido, reemplazando el contenido existente cada vez que el origen de datos se sincronice con el índice.
  + `FULL_CRAWL` para indexar solo el contenido nuevo, modificado y eliminado cada vez que el origen de datos se sincronice con el índice. Amazon Kendra puede utilizar el mecanismo del origen de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido modificado desde la última sincronización.
  + `CHANGE_LOG` para indexar solo el contenido nuevo y modificado cada vez que el origen de datos se sincronice con el índice. Amazon Kendra puede utilizar el mecanismo del origen de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido modificado desde la última sincronización.
+ **Nombre secreto de recurso de Amazon (ARN): proporcione** el nombre de recurso de Amazon (ARN) de un Secrets Manager secreto que contenga las credenciales de autenticación que creó en su cuenta. OneDrive 

  Si utiliza la autenticación OAuth 2.0, el secreto se almacena en una estructura JSON con las siguientes claves:

  ```
  {
      "clientId": "client ID",
      "clientSecret": "client secret"
  }
  ```
+ **IAM rol**: especifique `RoleArn` cuándo llama `CreateDataSource` para proporcionar a un IAM rol permisos para acceder a su Secrets Manager secreto y para llamar al público requerido APIs para el OneDrive conector y Amazon Kendra. Para obtener más información, consulte [Roles de IAM para orígenes de datos de OneDrive ](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds).

También puede añadir las siguientes características opcionales:
+  **Nube privada virtual (VPC)**: especifique a `VpcConfiguration` cuándo llamar a `CreateDataSource`. Para obtener más información, consulte [¿Se está configurando Amazon Kendra para usar un Amazon VPC](vpc-configuration.md).
+  **Filtros de inclusión y exclusión**: puede especificar si desea incluir o excluir determinados archivos, OneNote secciones y OneNote páginas.
**nota**  
La mayoría de los orígenes de datos utilizan patrones de expresiones regulares, que son patrones de inclusión o exclusión denominados filtros. Si especifica un filtro de inclusión, solo se indexará el contenido que coincida con el filtro de inclusión. Los documentos que no coincidan con el filtro de inclusión no se indexan. Si especifica un filtro de inclusión y exclusión, los documentos que coincidan con el filtro de exclusión no se indexarán, aunque coincidan con el filtro de inclusión.
+ **Rastreador de identidades**: especifique si se debe activar el rastreador de identidades de Amazon Kendra. El rastreador de identidades utiliza la información de la lista de control de acceso (ACL) de los documentos para filtrar los resultados de la búsqueda en función del acceso del usuario o del grupo a los documentos. Si tiene una ACL para sus documentos y decide utilizarla, también puede optar por activar el rastreador Amazon Kendra de identidades para configurar el [filtrado contextual de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#context-filter-user-incl-datasources) de los resultados de búsqueda. De lo contrario, si el rastreador de identidades está desactivado, todos los documentos se pueden buscar públicamente. Si quieres usar el control de acceso para tus documentos y el rastreador de identidad está desactivado, también puedes usar la [PutPrincipalMapping](https://docs.aws.amazon.com/kendra/latest/APIReference/API_PutPrincipalMapping.html)API para cargar información de acceso de usuarios y grupos para filtrar el contexto de los usuarios.
+  **Asignaciones de campos: solo puede mapear** campos de índice integrados o comunes para el conector. Amazon Kendra OneDrive La asignación de campos personalizada no está disponible para el OneDrive conector debido a las limitaciones de la API. Para obtener más información, consulte [Asignación de campos de origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/field-mapping.html).

Para obtener una lista de otras claves JSON importantes que debe configurar, consulte el [Esquema de plantilla de OneDrive ](https://docs.aws.amazon.com/kendra/latest/dg/ds-schemas.html#ds-onedrive-schema).

------

## Más información


Para obtener más información sobre la integración Amazon Kendra con su fuente de OneDrive datos, consulte:
+ [Anunciamos el OneDrive conector de Microsoft (V2) actualizado para Amazon Kendra](https://aws.amazon.com/blogs/machine-learning/announcing-the-updated-microsoft-onedrive-connector-v2-for-amazon-kendra/).

## Notas

+ Cuando las listas de control de acceso (ACLs) están habilitadas, la opción «Sincronizar solo contenido nuevo o modificado» no está disponible debido a limitaciones de la OneDrive API. En su lugar, te recomendamos usar los modos «Sincronización completa» o «Sincronización de contenido nuevo, modificado o eliminado», o desactivarlos ACLs si necesitas usar este modo de sincronización.

# Microsoft SharePoint


SharePoint es un servicio colaborativo de creación de sitios web que puede utilizar para personalizar el contenido web y crear páginas, sitios, bibliotecas de documentos y listas. Puede utilizarlo Amazon Kendra para indexar la fuente SharePoint de datos.

Amazon Kendra actualmente es compatible con SharePoint Online y SharePoint Server (versiones 2013, 2016, 2019 y Subscription Edition).

Puede conectarse Amazon Kendra a su fuente de SharePoint datos mediante la [Amazon Kendra consola](https://console.aws.amazon.com/kendra/), la [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_TemplateConfiguration.html)API o la [SharePointConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_SharePointConfiguration.html)API.

Amazon Kendra tiene dos versiones del SharePoint conector. Las características compatibles de cada versión incluyen:

**SharePoint Conector V1.0/API [SharePointConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_SharePointConfiguration.html)**
+ Asignaciones de campos
+ Control de acceso de usuarios
+ Filtros de inclusión/exclusión
+ Registro de cambios
+ Nube privada virtual (VPC)

**SharePoint Conector V2.0/API [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_TemplateConfiguration.html)**
+ Asignaciones de campos
+ Control de acceso de usuarios
+ Filtros de inclusión/exclusión
+ Sincronizaciones completas e incrementales del contenido
+ Nube privada virtual (VPC)

**nota**  
SharePoint El conector SharePointConfiguration V1.0/API finalizó en 2023. Recomendamos migrar o utilizar el SharePoint conector V2.0/API. TemplateConfiguration 

Para solucionar problemas del conector de la fuente de Amazon Kendra SharePoint datos, consulte. [Solución de problemas con los orígenes de datos](troubleshooting-data-sources.md)

**Topics**
+ [

# SharePoint conector V1.0
](data-source-v1-sharepoint.md)
+ [

# SharePoint conector V2.0
](data-source-v2-sharepoint.md)

# SharePoint conector V1.0


SharePoint es un servicio colaborativo de creación de sitios web que puede utilizar para personalizar el contenido web y crear páginas, sitios, bibliotecas de documentos y listas. Si es un SharePoint usuario, puede utilizarlo Amazon Kendra para indexar su fuente SharePoint de datos.

**nota**  
SharePoint El conector V1.0/ SharePointConfiguration API finalizó en 2023. Recomendamos migrar o utilizar el SharePoint conector V2.0/API. TemplateConfiguration 

Para solucionar problemas del conector de la fuente de Amazon Kendra SharePoint datos, consulte. [Solución de problemas con los orígenes de datos](troubleshooting-data-sources.md)

**Topics**
+ [

## Características admitidas
](#supported-features-v1-sharepoint)
+ [

## Requisitos previos
](#prerequisites-v1-sharepoint)
+ [

## Instrucciones de conexión
](#data-source-procedure-v1-sharepoint)
+ [

## Más información
](#sharepoint-v1-learn-more)

## Características admitidas

+ Asignaciones de campo
+ Control de acceso de usuarios
+ Filtros de inclusión/exclusión
+ Registro de cambios
+ Nube privada virtual (VPC)

## Requisitos previos


Antes de poder utilizarla Amazon Kendra para indexar la fuente de SharePoint datos, realice estos cambios en sus AWS cuentas SharePoint y.

Debe proporcionar las credenciales de autenticación, que se almacenan de forma segura en AWS Secrets Manager secreto.

**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).

**En SharePoint, asegúrese de tener:**
+ Apuntó la URL de los SharePoint sitios que desea indexar.
+ **Para SharePoint en línea:**
  + Ha apuntado sus credenciales de autenticación básica, que incluyen un nombre de usuario y una contraseña con permisos de administrador del sitio.
  + **Opcional:** credenciales OAuth 2.0 generadas que contienen un nombre de usuario, una contraseña, un ID de cliente y un secreto de cliente.
  + Ha desactivado los **Valores predeterminados de seguridad** en su portal de Azure mediante un usuario administrativo. Para obtener más información sobre la administración de la configuración predeterminada de seguridad en el portal de Azure, consulte la [documentación de Microsoft sobre cómo establecer la configuración predeterminada enable/disable de seguridad](https://learn.microsoft.com/en-us/microsoft-365/business-premium/m365bp-conditional-access?view=o365-worldwide&tabs=secdefaults#security-defaults-1).
+ **Para el SharePoint servidor:**
  + Apuntó el nombre de dominio de su SharePoint servidor (el nombre de NetBIOS en su Active Directory). Úselo, junto con su nombre de usuario y contraseña de autenticación SharePoint básicos, para conectarse al SharePoint Amazon Kendra servidor.
**nota**  
Si utiliza SharePoint Server y necesita convertir la lista de control de acceso (ACL) al formato de correo electrónico para filtrar según el contexto del usuario, proporcione la URL del servidor LDAP y la base de búsqueda de LDAP. También puede utilizar la anulación del dominio del directorio. La URL del servidor LDAP es el nombre de dominio completo y el número de puerto (por ejemplo, ldap://example.com:389). La base de búsqueda de LDAP son los controladores de dominio “example” y “com”. Al anular el dominio del directorio, puede utilizar el dominio del correo electrónico en lugar de la URL del servidor LDAP y la base de búsqueda LDAP. Por ejemplo, el dominio de correo electrónico de username@example.com es “example.com”. Puede usar esta anulación si no le interesa validar su dominio y simplemente quiere usar su dominio de correo electrónico.
+ Se agregaron los siguientes permisos a su cuenta: SharePoint 

  **Para SharePoint listas**
  + Abrir elementos: vea el origen de los documentos con los controladores de archivos del servidor.
  + Ver páginas de aplicaciones: vea formularios, vistas y páginas de aplicaciones. Enumere las listas.
  + Ver elementos: vea los elementos de las listas y los documentos de las bibliotecas de documentos.
  + Ver versiones: vea las versiones anteriores de un documento o elemento de la lista.

  **Para SharePoint sitios web**
  + Examinar directorios: enumere los archivos y carpetas de un sitio web mediante la interfaz SharePoint Designer y Web DAV.
  + Examinar la información del usuario: vea información sobre los usuarios del sitio web.
  + Enumerar permisos: enumere los permisos en el sitio web, la lista, la carpeta, el documento o el elemento de la lista.
  + Abrir: abra un sitio web, una lista o una carpeta para acceder a los elementos del contenedor.
  + Utilice las funciones de integración de clientes: utilice SOAP, WebDAV, el modelo de objetos del cliente o SharePoint las interfaces de diseñador para acceder al sitio web.
  + Utilizar interfaces remotas: use características que lanzan aplicaciones cliente.
  + Ver páginas: vea las páginas de un sitio web.
+ Marcó que cada documento es único en las demás fuentes de datos que vaya a utilizar para el mismo índice SharePoint y entre ellas. Cada origen de datos que desee utilizar para un índice no debe contener el mismo documento en varios orígenes de datos. IDs Los documentos son globales en relación con un índice y deben ser únicos por índice.

**En el tuyo Cuenta de AWS, asegúrate de tener:**
+ [Creó un Amazon Kendra índice](https://docs.aws.amazon.com/kendra/latest/dg/create-index.html) y, si usa la API, anotó el ID del índice.
+ [Creó un IAM rol](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds) para su fuente de datos y, si usa la API, anotó el ARN del IAM rol.
**nota**  
Si cambias el tipo de autenticación y las credenciales, debes actualizar tu IAM rol para acceder al ID AWS Secrets Manager secreto correcto.
+ Guardó sus credenciales de SharePoint autenticación en un AWS Secrets Manager secreto y, si usa la API, anotó el ARN del secreto.
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).

Si no tiene un IAM rol o secreto existente, puede usar la consola para crear un nuevo IAM rol y un Secrets Manager secreto al conectar su fuente de SharePoint datos. Amazon Kendra Si utiliza la API, debe proporcionar el ARN de un IAM rol y un Secrets Manager secreto existentes y un ID de índice.

## Instrucciones de conexión


Para conectarse Amazon Kendra a su fuente de SharePoint datos, debe proporcionar los detalles de sus SharePoint credenciales para Amazon Kendra poder acceder a sus datos. Si aún no lo ha configurado SharePoint , Amazon Kendra consulte[Requisitos previos](#prerequisites-v1-sharepoint).

------
#### [ Console ]

**Para conectarse Amazon Kendra a SharePoint** 

1. Inicie sesión en la consola AWS de administración y abra la [Amazon Kendra consola](https://console.aws.amazon.com/kendra/).

1. En el panel de navegación izquierdo, elija **Índices** y, a continuación, elija el índice que desee usar de la lista de índices.
**nota**  
Puede elegir configurar o editar los ajustes de **Control de acceso de usuarios** en la **Configuración del índice**. 

1. En la página **Introducción**, seleccione **Agregar origen de datos**.

1. En la página **Agregar fuente de datos**, elija el **SharePoint conector v1.0** y, a continuación, elija **Agregar fuente de datos**.

1. En la página **Especificar detalles del origen de datos**, introduzca la siguiente información:

   1. En **Nombre y descripción**, en **Nombre del origen de datos**: introduzca un nombre para el origen de datos. Puede incluir guiones, pero no espacios.

   1. (Opcional)** Descripción**: introduzca una descripción opcional para el origen de datos.

   1. En **Idioma predeterminado**: elija un idioma para filtrar los documentos para el índice. A menos que especifique lo contrario, el idioma predeterminado es el inglés. El idioma especificado en los metadatos del documento anula el idioma seleccionado.

   1. En **Etiquetas**, para **Agregar nueva etiqueta**: incluya etiquetas opcionales para buscar y filtrar sus recursos o realizar un seguimiento de sus AWS costos.

   1. Elija **Siguiente**.

1. En la página **Definir acceso y seguridad**, introduzca la siguiente información:

   1. **Para el **método de alojamiento**: elija entre **SharePoint en línea** y SharePoint servidor.**

      1. Para el **SharePointmodo en línea**: introduzca el **sitio URLs específico de su repositorio. SharePoint**

      1. Para el **SharePointservidor**: elija su **SharePoint versión**, introduzca el **sitio URLs específico de su SharePoint repositorio** e introduzca la Amazon S3 ruta a la ubicación de su **certificado SSL**.

   1. (Solo SharePoint servidor) Para el **proxy web**: introduzca el **nombre de host** y el **número de puerto** de la instancia interna SharePoint . El número de puerto debe ser un valor numérico entre 0 y 65535.

   1. En **Autenticación**: elija entre las siguientes opciones según el caso de uso:

      1. **Para conexión SharePoint en línea: elija entre la **autenticación básica y OAuth la autenticación 2.0**.**

      1. **Para el SharePoint servidor: elija entre **Ninguno**, **LDAP** y Manual.**

   1. Para **AWS Secrets Manager secreto**: elija un secreto existente o cree uno nuevo para almacenar sus credenciales de Secrets Manager autenticación. SharePoint Si decide crear un secreto nuevo, se abrirá una ventana de secreto de AWS Secrets Manager . Debe introducir un **Nombre del secreto**. El prefijo 'AmazonKendra- SharePoint -' se añade automáticamente a tu nombre secreto.

   1. Introduzca la siguiente información adicional en la **ventana Crear un secreto de AWS Secrets Manager **:

      1. Elija entre las siguientes opciones de autenticación SharePoint en la nube, según su caso de uso:

         1. **Autenticación básica**: introduzca el nombre de usuario de su SharePoint cuenta como **nombre de usuario** y la contraseña de la SharePoint cuenta como **contraseña**.

         1. **OAuth Autenticación 2.0**: introduzca SharePoint el nombre de usuario de su SharePoint cuenta como **nombre de usuario**, la **contraseña de la cuenta como contraseña**, su SharePoint ID único generado automáticamente como **ID de cliente** y la cadena de secreto compartido utilizada por ambos SharePoint y Amazon Kendra como secreto de **cliente**.

      1. Elija una de las siguientes opciones de autenticación SharePoint del servidor, según su caso de uso:

         1. **Ninguna**: introduzca el nombre de usuario de su SharePoint cuenta como **nombre de usuario**, la contraseña de su SharePoint cuenta como **contraseña** y el **nombre de dominio del servidor**.

         1. **LDAP**: introduzca el nombre de usuario de su SharePoint cuenta como nombre de **usuario**, la contraseña de la SharePoint cuenta como **contraseña**, el **punto de conexión del servidor LDAP** (incluidos el protocolo y el número de puerto, por ejemplo*ldap://example.com:389*) y su base de búsqueda de **LDAP** (por ejemplo,). *dc=example, dc=com*

         1. **Manual**: introduzca el nombre de usuario de su SharePoint cuenta como nombre de **usuario**, la contraseña de su SharePoint cuenta como **contraseña** y la **anulación del dominio de correo electrónico (dominio de correo electrónico** del usuario o grupo del directorio).

      1. Seleccione **Save**.

   1. **Nube privada virtual (VPC)**: también debe agregar **Subredes** y **Grupos de seguridad de VPC**.
**nota**  
Debe usar una VPC si usa SharePoint Server. Amazon VPC es opcional para otras SharePoint versiones.

   1. **IAM rol**: elija un IAM rol existente o cree uno nuevo IAM para acceder a las credenciales del repositorio y al contenido del índice.
**nota**  
IAM los roles utilizados para los índices no se pueden usar para las fuentes de datos. Si no está seguro de si un rol existente se utiliza para un índice o para las preguntas frecuentes, elija **Crear un nuevo rol** para evitar errores.

   1. Elija **Siguiente**.

1. En la página **Configurar ajustes de sincronización**, introduzca la siguiente información:

   1. **Usar registro de cambios**: seleccione esta opción para actualizar el índice en lugar de sincronizar todos los archivos.

   1. **Rastrear archivos adjuntos**: seleccione esta opción para rastrear los archivos adjuntos.

   1. **Utilizar asignaciones de grupos locales**: seleccione esta opción para asegurarse de que los documentos se filtran correctamente.

   1. **Configuración adicional**: añada patrones de expresión regular para incluir o excluir determinados archivos. Puede agregar hasta 100 patrones.

   1. En **Programa de ejecución de sincronización**, en **Frecuencia**: la frecuencia con la que Amazon Kendra se sincronizará con el origen de datos.

   1. Elija **Siguiente**.

1. En la página **Establecer asignaciones de campos**, especifique la siguiente información:

   1. **Amazon Kendra asignaciones de campos predeterminadas: seleccione entre las** fuentes de datos predeterminadas Amazon Kendra generadas los campos que desee asignar a su índice. 

   1. En **Asignaciones de campo personalizado**: agregue campos de origen de datos personalizados a fin de crear un nombre de campo de índice al que asignarlos y el tipo de datos del campo.

   1. Elija **Siguiente**.

1. En la página **Revisar y crear**, compruebe que la información que ha introducido es correcta y, a continuación, seleccione **Añadir origen de datos**. También puede elegir editar la información desde esta página. El origen de datos aparecerá en la página **Orígenes de datos** una vez que el origen de datos se haya agregado correctamente.

------
#### [ API ]

**Para conectarse a Amazon Kendra SharePoint**

Debe especificar lo siguiente mediante la [SharePointConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_SharePointConfiguration.html)API:
+ **SharePointVersión**: especifique la SharePoint versión que utiliza al configurar SharePoint. Este es el caso independientemente de si utiliza SharePoint Server 2013, SharePoint Server 2016, SharePoint Server 2019 u SharePoint Online.
+ **Nombre de recurso secreto de Amazon (ARN): proporcione** el nombre de recurso de Amazon (ARN) de un Secrets Manager secreto que contenga las credenciales de autenticación que creó en su SharePoint cuenta. El secreto se almacena en una estructura JSON.

  Para la **autenticación básica SharePoint en línea**, la siguiente es la estructura JSON mínima que debe estar en el secreto:

  ```
  {
      "userName": "user name",
      "password": "password"
  }
  ```

  Para la **autenticación SharePoint Online OAuth 2.0**, la siguiente es la estructura JSON mínima que debe estar en el secreto:

  ```
  {
      "userName": "SharePoint account user name"",
      "password": "SharePoint account password",
      "clientId": "SharePoint auto-generated unique client id",
      "clientSecret": "secret string shared by Amazon Kendra and SharePoint to authorize communications"
  }
  ```

  Para la **autenticación básica SharePoint del servidor**, la siguiente es la estructura JSON mínima que debe estar en tu secreto:

  ```
  {
      "userName": "user name",
      "password": "password",
      "domain": "server domain name"
  }
  ```

  Para la **autenticación LDAP SharePoint del servidor** (si necesita convertir la lista de control de acceso (ACL) al formato de correo electrónico para filtrar según el contexto del usuario, puede incluir la URL del servidor LDAP y la base de búsqueda de LDAP en su secreto), la siguiente es la estructura JSON mínima que debe estar en su secreto:

  ```
  {
      "userName": "user name",
      "password": "password",
      "domain": "server domain name"
      "ldapServerUrl": "ldap://example.com:389",
      "ldapSearchBase": "dc=example,dc=com"
  }
  ```

  Para la **autenticación manual SharePoint del servidor**, la siguiente es la estructura JSON mínima que debe estar en secreto:

  ```
  {
      "userName": "user name",
      "password": "password",
      "domain": "server domain name",
      "emailDomainOverride": "example.com"
  }
  ```
+ **IAM rol**: especifique `RoleArn` cuándo llama `CreateDataSource` para proporcionar a un IAM rol permisos para acceder a su Secrets Manager secreto y para llamar al público requerido APIs para el SharePoint conector y Amazon Kendra. Para obtener más información, consulte [Roles de IAM para orígenes de datos de SharePoint ](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds).
+  **Amazon VPC**—Si usa SharePoint Server, especifíquelo `VpcConfiguration` como parte de la configuración de la fuente de datos. Consulte [Configuración Amazon Kendra para usar una VPC](https://docs.aws.amazon.com/kendra/latest/dg/vpc-configuration.html).

También puede añadir las siguientes características opcionales:
+ **Proxy web**: si desea conectarse a su SharePoint sitio URLs mediante un proxy web. Puede usar esta opción solo para el SharePoint servidor.
+ **Listas de indexación**: si se Amazon Kendra debe indexar el contenido de los archivos adjuntos a los elementos de la SharePoint lista.
+  **Registro de cambios**: si se Amazon Kendra debe utilizar el mecanismo de registro de cambios de la fuente de SharePoint datos para determinar si un documento debe actualizarse en el índice.
**nota**  
Utilice el registro de cambios si no quiere que Amazon Kendra digitalice todos los documentos. Si el registro de cambios es grande, es posible que se Amazon Kendra tarde menos en digitalizar los documentos de la fuente de SharePoint datos que en procesar el registro de cambios. Si está sincronizando el origen de datos de SharePoint con su índice por primera vez, se escanean todos los documentos. 
+  **Filtros de inclusión y exclusión**: puede especificar si desea incluir o excluir determinado contenido.
**nota**  
La mayoría de los orígenes de datos utilizan patrones de expresiones regulares, que son patrones de inclusión o exclusión denominados filtros. Si especifica un filtro de inclusión, solo se indexará el contenido que coincida con el filtro de inclusión. Los documentos que no coincidan con el filtro de inclusión no se indexan. Si especifica un filtro de inclusión y exclusión, los documentos que coincidan con el filtro de exclusión no se indexarán, aunque coincidan con el filtro de inclusión.
+  **Asignaciones de campos**: elija asignar los campos del origen de datos de SharePoint a los campos de índice de Amazon Kendra . Para obtener más información, consulte [Asignación de campos de origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/field-mapping.html).
**nota**  
El campo del cuerpo del documento o el cuerpo del documento equivalente de sus documentos es obligatorio Amazon Kendra para poder buscarlos. Debe asignar el nombre del campo del cuerpo del documento en el origen de datos al nombre del campo del índice `_document_body`. Todos los demás campos son opcionales.
+  **Filtrado de contexto de usuario y control de acceso**: si hay una lista de control de acceso (ACL) para los documentos,Amazon Kendra la rastreará. La información de la ACL se utiliza para filtrar los resultados de búsqueda en función del acceso del usuario o su grupo a los documentos. Para obtener más información, consulte [Filtrado de contexto de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#datasource-context-filter).

------

## Más información


Para obtener más información sobre la integración Amazon Kendra con la fuente de SharePoint datos, consulte:
+ [Cómo empezar a utilizar el conector Amazon Kendra SharePoint en línea](https://aws.amazon.com/blogs/machine-learning/getting-started-with-the-amazon-kendra-sharepoint-online-connector/)

# SharePoint conector V2.0


SharePoint es un servicio colaborativo de creación de sitios web que puede utilizar para personalizar el contenido web y crear páginas, sitios, bibliotecas de documentos y listas. Puede utilizarlo Amazon Kendra para indexar la fuente SharePoint de datos.

Amazon Kendra actualmente es compatible con SharePoint Online and SharePoint Server (2013, 2016, 2019 y Subscription Edition).

**nota**  
SharePoint El conector SharePointConfiguration V1.0/API finalizó en 2023. Recomendamos migrar o utilizar el SharePoint conector V2.0/API. TemplateConfiguration 

Para solucionar problemas del conector de la fuente de Amazon Kendra SharePoint datos, consulte. [Solución de problemas con los orígenes de datos](troubleshooting-data-sources.md)

**Topics**
+ [

## Características admitidas
](#supported-features-v2-sharepoint)
+ [

## Requisitos previos
](#prerequisites-v2-sharepoint)
+ [

## Instrucciones de conexión
](#data-source-procedure-v2-sharepoint)
+ [

## Notas
](#sharepoint-notes)

## Características admitidas


Amazon Kendra SharePoint el conector de fuente de datos admite las siguientes funciones:
+ Asignaciones de campos
+ Control de acceso de usuarios
+ Filtros de inclusión/exclusión
+ Sincronizaciones completas e incrementales del contenido
+ Nube privada virtual (VPC)

## Requisitos previos


Antes de poder utilizarla Amazon Kendra para indexar la fuente de SharePoint datos, realice estos cambios en sus AWS cuentas SharePoint y.

Debe proporcionar las credenciales de autenticación, que se almacenan de forma segura en AWS Secrets Manager secreto.

**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).

**En SharePoint línea, asegúrese de tener:**
+ Ha copiado su SharePoint instancia URLs. El formato de la URL del host que introduzcas es*https://yourdomain.com/sites/mysite*. La URL debe empezar por `https`.
+ Se ha copiado el nombre de dominio de la URL de la SharePoint instancia.
+ Apuntó sus credenciales de autenticación básicas, que incluyen el nombre de usuario y la contraseña, además de los permisos de administrador del sitio para conectarse a SharePoint Online.
+ Ha desactivado los **Valores predeterminados de seguridad** en su portal de Azure mediante un usuario administrativo. Para obtener más información sobre la administración de la configuración predeterminada de seguridad en el portal de Azure, consulte la [documentación de Microsoft sobre cómo establecer la configuración predeterminada enable/disable de seguridad](https://learn.microsoft.com/en-us/microsoft-365/business-premium/m365bp-conditional-access?view=o365-worldwide&tabs=secdefaults#security-defaults-1).
+ Has desactivado la autenticación multifactor (MFA) en tu SharePoint cuenta para que no Amazon Kendra se bloquee el rastreo de tu contenido. SharePoint 
+ **Si utilizas un tipo de autenticación distinto de la autenticación básica:** has copiado el ID de inquilino de la instancia. SharePoint Para obtener más información sobre cómo encontrar el ID de inquilino, consulte [Encontrar el ID de inquilino de Microsoft 365](https://learn.microsoft.com/en-us/sharepoint/find-your-office-365-tenant-id).
+ Si necesita migrar a la autenticación de usuarios en la nube con Microsoft Entra, consulte la [documentación de Microsoft sobre la autenticación en la nube](https://learn.microsoft.com/en-us/entra/identity/hybrid/connect/migrate-from-federation-to-cloud-authentication).
+ **Para la autenticación OAuth OAuth 2.0 y la autenticación con token de actualización 2.0:** anote sus credenciales de **autenticación básica**, que contienen el nombre de usuario y la contraseña que utiliza para conectarse a SharePoint Online, así como el ID de cliente y el secreto de cliente generados tras SharePoint registrarse en Azure AD.
  + **Si no usa ACL**, ha agregado los siguientes permisos:    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/data-source-v2-sharepoint.html)
**nota**  
Note.Read.All y Sites.Read.All son necesarios solo si desea rastrear documentos. OneNote   
Si desea rastrear sitios específicos, el permiso se puede restringir a sitios específicos en lugar de a todos los sitios disponibles en el dominio. Debe configurar el permiso **Sites.Selected (aplicación)**. Con este permiso de API, debe establecer el permiso de acceso en todos los sitios de forma explícita a través de la API de Microsoft Graph. Para obtener más información, consulte [Microsoft's blog on Sites.Selected permissions](https://techcommunity.microsoft.com/t5/microsoft-sharepoint-blog/develop-applications-that-use-sites-selected-permissions-for-spo/ba-p/3790476).
  + **Si usa ACL**, ha agregado los siguientes permisos:    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/data-source-v2-sharepoint.html)
**nota**  
GroupMember**.Read.All y User.Read.All son necesarios solo si el rastreador de identidades está activado.**  
Si desea rastrear sitios específicos, el permiso se puede restringir a sitios específicos en lugar de a todos los sitios disponibles en el dominio. Debe configurar el permiso **Sites.Selected (aplicación)**. Con este permiso de API, debe establecer el permiso de acceso en todos los sitios de forma explícita a través de la API de Microsoft Graph. Para obtener más información, consulte [Microsoft's blog on Sites.Selected permissions](https://techcommunity.microsoft.com/t5/microsoft-sharepoint-blog/develop-applications-that-use-sites-selected-permissions-for-spo/ba-p/3790476).
+ **Para la autenticación exclusiva de la aplicación Azure AD:** clave privada e ID de cliente que generaste después de registrarte en Azure AD. SharePoint Tenga en cuenta también el certificado X.509.
  + **Si no usa ACL**, ha agregado los siguientes permisos:    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/data-source-v2-sharepoint.html)
**nota**  
Si desea rastrear sitios específicos, el permiso se puede restringir a sitios específicos en lugar de a todos los sitios disponibles en el dominio. Debe configurar el permiso **Sites.Selected (aplicación)**. Con este permiso de API, debe establecer el permiso de acceso en todos los sitios de forma explícita a través de la API de Microsoft Graph. Para obtener más información, consulte [Microsoft's blog on Sites.Selected permissions](https://techcommunity.microsoft.com/t5/microsoft-sharepoint-blog/develop-applications-that-use-sites-selected-permissions-for-spo/ba-p/3790476).
  + **Si usa ACL**, ha agregado los siguientes permisos:    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/data-source-v2-sharepoint.html)
**nota**  
Si desea rastrear sitios específicos, el permiso se puede restringir a sitios específicos en lugar de a todos los sitios disponibles en el dominio. Debe configurar el permiso **Sites.Selected (aplicación)**. Con este permiso de API, debe establecer el permiso de acceso en todos los sitios de forma explícita a través de la API de Microsoft Graph. Para obtener más información, consulte [Microsoft's blog on Sites.Selected permissions](https://techcommunity.microsoft.com/t5/microsoft-sharepoint-blog/develop-applications-that-use-sites-selected-permissions-for-spo/ba-p/3790476).
+ **Para la autenticación SharePoint solo con aplicaciones:** anotó su ID de SharePoint cliente y el secreto de cliente generados al conceder el permiso a SharePoint App Only, y su ID de cliente y su secreto de cliente generados al registrar la SharePoint aplicación en Azure AD.
**nota**  
SharePoint La autenticación solo para aplicaciones *no* es compatible con la versión de 2013. SharePoint 
  + **(Opcional) Si está rastreando OneNote documentos y utilizando el **rastreador de identidades****, agregue los siguientes permisos:    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/data-source-v2-sharepoint.html)
**nota**  
****No se requieren permisos de API para rastrear entidades mediante la autenticación básica y la autenticación solo mediante aplicaciones. SharePoint****

**En SharePoint Server, asegúrate de tener:**
+ Ha copiado su SharePoint instancia URLs y su nombre de dominio SharePoint URLs. El formato de la URL del host que introduzcas es*https://yourcompany/sites/mysite*. La URL debe empezar por `https`.
**nota**  
(local o en el servidor) Amazon Kendra comprueba si la información de punto final incluida AWS Secrets Manager es la misma que la información de punto final especificada en los detalles de configuración de la fuente de datos. Esto ayuda a evitar el [problema del suplente confuso](https://docs.aws.amazon.com/IAM/latest/UserGuide/confused-deputy.html), que es un problema de seguridad en el que un usuario no tiene permiso para realizar una acción, pero utiliza Amazon Kendra como proxy para acceder al secreto configurado y realizar la acción. Si más adelante cambia la información de punto de conexión, debe crear un nuevo secreto para sincronizar esta información.
+ Has desactivado la autenticación multifactor (MFA) en tu SharePoint cuenta para que no Amazon Kendra se bloquee el rastreo de tu contenido. SharePoint 
+ Si utilizas la autenticación solo por **SharePoint aplicación para el control de acceso**:
  + Se ha copiado el ID de SharePoint cliente generado al registrar App Only a nivel de sitio. El formato del ID de cliente es ClientId @TenantId. Por ejemplo, *ffa956f3-8f89-44e7-b0e4-49670756342c@888d0b57-69f1-4fb8-957f-e1f0bedf82fe*.
  + Se ha copiado el secreto de SharePoint cliente generado al registrar la aplicación solo a nivel de sitio.

  **Nota:** Dado que los secretos del cliente IDs y del cliente se generan para sitios individuales solo cuando se registra el SharePoint servidor para la autenticación solo con aplicaciones, solo se admite la URL de un sitio para SharePoint la autenticación solo con aplicaciones.
**nota**  
SharePoint La autenticación solo mediante aplicaciones *no* es compatible con la versión de SharePoint 2013.
+ Si utiliza un **ID de correo electrónico con dominio personalizado** para el control de acceso:
  + Apuntó el valor de su dominio de correo electrónico personalizado, por ejemplo: "». *amazon.com*
+ Si utiliza la autorización **ID de correo electrónico con dominio del IDP**, ha copiado:
  + El punto de conexión del servidor LDAP (punto de conexión del servidor LDAP, incluidos el protocolo y el número de puerto). Por ejemplo: *ldap://example.com:389*.
  + La base de búsqueda LDAP (base de búsqueda del usuario LDAP). Por ejemplo: *CN=Users,DC=sharepoint,DC=com*.
  + El nombre de usuario de LDAP y contraseña de LDAP.
+ Credenciales de autenticación NTLM configuradas **o** credenciales de autenticación Kerberos configuradas que contienen un nombre de usuario (nombre de usuario de la SharePoint cuenta) y una contraseña (contraseña de la cuenta). SharePoint 

**En el suyo Cuenta de AWS, asegúrese de tener:**
+ [Creó un Amazon Kendra índice](https://docs.aws.amazon.com/kendra/latest/dg/create-index.html) y, si usa la API, anotó el ID del índice.
+ [Creó un IAM rol](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds) para su fuente de datos y, si usa la API, anotó el ARN del IAM rol.
**nota**  
Si cambias el tipo de autenticación y las credenciales, debes actualizar tu IAM rol para acceder al ID AWS Secrets Manager secreto correcto.
+ Guardó sus credenciales de SharePoint autenticación en un AWS Secrets Manager secreto y, si usa la API, anotó el ARN del secreto.
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).

Si no tiene un IAM rol o secreto existente, puede usar la consola para crear un nuevo IAM rol y un Secrets Manager secreto al conectar su fuente de SharePoint datos. Amazon Kendra Si utiliza la API, debe proporcionar el ARN de un IAM rol y un Secrets Manager secreto existentes y un ID de índice.

## Instrucciones de conexión


Para conectarse Amazon Kendra a su fuente de SharePoint datos, debe proporcionar los detalles de sus SharePoint credenciales para Amazon Kendra poder acceder a sus datos. Si aún no lo ha configurado SharePoint , Amazon Kendra consulte[Requisitos previos](#prerequisites-v2-sharepoint).

------
#### [ Console: SharePoint Online ]

**Para conectarse Amazon Kendra a SharePoint Online** 

1. Inicie sesión en la [Amazon Kendra consola Consola de administración de AWS y ábrala](https://console.aws.amazon.com/kendra/).

1. En el panel de navegación izquierdo, elija **Índices** y, a continuación, elija el índice que desee usar de la lista de índices.
**nota**  
Puede elegir configurar o editar los ajustes de **Control de acceso de usuarios** en la **Configuración del índice**. 

1. En la página **Introducción**, seleccione **Agregar origen de datos**.

1. En la página **Agregar origen de datos**, seleccione el **Conector de SharePoint ** y, a continuación, seleccione **Agregar conector**. Si usa la versión 2 (si corresponde), elija el **Conector de SharePoint ** con la etiqueta “V2.0”.

1. En la página **Especificar detalles del origen de datos**, introduzca la siguiente información:

   1. En **Nombre y descripción**, en **Nombre del origen de datos**: introduzca un nombre para el origen de datos. Puede incluir guiones, pero no espacios.

   1. (Opcional)** Descripción**: introduzca una descripción opcional para el origen de datos.

   1. En **Idioma predeterminado**: elija un idioma para filtrar los documentos para el índice. A menos que especifique lo contrario, el idioma predeterminado es el inglés. El idioma especificado en los metadatos del documento anula el idioma seleccionado.

   1. En **Etiquetas**, para **añadir una nueva etiqueta**: incluye etiquetas opcionales para buscar y filtrar tus recursos o realizar un seguimiento de tus AWS costes.

   1. Elija **Siguiente**.

1. En la página **Definir acceso y seguridad**, introduzca la siguiente información:

   1. **Método de alojamiento****: elija en líneaSharePoint.**

   1. **Sitio URLs específico de su SharePoint repositorio**: introduzca el SharePoint host. URLs El formato del host URLs que introduzca es*https://yourdomain.sharepoint.com/sites/mysite*. La URL debe empezar por el protocolo `https`. Separe URLs con una línea nueva. Puede sumar hasta 100 URLs.

   1. **Dominio**: introduzca el SharePoint dominio. Por ejemplo, el dominio de la URL *https://yourdomain.sharepoint.com/sites/mysite* es*yourdomain*. 

   1. **Autorización**: active o desactive la información de la lista de control de acceso (ACL) para los documentos, si tiene una ACL y desea usarla para el control de acceso. La ACL especifica a qué documentos pueden acceder los usuarios y los grupos. La información de la ACL se utiliza para filtrar los resultados de búsqueda en función del acceso del usuario o su grupo a los documentos. Para obtener más información, consulte [Filtrado de contexto de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#context-filter-user-incl-datasources).

      También puede elegir el tipo de ID de usuario, ya sea el nombre de la entidad principal del usuario o el correo electrónico del usuario obtenido del portal de Azure. Si no lo especifica, se utiliza el correo electrónico de forma predeterminada.

   1. **Autenticación: elija entre la autenticación** básica, la OAuth 2.0, la autenticación solo para aplicaciones de Azure AD, la autenticación solo para SharePoint aplicaciones o OAuth la autenticación con token de actualización 2.0. Elija un secreto de AWS Secrets Manager existente o cree uno nuevo para almacenar sus credenciales de autenticación.

      1. Si usa la **autenticación básica**, su secreto debe incluir un nombre secreto, un nombre de usuario y una contraseña. SharePoint 

      1. Si usa la **autenticación OAuth 2.0**, su secreto debe incluir el ID de SharePoint inquilino, el nombre secreto, el nombre de SharePoint usuario, la contraseña, el ID de cliente de Azure AD generado al registrarse SharePoint en Azure AD y el secreto de cliente de Azure AD generado al registrarse SharePoint en Azure AD.

      1. Si utiliza la **autenticación exclusiva para aplicaciones de Azure AD**, su secreto debe incluir el ID de SharePoint inquilino, el certificado X.509 autofirmado de Azure AD, el nombre secreto, el ID de cliente de Azure AD generado al registrarse SharePoint en Azure AD y la clave privada para autenticar el conector de Azure AD.

      1. Si utiliza la **autenticación SharePoint solo por aplicación**, su secreto debe incluir el ID de SharePoint inquilino, el nombre secreto, el ID de SharePoint cliente que generó al registrar App Only a nivel de inquilino, el secreto de SharePoint cliente generado cuando se registró en App Only a nivel de inquilino, el ID de cliente de Azure AD generado al registrarse SharePoint en Azure AD y el secreto de cliente de Azure AD generado SharePoint al registrarse en Azure AD.

         El formato del ID de SharePoint cliente es. *ClientID@TenantId* Por ejemplo, *ffa956f3-8f89-44e7-b0e4-49670756342c@888d0b57-69f1-4fb8-957f-e1f0bedf82fe*.

      1. Si usa la **autenticación con token de actualización OAuth 2.0**, su secreto debe incluir el ID de SharePoint inquilino, el nombre secreto, el ID de cliente único de Azure AD generado al registrarse SharePoint en Azure AD, el secreto de cliente de Azure AD generado SharePoint al registrarse en Azure AD y el token de actualización generado Amazon Kendra para conectarse SharePoint.

   1. **Nube privada virtual (VPC)**: puede optar por utilizar una VPC. Si es así, debe agregar **Subredes** y **Grupos de seguridad de VPC**.

   1. **Rastreador de identidades**: especifique si se debe activar el rastreador de identidades de Amazon Kendra. El rastreador de identidades utiliza la información de la lista de control de acceso (ACL) de los documentos para filtrar los resultados de la búsqueda en función del acceso del usuario o del grupo a los documentos. Si tiene una ACL para sus documentos y decide utilizarla, también puede optar por activar el rastreador de identidades para configurar el [filtrado Amazon Kendra de los resultados de búsqueda por contexto de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#context-filter-user-incl-datasources). De lo contrario, si el rastreador de identidades está desactivado, todos los documentos se pueden buscar públicamente. Si quieres usar el control de acceso para tus documentos y el rastreador de identidad está desactivado, también puedes usar la [PutPrincipalMapping](https://docs.aws.amazon.com/kendra/latest/APIReference/API_PutPrincipalMapping.html)API para cargar información de acceso de usuarios y grupos para filtrar el contexto de los usuarios.

      También puede optar por rastrear la asignación de grupos locales o la asignación de grupos de Azure Active Directory.
**nota**  
El rastreo cartográfico de grupos de AD solo está disponible para la autenticación OAuth 2.0, el token de actualización OAuth 2.0 y la autenticación solo SharePoint mediante aplicaciones. 

   1. **IAM rol**: elige un IAM rol existente o crea uno nuevo IAM para acceder a las credenciales del repositorio y al contenido del índice.
**nota**  
IAM los roles utilizados para los índices no se pueden usar para las fuentes de datos. Si no está seguro de si un rol existente se utiliza para un índice o para las preguntas frecuentes, elija **Crear un nuevo rol** para evitar errores.

   1. Elija **Siguiente**.

1. En la página **Configurar ajustes de sincronización**, introduzca la siguiente información:

   1. En **Ámbito de sincronización**, seleccione de entre las siguientes opciones:

      1. **Seleccionar entidades**: elija las entidades que desee rastrear. Puede seleccionar rastrear **Todas** las entidades o cualquier combinación de **Archivos**, **Archivos adjuntos**, **Enlaces**, **Páginas**, **Eventos**, **Comentarios** y **Datos de listas**.

      1. En **Configuración adicional**, en **Patrones de expresiones regulares de entidades**: agregue patrones de expresiones regulares para los **Enlaces**, las **Páginas** y los **Eventos** con el fin de incluir entidades específicas en lugar de sincronizar todos los documentos.

      1. Patrones de **expresiones regulares: agregue patrones** de expresiones regulares para incluir o excluir archivos por **ruta de archivo**, nombre de **archivo, **tipo de archivo**, nombre** de **OneNote sección y nombre** de **OneNote página** en lugar de sincronizar todos los documentos. Puede añadir hasta 100.
**nota**  
OneNote El rastreo solo está disponible para la autenticación OAuth 2.0, el token de actualización OAuth 2.0 y la autenticación solo mediante aplicaciones. SharePoint 

   1. En **Modo de sincronización**, elija cómo desea actualizar el índice cuando cambie el contenido del origen de datos. Al sincronizar el origen de datos con Amazon Kendra por primera vez, todo el contenido se sincroniza de forma predeterminada.
      + **Sincronización completa**: sincroniza todo el contenido independientemente del estado de sincronización anterior.
      + **Sincronización de documentos nuevos o modificados**: sincroniza solo los documentos nuevos o modificados.
      + **Sincronización de documentos nuevos, modificados o eliminados**: sincroniza solo los documentos nuevos, modificados y eliminados.

   1. En **Programación de ejecución de sincronización**, en **Frecuencia**: elija la frecuencia con la que desea sincronizar el contenido del origen de datos y actualizar el índice.

   1. Elija **Siguiente**.

1. En la página **Establecer asignaciones de campos**, especifique la siguiente información:

   1. **Campos de fuente de datos predeterminados**: seleccione entre los campos de fuente de datos predeterminados Amazon Kendra generados que desee asignar a su índice. 

   1.  **Agregar campo**: para agregar campos de origen de datos personalizados para crear un nombre de campo de índice al que asignarlos y el tipo de datos del campo.

   1. Elija **Siguiente**.

1. En la página **Revisar y crear**, compruebe que la información que ha introducido es correcta y, a continuación, seleccione **Añadir origen de datos**. También puede elegir editar la información desde esta página. El origen de datos aparecerá en la página **Orígenes de datos** una vez que el origen de datos se haya agregado correctamente.

------
#### [ Console: SharePoint Server ]

**Para conectarse a Amazon Kendra SharePoint** 

1. Inicie sesión en la [Amazon Kendra consola Consola de administración de AWS y ábrala](https://console.aws.amazon.com/kendra/).

1. En el panel de navegación izquierdo, elija **Índices** y, a continuación, elija el índice que desee usar de la lista de índices.
**nota**  
Puede elegir configurar o editar los ajustes de **Control de acceso de usuarios** en la **Configuración del índice**. 

1. En la página **Introducción**, seleccione **Agregar origen de datos**.

1. En la página **Agregar origen de datos**, seleccione el **Conector de SharePoint ** y, a continuación, seleccione **Agregar conector**. Si usa la versión 2 (si corresponde), elija el **Conector de SharePoint ** con la etiqueta “V2.0”.

1. En la página **Especificar detalles del origen de datos**, introduzca la siguiente información:

   1. En **Nombre y descripción**, en **Nombre del origen de datos**: introduzca un nombre para el origen de datos. Puede incluir guiones, pero no espacios.

   1. (Opcional)** Descripción**: introduzca una descripción opcional para el origen de datos.

   1. En **Idioma predeterminado**: elija un idioma para filtrar los documentos para el índice. A menos que especifique lo contrario, el idioma predeterminado es el inglés. El idioma especificado en los metadatos del documento anula el idioma seleccionado.

   1. En **Etiquetas**, para **añadir una nueva etiqueta**: incluye etiquetas opcionales para buscar y filtrar tus recursos o realizar un seguimiento de tus AWS costes.

   1. Elija **Siguiente**.

1. En la página **Definir acceso y seguridad**, introduzca la siguiente información:

   1. **Método de alojamiento****: elija un SharePoint servidor.**

   1. **Elija SharePoint la versión**: elija entre **SharePoint 2013**, **SharePoint 2016**, **SharePoint 2019** y **SharePoint (edición de suscripción)**.

   1. **Sitio URLs específico de su SharePoint repositorio**: introduzca el SharePoint host. URLs El formato del host URLs que introduzca es*https://yourcompany/sites/mysite*. La URL debe empezar por el protocolo `https`. Separe URLs con una línea nueva. Puede sumar hasta 100 URLs.

   1. **Dominio**: introduzca el SharePoint dominio. Por ejemplo, el dominio de la URL *https://yourcompany/sites/mysite* es *yourcompany*

   1. **Ubicación del certificado SSL**: introduzca la Amazon S3 ruta al archivo de certificado SSL.

   1. (Opcional) En **Proxy web**: introduzca el nombre de host del proxy web (sin el protocolo `http://` o `https://`) y el número de puerto utilizado por el protocolo de transporte de URL del host. El valor numérico del número de puerto debe estar entre 0 y 65535.

   1. **Autorización**: active o desactive la información de la lista de control de acceso (ACL) para los documentos, si tiene una ACL y desea usarla para el control de acceso. La ACL especifica a qué documentos pueden acceder los usuarios y los grupos. La información de la ACL se utiliza para filtrar los resultados de búsqueda en función del acceso del usuario o su grupo a los documentos. Para obtener más información, consulte [Filtrado de contexto de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#context-filter-user-incl-datasources).

      Para el SharePoint servidor, puede elegir entre las siguientes opciones de ACL:

      1. **ID de correo electrónico con dominio del IDP**: el ID de usuario se basa en el correo electrónico IDs con sus dominios obtenidos del proveedor de identidad (IDP) subyacente. Proporcione los detalles de conexión del IDP en el secreto de Secrets Manager como parte de la **Autenticación**.

      1. **ID de correo electrónico con dominio personalizado**: el ID de usuario toma el valor del dominio de correo electrónico personalizado. Por ejemplo, “*amazon.com*”. El dominio de correo electrónico se utilizará para crear la ID de correo electrónico para el control de acceso. Debe introducir un dominio de correo electrónico personalizado.

      1. **Dominio\$1Usuario con dominio**: el ID de usuario se crea con un formato Dominio/ID de usuario. Debe proporcionar un nombre de dominio válido. Por ejemplo: *"sharepoint2019"* para construir el control de acceso.

   1. Para la **autenticación**, elija la autenticación SharePoint solo por aplicación, la autenticación NTLM o la autenticación Kerberos. Elija un secreto de AWS Secrets Manager existente o cree uno nuevo para almacenar sus credenciales de autenticación.

      1. Si utiliza la autenticación **NTLM o la autenticación** **Kerberos**, el secreto debe incluir un nombre secreto, un nombre de usuario y una contraseña. SharePoint 

         Si utiliza un **ID de correo electrónico con dominio de IDP**, introduzca también su:
         +  **Punto de conexión del servidor LDAP**: punto de conexión del servidor LDAP, incluidos el protocolo y el número de puerto. Por ejemplo: *ldap://example.com:389*.
         + **Base de búsqueda LDAP**: base de búsqueda del usuario de LDAP. Por ejemplo: *CN=Users,DC=sharepoint,DC=com*.
         + **Nombre de usuario de LDAP**: su nombre de usuario de LDAP.
         + **Contraseña de LDAP**: su contraseña LDAP.

      1. Si utiliza la **autenticación SharePoint solo por aplicación**, su secreto debe incluir un nombre secreto, el ID de SharePoint cliente que generó al registrar App Only a nivel de sitio y el secreto de SharePoint cliente generado cuando se registró en App Only a nivel de sitio.

         El formato del ID de SharePoint cliente es. *ClientID@TenantId* Por ejemplo, *ffa956f3-8f89-44e7-b0e4-49670756342c@888d0b57-69f1-4fb8-957f-e1f0bedf82fe*.

         **Nota:** Como el cliente IDs y los secretos del cliente se generan para sitios individuales solo cuando se registra el SharePoint servidor para la autenticación solo con aplicaciones, solo se admite la URL de un sitio para SharePoint la autenticación solo con aplicaciones.

         Si utiliza un **ID de correo electrónico con dominio de IDP**, introduzca también su:
         +  **Punto de conexión del servidor LDAP**: punto de conexión del servidor LDAP, incluidos el protocolo y el número de puerto. Por ejemplo: *ldap://example.com:389*.
         + **Base de búsqueda LDAP**: base de búsqueda del usuario de LDAP. Por ejemplo: *CN=Users,DC=sharepoint,DC=com*.
         + **Nombre de usuario de LDAP**: su nombre de usuario de LDAP.
         + **Contraseña de LDAP**: su contraseña LDAP.

   1. **Nube privada virtual (VPC)**: puede optar por utilizar una VPC. Si es así, debe agregar **Subredes** y **Grupos de seguridad de VPC**.

   1. **Rastreador de identidades**: especifique si se debe activar el rastreador de identidades de Amazon Kendra. El rastreador de identidades utiliza la información de la lista de control de acceso (ACL) de los documentos para filtrar los resultados de la búsqueda en función del acceso del usuario o del grupo a los documentos. Si tiene una ACL para sus documentos y decide utilizarla, también puede optar por activar el rastreador de identidad para configurar el [filtrado Amazon Kendra de los resultados de búsqueda por contexto de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#context-filter-user-incl-datasources). De lo contrario, si el rastreador de identidades está desactivado, todos los documentos se pueden buscar públicamente. Si quieres usar el control de acceso para tus documentos y el rastreador de identidad está desactivado, también puedes usar la [PutPrincipalMapping](https://docs.aws.amazon.com/kendra/latest/APIReference/API_PutPrincipalMapping.html)API para cargar información de acceso de usuarios y grupos para filtrar el contexto de los usuarios.

      También puede optar por rastrear la asignación de grupos locales o la asignación de grupos de Azure Active Directory.
**nota**  
El rastreo cartográfico de grupos AD solo está disponible para SharePoint la autenticación mediante aplicaciones.

   1. **IAM rol**: elige un IAM rol existente o crea uno nuevo IAM para acceder a las credenciales del repositorio y al contenido del índice.
**nota**  
IAM los roles utilizados para los índices no se pueden usar para las fuentes de datos. Si no está seguro de si un rol existente se utiliza para un índice o para las preguntas frecuentes, elija **Crear un nuevo rol** para evitar errores.

   1. Elija **Siguiente**.

1. En la página **Configurar ajustes de sincronización**, introduzca la siguiente información:

   1. En **Ámbito de sincronización**, seleccione de entre las siguientes opciones:

      1. **Seleccionar entidades**: elija las entidades que desee rastrear. Puede seleccionar rastrear **Todas** las entidades o cualquier combinación de **Archivos**, **Archivos adjuntos**, **Enlaces**, **Páginas**, **Eventos** y **Datos de la lista**.

      1. En **Configuración adicional**, en **Patrones de expresiones regulares de entidades**: agregue patrones de expresiones regulares para los **Enlaces**, las **Páginas** y los **Eventos** con el fin de incluir entidades específicas en lugar de sincronizar todos los documentos.

      1. Patrones de **expresiones regulares: agregue patrones** de expresiones regulares para incluir o excluir archivos por **ruta de archivo, nombre de archivo**, **tipo de archivo**, **nombre** de **OneNotesección y nombre** de **OneNotepágina**, en lugar de sincronizar todos los documentos. Puede añadir hasta 100.
**nota**  
OneNote El rastreo solo está disponible para la autenticación solo con aplicaciones. SharePoint 

   1. **Modo de sincronización**: elija cómo desea actualizar el índice cuando cambie el contenido del origen de datos. Al sincronizar el origen de datos con Amazon Kendra por primera vez, todo el contenido se rastrea y se indexa de forma predeterminada. Debe ejecutar una sincronización completa de los datos si la sincronización inicial falló, incluso si no selecciona la sincronización completa como opción de modo de sincronización.
      + Sincronización completa: se vuelve a indexar todo el contenido, reemplazando el contenido existente cada vez que el origen de datos se sincronice con el índice.
      + Sincronización nueva y modificada: indexe solo el contenido nuevo y modificado cada vez que la fuente de datos se sincronice con el índice. Amazon Kendra puede usar el mecanismo de la fuente de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido que ha cambiado desde la última sincronización.
      + Sincronización de lo nuevo y modificado: se indexa solo el contenido nuevo y modificado cada vez que el origen de datos se sincroniza con el índice. Amazon Kendra puede utilizar el mecanismo del origen de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido modificado desde la última sincronización.

   1. En **Programación de ejecución de sincronización**, en **Frecuencia**: elija la frecuencia con la que desea sincronizar el contenido del origen de datos y actualizar el índice.

   1. Elija **Siguiente**.

1. En la página **Establecer asignaciones de campos**, especifique la siguiente información:

   1. **Campos de fuente de datos predeterminados**: seleccione entre los campos de fuente de datos predeterminados Amazon Kendra generados que desee asignar a su índice.

   1.  **Agregar campo**: para agregar campos de origen de datos personalizados para crear un nombre de campo de índice al que asignarlos y el tipo de datos del campo.

   1. Elija **Siguiente**.

1. En la página **Revisar y crear**, compruebe que la información que ha introducido es correcta y, a continuación, seleccione **Añadir origen de datos**. También puede elegir editar la información desde esta página. El origen de datos aparecerá en la página **Orígenes de datos** una vez que el origen de datos se haya agregado correctamente.

------
#### [ API ]

**Para conectarse a Amazon Kendra SharePoint**

Debe especificar un JSON del [esquema del origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/ds-schemas.html) mediante la API [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_TemplateConfiguration.html). Debe proporcionar la siguiente información:
+ **Origen de datos**: defina el tipo de origen de datos como `SHAREPOINTV2` cuando utilice el esquema JSON [https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html](https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html). Además, defina el origen de datos como `TEMPLATE` al llamar a la API [https://docs.aws.amazon.com/kendra/latest/dg/API_CreateDataSource.html](https://docs.aws.amazon.com/kendra/latest/dg/API_CreateDataSource.html).
+ **Metadatos del punto de conexión del repositorio**: especifique el `tenantID` `domain` extremo `siteUrls` de la SharePoint instancia.
+ **Modo de sincronización**: especifique cómo Amazon Kendra debe actualizarse el índice cuando cambie el contenido de la fuente de datos. Al sincronizar la fuente de datos Amazon Kendra por primera vez, todo el contenido se rastrea e indexa de forma predeterminada. Debe ejecutar una sincronización completa de los datos si la sincronización inicial falló, incluso si no selecciona la sincronización completa como opción de modo de sincronización. Puede elegir entre las siguientes opciones:
  + `FORCED_FULL_CRAWL` para volver a indexar todo el contenido, reemplazando el contenido existente cada vez que el origen de datos se sincronice con el índice.
  + `FULL_CRAWL`para indexar solo el contenido nuevo, modificado y eliminado cada vez que la fuente de datos se sincronice con el índice. Amazon Kendra puede usar el mecanismo de la fuente de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido que ha cambiado desde la última sincronización.
  + `CHANGE_LOG`para indexar solo el contenido nuevo y modificado cada vez que la fuente de datos se sincronice con el índice. Amazon Kendra puede usar el mecanismo de la fuente de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido que ha cambiado desde la última sincronización.
+ **Rastreador de identidades**: especifique si se debe activar el rastreador de identidades de Amazon Kendra. El rastreador de identidades utiliza la información de la lista de control de acceso (ACL) de los documentos para filtrar los resultados de la búsqueda en función del acceso del usuario o del grupo a los documentos. Si tiene una ACL para sus documentos y decide utilizarla, también puede optar por activar el rastreador Amazon Kendra de identidades para configurar el [filtrado contextual de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#context-filter-user-incl-datasources) de los resultados de búsqueda. De lo contrario, si el rastreador de identidades está desactivado, todos los documentos se pueden buscar públicamente. Si quieres usar el control de acceso para tus documentos y el rastreador de identidad está desactivado, también puedes usar la [PutPrincipalMapping](https://docs.aws.amazon.com/kendra/latest/APIReference/API_PutPrincipalMapping.html)API para cargar información de acceso de usuarios y grupos para filtrar el contexto de los usuarios.
**nota**  
El rastreador de identidades solo está disponible cuando establece `crawlAcl` en `true`.
+ **Propiedades adicionales del repositorio**: especifique lo siguiente:
  + (Para Azure AD) `s3bucketName` y `s3certificateName` que utiliza para almacenar el certificado X.509 autofirmado de Azure AD.
  + Tipo de autenticación (`auth_Type`) que usa, ya sea `OAuth2`, `OAuth2App`, `OAuth2Certificate`, `Basic`, `OAuth2_RefreshToken`, `NTLM` o `Kerberos`.
  + Versión (`version`) que usa, ya sea `Server` o `Online`. Si usa `Server`, puede especificar adicionalmente la `onPremVersion` como `2013`, `2016`, `2019` o`SubscriptionEdition`.
+ **Nombre secreto de recurso de Amazon (ARN): proporcione** el nombre de recurso de Amazon (ARN) de un Secrets Manager secreto que contenga las credenciales de autenticación que creó en su cuenta. SharePoint 

  Si usa la autenticación SharePoint en línea, puede elegir entre la autenticación básica, OAuth 2.0, solo para aplicaciones de Azure AD o solo para aplicaciones. SharePoint La siguiente es la estructura JSON mínima que debe contener el secreto para cada opción de autenticación:
  + **Autenticación básica**

    ```
    {
        "userName": "SharePoint account user name",
        "password": "SharePoint account password"
    }
    ```
  + **OAuth Autenticación 2.0**

    ```
    {
        "clientId": "client id generated when registering SharePoint with Azure AD",
        "clientSecret": "client secret generated when registering SharePoint with Azure AD",
        "userName": "SharePoint account user name",
        "password": "SharePoint account password"
    }
    ```
  + **Autenticación App-Only de Azure AD**

    ```
    {
        "clientId": "client id generated when registering SharePoint with Azure AD",
        "privateKey": "private key to authorize connection with Azure AD"
    }
    ```
  + **SharePoint Autenticación solo mediante aplicación**

    ```
    {
        "clientId": "client id generated when registering SharePoint for App Only at Tenant Level",
        "clientSecret": "client secret generated when registering SharePoint for App Only at Tenant Level",
        "adClientId": "client id generated while registering SharePoint with Azure AD",
        "adClientSecret": "client secret generated while registering SharePoint with Azure AD"
    }
    ```
  + **OAuth Autenticación con token de actualización 2.0**

    ```
    {
        "clientId": "client id generated when registering SharePoint with Azure AD",
        "clientSecret": "client secret generated when registering SharePoint with Azure AD",
        "refreshToken": "refresh token generated to connect to SharePoint"
    }
    ```

  Si usa SharePoint Server, puede elegir entre la autenticación SharePoint solo por aplicación, la autenticación NTLM y la autenticación Kerberos. La siguiente es la estructura JSON mínima que debe contener el secreto para cada opción de autenticación:
  + ** SharePoint Autenticación solo por aplicación**

    ```
    {
        "siteUrlsHash": "Hash representation of SharePoint site URLs",
        "clientId": "client id generated when registering SharePoint for App Only at Site Level",
        "clientSecret": "client secret generated when registering SharePoint for App Only at Site Level" 
    }
    ```
  + ** SharePoint Autenticación solo para aplicaciones con el dominio de la autorización del IDP**

    ```
    {
        "siteUrlsHash": "Hash representation of SharePoint site URLs",
        "clientId": "client id generated when registering SharePoint for App Only at Site Level",
        "clientSecret": "client secret generated when registering SharePoint for App Only at Site Level",
        "ldapUrl": "LDAP Account url eg. ldap://example.com:389",
        "baseDn": "LDAP Account base dn eg. CN=Users,DC=sharepoint,DC=com",
        "ldapUser": "LDAP account user name",
        "ldapPassword": "LDAP account password"
    }
    ```
  + **(Solo para servidor) Autenticación NTLM o de Kerberos**

    ```
    {
        "siteUrlsHash": "Hash representation of SharePoint site URLs",
        "userName": "SharePoint account user name",
        "password": "SharePoint account password"
    }
    ```
  + **(Solo para servidor) Autenticación NTLM o de Kerberos con autorización de dominio de IDP**

    ```
    {
        "siteUrlsHash": "Hash representation of SharePoint site URLs",
        "userName": "SharePoint account user name",
        "password": "SharePoint account password",
        "ldapUrl": "ldap://example.com:389",
        "baseDn": "CN=Users,DC=sharepoint,DC=com",
        "ldapUser": "LDAP account user name",
        "ldapPassword": "LDAP account password"
    }
    ```
+ **IAM rol**: especifique `RoleArn` cuándo llama `CreateDataSource` para proporcionar a un IAM rol permisos para acceder a su Secrets Manager secreto y llamar al público requerido APIs para el conector y. SharePoint Amazon Kendra Para obtener más información, consulte [Roles de IAM para orígenes de datos de SharePoint ](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds).

También puede añadir las siguientes características opcionales:
+  **Nube privada virtual (VPC)**: especifique a `VpcConfiguration` cuándo llamar a `CreateDataSource`. Para obtener más información, consulte [¿Se está configurando Amazon Kendra para usar un Amazon VPC](vpc-configuration.md).
+  **Filtros de inclusión y exclusión**: puede especificar si desea incluir o excluir determinados archivos y otro contenido. OneNotes
**nota**  
La mayoría de los orígenes de datos utilizan patrones de expresiones regulares, que son patrones de inclusión o exclusión denominados filtros. Si especifica un filtro de inclusión, solo se indexará el contenido que coincida con el filtro de inclusión. Los documentos que no coincidan con el filtro de inclusión no se indexan. Si especifica un filtro de inclusión y exclusión, los documentos que coincidan con el filtro de exclusión no se indexarán, aunque coincidan con el filtro de inclusión.
+  **Asignaciones de campos**: elija asignar los campos del origen de datos de SharePoint a los campos de índice de Amazon Kendra . Para obtener más información, consulte [Asignación de campos de origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/field-mapping.html).
**nota**  
El campo del cuerpo del documento o el cuerpo del documento equivalente de sus documentos es obligatorio Amazon Kendra para poder buscarlos. Debe asignar el nombre del campo del cuerpo del documento en el origen de datos al nombre del campo del índice `_document_body`. Todos los demás campos son opcionales.

Para obtener una lista de otras claves JSON importantes que debe configurar, consulte el [Esquema de plantilla de SharePoint ](https://docs.aws.amazon.com/kendra/latest/dg/ds-schemas.html#ds-schema-sharepoint).

------

## Notas

+ El conector admite asignaciones de campos personalizados solo para la entidad **Archivos**.
+ Para todas las versiones SharePoint del servidor, el token ACL debe estar en minúsculas. Para **correos electrónicos con dominio de IDP** e **ID de correo electrónico con ACL de dominio personalizado**, por ejemplo:*user@sharepoint2019.com*. Para **dominio\$1 usuario con ACL de dominio**, por ejemplo:*sharepoint2013\$1user*.
+ Cuando las listas de control de acceso (ACLs) están habilitadas, la opción «Sincronizar solo contenido nuevo o modificado» no está disponible debido a limitaciones de la SharePoint API. En su lugar, te recomendamos usar los modos «Sincronización completa» o «Sincronización de contenido nuevo, modificado o eliminado», o desactivarlos ACLs si necesitas usar este modo de sincronización.
+ El conector no admite el modo de registro de cambios ni la **sincronización de contenido nuevo o modificado** para SharePoint 2013.
+ Si el nombre de una entidad contiene un carácter `%`, el conector omitirá estos archivos debido a las limitaciones de la API.
+ OneNote El conector solo puede rastrearlo con un ID de inquilino y con la autenticación OAuth 2.0, el token de actualización OAuth 2.0 o la autenticación solo por SharePoint SharePoint aplicación activada en línea.
+ El conector rastrea la primera sección de un OneNote documento utilizando únicamente su nombre predeterminado, incluso si se cambia el nombre del documento.
+ **El conector rastrea los enlaces en la edición SharePoint 2019, SharePoint en línea y en la edición de suscripción, solo si se seleccionan **páginas** y **archivos** como entidades que se rastrearán además de los enlaces.**
+ El conector rastrea los enlaces en SharePoint 2013 y SharePoint 2016 si se selecciona **Links** como entidad para rastrearlos.
+ El conector rastrea los archivos adjuntos y los comentarios solo cuando **Datos de la lista** también se selecciona como entidad que se va a rastrear.
+ El conector rastrea los archivos adjuntos de eventos solo cuando **Eventos** también se selecciona como entidad que se va a rastrear.
+ Para la versión SharePoint en línea, el token ACL estará en minúsculas. Por ejemplo, si el **nombre principal del usuario** está *MaryMajor@domain.com* en el portal de Azure, el token ACL del SharePoint conector lo estará*marymajor@domain.com*.
+ En **Identity Crawler** para SharePoint Online y Server, si quieres rastrear grupos anidados, tienes que activar el rastreo local y el rastreo de grupos de AD.
+ Si utilizas SharePoint Internet y el nombre principal del usuario de Azure Portal es una combinación de mayúsculas y minúsculas, la SharePoint API lo convierte internamente a minúsculas. Por este motivo, el Amazon Kendra SharePoint conector pone la ACL en minúsculas.

# Microsoft SQL Server


**nota**  
El conector de Microsoft SQL Server seguirá siendo totalmente compatible con los clientes actuales hasta el 31 de mayo de 2026. Si bien este conector ya no está disponible para los nuevos usuarios, los usuarios actuales pueden seguir utilizándolo sin interrupción. Desarrollamos de forma continua nuestra cartera de conectores para ofrecer soluciones más escalables y personalizables. Para futuras integraciones, le recomendamos que valore el marco de conectores personalizados de Amazon Kendra[1], diseñado de manera más flexible para una variedad más amplia de casos de uso empresariales.

Microsoft SQL Server es un sistema de administración de bases de datos relacionales (RDBMS) desarrollado por Microsoft. Si es un Microsoft SQL Server usuario, puede usarlo Amazon Kendra para indexar su fuente Microsoft SQL Server de datos. El conector Amazon Kendra Microsoft SQL Server de fuente de datos es compatible con MS SQL Server 2019.

Puede conectarse Amazon Kendra a su fuente Microsoft SQL Server de datos mediante la [Amazon Kendraconsola](https://console.aws.amazon.com/kendra/) y la [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html)API.

Para solucionar problemas del conector de la fuente de Amazon Kendra Microsoft SQL Server datos, consulte[Solución de problemas con los orígenes de datos](troubleshooting-data-sources.md).

**Topics**
+ [

## Características admitidas
](#supported-features-ms-sql-server)
+ [

## Requisitos previos
](#prerequisites-ms-sql-server)
+ [

## Instrucciones de conexión
](#data-source-procedure-ms-sql-server)
+ [

## Notas
](#ms-sql-server-notes)

## Características admitidas

+ Asignaciones de campo
+ Filtrado de contexto de usuario
+ Filtros de inclusión/exclusión
+ Sincronizaciones completas e incrementales del contenido
+ Nube privada virtual (VPC)

## Requisitos previos


Antes de poder utilizarla Amazon Kendra para indexar la fuente de Microsoft SQL Server datos, realice estos cambios en sus AWS cuentas Microsoft SQL Server y.

**En Microsoft SQL Server, asegúrese de que**:
+ Ha anotado el nombre de usuario y contraseña de la base de datos.
**importante**  
Como práctica recomendada, proporcione credenciales de base Amazon Kendra de datos de solo lectura.
+ Ha copiado la URL, el puerto y la instancia del host de la base de datos.
+ Ha comprobado que cada documento es único en Microsoft SQL Server y en otros orígenes de datos que vaya a utilizar para el mismo índice. Cada origen de datos que desee utilizar para un índice no debe contener el mismo documento en varios orígenes de datos. IDs Los documentos son globales para un índice y deben ser únicos por índice.

**En el tuyoCuenta de AWS, asegúrate de tener:**
+ [Creó un Amazon Kendra índice](https://docs.aws.amazon.com/kendra/latest/dg/create-index.html) y, si usa la API, anotó el ID del índice.
+ [Creó un IAM rol](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds) para su fuente de datos y, si usa la API, anotó el ARN del IAM rol.
**nota**  
Si cambias el tipo de autenticación y las credenciales, debes actualizar tu IAM rol para acceder al ID AWS Secrets Manager secreto correcto.
+ Ha guardado sus credenciales de autenticación de Microsoft SQL Server en un secreto de AWS Secrets Manager y, si utiliza la API, ha anotado el ARN del secreto.
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).

Si no tiene un IAM rol o secreto existente, puede usar la consola para crear un nuevo IAM rol y un Secrets Manager secreto al conectar su fuente de Microsoft SQL Server datosAmazon Kendra. Si utiliza la API, debe proporcionar el ARN de un IAM rol y un Secrets Manager secreto existentes y un ID de índice.

## Instrucciones de conexión


Para conectarse Amazon Kendra a su fuente de Microsoft SQL Server datos, debe proporcionar los detalles de sus Microsoft SQL Server credenciales para Amazon Kendra poder acceder a sus datos. Si aún no lo ha configuradoMicrosoft SQL Server, Amazon Kendra consulte[Requisitos previos](#prerequisites-ms-sql-server).

------
#### [ Console ]

**Para conectarse Amazon Kendra a Microsoft SQL Server** 

1. Inicie sesión en la [Amazon Kendraconsola Consola de administración de AWS y ábrala](https://console.aws.amazon.com/kendra/).

1. En el panel de navegación izquierdo, elija **Índices** y, a continuación, elija el índice que desee usar de la lista de índices.
**nota**  
Puede elegir configurar o editar los ajustes de **Control de acceso de usuarios** en la **Configuración del índice**. 

1. En la página **Introducción**, seleccione **Agregar origen de datos**.

1. En la página **Agregar origen de datos**, seleccione el **Conector de Microsoft SQL Server** y, a continuación, seleccione **Agregar conector**. Si usa la versión 2 (si corresponde), elija el **Conector de Microsoft SQL Server** con la etiqueta “V2.0”.

1. En la página **Especificar detalles del origen de datos**, introduzca la siguiente información:

   1. En **Nombre y descripción**, en **Nombre del origen de datos**: introduzca un nombre para el origen de datos. Puede incluir guiones, pero no espacios.

   1. (Opcional)** Descripción**: introduzca una descripción opcional para el origen de datos.

   1. En **Idioma predeterminado**: elija un idioma para filtrar los documentos para el índice. A menos que especifique lo contrario, el idioma predeterminado es el inglés. El idioma especificado en los metadatos del documento anula el idioma seleccionado.

   1. En **Etiquetas**, para **añadir una nueva etiqueta**: incluye etiquetas opcionales para buscar y filtrar tus recursos o realizar un seguimiento de tus AWS costes.

   1. Elija **Siguiente**.

1. En la página **Definir acceso y seguridad**, introduzca la siguiente información:

   1. En **Origen**, introduzca la siguiente información:

   1.  **Host**: introduzca el nombre del host de la base de datos.

   1.  **Puerto**: introduzca el puerto de la base de datos.

   1.  **Instancia**: introduzca la instancia de la base de datos.

   1. **Habilitar la ubicación del certificado SSL**: elija introducir la Amazon S3 ruta al archivo de certificado SSL.

   1. En **Autenticación**, introduzca la siguiente información:

      1. **AWS Secrets Managersecreto**: elija un secreto existente o cree uno nuevo Secrets Manager para almacenar sus credenciales de Microsoft SQL Server autenticación. Si decide crear un secreto nuevo, se abrirá una ventana de secreto de AWS Secrets Manager.

        1. Introduzca la siguiente información en la **ventana Crear un secreto de AWS Secrets Manager**:

           1. **Nombre del secreto**: un nombre para su secreto. El prefijo 'AmazonKendra- Microsoft SQL Server -' se añade automáticamente a tu nombre secreto.

           1. Para el **nombre de usuario** y la **contraseña de la base de datos**: introduzca los valores de las credenciales de autenticación que ha copiado de la base de datos. 

        1. Seleccione **Save**.

   1. **Nube privada virtual (VPC)**: puede optar por utilizar una VPC. Si es así, debe agregar **Subredes** y **Grupos de seguridad de VPC**.

   1. **IAMrol**: elige un IAM rol existente o crea uno nuevo IAM para acceder a las credenciales del repositorio y al contenido del índice.
**nota**  
IAMlos roles utilizados para los índices no se pueden usar para las fuentes de datos. Si no está seguro de si un rol existente se utiliza para un índice o para las preguntas frecuentes, elija **Crear un nuevo rol** para evitar errores.

   1. Elija **Siguiente**.

1. En la página **Configurar ajustes de sincronización**, introduzca la siguiente información:

   1. En **Ámbito de sincronización**, seleccione de entre las siguientes opciones:
      + **Consulta SQL**: introduzca instrucciones de consulta SQL, como las operaciones SELECT y JOIN. Las consultas de SQL deben ser inferiores a 32 KB. Amazon Kendra rastreará todo el contenido de la base de datos que coincida con su consulta.
**nota**  
Si el nombre de una tabla incluye caracteres especiales (no alfanuméricos), debe utilizar corchetes alrededor del nombre de la tabla. Por ejemplo, *select \$1 from [my-database-table]*
      + **Columna de clave principal**: proporcione la clave principal de la tabla de la base de datos. Esto identifica una tabla dentro de la base de datos.
      + **Columna de título**: proporcione el nombre de la columna del título del documento en la tabla de la base de datos.
      + **Columna de cuerpo**: proporcione el nombre de la columna del cuerpo del documento en la tabla de la base de datos.

   1. En **Configuración adicional (*opcional*)**, elija una de las siguientes opciones para sincronizar contenido específico en lugar de sincronizar todos los archivos:
      + **Columnas de detección de cambios**: introduzca los nombres de las columnas que se Amazon Kendra utilizarán para detectar cambios en el contenido. Amazon Kendravolverá a indexar el contenido cuando se produzca un cambio en alguna de estas columnas.
      + ** IDsColumna de usuario**: introduzca el nombre de la columna que contiene el usuario IDs al que se le permitirá acceder al contenido.
      + **Columna de grupos**: introduzca el nombre de la columna que contiene los grupos a los que se dará acceso al contenido.
      + ** URLsColumna de origen**: introduzca el nombre de la columna que contiene el origen que se va URLs a indexar.
      + **Columna de marcas de tiempo**: introduzca el nombre de la columna que contiene las marcas de tiempo. Amazon Kendrautiliza la información de las marcas de tiempo para detectar cambios en el contenido y sincronizar solo el contenido modificado. 
      + **Columna de zonas horarias**: introduzca el nombre de la columna que contiene las zonas horarias del contenido que se va a rastrear.
      + **Formato de marcas temporales**: introduzca el nombre de la columna que contiene los formatos de marcas temporales que se deben utilizar para detectar cambios en el contenido y volver a sincronizar su contenido.

   1. **Modo de sincronización**: elija cómo desea actualizar el índice cuando cambie el contenido del origen de datos. Al sincronizar la fuente de datos Amazon Kendra por primera vez, todo el contenido se rastrea e indexa de forma predeterminada. Debe ejecutar una sincronización completa de los datos si la sincronización inicial falló, incluso si no selecciona la sincronización completa como opción de modo de sincronización.
      + Sincronización completa: se vuelve a indexar todo el contenido, reemplazando el contenido existente cada vez que el origen de datos se sincronice con el índice.
      + Sincronización de lo nuevo y modificado: se indexa solo el contenido nuevo y modificado cada vez que el origen de datos se sincroniza con el índice. Amazon Kendra puede utilizar el mecanismo del origen de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido modificado desde la última sincronización.
      + Sincronización nueva, modificada o eliminada: indexe solo el contenido nuevo, modificado y eliminado cada vez que la fuente de datos se sincronice con el índice. Amazon Kendrapuede usar el mecanismo de la fuente de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido que ha cambiado desde la última sincronización.

   1. En **Programa de ejecución de sincronización**, en **Frecuencia**: la frecuencia con la que Amazon Kendra se sincronizará con el origen de datos.

   1. Elija **Siguiente**.

1. En la página **Establecer asignaciones de campos**, especifique la siguiente información:

   1. Seleccione uno de los campos de fuente de datos predeterminados generados (**Documento IDs****, Títulos** de documentos y **Fuente URLs**) que desee mapear para Amazon Kendra indexarlos.

   1.  **Agregar campo**: para agregar campos de origen de datos personalizados para crear un nombre de campo de índice al que asignarlos y el tipo de datos del campo.

   1. Elija **Siguiente**.

1. En la página **Revisar y crear**, compruebe que la información que ha introducido es correcta y, a continuación, seleccione **Añadir origen de datos**. También puede elegir editar la información desde esta página. El origen de datos aparecerá en la página **Orígenes de datos** una vez que el origen de datos se haya agregado correctamente.

------
#### [ API ]

**Para conectarse a Amazon Kendra Microsoft SQL Server**

Debe especificar lo siguiente mediante la [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html)API:
+ **Origen de datos**: defina el tipo de origen de datos como `JDBC` cuando utilice el esquema JSON [https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html](https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html). Además, defina el origen de datos como `TEMPLATE` al llamar a la API [https://docs.aws.amazon.com/kendra/latest/dg/API_CreateDataSource.html](https://docs.aws.amazon.com/kendra/latest/dg/API_CreateDataSource.html).
+ **Tipo de base de datos**: debe especificar el tipo de base de datos como `sqlserver`.
+ **Consulta SQL**: especifique instrucciones de consulta SQL, como las operaciones SELECT y JOIN. Las consultas de SQL deben ser inferiores a 32 KB. Amazon Kendra rastreará todo el contenido de la base de datos que coincida con su consulta.
**nota**  
Si el nombre de una tabla incluye caracteres especiales (no alfanuméricos), debe utilizar corchetes alrededor del nombre de la tabla. Por ejemplo, *select \$1 from [my-database-table]*
+ **Modo de sincronización**: especifique cómo Amazon Kendra debe actualizarse el índice cuando cambie el contenido de la fuente de datos. Al sincronizar el origen de datos con Amazon Kendra por primera vez, todo el contenido se rastrea y se indexa de forma predeterminada. Debe ejecutar una sincronización completa de los datos si la sincronización inicial falló, incluso si no selecciona la sincronización completa como opción de modo de sincronización. Puede elegir entre las siguientes opciones:
  + `FORCED_FULL_CRAWL` para volver a indexar todo el contenido, reemplazando el contenido existente cada vez que el origen de datos se sincronice con el índice.
  + `FULL_CRAWL` para indexar solo el contenido nuevo, modificado y eliminado cada vez que el origen de datos se sincronice con el índice. Amazon Kendra puede utilizar el mecanismo del origen de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido modificado desde la última sincronización.
  + `CHANGE_LOG` para indexar solo el contenido nuevo y modificado cada vez que el origen de datos se sincronice con el índice. Amazon Kendra puede utilizar el mecanismo del origen de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido modificado desde la última sincronización.
+ **Nombre secreto de recurso de Amazon (ARN): proporcione** el nombre de recurso de Amazon (ARN) de un Secrets Manager secreto que contenga las credenciales de autenticación que creó en su cuenta. Microsoft SQL Server El secreto se almacena en una estructura JSON con las siguientes claves:

  ```
  {
      "user name": "database user name",
      "password": "password"
  }
  ```
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).
+ **IAMrol**: especifique `RoleArn` cuándo llama `CreateDataSource` para proporcionar un IAM rol con permisos para acceder a su Secrets Manager secreto y para llamar al público requerido APIs para el conector y. Microsoft SQL Server Amazon Kendra Para obtener más información, consulte [Roles de IAM para orígenes de datos de Microsoft SQL Server](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds).

También puede añadir las siguientes características opcionales:
+  **Nube privada virtual (VPC)**: especifique a `VpcConfiguration` cuándo llamar a `CreateDataSource`. Para obtener más información, consulte [¿Se está configurando Amazon Kendra para usar un Amazon VPC](vpc-configuration.md).
+  **Filtros de inclusión y exclusión**: puede especificar si desea incluir contenido específico mediante el usuario IDs, los grupos, la fuente URLs, las marcas horarias y las zonas horarias. 
+  **Filtrado de contexto de usuario y control de acceso**: si hay una lista de control de acceso (ACL) para los documentos, Amazon Kendra la rastreará. La información de la ACL se utiliza para filtrar los resultados de búsqueda en función del acceso del usuario o su grupo a los documentos. Para obtener más información, consulte [Filtrado de contexto de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#datasource-context-filter).
+  **Asignaciones de campos**: elija asignar los campos del origen de datos de Microsoft SQL Server a los campos de índice de Amazon Kendra. Para obtener más información, consulte [Asignación de campos de origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/field-mapping.html).
**nota**  
El campo del cuerpo del documento o el cuerpo del documento equivalente de sus documentos es obligatorio Amazon Kendra para poder buscarlos. Debe asignar el nombre del campo del cuerpo del documento en el origen de datos al nombre del campo del índice `_document_body`. Todos los demás campos son opcionales.

Para obtener una lista de otras claves JSON importantes que debe configurar, consulte [Esquema de plantilla de Microsoft SQL Server](ds-schemas.md#ds-ms-sql-server-schema).

------

## Notas

+ Las filas de la base de datos eliminadas no se registrarán cuando se Amazon Kendra compruebe si hay contenido actualizado.
+ El tamaño de los nombres y valores de los campos de una fila de la base de datos no puede superar los 400 KB.
+ Si tiene una gran cantidad de datos en la fuente de datos de la base de datos y no desea Amazon Kendra indexar todo el contenido de la base de datos después de la primera sincronización, puede optar por sincronizar solo los documentos nuevos, modificados o eliminados.
+ Como práctica recomendada, proporcione credenciales de base Amazon Kendra de datos de solo lectura.
+ Como práctica recomendada, evite añadir tablas con datos confidenciales o información de identificación personal (PII).

# Microsoft Teams


Microsoft Teams es una herramienta de colaboración empresarial para mensajería, reuniones e intercambio de archivos. Si es usuario de Microsoft Teams, puede usarlo Amazon Kendra para indexar su fuente de datos de Microsoft Teams.

Puedes conectarte Amazon Kendra a tu fuente de datos de Microsoft Teams mediante la [Amazon Kendraconsola](https://console.aws.amazon.com/kendra/) y la [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_TemplateConfiguration.html)API.

Para solucionar problemas del conector de fuente de datos de Amazon Kendra Microsoft Teams, consulte[Solución de problemas con los orígenes de datos](troubleshooting-data-sources.md).

**Topics**
+ [

## Características admitidas
](#supported-features-teams)
+ [

## Requisitos previos
](#prerequisites-teams)
+ [

## Instrucciones de conexión
](#data-source-procedure-teams)
+ [

## Más información
](#teams-learn-more)
+ [

## Notas
](#teams-notes)

## Características admitidas

+ Asignaciones de campo
+ Control de acceso de usuarios
+ Filtros de inclusión/exclusión
+ Sincronizaciones completas e incrementales del contenido
+ Nube privada virtual (VPC)

## Requisitos previos


Antes de poder utilizarla Amazon Kendra para indexar la fuente de datos de Microsoft Teams, realice estos cambios en sus AWS cuentas y equipos de Microsoft.

**En Microsoft Teams, asegúrese de que:**
+ Ha creado una cuenta de Microsoft Teams en Office 365.
+ Ha apuntado su ID de inquilino de Microsoft 365. Puede encontrar su ID de inquilino en las propiedades de su portal de Azure Active Directory o en su OAuth aplicación.
+ Configuró una OAuth aplicación en el portal de Azure y anotó el ID de cliente y el secreto del cliente o las credenciales del cliente. Consulte este [tutorial de Microsoft](https://learn.microsoft.com/en-us/power-apps/developer/data-platform/walkthrough-register-app-azure-active-directory) y este [ejemplo de registro de aplicación](https://learn.microsoft.com/en-us/azure/healthcare-apis/register-application) para obtener más información.
**nota**  
Al crear o registrar una aplicación en el portal de Azure, el ID del secreto representa el valor del secreto real. Debe anotar o guardar el valor del secreto real inmediatamente al crear el secreto y la aplicación. Para acceder a su secreto, seleccione el nombre de la aplicación en el portal de Azure y, a continuación, vaya a la opción de menú relativa a los certificados y secretos.  
Puede acceder a su ID de cliente seleccionando el nombre de su aplicación en el portal de Azure y, a continuación, yendo a la página de información general. El ID de la aplicación (cliente) es el ID del cliente.
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).
+ Ha añadido los permisos necesarios. Puede optar por agregar todos los permisos o puede limitar el alcance seleccionando menos permisos en función de las entidades que desee rastrear. En la siguiente tabla se indican los permisos en el nivel de aplicación por entidad correspondiente:    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/data-source-teams.html)
+ Comprobó que cada documento es único en Microsoft Teams y en otros orígenes que planea usar para el mismo índice. Cada origen de datos que desee utilizar para un índice no debe contener el mismo documento en varios orígenes de datos. IDs Los documentos son globales en relación con un índice y deben ser únicos por índice.

**En el tuyoCuenta de AWS, asegúrate de tener:**
+ [Creó un Amazon Kendra índice](https://docs.aws.amazon.com/kendra/latest/dg/create-index.html) y, si usa la API, anotó el ID del índice.
+ [Creó un IAM rol](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds) para su fuente de datos y, si usa la API, anotó el ARN del IAM rol.
**nota**  
Si cambias el tipo de autenticación y las credenciales, debes actualizar tu IAM rol para acceder al ID AWS Secrets Manager secreto correcto.
+ Ha guardado sus credenciales de autenticación de Microsoft Teams en un secreto de AWS Secrets Manager y, si utiliza la API, ha anotado el ARN del secreto.
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).

Si no tienes un IAM rol o secreto existente, puedes usar la consola para crear un nuevo IAM rol y Secrets Manager secreto al conectar tu fuente de datos de Microsoft Teams aAmazon Kendra. Si utiliza la API, debe proporcionar el ARN de un IAM rol y un Secrets Manager secreto existentes y un ID de índice.

## Instrucciones de conexión


Para conectarse Amazon Kendra a su fuente de datos de Microsoft Teams, debe proporcionar los detalles necesarios de su fuente de datos de Microsoft Teams para que Amazon Kendra pueda acceder a sus datos. Si aún no ha configurado Microsoft Teams paraAmazon Kendra, consulte[Requisitos previos](#prerequisites-teams).

------
#### [ Console ]

**Para conectarse Amazon Kendra a Microsoft Teams** 

1. Inicia sesión en la [Amazon Kendraconsola Consola de administración de AWS](https://console.aws.amazon.com/kendra/) y ábrela.

1. En el panel de navegación izquierdo, elija **Índices** y, a continuación, elija el índice que desee usar de la lista de índices.
**nota**  
Puede elegir configurar o editar los ajustes de **Control de acceso de usuarios** en la **Configuración del índice**. 

1. En la página **Introducción**, seleccione **Agregar origen de datos**.

1. En la página **Agregar origen de datos**, seleccione el **Conector de Microsoft Teams** y, a continuación, seleccione **Agregar conector**. Si usa la versión 2 (si corresponde), elija el **Conector de Microsoft Teams** con la etiqueta “V2.0”.

1. En la página **Especificar detalles del origen de datos**, introduzca la siguiente información:

   1. En **Nombre y descripción**, en **Nombre del origen de datos**: introduzca un nombre para el origen de datos. Puede incluir guiones, pero no espacios.

   1. (Opcional)** Descripción**: introduzca una descripción opcional para el origen de datos.

   1. En **Idioma predeterminado**: elija un idioma para filtrar los documentos para el índice. A menos que especifique lo contrario, el idioma predeterminado es el inglés. El idioma especificado en los metadatos del documento anula el idioma seleccionado.

   1. En **Etiquetas**, para **añadir una nueva etiqueta**: incluye etiquetas opcionales para buscar y filtrar tus recursos o realizar un seguimiento de tus AWS costes.

   1. Elija **Siguiente**.

1. En la página **Definir acceso y seguridad**, introduzca la siguiente información:

   1. **ID de inquilina**: introduzca su ID de inquilino de Microsoft 365. Puede encontrar su ID de inquilino en las propiedades de su portal de Azure Active Directory o en su OAuth aplicación.

   1. **Autorización**: active o desactive la información de la lista de control de acceso (ACL) para los documentos, si tiene una ACL y desea usarla para el control de acceso. La ACL especifica a qué documentos pueden acceder los usuarios y los grupos. La información de la ACL se utiliza para filtrar los resultados de búsqueda en función del acceso del usuario o su grupo a los documentos. Para obtener más información, consulte [Filtrado de contexto de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#context-filter-user-incl-datasources).

   1. **AWS Secrets Managersecreto**: elija un secreto existente o cree uno nuevo Secrets Manager para almacenar sus credenciales de autenticación de Microsoft Teams. Si decide crear un secreto nuevo, se abrirá una ventana de secreto de AWS Secrets Manager.

      1. Introduzca la siguiente información en la **ventana Crear un secreto de AWS Secrets Manager**:

         1. **Nombre del secreto**: un nombre para su secreto. El prefijo 'AmazonKendra-Microsoft Teams-' se añade automáticamente a tu nombre secreto.

         1. En **ID de cliente** y **Secreto de cliente**: introduzca las credenciales de autenticación que ha configurado en Microsoft Teams en el portal de Azure.

      1. Guarde y agregue el secreto.

   1. **Modelo de pago**: puede elegir un modelo de licencia y pago para su cuenta de Microsoft Teams. Los modelos de pago del modelo A están restringidos a los modelos de licencia y pago que requieren el cumplimiento de las normas de seguridad. Los modelos de pago del modelo B son adecuados para los modelos de licencia y pago que no requieren el cumplimiento de las normas de seguridad.

   1. **Nube privada virtual (VPC)**: puede optar por utilizar una VPC. Si es así, debe agregar **Subredes** y **Grupos de seguridad de VPC**.

   1. **Rastreador de identidades**: especifique si se debe activar el rastreador de identidades de Amazon Kendra. El rastreador de identidades utiliza la información de la lista de control de acceso (ACL) de los documentos para filtrar los resultados de la búsqueda en función del acceso del usuario o del grupo a los documentos. Si tiene una ACL para sus documentos y decide utilizarla, también puede optar por activar el rastreador de identidades para configurar el filtrado Amazon Kendra de los resultados de búsqueda según el [contexto del usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#context-filter-user-incl-datasources). De lo contrario, si el rastreador de identidades está desactivado, todos los documentos se pueden buscar públicamente. Si quieres usar el control de acceso para tus documentos y el rastreador de identidad está desactivado, también puedes usar la [PutPrincipalMapping](https://docs.aws.amazon.com/kendra/latest/APIReference/API_PutPrincipalMapping.html)API para cargar información de acceso de usuarios y grupos para filtrar el contexto de los usuarios.

   1. **IAMrol**: elija un IAM rol existente o cree uno nuevo IAM para acceder a las credenciales del repositorio y al contenido del índice.
**nota**  
IAMlos roles utilizados para los índices no se pueden usar para las fuentes de datos. Si no está seguro de si un rol existente se utiliza para un índice o para las preguntas frecuentes, elija **Crear un nuevo rol** para evitar errores.

   1. Elija **Siguiente**.

1. En la página **Configurar ajustes de sincronización**, introduzca la siguiente información:

   1. **Contenidos que se sincronizarán**: seleccione los tipos de contenido que quiera rastrear. Puede elegir rastrear el contenido del chat, los equipos y el calendario.

   1. **Configuración adicional**: especifique determinadas fechas de inicio y finalización del calendario, los correos electrónicos de los usuarios, los nombres de los equipos y los nombres de los canales, los archivos adjuntos y. OneNotes

   1. **Modo de sincronización**: elija cómo desea actualizar el índice cuando cambie el contenido del origen de datos. Cuando sincronizas tu fuente de datos Amazon Kendra por primera vez, todo el contenido se rastrea e indexa de forma predeterminada. Debe ejecutar una sincronización completa de los datos si la sincronización inicial falló, incluso si no selecciona la sincronización completa como opción de modo de sincronización.
      + Sincronización completa: se vuelve a indexar todo el contenido, reemplazando el contenido existente cada vez que el origen de datos se sincronice con el índice.
      + Sincronización de lo nuevo y modificado: se indexa solo el contenido nuevo y modificado cada vez que el origen de datos se sincroniza con el índice. Amazon Kendra puede utilizar el mecanismo del origen de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido modificado desde la última sincronización.
      + Sincronización nueva, modificada o eliminada: indexe solo el contenido nuevo, modificado y eliminado cada vez que la fuente de datos se sincronice con el índice. Amazon Kendrapuede usar el mecanismo de la fuente de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido que ha cambiado desde la última sincronización.

   1. En **Programación de ejecución de sincronización**, en **Frecuencia**: elija la frecuencia con la que desea sincronizar el contenido del origen de datos y actualizar el índice.

   1. Elija **Siguiente**.

1. En la página **Establecer asignaciones de campos**, especifique la siguiente información:

   1. **Campos de fuente de datos predeterminados**: seleccione entre los campos de fuente de datos predeterminados Amazon Kendra generados que desee asignar a su índice. 

   1.  **Agregar campo**: para agregar campos de origen de datos personalizados para crear un nombre de campo de índice al que asignarlos y el tipo de datos del campo.

   1. Elija **Siguiente**.

1. En la página **Revisar y crear**, compruebe que la información que ha introducido es correcta y, a continuación, seleccione **Añadir origen de datos**. También puede elegir editar la información desde esta página. El origen de datos aparecerá en la página **Orígenes de datos** una vez que el origen de datos se haya agregado correctamente.

------
#### [ API ]

**Para conectarse Amazon Kendra a Microsoft Teams**

Debe especificar un JSON del [esquema del origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/ds-schemas.html) mediante la API [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_TemplateConfiguration.html). Debe proporcionar la siguiente información:
+ **Origen de datos**: defina el tipo de origen de datos como `MSTEAMS` cuando utilice el esquema JSON [https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html](https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html). Además, defina el origen de datos como `TEMPLATE` al llamar a la API [https://docs.aws.amazon.com/kendra/latest/dg/API_CreateDataSource.html](https://docs.aws.amazon.com/kendra/latest/dg/API_CreateDataSource.html).
+ **ID de inquilino**: puede encontrar su ID de inquilino en las propiedades de su portal de Azure Active Directory o en su OAuth aplicación.
+ **Modo de sincronización**: especifique cómo Amazon Kendra debe actualizarse el índice cuando cambie el contenido de la fuente de datos. Al sincronizar el origen de datos con Amazon Kendra por primera vez, todo el contenido se rastrea y se indexa de forma predeterminada. Debe ejecutar una sincronización completa de los datos si la sincronización inicial falló, incluso si no selecciona la sincronización completa como opción de modo de sincronización. Puede elegir entre las siguientes opciones:
  + `FORCED_FULL_CRAWL` para volver a indexar todo el contenido, reemplazando el contenido existente cada vez que el origen de datos se sincronice con el índice.
  + `FULL_CRAWL` para indexar solo el contenido nuevo, modificado y eliminado cada vez que el origen de datos se sincronice con el índice. Amazon Kendra puede utilizar el mecanismo del origen de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido modificado desde la última sincronización.
  + `CHANGE_LOG` para indexar solo el contenido nuevo y modificado cada vez que el origen de datos se sincronice con el índice. Amazon Kendra puede utilizar el mecanismo del origen de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido modificado desde la última sincronización.
+ **Nombre secreto del recurso de Amazon (ARN): proporcione** el nombre del recurso de Amazon (ARN) de un Secrets Manager secreto que contenga las credenciales de autenticación de su cuenta de Microsoft Teams. El secreto se almacena en una estructura JSON con las siguientes claves:

  ```
  {
      "clientId": "client ID",
      "clientSecret": "client secret"
  }
  ```
+ **IAMrol**: especifique `RoleArn` cuándo llama `CreateDataSource` para proporcionar un IAM rol con permisos para acceder a su Secrets Manager secreto y para llamar al público requerido APIs para el conector de Microsoft Teams yAmazon Kendra. Para obtener más información, consulte los [roles de IAM para los orígenes de datos de Microsoft Teams](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds).

También puede añadir las siguientes características opcionales:
+  **Nube privada virtual (VPC)**: especifique a `VpcConfiguration` cuándo llamar a `CreateDataSource`. Para obtener más información, consulte [¿Se está configurando Amazon Kendra para usar un Amazon VPC](vpc-configuration.md).
+ **Tipos de documento o contenido**: especifique si se van a rastrear los mensajes y archivos adjuntos de los chats, las publicaciones y archivos adjuntos de los canales, las wikis de los canales, el contenido de los calendarios, los chats de las reuniones y los archivos y notas.
+ **Contenido del calendario**: especifique una fecha y hora de inicio y finalización para rastrear el contenido del calendario.
+ **Filtros de inclusión y exclusión**: especifique si desea incluir o excluir determinados archivos en Microsoft Teams. Puedes incluir o excluir los nombres de los equipos, los nombres de los canales, los nombres y tipos de archivos, el correo electrónico de los usuarios, OneNote las secciones y las OneNote páginas.
**nota**  
La mayoría de los orígenes de datos utilizan patrones de expresiones regulares, que son patrones de inclusión o exclusión denominados filtros. Si especifica un filtro de inclusión, solo se indexará el contenido que coincida con el filtro de inclusión. Los documentos que no coincidan con el filtro de inclusión no se indexan. Si especifica un filtro de inclusión y exclusión, los documentos que coincidan con el filtro de exclusión no se indexarán, aunque coincidan con el filtro de inclusión.
+ **Rastreador de identidades**: especifique si se debe activar el rastreador de identidades de Amazon Kendra. El rastreador de identidades utiliza la información de la lista de control de acceso (ACL) de los documentos para filtrar los resultados de la búsqueda en función del acceso del usuario o del grupo a los documentos. Si tiene una ACL para sus documentos y decide utilizarla, también puede optar por activar el rastreador de identidades para configurar el [filtrado Amazon Kendra de los resultados de búsqueda por contexto de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#context-filter-user-incl-datasources). De lo contrario, si el rastreador de identidades está desactivado, todos los documentos se pueden buscar públicamente. Si quieres usar el control de acceso para tus documentos y el rastreador de identidad está desactivado, también puedes usar la [PutPrincipalMapping](https://docs.aws.amazon.com/kendra/latest/APIReference/API_PutPrincipalMapping.html)API para cargar información de acceso de usuarios y grupos para filtrar el contexto de los usuarios.
+  **Asignaciones de campos**: elija asignar los campos del origen de datos de Microsoft Teams a los campos de índice. Amazon Kendra Para obtener más información, consulte [Asignación de campos de origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/field-mapping.html).
**nota**  
El campo del cuerpo del documento o el cuerpo del documento equivalente de sus documentos es obligatorio Amazon Kendra para poder buscarlos. Debe asignar el nombre del campo del cuerpo del documento en el origen de datos al nombre del campo del índice `_document_body`. Todos los demás campos son opcionales.

Para obtener una lista de otras claves JSON importantes que debe configurar, consulte el [Esquema de plantilla de Microsoft Teams](https://docs.aws.amazon.com/kendra/latest/dg/ds-schemas.html#ds-msteams-schema).

------

## Más información


Para obtener más información sobre la integración Amazon Kendra con la fuente de datos de Microsoft Teams, consulte:
+ [Busque de forma inteligente en la fuente de datos de Microsoft Teams de su organización con el Amazon Kendra conector para Microsoft Teams](https://aws.amazon.com/blogs/machine-learning/intelligently-search-your-organizations-microsoft-teams-data-source-with-the-amazon-kendra-connector-for-microsoft-teams/)

## Notas

+ Cuando las listas de control de acceso (ACLs) están habilitadas, la opción «Sincronizar solo contenido nuevo o modificado» no está disponible debido a las limitaciones de la API de Microsoft Teams. En su lugar, te recomendamos usar los modos «Sincronización completa» o «Sincronización de contenido nuevo, modificado o eliminado», o desactivarlos ACLs si necesitas usar este modo de sincronización.

# Microsoft Yammer


**nota**  
El conector de Microsoft Yammer seguirá siendo totalmente compatible para los clientes actuales hasta el 31 de mayo de 2026. Si bien este conector ya no está disponible para los nuevos usuarios, los usuarios actuales pueden seguir utilizándolo sin interrupciones. Desarrollamos de forma continua nuestra cartera de conectores para ofrecer soluciones más escalables y personalizables. Para futuras integraciones, le recomendamos que valore el marco de conectores personalizados de Amazon Kendra[1], diseñado de manera más flexible para una variedad más amplia de casos de uso empresariales.

Microsoft Yammer es una herramienta de colaboración empresarial para mensajería, reuniones e intercambio de archivos. Si es usuario de Microsoft Yammer, puede usarlo Amazon Kendra para indexar su fuente de datos de Microsoft Yammer.

Puede conectarse Amazon Kendra a la fuente de datos de Microsoft Yammer mediante la [Amazon Kendraconsola](https://console.aws.amazon.com/kendra/) y la [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_TemplateConfiguration.html)API.

Para solucionar problemas del conector de fuente de datos de Amazon Kendra Microsoft Yammer, consulte[Solución de problemas con los orígenes de datos](troubleshooting-data-sources.md).

## Características admitidas

+ Asignaciones de campo
+ Control de acceso de usuarios
+ Filtros de inclusión/exclusión
+ Sincronizaciones completas e incrementales del contenido
+ Nube privada virtual (VPC)

## Requisitos previos


Antes de poder utilizarla Amazon Kendra para indexar la fuente de datos de Microsoft Yammer, realice estos cambios en su cuenta y AWS en su cuenta de Microsoft Yammer.

**En Microsoft Yammer, asegúrese de que:**
+ Ha creado una cuenta administrativa de Office 365 de Microsoft Yammer.
+ Apuntó su nombre de usuario y contraseña de Microsoft Yammer.
+ Ha apuntado su ID de inquilino de Microsoft 365. Puede encontrar su ID de inquilino en las propiedades de su portal de Azure Active Directory o en su OAuth aplicación.
+ Configuró una OAuth aplicación en el portal de Azure y anotó el ID de cliente y el secreto del cliente o las credenciales del cliente. Consulte este [tutorial de Microsoft](https://learn.microsoft.com/en-us/power-apps/developer/data-platform/walkthrough-register-app-azure-active-directory) y este [ejemplo de registro de aplicación](https://learn.microsoft.com/en-us/azure/healthcare-apis/register-application) para obtener más información.
**nota**  
Al crear o registrar una aplicación en el portal de Azure, el ID del secreto representa el valor del secreto real. Debe anotar o guardar el valor del secreto real inmediatamente al crear el secreto y la aplicación. Para acceder a su secreto, seleccione el nombre de la aplicación en el portal de Azure y, a continuación, vaya a la opción de menú relativa a los certificados y secretos.  
Puede acceder a su ID de cliente seleccionando el nombre de su aplicación en el portal de Azure y, a continuación, yendo a la página de información general. El ID de la aplicación (cliente) es el ID del cliente.
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).
+ Comprobó que cada documento es único en Microsoft Yammer y en otros orígenes que planea usar para el mismo índice. Cada origen de datos que desee utilizar para un índice no debe contener el mismo documento en varios orígenes de datos. IDs Los documentos son globales para un índice y deben ser únicos por índice.

**En el tuyoCuenta de AWS, asegúrate de tener:**
+ [Creó un Amazon Kendra índice](https://docs.aws.amazon.com/kendra/latest/dg/create-index.html) y, si usa la API, anotó el ID del índice.
+ [Creó un IAM rol](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds) para su fuente de datos y, si usa la API, anotó el ARN del IAM rol.
**nota**  
Si cambias el tipo de autenticación y las credenciales, debes actualizar tu IAM rol para acceder al ID AWS Secrets Manager secreto correcto.
+ Ha guardado sus credenciales de autenticación de Microsoft Yammer en un secreto de AWS Secrets Manager y, si utiliza la API, ha anotado el ARN del secreto.
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).

Si no tiene un IAM rol o secreto existente, puede usar la consola para crear un nuevo IAM rol y Secrets Manager secreto al conectar la fuente de datos de Microsoft Yammer aAmazon Kendra. Si utiliza la API, debe proporcionar el ARN de un IAM rol y un Secrets Manager secreto existentes y un ID de índice.

## Instrucciones de conexión


Para conectarse Amazon Kendra a la fuente de datos de Microsoft Yammer, debe proporcionar los detalles necesarios de la fuente de datos de Microsoft Yammer para que Amazon Kendra pueda acceder a los datos. Si aún no ha configurado Microsoft Yammer paraAmazon Kendra, consulte[Requisitos previos](#prerequisites-yammer).

------
#### [ Console ]

**Para conectarse Amazon Kendra a Microsoft Yammer** 

1. Inicie sesión en la [Amazon Kendraconsola Consola de administración de AWS](https://console.aws.amazon.com/kendra/) y ábrala.

1. En el panel de navegación izquierdo, elija **Índices** y, a continuación, elija el índice que desee usar de la lista de índices.
**nota**  
Puede elegir configurar o editar los ajustes de **Control de acceso de usuarios** en la **Configuración del índice**. 

1. En la página **Introducción**, seleccione **Agregar origen de datos**.

1. En la página **Agregar origen de datos**, seleccione el **Conector de Microsoft Yammer** y, a continuación, seleccione **Agregar origen de datos**. Si usa la versión 2 (si corresponde), elija el **Conector de Microsoft Yammer** con la etiqueta “V2.0”.

1. En la página **Especificar detalles del origen de datos**, introduzca la siguiente información:

   1. En **Nombre y descripción**, en **Nombre del origen de datos**: introduzca un nombre para el origen de datos. Puede incluir guiones, pero no espacios.

   1. (Opcional)** Descripción**: introduzca una descripción opcional para el origen de datos.

   1. En **Idioma predeterminado**: elija un idioma para filtrar los documentos para el índice. A menos que especifique lo contrario, el idioma predeterminado es el inglés. El idioma especificado en los metadatos del documento anula el idioma seleccionado.

   1. En **Etiquetas**, para **añadir una nueva etiqueta**: incluye etiquetas opcionales para buscar y filtrar tus recursos o realizar un seguimiento de tus AWS costes.

   1. Elija **Siguiente**.

1. En la página **Definir acceso y seguridad**, introduzca la siguiente información:

   1. **Autorización**: active o desactive la información de la lista de control de acceso (ACL) para los documentos, si tiene una ACL y desea usarla para el control de acceso. La ACL especifica a qué documentos pueden acceder los usuarios y los grupos. La información de la ACL se utiliza para filtrar los resultados de búsqueda en función del acceso del usuario o su grupo a los documentos. Para obtener más información, consulte [Filtrado de contexto de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#context-filter-user-incl-datasources).

   1. **AWS Secrets Managersecreto**: elija un secreto existente o cree uno nuevo Secrets Manager para almacenar sus credenciales de autenticación de Microsoft Yammer. Si decide crear un secreto nuevo, se abrirá una ventana de secreto de AWS Secrets Manager.

      1. Introduzca la siguiente información en la **ventana Crear un secreto de AWS Secrets Manager**:

         1. **Nombre del secreto**: un nombre para su secreto. El prefijo 'AmazonKendra-Microsoft Yammer-' se añade automáticamente a tu nombre secreto.

         1. Para **Nombre de usuario** y **Contraseña**: introduzca su nombre de usuario y contraseña de Microsoft Yammer.

         1. En **ID de cliente**, **Secreto de cliente**: introduzca las credenciales de autenticación que ha configurado en Microsoft Yammer en el portal de Azure.

      1. Guarde y agregue el secreto.

   1. **Nube privada virtual (VPC)**: puede optar por utilizar una VPC. Si es así, debe agregar **Subredes** y **Grupos de seguridad de VPC**.

   1. **Rastreador de identidades**: especifique si se debe activar el rastreador de identidades de Amazon Kendra. El rastreador de identidades utiliza la información de la lista de control de acceso (ACL) de los documentos para filtrar los resultados de la búsqueda en función del acceso del usuario o del grupo a los documentos. Si tiene una ACL para sus documentos y decide utilizarla, también puede optar por activar el rastreador de identidades para configurar el filtrado de los Amazon Kendra resultados de búsqueda por contexto de [usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#context-filter-user-incl-datasources). De lo contrario, si el rastreador de identidades está desactivado, todos los documentos se pueden buscar públicamente. Si quieres usar el control de acceso para tus documentos y el rastreador de identidad está desactivado, también puedes usar la [PutPrincipalMapping](https://docs.aws.amazon.com/kendra/latest/APIReference/API_PutPrincipalMapping.html)API para cargar información de acceso de usuarios y grupos para filtrar el contexto de los usuarios.

   1. **IAMrol**: elija un IAM rol existente o cree uno nuevo IAM para acceder a las credenciales del repositorio y al contenido del índice.
**nota**  
IAMlos roles utilizados para los índices no se pueden usar para las fuentes de datos. Si no está seguro de si un rol existente se utiliza para un índice o para las preguntas frecuentes, elija **Crear un nuevo rol** para evitar errores.

   1. Elija **Siguiente**.

1. En la página **Configurar ajustes de sincronización**, introduzca la siguiente información:

   1. **Desde la fecha**: especifique la fecha para empezar a rastrear los datos en Microsoft Yammer.

   1. **Contenidos que se sincronizarán**: seleccione el tipo de contenido que quiera rastrear. Por ejemplo, mensajes públicos, mensajes privados y archivos adjuntos.

   1. **Configuración adicional**: especifique los nombres de las comunidades que desee rastrear y utilice también patrones de expresiones regulares para incluir o excluir cierto contenido.

   1. **Modo de sincronización**: elija cómo desea actualizar el índice cuando cambie el contenido del origen de datos. Al sincronizar la fuente de datos Amazon Kendra por primera vez, todo el contenido se rastrea e indexa de forma predeterminada. Debe ejecutar una sincronización completa de los datos si la sincronización inicial falló, incluso si no selecciona la sincronización completa como opción de modo de sincronización.
      + Sincronización completa: se vuelve a indexar todo el contenido, reemplazando el contenido existente cada vez que el origen de datos se sincronice con el índice.
      + Sincronización de lo nuevo y modificado: se indexa solo el contenido nuevo y modificado cada vez que el origen de datos se sincroniza con el índice. Amazon Kendra puede utilizar el mecanismo del origen de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido modificado desde la última sincronización.
      + Sincronización nueva, modificada o eliminada: indexe solo el contenido nuevo, modificado y eliminado cada vez que la fuente de datos se sincronice con el índice. Amazon Kendrapuede usar el mecanismo de la fuente de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido que ha cambiado desde la última sincronización.

   1. En **Programación de ejecución de sincronización**, en **Frecuencia**: elija la frecuencia con la que desea sincronizar el contenido del origen de datos y actualizar el índice.

   1. Elija **Siguiente**.

1. En la página **Establecer asignaciones de campos**, especifique la siguiente información:

   1. **Campos de fuente de datos predeterminados**: seleccione entre los campos de fuente de datos predeterminados Amazon Kendra generados que desee asignar a su índice. 

   1.  **Agregar campo**: para agregar campos de origen de datos personalizados para crear un nombre de campo de índice al que asignarlos y el tipo de datos del campo.

   1. Elija **Siguiente**.

1. En la página **Revisar y crear**, compruebe que la información que ha introducido es correcta y, a continuación, seleccione **Añadir origen de datos**. También puede elegir editar la información desde esta página. El origen de datos aparecerá en la página **Orígenes de datos** una vez que el origen de datos se haya agregado correctamente.

------
#### [ API  ]

**Para conectarse Amazon Kendra a Microsoft Yammer**

Debe especificar un JSON del [esquema del origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/ds-schemas.html) mediante la API [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_TemplateConfiguration.html). Debe proporcionar la siguiente información:
+ **Origen de datos**: defina el tipo de origen de datos como `YAMMER` cuando utilice el esquema JSON [https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html](https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html). Además, defina el origen de datos como `TEMPLATE` al llamar a la API [https://docs.aws.amazon.com/kendra/latest/dg/API_CreateDataSource.html](https://docs.aws.amazon.com/kendra/latest/dg/API_CreateDataSource.html).
+ **Modo de sincronización**: especifique cómo Amazon Kendra debe actualizarse el índice cuando cambie el contenido de la fuente de datos. Al sincronizar el origen de datos con Amazon Kendra por primera vez, todo el contenido se rastrea y se indexa de forma predeterminada. Debe ejecutar una sincronización completa de los datos si la sincronización inicial falló, incluso si no selecciona la sincronización completa como opción de modo de sincronización. Puede elegir entre las siguientes opciones:
  + `FORCED_FULL_CRAWL` para volver a indexar todo el contenido, reemplazando el contenido existente cada vez que el origen de datos se sincronice con el índice.
  + `FULL_CRAWL` para indexar solo el contenido nuevo, modificado y eliminado cada vez que el origen de datos se sincronice con el índice. Amazon Kendra puede utilizar el mecanismo del origen de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido modificado desde la última sincronización.
  + `CHANGE_LOG` para indexar solo el contenido nuevo y modificado cada vez que el origen de datos se sincronice con el índice. Amazon Kendra puede utilizar el mecanismo del origen de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido modificado desde la última sincronización.
+ **Nombre de recurso secreto de Amazon (ARN): proporcione** el nombre de recurso de Amazon (ARN) de un Secrets Manager secreto que contenga las credenciales de autenticación de su cuenta de Microsoft Yammer. El secreto se almacena en una estructura JSON con las siguientes claves:

  ```
  {
      "username": "user name",
      "password": "password",
      "clientId": "client ID",
      "clientSecret": "client secret"
  }
  ```
+ **IAMrol**: especifique `RoleArn` cuándo llama `CreateDataSource` para proporcionar un IAM rol con permisos para acceder a su Secrets Manager secreto y para llamar al público requerido APIs para el conector de Microsoft Yammer y. Amazon Kendra Para obtener más información, consulte los [roles de IAM para los orígenes de datos de Microsoft Yammer](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds).

También puede añadir las siguientes características opcionales:
+  **Nube privada virtual (VPC)**: especifique a `VpcConfiguration` cuándo llamar a `CreateDataSource`. Para obtener más información, consulte [¿Se está configurando Amazon Kendra para usar un Amazon VPC](vpc-configuration.md).
+ **Tipos de documentos o contenido**: especifique si desea rastrear contenido de comunidad, mensajes y archivos adjuntos, y mensajes privados.
+ **Filtros de inclusión y exclusión**: especifique si desea incluir o excluir determinado contenido.
**nota**  
La mayoría de los orígenes de datos utilizan patrones de expresiones regulares, que son patrones de inclusión o exclusión denominados filtros. Si especifica un filtro de inclusión, solo se indexará el contenido que coincida con el filtro de inclusión. Los documentos que no coincidan con el filtro de inclusión no se indexan. Si especifica un filtro de inclusión y exclusión, los documentos que coincidan con el filtro de exclusión no se indexarán, aunque coincidan con el filtro de inclusión.
+ **Rastreador de identidades**: especifique si se debe activar el rastreador de identidades de Amazon Kendra. El rastreador de identidades utiliza la información de la lista de control de acceso (ACL) de los documentos para filtrar los resultados de la búsqueda en función del acceso del usuario o del grupo a los documentos. Si tiene una ACL para sus documentos y decide utilizarla, también puede optar por activar el rastreador de identidades para configurar el [filtrado Amazon Kendra de los resultados de búsqueda por contexto de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#context-filter-user-incl-datasources). De lo contrario, si el rastreador de identidades está desactivado, todos los documentos se pueden buscar públicamente. Si quieres usar el control de acceso para tus documentos y el rastreador de identidad está desactivado, también puedes usar la [PutPrincipalMapping](https://docs.aws.amazon.com/kendra/latest/APIReference/API_PutPrincipalMapping.html)API para cargar información de acceso de usuarios y grupos para filtrar el contexto de los usuarios.
+  **Asignaciones de campos**: elija asignar los campos del origen de datos de Microsoft Yammer a los campos de índice de Amazon Kendra. Para obtener más información, consulte [Asignación de campos de origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/field-mapping.html).
**nota**  
El campo del cuerpo del documento o el cuerpo del documento equivalente de sus documentos es obligatorio Amazon Kendra para poder buscarlos. Debe asignar el nombre del campo del cuerpo del documento en el origen de datos al nombre del campo del índice `_document_body`. Todos los demás campos son opcionales.

Para obtener una lista de otras claves JSON importantes que debe configurar, consulte el [Esquema de plantilla de Microsoft Yammer](https://docs.aws.amazon.com/kendra/latest/dg/ds-schemas.html#ds-schema-yammer).

------

## Más información


Para obtener más información sobre la integración Amazon Kendra con la fuente de datos de Microsoft Yammer, consulte:
+ [Presentamos el conector Yammer para Amazon Kendra](https://aws.amazon.com/blogs/machine-learning/announcing-the-yammer-connector-for-amazon-kendra/)

# MySQL


**nota**  
El conector de MySQL seguirá siendo totalmente compatible con los clientes actuales hasta el 31 de mayo de 2026. Si bien este conector ya no está disponible para los nuevos usuarios, los usuarios actuales pueden seguir utilizándolo sin interrupción. Desarrollamos de forma continua nuestra cartera de conectores para ofrecer soluciones más escalables y personalizables. Para futuras integraciones, le recomendamos que valore el marco de conectores personalizados de Amazon Kendra[1], diseñado de manera más flexible para una variedad más amplia de casos de uso empresariales.

MySQL es un sistema de administración de bases de datos relacionales de código abierto. Si es un MySQL usuario, puede usarlo Amazon Kendra para indexar su fuente MySQL de datos. El conector Amazon Kendra MySQL de fuente de datos es compatible con MySQL 8.0. 21.

Puede conectarse Amazon Kendra a su fuente MySQL de datos mediante la [Amazon Kendraconsola](https://console.aws.amazon.com/kendra/) y la [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html)API.

Para solucionar problemas del conector de la fuente de Amazon Kendra MySQL datos, consulte[Solución de problemas con los orígenes de datos](troubleshooting-data-sources.md).

**Topics**
+ [

## Características admitidas
](#supported-features-mysql)
+ [

## Requisitos previos
](#prerequisites-mysql)
+ [

## Instrucciones de conexión
](#data-source-procedure-mysql)
+ [

## Notas
](#mysql-notes)

## Características admitidas

+ Asignaciones de campo
+ Filtrado de contexto de usuario
+ Filtros de inclusión/exclusión
+ Sincronizaciones completas e incrementales del contenido
+ Nube privada virtual (VPC)

## Requisitos previos


Antes de poder utilizarla Amazon Kendra para indexar la fuente de MySQL datos, realice estos cambios en sus AWS cuentas MySQL y.

**En MySQL, asegúrese de que**:
+ Ha anotado el nombre de usuario y contraseña de la base de datos.
**importante**  
Como práctica recomendada, proporcione credenciales de base Amazon Kendra de datos de solo lectura.
+ Ha copiado la URL, el puerto y la instancia del host de la base de datos.
+ Ha comprobado que cada documento es único en MySQL y en otros orígenes de datos que vaya a utilizar para el mismo índice. Cada origen de datos que desee utilizar para un índice no debe contener el mismo documento en varios orígenes de datos. IDs Los documentos son globales para un índice y deben ser únicos por índice.

**En el tuyoCuenta de AWS, asegúrate de tener:**
+ [Creó un Amazon Kendra índice](https://docs.aws.amazon.com/kendra/latest/dg/create-index.html) y, si usa la API, anotó el ID del índice.
+ [Creó un IAM rol](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds) para su fuente de datos y, si usa la API, anotó el ARN del IAM rol.
**nota**  
Si cambias el tipo de autenticación y las credenciales, debes actualizar tu IAM rol para acceder al ID AWS Secrets Manager secreto correcto.
+ Ha guardado sus credenciales de autenticación de MySQL en un secreto de AWS Secrets Manager y, si utiliza la API, ha anotado el ARN del secreto.
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).

Si no tiene un IAM rol o secreto existente, puede usar la consola para crear un nuevo IAM rol y un Secrets Manager secreto al conectar su fuente de MySQL datosAmazon Kendra. Si utiliza la API, debe proporcionar el ARN de un IAM rol y un Secrets Manager secreto existentes y un ID de índice.

## Instrucciones de conexión


Para conectarse Amazon Kendra a su fuente de MySQL datos, debe proporcionar los detalles de sus MySQL credenciales para Amazon Kendra poder acceder a sus datos. Si aún no lo ha configuradoMySQL, Amazon Kendra consulte[Requisitos previos](#prerequisites-mysql).

------
#### [ Console ]

**Para conectarse Amazon Kendra a MySQL** 

1. Inicie sesión en la [Amazon Kendraconsola Consola de administración de AWS y ábrala](https://console.aws.amazon.com/kendra/).

1. En el panel de navegación izquierdo, elija **Índices** y, a continuación, elija el índice que desee usar de la lista de índices.
**nota**  
Puede elegir configurar o editar los ajustes de **Control de acceso de usuarios** en la **Configuración del índice**. 

1. En la página **Introducción**, seleccione **Agregar origen de datos**.

1. En la página **Agregar origen de datos**, seleccione el **Conector de MySQL** y, a continuación, seleccione **Agregar conector**. Si usa la versión 2 (si corresponde), elija el **Conector de MySQL** con la etiqueta “V2.0”.

1. En la página **Especificar detalles del origen de datos**, introduzca la siguiente información:

   1. En **Nombre y descripción**, en **Nombre del origen de datos**: introduzca un nombre para el origen de datos. Puede incluir guiones, pero no espacios.

   1. (Opcional)** Descripción**: introduzca una descripción opcional para el origen de datos.

   1. En **Idioma predeterminado**: elija un idioma para filtrar los documentos para el índice. A menos que especifique lo contrario, el idioma predeterminado es el inglés. El idioma especificado en los metadatos del documento anula el idioma seleccionado.

   1. En **Etiquetas**, para **añadir una nueva etiqueta**: incluye etiquetas opcionales para buscar y filtrar tus recursos o realizar un seguimiento de tus AWS costes.

   1. Elija **Siguiente**.

1. En la página **Definir acceso y seguridad**, introduzca la siguiente información:

   1. En **Origen**, introduzca la siguiente información:

   1.  **Host**: introduzca el nombre del host de la base de datos.

   1.  **Puerto**: introduzca el puerto de la base de datos.

   1.  **Instancia**: introduzca la instancia de la base de datos.

   1. **Habilitar la ubicación del certificado SSL**: elija introducir la Amazon S3 ruta al archivo de certificado SSL.

   1. En **Autenticación**, introduzca la siguiente información:

      1. **AWS Secrets Managersecreto**: elija un secreto existente o cree uno nuevo Secrets Manager para almacenar sus credenciales de MySQL autenticación. Si decide crear un secreto nuevo, se abrirá una ventana de secreto de AWS Secrets Manager.

        1. Introduzca la siguiente información en la **ventana Crear un secreto de AWS Secrets Manager**:

           1. **Nombre del secreto**: un nombre para su secreto. El prefijo 'AmazonKendra- MySQL -' se añade automáticamente a tu nombre secreto.

           1. Para el **nombre de usuario** y la **contraseña de la base de datos**: introduzca los valores de las credenciales de autenticación que ha copiado de la base de datos. 

        1. Seleccione **Save**.

   1. **Nube privada virtual (VPC)**: puede optar por utilizar una VPC. Si es así, debe agregar **Subredes** y **Grupos de seguridad de VPC**.

   1. **IAMrol**: elige un IAM rol existente o crea uno nuevo IAM para acceder a las credenciales del repositorio y al contenido del índice.
**nota**  
IAMlos roles utilizados para los índices no se pueden usar para las fuentes de datos. Si no está seguro de si un rol existente se utiliza para un índice o para las preguntas frecuentes, elija **Crear un nuevo rol** para evitar errores.

   1. Elija **Siguiente**.

1. En la página **Configurar ajustes de sincronización**, introduzca la siguiente información:

   1. En **Ámbito de sincronización**, seleccione de entre las siguientes opciones:
      + **Consulta SQL**: introduzca instrucciones de consulta SQL, como las operaciones SELECT y JOIN. Las consultas de SQL deben ser inferiores a 32 KB. Amazon Kendra rastreará todo el contenido de la base de datos que coincida con su consulta.
      + **Columna de clave principal**: proporcione la clave principal de la tabla de la base de datos. Esto identifica una tabla dentro de la base de datos.
      + **Columna de título**: proporcione el nombre de la columna del título del documento en la tabla de la base de datos.
      + **Columna de cuerpo**: proporcione el nombre de la columna del cuerpo del documento en la tabla de la base de datos.

   1. En **Configuración adicional (*opcional*)**, elija una de las siguientes opciones para sincronizar contenido específico en lugar de sincronizar todos los archivos:
      + **Columnas de detección de cambios**: introduzca los nombres de las columnas que se Amazon Kendra utilizarán para detectar cambios en el contenido. Amazon Kendravolverá a indexar el contenido cuando se produzca un cambio en alguna de estas columnas.
      + ** IDsColumna de usuarios**: introduzca el nombre de la columna que contiene el usuario IDs al que se le permitirá acceder al contenido.
      + **Columna de grupos**: introduzca el nombre de la columna que contiene los grupos a los que se dará acceso al contenido.
      + ** URLsColumna de origen**: introduzca el nombre de la columna que contiene el origen que se va URLs a indexar.
      + **Columna de marcas de tiempo**: introduzca el nombre de la columna que contiene las marcas de tiempo. Amazon Kendrautiliza la información de las marcas de tiempo para detectar cambios en el contenido y sincronizar solo el contenido modificado. 
      + **Columna de zonas horarias**: introduzca el nombre de la columna que contiene las zonas horarias del contenido que se va a rastrear.
      + **Formato de marcas temporales**: introduzca el nombre de la columna que contiene los formatos de marcas temporales que se deben utilizar para detectar cambios en el contenido y volver a sincronizar su contenido.

   1. **Modo de sincronización**: elija cómo desea actualizar el índice cuando cambie el contenido del origen de datos. Al sincronizar la fuente de datos Amazon Kendra por primera vez, todo el contenido se rastrea e indexa de forma predeterminada. Debe ejecutar una sincronización completa de los datos si la sincronización inicial falló, incluso si no selecciona la sincronización completa como opción de modo de sincronización.
      + Sincronización completa: se vuelve a indexar todo el contenido, reemplazando el contenido existente cada vez que el origen de datos se sincronice con el índice.
      + Sincronización de lo nuevo y modificado: se indexa solo el contenido nuevo y modificado cada vez que el origen de datos se sincroniza con el índice. Amazon Kendra puede utilizar el mecanismo del origen de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido modificado desde la última sincronización.
      + Sincronización nueva, modificada o eliminada: indexe solo el contenido nuevo, modificado y eliminado cada vez que la fuente de datos se sincronice con el índice. Amazon Kendrapuede usar el mecanismo de la fuente de datos para rastrear los cambios en el contenido e indexar el contenido que ha cambiado desde la última sincronización.

   1. En **Programa de ejecución de sincronización**, en **Frecuencia**: la frecuencia con la que Amazon Kendra se sincronizará con el origen de datos.

   1. Elija **Siguiente**.

1. En la página **Establecer asignaciones de campos**, especifique la siguiente información:

   1. Seleccione uno de los campos de fuente de datos predeterminados generados (**Documento IDs****, Títulos** de documentos y **Fuente URLs**) que desee mapear para Amazon Kendra indexarlos.

   1.  **Agregar campo**: para agregar campos de origen de datos personalizados para crear un nombre de campo de índice al que asignarlos y el tipo de datos del campo.

   1. Elija **Siguiente**.

1. En la página **Revisar y crear**, compruebe que la información que ha introducido es correcta y, a continuación, seleccione **Añadir origen de datos**. También puede elegir editar la información desde esta página. El origen de datos aparecerá en la página **Orígenes de datos** una vez que el origen de datos se haya agregado correctamente.

------
#### [ API ]

**Para conectarse a Amazon Kendra MySQL**

Debe especificar lo siguiente mediante la [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html)API:
+ **Origen de datos**: defina el tipo de origen de datos como `JDBC` cuando utilice el esquema JSON [https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html](https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html). Además, defina el origen de datos como `TEMPLATE` al llamar a la API [https://docs.aws.amazon.com/kendra/latest/dg/API_CreateDataSource.html](https://docs.aws.amazon.com/kendra/latest/dg/API_CreateDataSource.html).
+ **Tipo de base de datos**: debe especificar el tipo de base de datos como `mySql`.
+ **Consulta SQL**: especifique instrucciones de consulta SQL, como las operaciones SELECT y JOIN. Las consultas de SQL deben ser inferiores a 32 KB. Amazon Kendra rastreará todo el contenido de la base de datos que coincida con su consulta.
+ **Modo de sincronización**: especifique cómo Amazon Kendra debe actualizarse el índice cuando cambie el contenido de la fuente de datos. Al sincronizar el origen de datos con Amazon Kendra por primera vez, todo el contenido se rastrea y se indexa de forma predeterminada. Debe ejecutar una sincronización completa de los datos si la sincronización inicial falló, incluso si no selecciona la sincronización completa como opción de modo de sincronización. Puede elegir entre las siguientes opciones:
  + `FORCED_FULL_CRAWL` para volver a indexar todo el contenido, reemplazando el contenido existente cada vez que el origen de datos se sincronice con el índice.
  + `FULL_CRAWL` para indexar solo el contenido nuevo, modificado y eliminado cada vez que el origen de datos se sincronice con el índice. Amazon Kendra puede utilizar el mecanismo del origen de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido modificado desde la última sincronización.
  + `CHANGE_LOG` para indexar solo el contenido nuevo y modificado cada vez que el origen de datos se sincronice con el índice. Amazon Kendra puede utilizar el mecanismo del origen de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido modificado desde la última sincronización.
+ **Nombre secreto de recurso de Amazon (ARN): proporcione** el nombre de recurso de Amazon (ARN) de un Secrets Manager secreto que contenga las credenciales de autenticación que creó en su cuenta. MySQL El secreto se almacena en una estructura JSON con las siguientes claves:

  ```
  {
      "user name": "database user name",
      "password": "password"
  }
  ```
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).
+ **IAMrol**: especifique `RoleArn` cuándo llama `CreateDataSource` para proporcionar un IAM rol con permisos para acceder a su Secrets Manager secreto y para llamar al público requerido APIs para el conector y. MySQL Amazon Kendra Para obtener más información, consulte [Roles de IAM para orígenes de datos de MySQL](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds).

También puede añadir las siguientes características opcionales:
+  **Nube privada virtual (VPC)**: especifique a `VpcConfiguration` cuándo llamar a `CreateDataSource`. Para obtener más información, consulte [¿Se está configurando Amazon Kendra para usar un Amazon VPC](vpc-configuration.md).
+  **Filtros de inclusión y exclusión**: puede especificar si desea incluir contenido específico mediante el usuario IDs, los grupos, la fuente URLs, las marcas horarias y las zonas horarias. 
+  **Filtrado de contexto de usuario y control de acceso**: si hay una lista de control de acceso (ACL) para los documentos, Amazon Kendra la rastreará. La información de la ACL se utiliza para filtrar los resultados de búsqueda en función del acceso del usuario o su grupo a los documentos. Para obtener más información, consulte [Filtrado de contexto de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#datasource-context-filter).
+  **Asignaciones de campos**: elija asignar los campos del origen de datos de MySQL a los campos de índice de Amazon Kendra. Para obtener más información, consulte [Asignación de campos de origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/field-mapping.html).
**nota**  
El campo del cuerpo del documento o el cuerpo del documento equivalente de sus documentos es obligatorio Amazon Kendra para poder buscarlos. Debe asignar el nombre del campo del cuerpo del documento en el origen de datos al nombre del campo del índice `_document_body`. Todos los demás campos son opcionales.

------

## Notas

+ Las filas de la base de datos eliminadas no se registrarán cuando se Amazon Kendra compruebe si hay contenido actualizado.
+ El tamaño de los nombres y valores de los campos de una fila de la base de datos no puede superar los 400 KB.
+ Si tiene una gran cantidad de datos en la fuente de datos de la base de datos y no desea Amazon Kendra indexar todo el contenido de la base de datos después de la primera sincronización, puede optar por sincronizar solo los documentos nuevos, modificados o eliminados.
+ Como práctica recomendada, proporcione credenciales de base Amazon Kendra de datos de solo lectura.
+ Como práctica recomendada, evite añadir tablas con datos confidenciales o información de identificación personal (PII).

# Oracle Database


**nota**  
El conector de Oracle Database seguirá siendo totalmente compatible con los clientes actuales hasta el 31 de mayo de 2026. Si bien este conector ya no está disponible para los nuevos usuarios, los usuarios actuales pueden seguir utilizándolo sin interrupción. Desarrollamos de forma continua nuestra cartera de conectores para ofrecer soluciones más escalables y personalizables. Para futuras integraciones, le recomendamos que valore el marco de conectores personalizados de Amazon Kendra[1], diseñado de manera más flexible para una variedad más amplia de casos de uso empresariales.

Oracle Database es un sistema de administración de bases de datos. Si es un Oracle Database usuario, puede usarlo Amazon Kendra para indexar su fuente Oracle Database de datos. El conector Amazon Kendra Oracle Database de fuente de datos es compatible con Oracle Database 18c, 19c y 21c.

Puede conectarse Amazon Kendra a su fuente de Oracle Database datos mediante la [Amazon Kendraconsola y la API](https://console.aws.amazon.com/kendra/). [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html)

Para solucionar problemas del conector de la fuente de Amazon Kendra Oracle Database datos, consulte[Solución de problemas con los orígenes de datos](troubleshooting-data-sources.md).

**Topics**
+ [

## Características admitidas
](#supported-features-oracle-database)
+ [

## Requisitos previos
](#prerequisites-oracle-database)
+ [

## Instrucciones de conexión
](#data-source-procedure-oracle-database)
+ [

## Notas
](#oracle-database-notes)

## Características admitidas

+ Asignaciones de campo
+ Filtrado de contexto de usuario
+ Filtros de inclusión/exclusión
+ Sincronizaciones completas e incrementales del contenido
+ Nube privada virtual (VPC)

## Requisitos previos


Antes de poder utilizarla Amazon Kendra para indexar la fuente de Oracle Database datos, realice estos cambios en sus AWS cuentas Oracle Database y.

**En Oracle Database, asegúrese de que**:
+ Ha anotado el nombre de usuario y contraseña de la base de datos.
**importante**  
Como práctica recomendada, proporcione credenciales de base Amazon Kendra de datos de solo lectura.
+ Ha copiado la URL, el puerto y la instancia del host de la base de datos.
+ Ha comprobado que cada documento es único en Oracle Database y en otros orígenes de datos que vaya a utilizar para el mismo índice. Cada origen de datos que desee utilizar para un índice no debe contener el mismo documento en varios orígenes de datos. IDs Los documentos son globales para un índice y deben ser únicos por índice.

**En el tuyoCuenta de AWS, asegúrate de tener:**
+ [Creó un Amazon Kendra índice](https://docs.aws.amazon.com/kendra/latest/dg/create-index.html) y, si usa la API, anotó el ID del índice.
+ [Creó un IAM rol](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds) para su fuente de datos y, si usa la API, anotó el ARN del IAM rol.
**nota**  
Si cambias el tipo de autenticación y las credenciales, debes actualizar tu IAM rol para acceder al ID AWS Secrets Manager secreto correcto.
+ Ha guardado sus credenciales de autenticación de Oracle Database en un secreto de AWS Secrets Manager y, si utiliza la API, ha anotado el ARN del secreto.
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).

Si no tiene un IAM rol o secreto existente, puede usar la consola para crear un nuevo IAM rol y un Secrets Manager secreto al conectar su fuente de Oracle Database datosAmazon Kendra. Si utiliza la API, debe proporcionar el ARN de un IAM rol y un Secrets Manager secreto existentes y un ID de índice.

## Instrucciones de conexión


Para conectarse Amazon Kendra a su fuente de Oracle Database datos, debe proporcionar los detalles de sus Oracle Database credenciales para que Amazon Kendra pueda acceder a sus datos. Si aún no lo ha configuradoOracle Database, Amazon Kendra consulte[Requisitos previos](#prerequisites-oracle-database).

------
#### [ Console ]

**Para conectarse Amazon Kendra a Oracle Database** 

1. Inicie sesión en la [Amazon Kendraconsola Consola de administración de AWS y ábrala](https://console.aws.amazon.com/kendra/).

1. En el panel de navegación izquierdo, elija **Índices** y, a continuación, elija el índice que desee usar de la lista de índices.
**nota**  
Puede elegir configurar o editar los ajustes de **Control de acceso de usuarios** en la **Configuración del índice**. 

1. En la página **Introducción**, seleccione **Agregar origen de datos**.

1. En la página **Agregar origen de datos**, seleccione el **Conector de Oracle Database** y, a continuación, seleccione **Agregar conector**. Si usa la versión 2 (si corresponde), elija el **Conector de Oracle Database** con la etiqueta “V2.0”.

1. En la página **Especificar detalles del origen de datos**, introduzca la siguiente información:

   1. En **Nombre y descripción**, en **Nombre del origen de datos**: introduzca un nombre para el origen de datos. Puede incluir guiones, pero no espacios.

   1. (Opcional)** Descripción**: introduzca una descripción opcional para el origen de datos.

   1. En **Idioma predeterminado**: elija un idioma para filtrar los documentos para el índice. A menos que especifique lo contrario, el idioma predeterminado es el inglés. El idioma especificado en los metadatos del documento anula el idioma seleccionado.

   1. En **Etiquetas**, para **añadir una nueva etiqueta**: incluye etiquetas opcionales para buscar y filtrar tus recursos o realizar un seguimiento de tus AWS costes.

   1. Elija **Siguiente**.

1. En la página **Definir acceso y seguridad**, introduzca la siguiente información:

   1. En **Origen**, introduzca la siguiente información:

   1.  **Host**: introduzca el nombre del host de la base de datos.

   1.  **Puerto**: introduzca el puerto de la base de datos.

   1.  **Instancia**: introduzca la instancia de la base de datos.

   1. **Habilitar la ubicación del certificado SSL**: elija introducir la Amazon S3 ruta al archivo de certificado SSL.

   1. En **Autenticación**, introduzca la siguiente información:

      1. **AWS Secrets Managersecreto**: elija un secreto existente o cree uno nuevo Secrets Manager para almacenar sus credenciales de Oracle Database autenticación. Si decide crear un secreto nuevo, se abrirá una ventana de secreto de AWS Secrets Manager.

        1. Introduzca la siguiente información en la **ventana Crear un secreto de AWS Secrets Manager**:

           1. **Nombre del secreto**: un nombre para su secreto. El prefijo 'AmazonKendra- Oracle Database -' se añade automáticamente a tu nombre secreto.

           1. Para el **nombre de usuario** y la **contraseña de la base de datos**: introduzca los valores de las credenciales de autenticación que ha copiado de la base de datos. 

        1. Seleccione **Save**.

   1. **Nube privada virtual (VPC)**: puede optar por utilizar una VPC. Si es así, debe agregar **Subredes** y **Grupos de seguridad de VPC**.

   1. **IAMrol**: elige un IAM rol existente o crea uno nuevo IAM para acceder a las credenciales del repositorio y al contenido del índice.
**nota**  
IAMlos roles utilizados para los índices no se pueden usar para las fuentes de datos. Si no está seguro de si un rol existente se utiliza para un índice o para las preguntas frecuentes, elija **Crear un nuevo rol** para evitar errores.

   1. Elija **Siguiente**.

1. En la página **Configurar ajustes de sincronización**, introduzca la siguiente información:

   1. En **Ámbito de sincronización**, seleccione de entre las siguientes opciones:
      + **Consulta SQL**: introduzca instrucciones de consulta SQL, como las operaciones SELECT y JOIN. Las consultas de SQL deben ser inferiores a 32 KB. Amazon Kendra rastreará todo el contenido de la base de datos que coincida con su consulta.
      + **Columna de clave principal**: proporcione la clave principal de la tabla de la base de datos. Esto identifica una tabla dentro de la base de datos.
      + **Columna de título**: proporcione el nombre de la columna del título del documento en la tabla de la base de datos.
      + **Columna de cuerpo**: proporcione el nombre de la columna del cuerpo del documento en la tabla de la base de datos.

   1. En **Configuración adicional (*opcional*)**, elija una de las siguientes opciones para sincronizar contenido específico en lugar de sincronizar todos los archivos:
      + **Columnas de detección de cambios**: introduzca los nombres de las columnas que se Amazon Kendra utilizarán para detectar cambios en el contenido. Amazon Kendravolverá a indexar el contenido cuando se produzca un cambio en alguna de estas columnas.
      + ** IDsColumna de usuario**: introduzca el nombre de la columna que contiene el usuario IDs al que se le permitirá acceder al contenido.
      + **Columna de grupos**: introduzca el nombre de la columna que contiene los grupos a los que se dará acceso al contenido.
      + ** URLsColumna de origen**: introduzca el nombre de la columna que contiene el origen que se va URLs a indexar.
      + **Columna de marcas de tiempo**: introduzca el nombre de la columna que contiene las marcas de tiempo. Amazon Kendrautiliza la información de las marcas de tiempo para detectar cambios en el contenido y sincronizar solo el contenido modificado. 
      + **Columna de zonas horarias**: introduzca el nombre de la columna que contiene las zonas horarias del contenido que se va a rastrear.
      + **Formato de marcas temporales**: introduzca el nombre de la columna que contiene los formatos de marcas temporales que se deben utilizar para detectar cambios en el contenido y volver a sincronizar su contenido.

   1. **Modo de sincronización**: elija cómo desea actualizar el índice cuando cambie el contenido del origen de datos. Al sincronizar la fuente de datos Amazon Kendra por primera vez, todo el contenido se rastrea e indexa de forma predeterminada. Debe ejecutar una sincronización completa de los datos si la sincronización inicial falló, incluso si no selecciona la sincronización completa como opción de modo de sincronización.
      + Sincronización completa: se vuelve a indexar todo el contenido, reemplazando el contenido existente cada vez que el origen de datos se sincronice con el índice.
      + Sincronización de lo nuevo y modificado: se indexa solo el contenido nuevo y modificado cada vez que el origen de datos se sincroniza con el índice. Amazon Kendra puede utilizar el mecanismo del origen de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido modificado desde la última sincronización.
      + Sincronización nueva, modificada o eliminada: indexe solo el contenido nuevo, modificado y eliminado cada vez que la fuente de datos se sincronice con el índice. Amazon Kendrapuede usar el mecanismo de la fuente de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido que ha cambiado desde la última sincronización.

   1. En **Programa de ejecución de sincronización**, en **Frecuencia**: la frecuencia con la que Amazon Kendra se sincronizará con el origen de datos.

   1. Elija **Siguiente**.

1. En la página **Establecer asignaciones de campos**, especifique la siguiente información:

   1. Seleccione uno de los campos de fuente de datos predeterminados generados (**Documento IDs****, Títulos** de documentos y **Fuente URLs**) que desee mapear para Amazon Kendra indexarlos.

   1.  **Agregar campo**: para agregar campos de origen de datos personalizados para crear un nombre de campo de índice al que asignarlos y el tipo de datos del campo.

   1. Elija **Siguiente**.

1. En la página **Revisar y crear**, compruebe que la información que ha introducido es correcta y, a continuación, seleccione **Añadir origen de datos**. También puede elegir editar la información desde esta página. El origen de datos aparecerá en la página **Orígenes de datos** una vez que el origen de datos se haya agregado correctamente.

------
#### [ API ]

**Para conectarse a Amazon Kendra Oracle Database**

Debe especificar lo siguiente mediante la [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html)API:
+ **Origen de datos**: defina el tipo de origen de datos como `JDBC` cuando utilice el esquema JSON [https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html](https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html). Además, defina el origen de datos como `TEMPLATE` al llamar a la API [https://docs.aws.amazon.com/kendra/latest/dg/API_CreateDataSource.html](https://docs.aws.amazon.com/kendra/latest/dg/API_CreateDataSource.html).
+ **Tipo de base de datos**: debe especificar el tipo de base de datos como `oracle`.
+ **Consulta SQL**: especifique instrucciones de consulta SQL, como las operaciones SELECT y JOIN. Las consultas de SQL deben ser inferiores a 32 KB. Amazon Kendra rastreará todo el contenido de la base de datos que coincida con su consulta.
+ **Modo de sincronización**: especifique cómo Amazon Kendra debe actualizarse el índice cuando cambie el contenido de la fuente de datos. Al sincronizar el origen de datos con Amazon Kendra por primera vez, todo el contenido se rastrea y se indexa de forma predeterminada. Debe ejecutar una sincronización completa de los datos si la sincronización inicial falló, incluso si no selecciona la sincronización completa como opción de modo de sincronización. Puede elegir entre las siguientes opciones:
  + `FORCED_FULL_CRAWL` para volver a indexar todo el contenido, reemplazando el contenido existente cada vez que el origen de datos se sincronice con el índice.
  + `FULL_CRAWL` para indexar solo el contenido nuevo, modificado y eliminado cada vez que el origen de datos se sincronice con el índice. Amazon Kendra puede utilizar el mecanismo del origen de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido modificado desde la última sincronización.
  + `CHANGE_LOG` para indexar solo el contenido nuevo y modificado cada vez que el origen de datos se sincronice con el índice. Amazon Kendra puede utilizar el mecanismo del origen de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido modificado desde la última sincronización.
+ **Nombre secreto de recurso de Amazon (ARN): proporcione** el nombre de recurso de Amazon (ARN) de un Secrets Manager secreto que contenga las credenciales de autenticación que creó en su cuenta. Oracle Database El secreto se almacena en una estructura JSON con las siguientes claves:

  ```
  {
      "user name": "database user name",
      "password": "password"
  }
  ```
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).
+ **IAMrol**: especifique `RoleArn` cuándo llama `CreateDataSource` para proporcionar un IAM rol con permisos para acceder a su Secrets Manager secreto y para llamar al público requerido APIs para el conector y. Oracle Database Amazon Kendra Para obtener más información, consulte [Roles de IAM para orígenes de datos de Oracle Database](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds).

También puede añadir las siguientes características opcionales:
+  **Nube privada virtual (VPC)**: especifique a `VpcConfiguration` cuándo llamar a `CreateDataSource`. Para obtener más información, consulte [¿Se está configurando Amazon Kendra para usar un Amazon VPC](vpc-configuration.md).
+  **Filtros de inclusión y exclusión**: puede especificar si desea incluir contenido específico mediante el usuario IDs, los grupos, la fuente URLs, las marcas horarias y las zonas horarias. 
+  **Filtrado de contexto de usuario y control de acceso**: si hay una lista de control de acceso (ACL) para los documentos, Amazon Kendra la rastreará. La información de la ACL se utiliza para filtrar los resultados de búsqueda en función del acceso del usuario o su grupo a los documentos. Para obtener más información, consulte [Filtrado de contexto de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#datasource-context-filter).
+  **Asignaciones de campos**: elija asignar los campos del origen de datos de Oracle Database a los campos de índice de Amazon Kendra. Para obtener más información, consulte [Asignación de campos de origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/field-mapping.html).
**nota**  
El campo del cuerpo del documento o el cuerpo del documento equivalente de sus documentos es obligatorio Amazon Kendra para poder buscarlos. Debe asignar el nombre del campo del cuerpo del documento en el origen de datos al nombre del campo del índice `_document_body`. Todos los demás campos son opcionales.

Para obtener una lista de otras claves JSON importantes que debe configurar, consulte [Esquema de plantilla de Oracle Database](ds-schemas.md#ds-oracle-database-schema).

------

## Notas

+ Las filas de la base de datos eliminadas no se registrarán cuando se Amazon Kendra compruebe si hay contenido actualizado.
+ El tamaño de los nombres y valores de los campos de una fila de la base de datos no puede superar los 400 KB.
+ Si tiene una gran cantidad de datos en la fuente de datos de la base de datos y no desea Amazon Kendra indexar todo el contenido de la base de datos después de la primera sincronización, puede optar por sincronizar solo los documentos nuevos, modificados o eliminados.
+ Como práctica recomendada, proporcione credenciales de base Amazon Kendra de datos de solo lectura.
+ Como práctica recomendada, evite añadir tablas con datos confidenciales o información de identificación personal (PII).

# PostgreSQL


**nota**  
El conector de PostgreSQL seguirá siendo totalmente compatible con los clientes actuales hasta el 31 de mayo de 2026. Si bien este conector ya no está disponible para los nuevos usuarios, los usuarios actuales pueden seguir utilizándolo sin interrupción. Desarrollamos de forma continua nuestra cartera de conectores para ofrecer soluciones más escalables y personalizables. Para futuras integraciones, le recomendamos que valore el marco de conectores personalizados de Amazon Kendra[1], diseñado de manera más flexible para una variedad más amplia de casos de uso empresariales.

PostgreSQL es un sistema de administración de bases de datos de código abierto. Si es un PostgreSQL usuario, puede usarlo Amazon Kendra para indexar su fuente PostgreSQL de datos. El conector Amazon Kendra PostgreSQL de fuente de datos es compatible con PostgreSQL 9.6.

Puede conectarse Amazon Kendra a su fuente de PostgreSQL datos mediante la [Amazon Kendraconsola](https://console.aws.amazon.com/kendra/) y la [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html)API.

Para solucionar problemas del conector de la fuente de Amazon Kendra PostgreSQL datos, consulte[Solución de problemas con los orígenes de datos](troubleshooting-data-sources.md).

**Topics**
+ [

## Características admitidas
](#supported-features-postgresql)
+ [

## Requisitos previos
](#prerequisites-postgresql)
+ [

## Instrucciones de conexión
](#data-source-procedure-postgresql)
+ [

## Notas
](#postgresql-notes)

## Características admitidas

+ Asignaciones de campo
+ Filtrado de contexto de usuario
+ Filtros de inclusión/exclusión
+ Sincronizaciones completas e incrementales del contenido
+ Nube privada virtual (VPC)

## Requisitos previos


Antes de poder utilizarla Amazon Kendra para indexar la fuente de PostgreSQL datos, realice estos cambios en sus AWS cuentas PostgreSQL y.

**En PostgreSQL, asegúrese de que**:
+ Ha anotado el nombre de usuario y contraseña de la base de datos.
**importante**  
Como práctica recomendada, proporcione credenciales de base Amazon Kendra de datos de solo lectura.
+ Ha copiado la URL, el puerto y la instancia del host de la base de datos.
+ Ha comprobado que cada documento es único en PostgreSQL y en otros orígenes de datos que vaya a utilizar para el mismo índice. Cada origen de datos que desee utilizar para un índice no debe contener el mismo documento en varios orígenes de datos. IDs Los documentos son globales para un índice y deben ser únicos por índice.

**En el tuyoCuenta de AWS, asegúrate de tener:**
+ [Creó un Amazon Kendra índice](https://docs.aws.amazon.com/kendra/latest/dg/create-index.html) y, si usa la API, anotó el ID del índice.
+ [Creó un IAM rol](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds) para su fuente de datos y, si usa la API, anotó el ARN del IAM rol.
**nota**  
Si cambias el tipo de autenticación y las credenciales, debes actualizar tu IAM rol para acceder al ID AWS Secrets Manager secreto correcto.
+ Ha guardado sus credenciales de autenticación de PostgreSQL en un secreto de AWS Secrets Manager y, si utiliza la API, ha anotado el ARN del secreto.
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).

Si no tiene un IAM rol o secreto existente, puede usar la consola para crear un nuevo IAM rol y un Secrets Manager secreto al conectar su fuente de PostgreSQL datosAmazon Kendra. Si utiliza la API, debe proporcionar el ARN de un IAM rol y un Secrets Manager secreto existentes y un ID de índice.

## Instrucciones de conexión


Para conectarse Amazon Kendra a su fuente de PostgreSQL datos, debe proporcionar los detalles de sus PostgreSQL credenciales para Amazon Kendra poder acceder a sus datos. Si aún no lo ha configuradoPostgreSQL, Amazon Kendra consulte[Requisitos previos](#prerequisites-postgresql).

------
#### [ Console ]

**Para conectarse Amazon Kendra a PostgreSQL** 

1. Inicie sesión en la [Amazon Kendraconsola Consola de administración de AWS y ábrala](https://console.aws.amazon.com/kendra/).

1. En el panel de navegación izquierdo, elija **Índices** y, a continuación, elija el índice que desee usar de la lista de índices.
**nota**  
Puede elegir configurar o editar los ajustes de **Control de acceso de usuarios** en la **Configuración del índice**. 

1. En la página **Introducción**, seleccione **Agregar origen de datos**.

1. En la página **Agregar origen de datos**, seleccione el **Conector de PostgreSQL** y, a continuación, seleccione **Agregar conector**. Si usa la versión 2 (si corresponde), elija el **Conector de PostgreSQL** con la etiqueta “V2.0”.

1. En la página **Especificar detalles del origen de datos**, introduzca la siguiente información:

   1. En **Nombre y descripción**, en **Nombre del origen de datos**: introduzca un nombre para el origen de datos. Puede incluir guiones, pero no espacios.

   1. (Opcional)** Descripción**: introduzca una descripción opcional para el origen de datos.

   1. En **Idioma predeterminado**: elija un idioma para filtrar los documentos para el índice. A menos que especifique lo contrario, el idioma predeterminado es el inglés. El idioma especificado en los metadatos del documento anula el idioma seleccionado.

   1. En **Etiquetas**, para **añadir una nueva etiqueta**: incluye etiquetas opcionales para buscar y filtrar tus recursos o realizar un seguimiento de tus AWS costes.

   1. Elija **Siguiente**.

1. En la página **Definir acceso y seguridad**, introduzca la siguiente información:

   1. En **Origen**, introduzca la siguiente información:

   1.  **Host**: introduzca el nombre del host de la base de datos.

   1.  **Puerto**: introduzca el puerto de la base de datos.

   1.  **Instancia**: introduzca la instancia de la base de datos.

   1. **Habilitar la ubicación del certificado SSL**: elija introducir la Amazon S3 ruta al archivo de certificado SSL.

   1. En **Autenticación**, introduzca la siguiente información:

      1. **AWS Secrets Managersecreto**: elija un secreto existente o cree uno nuevo Secrets Manager para almacenar sus credenciales de PostgreSQL autenticación. Si decide crear un secreto nuevo, se abrirá una ventana de secreto de AWS Secrets Manager.

        1. Introduzca la siguiente información en la **ventana Crear un secreto de AWS Secrets Manager**:

           1. **Nombre del secreto**: un nombre para su secreto. El prefijo 'AmazonKendra- PostgreSQL -' se añade automáticamente a tu nombre secreto.

           1. Para el **nombre de usuario** y la **contraseña de la base de datos**: introduzca los valores de las credenciales de autenticación que ha copiado de la base de datos. 

        1. Seleccione **Save**.

   1. **Nube privada virtual (VPC)**: puede optar por utilizar una VPC. Si es así, debe agregar **Subredes** y **Grupos de seguridad de VPC**.

   1. **IAMrol**: elige un IAM rol existente o crea uno nuevo IAM para acceder a las credenciales del repositorio y al contenido del índice.
**nota**  
IAMlos roles utilizados para los índices no se pueden usar para las fuentes de datos. Si no está seguro de si un rol existente se utiliza para un índice o para las preguntas frecuentes, elija **Crear un nuevo rol** para evitar errores.

   1. Elija **Siguiente**.

1. En la página **Configurar ajustes de sincronización**, introduzca la siguiente información:

   1. En **Ámbito de sincronización**, seleccione de entre las siguientes opciones:
      + **Consulta SQL**: introduzca instrucciones de consulta SQL, como las operaciones SELECT y JOIN. Las consultas de SQL deben ser inferiores a 32 KB. Amazon Kendra rastreará todo el contenido de la base de datos que coincida con su consulta.
      + **Columna de clave principal**: proporcione la clave principal de la tabla de la base de datos. Esto identifica una tabla dentro de la base de datos.
      + **Columna de título**: proporcione el nombre de la columna del título del documento en la tabla de la base de datos.
      + **Columna de cuerpo**: proporcione el nombre de la columna del cuerpo del documento en la tabla de la base de datos.

   1. En **Configuración adicional (*opcional*)**, elija una de las siguientes opciones para sincronizar contenido específico en lugar de sincronizar todos los archivos:
      + **Columnas de detección de cambios**: introduzca los nombres de las columnas que se Amazon Kendra utilizarán para detectar cambios en el contenido. Amazon Kendravolverá a indexar el contenido cuando se produzca un cambio en alguna de estas columnas.
      + ** IDsColumna de usuarios**: introduzca el nombre de la columna que contiene el usuario IDs al que se le permitirá acceder al contenido.
      + **Columna de grupos**: introduzca el nombre de la columna que contiene los grupos a los que se dará acceso al contenido.
      + ** URLsColumna de origen**: introduzca el nombre de la columna que contiene el origen que se va URLs a indexar.
      + **Columna de marcas de tiempo**: introduzca el nombre de la columna que contiene las marcas de tiempo. Amazon Kendrautiliza la información de las marcas de tiempo para detectar cambios en el contenido y sincronizar solo el contenido modificado. 
      + **Columna de zonas horarias**: introduzca el nombre de la columna que contiene las zonas horarias del contenido que se va a rastrear.
      + **Formato de marcas temporales**: introduzca el nombre de la columna que contiene los formatos de marcas temporales que se deben utilizar para detectar cambios en el contenido y volver a sincronizar su contenido.

   1. **Modo de sincronización**: elija cómo desea actualizar el índice cuando cambie el contenido del origen de datos. Al sincronizar la fuente de datos Amazon Kendra por primera vez, todo el contenido se rastrea e indexa de forma predeterminada. Debe ejecutar una sincronización completa de los datos si la sincronización inicial falló, incluso si no selecciona la sincronización completa como opción de modo de sincronización.
      + Sincronización completa: se vuelve a indexar todo el contenido, reemplazando el contenido existente cada vez que el origen de datos se sincronice con el índice.
      + Sincronización de lo nuevo y modificado: se indexa solo el contenido nuevo y modificado cada vez que el origen de datos se sincroniza con el índice. Amazon Kendra puede utilizar el mecanismo del origen de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido modificado desde la última sincronización.
      + Sincronización nueva, modificada o eliminada: indexe solo el contenido nuevo, modificado y eliminado cada vez que la fuente de datos se sincronice con el índice. Amazon Kendrapuede usar el mecanismo de la fuente de datos para rastrear los cambios en el contenido e indexar el contenido que ha cambiado desde la última sincronización.

   1. En **Programa de ejecución de sincronización**, en **Frecuencia**: la frecuencia con la que Amazon Kendra se sincronizará con el origen de datos.

   1. Elija **Siguiente**.

1. En la página **Establecer asignaciones de campos**, especifique la siguiente información:

   1. Seleccione uno de los campos de fuente de datos predeterminados generados (**Documento IDs****, Títulos** de documentos y **Fuente URLs**) que desee mapear para Amazon Kendra indexarlos.

   1.  **Agregar campo**: para agregar campos de origen de datos personalizados para crear un nombre de campo de índice al que asignarlos y el tipo de datos del campo.

   1. Elija **Siguiente**.

1. En la página **Revisar y crear**, compruebe que la información que ha introducido es correcta y, a continuación, seleccione **Añadir origen de datos**. También puede elegir editar la información desde esta página. El origen de datos aparecerá en la página **Orígenes de datos** una vez que el origen de datos se haya agregado correctamente.

------
#### [ API ]

**Para conectarse a Amazon Kendra PostgreSQL**

Debe especificar lo siguiente mediante la [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html)API:
+ **Origen de datos**: defina el tipo de origen de datos como `JDBC` cuando utilice el esquema JSON [https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html](https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html). Además, defina el origen de datos como `TEMPLATE` al llamar a la API [https://docs.aws.amazon.com/kendra/latest/dg/API_CreateDataSource.html](https://docs.aws.amazon.com/kendra/latest/dg/API_CreateDataSource.html).
+ **Tipo de base de datos**: debe especificar el tipo de base de datos como `postgresql`.
+ **Consulta SQL**: especifique instrucciones de consulta SQL, como las operaciones SELECT y JOIN. Las consultas de SQL deben ser inferiores a 32 KB. Amazon Kendra rastreará todo el contenido de la base de datos que coincida con su consulta.
+ **Modo de sincronización**: especifique cómo Amazon Kendra debe actualizarse el índice cuando cambie el contenido de la fuente de datos. Al sincronizar el origen de datos con Amazon Kendra por primera vez, todo el contenido se rastrea y se indexa de forma predeterminada. Debe ejecutar una sincronización completa de los datos si la sincronización inicial falló, incluso si no selecciona la sincronización completa como opción de modo de sincronización. Puede elegir entre las siguientes opciones:
  + `FORCED_FULL_CRAWL` para volver a indexar todo el contenido, reemplazando el contenido existente cada vez que el origen de datos se sincronice con el índice.
  + `FULL_CRAWL` para indexar solo el contenido nuevo, modificado y eliminado cada vez que el origen de datos se sincronice con el índice. Amazon Kendra puede utilizar el mecanismo del origen de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido modificado desde la última sincronización.
  + `CHANGE_LOG` para indexar solo el contenido nuevo y modificado cada vez que el origen de datos se sincronice con el índice. Amazon Kendra puede utilizar el mecanismo del origen de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido modificado desde la última sincronización.
+ **Nombre secreto de recurso de Amazon (ARN): proporcione** el nombre de recurso de Amazon (ARN) de un Secrets Manager secreto que contenga las credenciales de autenticación que creó en su cuenta. PostgreSQL El secreto se almacena en una estructura JSON con las siguientes claves:

  ```
  {
      "user name": "database user name",
      "password": "password"
  }
  ```
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).
+ **IAMrol**: especifique `RoleArn` cuándo llama `CreateDataSource` para proporcionar un IAM rol con permisos para acceder a su Secrets Manager secreto y para llamar al público requerido APIs para el conector y. PostgreSQL Amazon Kendra Para obtener más información, consulte [Roles de IAM para orígenes de datos de PostgreSQL](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds).

También puede añadir las siguientes características opcionales:
+  **Nube privada virtual (VPC)**: especifique a `VpcConfiguration` cuándo llamar a `CreateDataSource`. Para obtener más información, consulte [¿Se está configurando Amazon Kendra para usar un Amazon VPC](vpc-configuration.md).
+  **Filtros de inclusión y exclusión**: puede especificar si desea incluir contenido específico mediante el usuario IDs, los grupos, la fuente URLs, las marcas horarias y las zonas horarias. 
+  **Filtrado de contexto de usuario y control de acceso**: si hay una lista de control de acceso (ACL) para los documentos, Amazon Kendra la rastreará. La información de la ACL se utiliza para filtrar los resultados de búsqueda en función del acceso del usuario o su grupo a los documentos. Para obtener más información, consulte [Filtrado de contexto de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#datasource-context-filter).
+  **Asignaciones de campos**: elija asignar los campos del origen de datos de PostgreSQL a los campos de índice de Amazon Kendra. Para obtener más información, consulte [Asignación de campos de origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/field-mapping.html).
**nota**  
El campo del cuerpo del documento o el cuerpo del documento equivalente de sus documentos es obligatorio Amazon Kendra para poder buscarlos. Debe asignar el nombre del campo del cuerpo del documento en el origen de datos al nombre del campo del índice `_document_body`. Todos los demás campos son opcionales.

Para obtener una lista de otras claves JSON importantes que debe configurar, consulte [Esquema de plantilla de PostgreSQL](ds-schemas.md#ds-postgresql-schema).

------

## Notas

+ Las filas de la base de datos eliminadas no se registrarán cuando se Amazon Kendra compruebe si hay contenido actualizado.
+ El tamaño de los nombres y valores de los campos de una fila de la base de datos no puede superar los 400 KB.
+ Si tiene una gran cantidad de datos en la fuente de datos de la base de datos y no desea Amazon Kendra indexar todo el contenido de la base de datos después de la primera sincronización, puede optar por sincronizar solo los documentos nuevos, modificados o eliminados.
+ Como práctica recomendada, proporcione credenciales de base Amazon Kendra de datos de solo lectura.
+ Como práctica recomendada, evite añadir tablas con datos confidenciales o información de identificación personal (PII).

# Quip


**nota**  
El conector Quip seguirá siendo totalmente compatible con los clientes actuales hasta el 31 de mayo de 2026. Si bien este conector ya no está disponible para los nuevos usuarios, los usuarios actuales pueden seguir utilizándolo sin interrupción. Desarrollamos de forma continua nuestra cartera de conectores para ofrecer soluciones más escalables y personalizables. Para futuras integraciones, le recomendamos que valore el marco de conectores personalizados de Amazon Kendra[1], diseñado de manera más flexible para una variedad más amplia de casos de uso empresariales.

Quip es un software de productividad colaborativa que ofrece capacidades de creación de documentos en tiempo real. Puede usarlo Amazon Kendra para indexar sus carpetas, archivos, comentarios de archivos, salas de chat y archivos adjuntos de Quip.

Puede conectarse Amazon Kendra a su fuente de datos de Quip mediante la [Amazon Kendraconsola y la API](https://console.aws.amazon.com/kendra/). [QuipConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_QuipConfiguration.html)

Para solucionar problemas del conector de fuente de datos de Amazon Kendra Quip, consulte. [Solución de problemas con los orígenes de datos](troubleshooting-data-sources.md)

**Topics**
+ [

## Características admitidas
](#supported-features-quip)
+ [

## Requisitos previos
](#prerequisites-quip)
+ [

## Instrucciones de conexión
](#data-source-procedure-quip)
+ [

## Más información
](#quip-learn-more)

## Características admitidas


Amazon KendraEl conector de fuente de datos Quip admite las siguientes funciones:
+ Asignaciones de campos
+ Control de acceso de usuarios
+ Filtros de inclusión/exclusión
+ Nube privada virtual (VPC)

## Requisitos previos


Antes de poder utilizarla Amazon Kendra para indexar su fuente de datos de Quip, realice estos cambios en Quip y en sus cuentas. AWS

**En Quip, asegúrese de que:**
+ Tiene una cuenta de Quip con permisos administrativos.
+ Ha creado credenciales de autenticación de Quip que incluyen un token de acceso personal. El token se utiliza como su credencial de autenticación almacenada en un secreto. AWS Secrets Manager Consulte la [Documentación de Quip sobre la autenticación](https://quip.com/dev/admin/documentation/current#section/Authentication) para obtener más información.
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).
+ Ha copiado el dominio de su sitio de Quip. Por ejemplo, *https://quip-company.quipdomain.com/browse* dónde *quipdomain* está el dominio.
+ Ha comprobado que cada documento es único en Quip y en otros orígenes de datos que vaya a utilizar para el mismo índice. Cada origen de datos que desee utilizar para un índice no debe contener el mismo documento en varios orígenes de datos. IDs Los documentos son globales en relación con un índice y deben ser únicos por índice.

**En el tuyoCuenta de AWS, asegúrate de tener:**
+ [Creó un Amazon Kendra índice](https://docs.aws.amazon.com/kendra/latest/dg/create-index.html) y, si usa la API, anotó el ID del índice.
+ [Creó un IAM rol](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds) para su fuente de datos y, si usa la API, anotó el ARN del IAM rol.
**nota**  
Si cambias el tipo de autenticación y las credenciales, debes actualizar tu IAM rol para acceder al ID AWS Secrets Manager secreto correcto.
+ Ha guardado sus credenciales de autenticación de Quip en un secreto de AWS Secrets Manager y, si utiliza la API, ha anotado el ARN del secreto.
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).

Si no tiene un IAM rol o secreto existente, puede usar la consola para crear un nuevo IAM rol y un Secrets Manager secreto al conectar su fuente de datos de Quip. Amazon Kendra Si utiliza la API, debe proporcionar el ARN de un IAM rol y un Secrets Manager secreto existentes y un ID de índice.

## Instrucciones de conexión


Para conectarse Amazon Kendra a su fuente de datos de Quip, debe proporcionar los detalles necesarios de su fuente de datos de Quip para que Amazon Kendra pueda acceder a sus datos. Si aún no ha configurado Quip paraAmazon Kendra, consulte. [Requisitos previos](#prerequisites-quip)

------
#### [ Console ]

**Para conectarse Amazon Kendra a Quip** 

1. Inicie sesión en la [Amazon Kendraconsola Consola de administración de AWS](https://console.aws.amazon.com/kendra/) y ábrala.

1. En el panel de navegación izquierdo, elija **Índices** y, a continuación, elija el índice que desee usar de la lista de índices.
**nota**  
Puede elegir configurar o editar los ajustes de **Control de acceso de usuarios** en la **Configuración del índice**. 

1. En la página **Introducción**, seleccione **Agregar origen de datos**.

1. En la página **Agregar origen de datos**, seleccione el **Conector de Quip** y, a continuación, seleccione **Agregar conector**. Si usa la versión 2 (si corresponde), elija el **Conector de Quip** con la etiqueta “V2.0”.

1. En la página **Especificar detalles del origen de datos**, introduzca la siguiente información:

   1. En **Nombre y descripción**, en **Nombre del origen de datos**: introduzca un nombre para el origen de datos. Puede incluir guiones, pero no espacios.

   1. (Opcional)** Descripción**: introduzca una descripción opcional para el origen de datos.

   1. En **Idioma predeterminado**: elija un idioma para filtrar los documentos para el índice. A menos que especifique lo contrario, el idioma predeterminado es el inglés. El idioma especificado en los metadatos del documento anula el idioma seleccionado.

   1. En **Etiquetas**, para **añadir una nueva etiqueta**: incluye etiquetas opcionales para buscar y filtrar tus recursos o realizar un seguimiento de tus AWS costes.

   1. Elija **Siguiente**.

1. En la página **Definir acceso y seguridad**, introduzca la siguiente información:

   1. **Nombre de dominio de Quip**: introduzca el Quip que ha copiado de la cuenta de Quip.

   1. **AWS Secrets Managersecreto**: elija un secreto existente o cree uno nuevo para almacenar sus Secrets Manager credenciales de autenticación de Quip. Si decide crear un secreto nuevo, se abrirá una ventana de secreto de AWS Secrets Manager.

      1. Introduzca la siguiente información en la **ventana Crear un secreto de AWS Secrets Manager**:

         1. **Nombre del secreto**: un nombre para su secreto. El prefijo «AmazonKendra-Quip» se añade automáticamente a su nombre secreto.

         1. **Token de Quip**: introduzca el acceso personal de Quip configurado en Quip.

      1. Agregue y guarde el secreto.

   1. **Nube privada virtual (VPC)**: puede optar por utilizar una VPC. Si es así, debe agregar **Subredes** y **Grupos de seguridad de VPC**.

   1. **IAMrol**: elige un IAM rol existente o crea uno nuevo IAM para acceder a las credenciales del repositorio y al contenido del índice.
**nota**  
IAMlos roles utilizados para los índices no se pueden usar para las fuentes de datos. Si no está seguro de si un rol existente se utiliza para un índice o para las preguntas frecuentes, elija **Crear un nuevo rol** para evitar errores.

   1. Elija **Siguiente**.

1. En la página **Configurar ajustes de sincronización**, introduzca la siguiente información:

   1. **Añadir la carpeta de Quip IDs a rastrear**: la carpeta de Quip IDs que desea rastrear.
**nota**  
Para rastrear una carpeta raíz, incluidas todas las subcarpetas y documentos que contiene, agregue el ID de la carpeta raíz. Para rastrear subcarpetas específicas, añada la subcarpeta específica. IDs

   1. **Configuración adicional (tipos de contenido)**: introduzca los tipos de contenido que desee rastrear.

   1. **Patrones regex**: patrones de expresiones regulares para incluir o excluir determinados archivos. Puedes añadir hasta 100 patrones.

   1. En **Programación de ejecución de sincronización**, en **Frecuencia**: elija la frecuencia con la que desea sincronizar el contenido del origen de datos y actualizar el índice.

   1. Elija **Siguiente**.

1. En la página **Establecer asignaciones de campos**, especifique la siguiente información:

   1. Seleccione uno de los campos de fuente de datos predeterminados generados que desee mapear para Amazon Kendra indexar.

   1.  **Agregar campo**: para agregar campos de origen de datos personalizados para crear un nombre de campo de índice al que asignarlos y el tipo de datos del campo.

   1. Elija **Siguiente**.

1. En la página **Revisar y crear**, compruebe que la información que ha introducido es correcta y, a continuación, seleccione **Añadir origen de datos**. También puede elegir editar la información desde esta página. El origen de datos aparecerá en la página **Orígenes de datos** una vez que el origen de datos se haya agregado correctamente.

------
#### [ API ]

**Para conectarse Amazon Kendra a Quip**

Debe especificar lo siguiente mediante la [QuipConfiguration ](https://docs.aws.amazon.com/kendra/latest/APIReference/API_QuipConfiguration.html)API:
+ **Dominio del sitio de Quip**: por ejemplo, *https://quip-company.quipdomain.com/browse* dónde *quipdomain* está el dominio.
+ **Nombre secreto de recurso de Amazon (ARN): proporcione** el nombre de recurso de Amazon (ARN) de un Secrets Manager secreto que contenga las credenciales de autenticación de su cuenta de Quip. El secreto se almacena en una estructura JSON con las siguientes claves:

  ```
  {
      "accessToken": "token"
  }
  ```
+ **IAMrol**: especifique `RoleArn` cuándo llama `CreateDataSource` para proporcionar un IAM rol con permisos para acceder a su Secrets Manager secreto y para llamar al público APIs requerido para el conector de Quip y. Amazon Kendra Para obtener más información, consulte [Roles de IAM](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds) para orígenes de datos de Quip.

También puede añadir las siguientes características opcionales:
+ **Nube privada virtual (VPC)**: especifique `VpcConfiguration` como parte de la configuración del origen de datos. Consulte [Configuración de Amazon Kendra para utilizar una VPC](https://docs.aws.amazon.com/kendra/latest/dg/vpc-configuration.html).
+  **Filtros de inclusión y exclusión**: especifique si desea incluir o excluir determinados archivos.
**nota**  
La mayoría de los orígenes de datos utilizan patrones de expresiones regulares, que son patrones de inclusión o exclusión denominados filtros. Si especifica un filtro de inclusión, solo se indexará el contenido que coincida con el filtro de inclusión. Los documentos que no coincidan con el filtro de inclusión no se indexan. Si especifica un filtro de inclusión y exclusión, los documentos que coincidan con el filtro de exclusión no se indexarán, aunque coincidan con el filtro de inclusión.
+ **Carpetas**: especifique las carpetas y subcarpetas de Quip que desee indexar
**nota**  
Para rastrear una carpeta raíz, incluidas todas las subcarpetas y documentos que contiene, introduzca el ID de la carpeta raíz. Para rastrear subcarpetas específicas, añada la subcarpeta específica. IDs
+ **Archivos adjuntos, salas de chat, comentarios de archivos**: elija si desea incluir el rastreo de los archivos adjuntos, el contenido de las salas de chat y los comentarios de los archivos.
+  **Filtrado de contexto de usuario y control de acceso**: si hay una lista de control de acceso (ACL) para los documentos, Amazon Kendra la rastreará. La información de la ACL se utiliza para filtrar los resultados de búsqueda en función del acceso del usuario o su grupo a los documentos. Para obtener más información, consulte [Filtrado de contexto de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#datasource-context-filter).
+  **Asignaciones de campos**: elija asignar los campos del origen de datos de Quip a los campos de índice de Amazon Kendra. Para obtener más información, consulte [Asignación de campos de origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/field-mapping.html).
**nota**  
El campo del cuerpo del documento o el cuerpo del documento equivalente de sus documentos es obligatorio Amazon Kendra para poder buscarlos. Debe asignar el nombre del campo del cuerpo del documento en el origen de datos al nombre del campo del índice `_document_body`. Todos los demás campos son opcionales.

------

## Más información


Para obtener más información sobre la integración Amazon Kendra con su fuente de datos de Quip, consulte:
+ [Busque información en los documentos de Quip mediante la búsqueda inteligente mediante el conector Quip para Amazon Kendra](https://aws.amazon.com/blogs/machine-learning/search-for-knowledge-in-quip-documents-with-intelligent-search-using-the-quip-connector-for-amazon-kendra/)

# Salesforce


Salesforce es una herramienta de gestión de relaciones con los clientes (CRM) para administrar los equipos de soporte, ventas y marketing. Puede usarlo Amazon Kendra para indexar sus objetos estándar de Salesforce e incluso objetos personalizados. 

Puede conectarse Amazon Kendra a su fuente de datos de Salesforce mediante la [Amazon Kendraconsola](https://console.aws.amazon.com/kendra/), la [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_TemplateConfiguration.html)API o la [SalesforceConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_SalesforceConfiguration.html)API.

Amazon Kendratiene dos versiones del conector de Salesforce. Las características compatibles de cada versión incluyen:

**Conector de Salesforce V1.0/API [SalesforceConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_SalesforceConfiguration.html)**
+ Asignaciones de campos
+ Control de acceso de usuarios
+ Filtros de inclusión/exclusión

**Conector de Salesforce V2.0/API [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_TemplateConfiguration.html)**
+ Asignaciones de campos
+ Control de acceso de usuarios
+ Filtros de inclusión/exclusión
+ Sincronizaciones completas e incrementales del contenido
+ Nube privada virtual (VPC)

**nota**  
El conector SalesforceConfiguration V1.0/API de Salesforce finalizó en 2023. Recomendamos migrar o utilizar el conector V2.0/API de Salesforce. TemplateConfiguration 

Para solucionar problemas de su conector de fuente de datos de Amazon Kendra Salesforce, consulte. [Solución de problemas con los orígenes de datos](troubleshooting-data-sources.md)

**Topics**
+ [

# Salesforce Connector V1.0
](data-source-v1-salesforce.md)
+ [

# Salesforce Connector V2.0
](data-source-v2-salesforce.md)

# Salesforce Connector V1.0


Salesforce es una herramienta de gestión de relaciones con los clientes (CRM) para administrar los equipos de soporte, ventas y marketing. Puede utilizarlo Amazon Kendra para indexar sus objetos estándar de Salesforce e incluso objetos personalizados.

**importante**  
Amazon Kendrautiliza la versión 48 de la API de Salesforce. La API de Salesforce limita la cantidad de solicitudes que se pueden realizar por día. Si Salesforce supera esas solicitudes, lo volverá a intentar hasta que pueda continuar.

**nota**  
El conector SalesforceConfiguration V1.0/API de Salesforce finalizó en 2023. Recomendamos migrar o utilizar el conector V2.0/API de Salesforce. TemplateConfiguration 

Para solucionar problemas de su conector de fuente de datos de Amazon Kendra Salesforce, consulte. [Solución de problemas con los orígenes de datos](troubleshooting-data-sources.md)

**Topics**
+ [

## Características admitidas
](#supported-features-v1-salesforce)
+ [

## Requisitos previos
](#prerequisites-v1-salesforce)
+ [

## Instrucciones de conexión
](#data-source-procedure-v1-salesforce)

## Características admitidas


Amazon KendraEl conector de fuente de datos de Salesforce admite las siguientes funciones:
+ Asignaciones de campos
+ Control de acceso de usuarios
+ Filtros de inclusión/exclusión

## Requisitos previos


Antes de que pueda utilizarla Amazon Kendra para indexar su fuente de datos de Salesforce, realice estos cambios en Salesforce y en sus cuentas. AWS

**En Salesforce, asegúrese de que:**
+ Ha creado una cuenta de Salesforce y ha anotado el nombre de usuario y la contraseña que utiliza para conectarse a Salesforce.
+ Ha creado una cuenta de Salesforce Connected App OAuth con la clave de consumidor (ID de cliente) y el secreto de consumidor (secreto de cliente) asignados a su aplicación Salesforce Connected. El ID de cliente y el secreto del cliente se utilizan como credenciales de autenticación almacenadas en un AWS Secrets Manager secreto. Consulte la [Documentación de Salesforce sobre aplicaciones conectadas](https://help.salesforce.com/s/articleView?id=sf.connected_app_overview.htm&type=5) para obtener más información.
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).
+ Ha copiado el token de seguridad de Salesforce asociado a la cuenta utilizada para conectarse a Salesforce.
+ Ha copiado la URL de la instancia de Salesforce que desea indexar. Normalmente es *https://<company>.salesforce.com/*. El servidor debe ejecutar una aplicación conectada de Salesforce.
+ Se agregaron credenciales a su servidor de Salesforce para un usuario con acceso de solo lectura a Salesforce. Para ello, clonó el ReadOnly perfil y, a continuación, agregó los permisos Ver todos los datos y Administrar artículos. Estas credenciales identifican al usuario que realiza la conexión y a la aplicación conectada de Salesforce a la que se conecta. Amazon Kendra
+ Ha comprobado que cada documento es único en Salesforce y en otros orígenes de datos que vaya a utilizar para el mismo índice. Cada origen de datos que desee utilizar para un índice no debe contener el mismo documento en varios orígenes de datos. IDs Los documentos son globales en relación con un índice y deben ser únicos por índice.

**En el tuyoCuenta de AWS, asegúrate de tener:**
+ [Creó un Amazon Kendra índice](https://docs.aws.amazon.com/kendra/latest/dg/create-index.html) y, si usa la API, anotó el ID del índice.
+ [Creó un IAM rol](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds) para su fuente de datos y, si usa la API, anotó el ARN del IAM rol.
**nota**  
Si cambias el tipo de autenticación y las credenciales, debes actualizar tu IAM rol para acceder al ID AWS Secrets Manager secreto correcto.
+ Ha guardado sus credenciales de autenticación de Salesforce en un secreto de AWS Secrets Manager y, si utiliza la API, ha anotado el ARN del secreto.
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).

Si no tiene un IAM rol o secreto existente, puede usar la consola para crear un nuevo IAM rol y un Secrets Manager secreto al conectar su fuente de datos de Salesforce. Amazon Kendra Si utiliza la API, debe proporcionar el ARN de un IAM rol y un Secrets Manager secreto existentes y un ID de índice.

## Instrucciones de conexión


Para conectarse Amazon Kendra a su fuente de datos de Salesforce, debe proporcionar los detalles necesarios de su fuente de datos de Salesforce para que Amazon Kendra pueda acceder a sus datos. Si aún no ha configurado Salesforce para consultarlo. Amazon Kendra [Requisitos previos](#prerequisites-v1-salesforce)

------
#### [ Console ]

**Para conectarse a Amazon Kendra Salesforce** 

1. Inicie sesión en la consola AWS de administración y abra la [Amazon Kendraconsola](https://console.aws.amazon.com/kendra/).

1. En el panel de navegación izquierdo, elija **Índices** y, a continuación, elija el índice que desee usar de la lista de índices.
**nota**  
Puede elegir configurar o editar los ajustes de **Control de acceso de usuarios** en la **Configuración del índice**. 

1. En la página **Introducción**, seleccione **Agregar origen de datos**.

1. En la página **Agregar origen de datos**, seleccione **Salesforce Connector V1.0** y, a continuación, seleccione **Añadir conector**.

1. En la página **Especificar detalles del origen de datos**, introduzca la siguiente información: 

   1. **Nombre de origen de datos**: introduzca un nombre para el origen de datos. Puede incluir guiones, pero no espacios.

   1. (Opcional)** Descripción**: introduzca una descripción opcional para el origen de datos. 

   1. **Idioma predeterminado**: un idioma para filtrar los documentos para el índice. A menos que especifique lo contrario, el idioma predeterminado es el inglés. El idioma especificado en los metadatos anula el idioma seleccionado.

   1. **Agregar nueva etiqueta**: etiquetas para buscar y filtrar los recursos o hacer un seguimiento de los costos compartidos.

   1. Elija **Siguiente**.

1. En la página **Definir acceso y seguridad**, introduzca la siguiente información:

   1. **URL de Salesforce**: introduzca la URL de la instancia para el sitio de Salesforce que desea indexar.

   1. En **Tipo de autenticación**, elija entre **Existente** y **Nuevo** para almacenar las credenciales de autenticación de Salesforce. Si decide crear un secreto nuevo, se abrirá una ventana AWS Secrets Manager secreta.

      1. Introduzca la siguiente información en la **ventana Crear un secreto de AWS Secrets Manager**:

        1. **Nombre del secreto**: un nombre para su secreto. El prefijo «AmazonKendra-Salesforce-» se añade automáticamente a su nombre secreto.

        1. En **Nombre de usuario**, **Contraseña**, **Token de seguridad**, **Clave de consumidor**, **Secreto del consumidor** y **URL de autenticación**: introduzca los valores de las credenciales de autenticación que creó en la cuenta de Salesforce. 

        1. Seleccione **Guardar autenticación**.

   1. **IAMrol**: elija un IAM rol existente o cree uno nuevo IAM para acceder a las credenciales del repositorio y al contenido del índice.
**nota**  
IAMlos roles utilizados para los índices no se pueden usar para las fuentes de datos. Si no está seguro de si un rol existente se utiliza para un índice o para las preguntas frecuentes, elija **Crear un nuevo rol** para evitar errores.

   1. Elija **Siguiente**.

1. En la página **Configurar ajustes de sincronización**, introduzca la siguiente información:

   1. En **Rastrear archivos adjuntos**: seleccione esta opción para rastrear todos los objetos, artículos y feeds adjuntos.

   1. En **Objetos estándar**, **Artículos de conocimiento** y **Fuente de chat**, seleccione las entidades o los tipos de contenido de Salesforce que desee rastrear.
**nota**  
Debe proporcionar información de configuración para indexar al menos uno de los objetos estándar, artículos de conocimiento o fuentes de chat. Si decide rastrear los **Artículos de conocimiento**, debe especificar los tipos de artículos de conocimiento que desea indexar, el nombre de los artículos y si desea indexar los campos estándar de todos los artículos de conocimiento o solo los campos de un tipo de artículo personalizado. Si decide indexar artículos personalizados, debe especificar el nombre interno del tipo de artículo. Puede especificar hasta 10 tipos de artículos.

   1. **Frecuencia: la frecuencia** con la Amazon Kendra que se sincronizará con la fuente de datos.

   1. Elija **Siguiente**.

1. En la página **Establecer asignaciones de campos**, especifique la siguiente información:

   1. Para ver el **artículo de conocimiento estándar****, los archivos adjuntos a objetos estándar** y **las asignaciones de campos sugeridas adicionales**, seleccione entre los campos de fuentes de datos predeterminados Amazon Kendra generados que desee asignar a su índice.
**nota**  
Es necesaria una asignación de índice a `_document_body`. No puede cambiar la asignación entre el campo `Salesforce ID` y el campo `_document_id ` de Amazon Kendra. 

   1.  **Agregar campo**: para agregar campos de origen de datos personalizados para crear un nombre de campo de índice al que asignarlos y el tipo de datos del campo.

   1. Elija **Siguiente**.

1. En la página **Revisar y crear**, compruebe que la información que ha introducido es correcta y, a continuación, seleccione **Añadir origen de datos**. También puede elegir editar la información desde esta página. El origen de datos aparecerá en la página **Orígenes de datos** una vez que el origen de datos se haya agregado correctamente.

------
#### [ API ]

**Para conectarse a Salesforce Amazon Kendra**

Debe especificar lo siguiente en la [SalesforceConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_SalesforceConfiguration.html)API:
+ **URL del servidor**: la URL de la instancia para el sitio de Salesforce que desea indexar.
+ **Nombre secreto del recurso de Amazon (ARN)**: proporcione el nombre del recurso de Amazon (ARN) de un Secrets Manager secreto que contenga las credenciales de autenticación de su cuenta de Salesforce. El secreto se almacena en una estructura JSON con las siguientes claves:

  ```
  {
      "authenticationUrl": "OAUTH endpoint that Amazon Kendra connects to get an OAUTH token",
      "consumerKey": "Application public key generated when you created your Salesforce application",
      "consumerSecret": "Application private key generated when you created your Salesforce application.",
      "password": "Password associated with the user logging in to the Salesforce instance",
      "securityToken": "Token associated with the user account logging in to the Salesforce instance",
      "username": "User name of the user logging in to the Salesforce instance"
  }
  ```
+ **IAMrol**: especifique `RoleArn` cuándo llama `CreateDataSource` para proporcionar un IAM rol con permisos para acceder a su Secrets Manager secreto y para llamar al público APIs requerido para el conector de Salesforce y. Amazon Kendra Para obtener más información, consulte [Roles de IAM para orígenes de datos de Salesforce](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds).
+ Debe proporcionar información de configuración para indexar al menos uno de los objetos estándar, artículos de conocimiento o fuentes de chat.
  + **Objetos estándar**: si decide rastrear los **Objetos estándar**, debe especificar el nombre del objeto estándar y el nombre del campo de la tabla de objetos estándar que contiene el contenido del documento.
  + **Artículos de conocimiento**: si decide rastrear los **Artículos de conocimiento**, debe especificar los tipos de artículos de conocimiento que desea indexar, los estados de los artículos de conocimiento que desea indexar y si quiere indexar los campos estándar de todos los artículos de conocimiento o solo los campos de un tipo de artículo personalizado.
  + **Fuentes de Chatter**: si decide rastrear las **fuentes de Chatter**, debe especificar el nombre de la columna de la FeedItem tabla de Salesforce que contiene el contenido que se va a indexar.

También puede añadir las siguientes características opcionales:
+  **Filtros de inclusión y exclusión**: especifique si desea incluir o excluir determinados archivos adjuntos.
**nota**  
La mayoría de los orígenes de datos utilizan patrones de expresiones regulares, que son patrones de inclusión o exclusión denominados filtros. Si especifica un filtro de inclusión, solo se indexará el contenido que coincida con el filtro de inclusión. Los documentos que no coincidan con el filtro de inclusión no se indexan. Si especifica un filtro de inclusión y exclusión, los documentos que coincidan con el filtro de exclusión no se indexarán, aunque coincidan con el filtro de inclusión.
+  **Asignaciones de campos**: elija asignar los campos del origen de datos de Salesforce a los campos de índice de Amazon Kendra. Para obtener más información, consulte [Asignación de campos de origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/field-mapping.html).
**nota**  
El campo del cuerpo del documento o el cuerpo del documento equivalente de sus documentos es obligatorio para Amazon Kendra poder buscarlos. Debe asignar el nombre del campo del cuerpo del documento en el origen de datos al nombre del campo del índice `_document_body`. Todos los demás campos son opcionales.
+  **Filtrado de contexto de usuario y control de acceso**: si hay una lista de control de acceso (ACL) para los documentos, Amazon Kendra la rastreará. La información de la ACL se utiliza para filtrar los resultados de búsqueda en función del acceso del usuario o su grupo a los documentos. Para obtener más información, consulte [Filtrado de contexto de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#datasource-context-filter).

------

# Salesforce Connector V2.0


Salesforce es una herramienta de gestión de relaciones con los clientes (CRM) para administrar los equipos de soporte, ventas y marketing. Puede utilizarlo Amazon Kendra para indexar sus objetos estándar de Salesforce e incluso objetos personalizados.

El conector de fuentes de datos de Amazon Kendra Salesforce es compatible con las siguientes ediciones de Salesforce: Developer Edition y Enterprise Edition.

**nota**  
El conector SalesforceConfiguration V1.0/API de Salesforce finalizó en 2023. Recomendamos migrar o utilizar el conector V2.0/API de Salesforce. TemplateConfiguration 

Para solucionar problemas de su conector de fuente de datos de Amazon Kendra Salesforce, consulte. [Solución de problemas con los orígenes de datos](troubleshooting-data-sources.md)

**Topics**
+ [

## Características admitidas
](#supported-features-v2-salesforce)
+ [

## Requisitos previos
](#prerequisites-v2-salesforce)
+ [

## Instrucciones de conexión
](#data-source-procedure-v2-salesforce)
+ [

## Más información
](#salesforce-v2-learn-more)
+ [

## Notas
](#salesforce-notes)

## Características admitidas


Amazon KendraEl conector de fuente de datos de Salesforce admite las siguientes funciones:
+ Asignaciones de campos
+ Control de acceso de usuarios
+ Filtros de inclusión/exclusión
+ Sincronizaciones completas e incrementales del contenido
+ Nube privada virtual (VPC)

## Requisitos previos


Antes de que pueda utilizarla Amazon Kendra para indexar su fuente de datos de Salesforce, realice estos cambios en Salesforce y en sus cuentas. AWS

**En Salesforce, asegúrese de que:**
+ Ha creado una cuenta administrativa de Salesforce y ha anotado el nombre de usuario y la contraseña que utiliza para conectarse a Salesforce.
+ Ha copiado el token de seguridad de Salesforce asociado a la cuenta utilizada para conectarse a Salesforce.
+ Ha creado una cuenta de Salesforce Connected App OAuth con la clave de consumidor (ID de cliente) y el secreto de consumidor (secreto de cliente) asignados a su aplicación Salesforce Connected. El ID de cliente y el secreto del cliente se utilizan como credenciales de autenticación almacenadas en un AWS Secrets Manager secreto. Consulte la [Documentación de Salesforce sobre aplicaciones conectadas](https://help.salesforce.com/s/articleView?id=sf.connected_app_overview.htm&type=5) para obtener más información.
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).
+ Ha copiado la URL de la instancia de Salesforce que desea indexar. Normalmente es *https://<company>.salesforce.com/*. El servidor debe ejecutar una aplicación conectada de Salesforce.
+ Se agregaron credenciales a su servidor de Salesforce para un usuario con acceso de solo lectura a Salesforce. Para ello, clonó el ReadOnly perfil y, a continuación, agregó los permisos Ver todos los datos y Administrar artículos. Estas credenciales identifican al usuario que realiza la conexión y a la aplicación conectada de Salesforce a la que se conecta. Amazon Kendra
+ Ha comprobado que cada documento es único en Salesforce y en otros orígenes de datos que vaya a utilizar para el mismo índice. Cada origen de datos que desee utilizar para un índice no debe contener el mismo documento en varios orígenes de datos. IDs Los documentos son globales en relación con un índice y deben ser únicos por índice.

**En el tuyoCuenta de AWS, asegúrate de tener:**
+ [Creó un Amazon Kendra índice](https://docs.aws.amazon.com/kendra/latest/dg/create-index.html) y, si usa la API, anotó el ID del índice.
+ [Creó un IAM rol](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds) para su fuente de datos y, si usa la API, anotó el ARN del IAM rol.
**nota**  
Si cambias el tipo de autenticación y las credenciales, debes actualizar tu IAM rol para acceder al ID AWS Secrets Manager secreto correcto.
+ Ha guardado sus credenciales de autenticación de Salesforce en un secreto de AWS Secrets Manager y, si utiliza la API, ha anotado el ARN del secreto.
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).

Si no tiene un IAM rol o secreto existente, puede usar la consola para crear un nuevo IAM rol y un Secrets Manager secreto al conectar su fuente de datos de Salesforce. Amazon Kendra Si utiliza la API, debe proporcionar el ARN de un IAM rol y un Secrets Manager secreto existentes y un ID de índice.

## Instrucciones de conexión


Para conectarse Amazon Kendra a su fuente de datos de Salesforce, debe proporcionar los detalles necesarios de su fuente de datos de Salesforce para que Amazon Kendra pueda acceder a sus datos. Si aún no ha configurado Salesforce para consultarlo. Amazon Kendra [Requisitos previos](#prerequisites-v2-salesforce)

------
#### [ Console ]

**Para conectarse Amazon Kendra a Salesforce**:

1. Inicie sesión en la [Amazon Kendraconsola Consola de administración de AWS](https://console.aws.amazon.com/kendra/) y ábrala.

1. En el panel de navegación izquierdo, elija **Índices** y, a continuación, elija el índice que desee usar de la lista de índices.
**nota**  
Puede elegir configurar o editar los ajustes de **Control de acceso de usuarios** en la **Configuración del índice**. 

1. En la página **Introducción**, seleccione **Agregar origen de datos**.

1. En la página **Agregar origen de datos**, seleccione **Conector de Salesforce** y, a continuación, seleccione **Añadir conector**. Si usa la versión 2 (si corresponde), elija el **Conector de Salesforce** con la etiqueta “V2.0”.

1. En la página **Especificar detalles del origen de datos**, introduzca la siguiente información:

   1. En **Nombre y descripción**, en **Nombre del origen de datos**: introduzca un nombre para el origen de datos. Puede incluir guiones, pero no espacios.

   1. (Opcional)** Descripción**: introduzca una descripción opcional para el origen de datos.

   1. En **Idioma predeterminado**: elija un idioma para filtrar los documentos para el índice. A menos que especifique lo contrario, el idioma predeterminado es el inglés. El idioma especificado en los metadatos del documento anula el idioma seleccionado.

   1. En **Etiquetas**, para **añadir una nueva etiqueta**: incluye etiquetas opcionales para buscar y filtrar tus recursos o realizar un seguimiento de tus AWS costes.

   1. Elija **Siguiente**.

1. En la página **Definir acceso y seguridad**, introduzca la siguiente información:

   1. **URL de Salesforce**: introduzca la URL de la instancia para el sitio de Salesforce que desea indexar.

   1. **Autorización**: active o desactive la información de la lista de control de acceso (ACL) para los documentos, si tiene una ACL y desea usarla para el control de acceso. La ACL especifica a qué documentos pueden acceder los usuarios y los grupos. La información de la ACL se utiliza para filtrar los resultados de búsqueda en función del acceso del usuario o su grupo a los documentos. Para obtener más información, consulte [Filtrado de contexto de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#context-filter-user-incl-datasources).

   1. Introduzca un secreto existente o, si crea uno nuevo, se abrirá una ventana de secreto de AWS Secrets Manager.

      1. **Autenticación**: introduzca la siguiente información en la ventana **Crear un secreto de AWS Secrets Manager**:

        1. **Nombre del secreto**: un nombre para su secreto. El prefijo «AmazonKendra-Salesforce» se añade automáticamente a su nombre secreto.

        1. En **Nombre de usuario**, **Contraseña**, **Token de seguridad**, **Clave de consumidor**, **Secreto del consumidor** y **URL de autenticación**: introduzca los valores de las credenciales de autenticación que ha generado y descargado de la cuenta de Salesforce. 
**nota**  
**Si utiliza Salesforce Developer Edition, utilice `https://login.salesforce.com/services/oauth2/token` o la URL de inicio de sesión de My Domain (por ejemplo) como URL de autenticación. * https://MyCompany.my.salesforce.com*** **Si utiliza Salesforce Sandbox Edition, utilice `https://test.salesforce.com/services/oauth2/token ` o la URL de inicio de sesión de My Domain (por ejemplo* MyDomainName--SandboxName.sandbox.my.salesforce.com*) como URL de autenticación.**

        1. Seleccione **Guardar autenticación**.

   1. **Nube privada virtual (VPC)**: puede optar por utilizar una VPC. Si es así, debe agregar **Subredes** y **Grupos de seguridad de VPC**.

   1. **Rastreador de identidades**: especifique si se debe activar el rastreador de identidades de Amazon Kendra. El rastreador de identidades utiliza la información de la lista de control de acceso (ACL) de los documentos para filtrar los resultados de la búsqueda en función del acceso del usuario o del grupo a los documentos. Si tiene una ACL para sus documentos y decide utilizarla, también puede optar por activar el rastreador de identidades para configurar el [filtrado Amazon Kendra de los resultados de búsqueda por contexto de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#context-filter-user-incl-datasources). De lo contrario, si el rastreador de identidades está desactivado, todos los documentos se pueden buscar públicamente. Si quieres usar el control de acceso para tus documentos y el rastreador de identidad está desactivado, también puedes usar la [PutPrincipalMapping](https://docs.aws.amazon.com/kendra/latest/APIReference/API_PutPrincipalMapping.html)API para cargar información de acceso de usuarios y grupos para filtrar el contexto de los usuarios.

   1. **IAMrol**: elija un IAM rol existente o cree uno nuevo IAM para acceder a las credenciales del repositorio y al contenido del índice.
**nota**  
IAMlos roles utilizados para los índices no se pueden usar para las fuentes de datos. Si no está seguro de si un rol existente se utiliza para un índice o para las preguntas frecuentes, elija **Crear un nuevo rol** para evitar errores.

   1. Elija **Siguiente**.

1. En la página **Configurar ajustes de sincronización**, introduzca la siguiente información:

   1. En **Rastrear archivos adjuntos**: seleccione esta opción para rastrear todos los objetos de Salesforce adjuntos.

   1. En **Objetos estándar**, **Objetos estándar con archivos adjuntos**, **Objetos estándar sin archivos adjuntos** y **Artículos de conocimiento**: seleccione las entidades o los tipos de contenido de Salesforce que desee rastrear.

   1. Debe proporcionar información de configuración para indexar al menos uno de los objetos estándar, artículos de conocimiento o fuentes de chat. Si decide rastrear los **Artículos de conocimiento**, debe especificar los tipos de artículos de conocimiento que desea indexar. Puede elegir entre artículos publicados, archivados, borradores y archivos adjuntos.

      **Filtro de regex**: especifique un patrón de regex para incluir elementos específicos del catálogo.

1. En **Configuración adicional**:
   + **Información de ACL**: todas las listas de control de acceso se incluyen de forma predeterminada. Al anular la selección de una lista de control de acceso, todos los archivos de esa categoría serán públicos.
   + **Patrones regex**: añada patrones de expresiones regulares para incluir o excluir determinados archivos. Puede añadir hasta 100 patrones.

   **Modo de sincronización**: elija cómo desea actualizar el índice cuando cambie el contenido del origen de datos. Al sincronizar el origen de datos con Amazon Kendra por primera vez, todo el contenido se rastrea y se indexa de forma predeterminada. Debe ejecutar una sincronización completa de los datos si la sincronización inicial falló, incluso si no selecciona la sincronización completa como opción de modo de sincronización.
   + Sincronización completa: se vuelve a indexar todo el contenido, reemplazando el contenido existente cada vez que el origen de datos se sincronice con el índice.
   + Sincronización nueva y modificada: indexe solo el contenido nuevo y modificado cada vez que la fuente de datos se sincronice con el índice. Amazon Kendrapuede usar el mecanismo de la fuente de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido que ha cambiado desde la última sincronización.
   + Sincronización nueva, modificada o eliminada: indexe solo el contenido nuevo, modificado y eliminado cada vez que la fuente de datos se sincronice con el índice. Amazon Kendrapuede usar el mecanismo de la fuente de datos para rastrear los cambios en el contenido e indexar el contenido que ha cambiado desde la última sincronización.

1. Elija **Siguiente**.

1. En la página **Establecer asignaciones de campos**, especifique la siguiente información:

   1. Para ver el **artículo de conocimiento estándar****, los archivos adjuntos a objetos estándar** y **otras sugerencias de mapeo de campos**: seleccione entre los campos de fuentes de datos predeterminados Amazon Kendra generados que desee asignar a su índice.
**nota**  
Es necesaria una asignación de índice a `_document_body`. No puede cambiar la asignación entre el campo `Salesforce ID` y el campo `_document_id ` de Amazon Kendra. Puede asignar cualquier campo de Salesforce a los campos de índice de Amazon reserved/default Kendra del título o del cuerpo del documento.   
Si asigna algún campo de Salesforce a los campos del título y cuerpo del documento de Amazon Kendra, Amazon Kendra utilizará datos de los campos del título y el cuerpo del documento en las respuestas de búsqueda.

   1.  **Agregar campo**: para agregar campos de origen de datos personalizados para crear un nombre de campo de índice al que asignarlos y el tipo de datos del campo.

   1. Elija **Siguiente**.

1. En la página **Revisar y crear**, compruebe que la información que ha introducido es correcta y, a continuación, seleccione **Añadir origen de datos**. También puede elegir editar la información desde esta página. El origen de datos aparecerá en la página **Orígenes de datos** una vez que el origen de datos se haya agregado correctamente.

------
#### [ API ]

**Para conectarse a Salesforce Amazon Kendra**

Debe especificar un JSON del [esquema del origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/ds-schemas.html) mediante la API [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_TemplateConfiguration.html). Debe proporcionar la siguiente información:
+ **Origen de datos**: defina el tipo de origen de datos como `SALESFORCEV2` cuando utilice el esquema JSON [https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html](https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html). Además, defina el origen de datos como `TEMPLATE` al llamar a la API [https://docs.aws.amazon.com/kendra/latest/dg/API_CreateDataSource.html](https://docs.aws.amazon.com/kendra/latest/dg/API_CreateDataSource.html).
+ **URL del host**: especifique la URL del host de la instancia de Salesforce.
+ **Modo de sincronización**: especifique cómo Amazon Kendra debe actualizar el índice cuando cambie el contenido del origen de datos. Cuando sincroniza su fuente de datos Amazon Kendra por primera vez, todo el contenido se rastrea e indexa de forma predeterminada. Debe ejecutar una sincronización completa de los datos si la sincronización inicial falló, incluso si no selecciona la sincronización completa como opción de modo de sincronización. Puede elegir entre las siguientes opciones:
  + `FORCED_FULL_CRAWL` para volver a indexar todo el contenido, reemplazando el contenido existente cada vez que el origen de datos se sincronice con el índice.
  + `FULL_CRAWL`para indexar solo el contenido nuevo, modificado y eliminado cada vez que la fuente de datos se sincronice con el índice. Amazon Kendrapuede usar el mecanismo de la fuente de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido que ha cambiado desde la última sincronización.
  + `CHANGE_LOG`para indexar solo el contenido nuevo y modificado cada vez que la fuente de datos se sincronice con el índice. Amazon Kendrapuede usar el mecanismo de la fuente de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido que ha cambiado desde la última sincronización.
+ **Nombre secreto del recurso de Amazon (ARN)**: proporcione el nombre del recurso de Amazon (ARN) de un Secrets Manager secreto que contenga las credenciales de autenticación de su cuenta de Salesforce. El secreto se almacena en una estructura JSON con las siguientes claves:

  ```
  {
      "authenticationUrl": "OAUTH endpoint that Amazon Kendra connects to get an OAUTH token",
      "consumerKey": "Application public key generated when you created your Salesforce application",
      "consumerSecret": "Application private key generated when you created your Salesforce application",
      "password": "Password associated with the user logging in to the Salesforce instance",
      "securityToken": "Token associated with the user account logging in to the Salesforce instance",
      "username": "User name of the user logging in to the Salesforce instance"
  }
  ```
+ **IAMrol**: especifique `RoleArn` cuándo llama `CreateDataSource` para proporcionar un IAM rol con permisos para acceder a su Secrets Manager secreto y para llamar al público APIs requerido para el conector de Salesforce y. Amazon Kendra Para obtener más información, consulte [Roles de IAM para orígenes de datos de Salesforce](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds).

También puede añadir las siguientes características opcionales:
+  **Nube privada virtual (VPC)**: especifique a `VpcConfiguration` cuándo llamar a `CreateDataSource`. Para obtener más información, consulte [¿Se está configurando Amazon Kendra para usar un Amazon VPC](vpc-configuration.md).
+ **Filtros de inclusión y exclusión**: puede especificar si desea incluir o excluir determinados documentos, cuentas, campañas, casos, contactos, clientes potenciales, oportunidades, soluciones, tareas, grupos, chats y archivos de entidades personalizados.
**nota**  
La mayoría de los orígenes de datos utilizan patrones de expresiones regulares, que son patrones de inclusión o exclusión denominados filtros. Si especifica un filtro de inclusión, solo se indexará el contenido que coincida con el filtro de inclusión. Los documentos que no coincidan con el filtro de inclusión no se indexan. Si especifica un filtro de inclusión y exclusión, los documentos que coincidan con el filtro de exclusión no se indexarán, aunque coincidan con el filtro de inclusión.
+ **Rastreador de identidades**: especifique si se debe activar el rastreador de identidades de Amazon Kendra. El rastreador de identidades utiliza la información de la lista de control de acceso (ACL) de los documentos para filtrar los resultados de la búsqueda en función del acceso del usuario o del grupo a los documentos. Si tiene una ACL para sus documentos y decide utilizarla, también puede optar por activar el rastreador de identidades para configurar el [filtrado Amazon Kendra de los resultados de búsqueda por contexto de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#context-filter-user-incl-datasources). De lo contrario, si el rastreador de identidades está desactivado, todos los documentos se pueden buscar públicamente. Si quieres usar el control de acceso para tus documentos y el rastreador de identidad está desactivado, también puedes usar la [PutPrincipalMapping](https://docs.aws.amazon.com/kendra/latest/APIReference/API_PutPrincipalMapping.html)API para cargar información de acceso de usuarios y grupos para filtrar el contexto de los usuarios.
+  **Asignaciones de campos**: elija asignar los campos del origen de datos de Salesforce a los campos de índice de Amazon Kendra. Para obtener más información, consulte [Asignación de campos de origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/field-mapping.html).
**nota**  
El campo del cuerpo del documento o el cuerpo del documento equivalente de sus documentos es obligatorio Amazon Kendra para poder buscarlos. Debe asignar el nombre del campo del cuerpo del documento en el origen de datos al nombre del campo del índice `_document_body`. Todos los demás campos son opcionales.
**nota**  
Es necesaria una asignación de índice a `_document_body`. No puede cambiar la asignación entre el campo `Salesforce ID` y el campo `_document_id ` de Amazon Kendra. Puede asignar cualquier campo de Salesforce a los campos de índice de Amazon reserved/default Kendra del título o del cuerpo del documento.   
Si asigna algún campo de Salesforce a los campos del título y cuerpo del documento de Amazon Kendra, Amazon Kendra utilizará datos de los campos del título y el cuerpo del documento en las respuestas de búsqueda.

Para obtener una lista de otras claves JSON importantes que debe configurar, consulte el [Esquema de plantilla de Salesforce](https://docs.aws.amazon.com/kendra/latest/dg/ds-schemas.html#ds-salesforce-schema).

------

## Más información


Para obtener más información sobre la integración Amazon Kendra con su fuente de datos de Salesforce, consulte:
+ [Anunciamos el conector de Salesforce actualizado (V2) para Amazon Kendra](https://aws.amazon.com/blogs/machine-learning/announcing-the-updated-salesforce-connector-v2-for-amazon-kendra/)

## Notas

+ Cuando las listas de control de acceso (ACLs) están habilitadas, la opción «Sincronizar solo contenido nuevo o modificado» no está disponible debido a las limitaciones de la API de Salesforce. Le recomendamos utilizar los modos «Sincronización completa» o «Sincronización de contenido nuevo, modificado o eliminado» en su lugar, o desactivarlos ACLs si necesita utilizar este modo de sincronización.

# ServiceNow


ServiceNow proporciona un sistema de administración de servicios basado en la nube para crear y administrar flujos de trabajo a nivel de organización, como los servicios de TI, los sistemas de venta de entradas y el soporte. Puede utilizarlo Amazon Kendra para indexar sus ServiceNow catálogos, artículos de conocimiento, incidentes y sus archivos adjuntos.

Puede conectarse Amazon Kendra a su fuente de ServiceNow datos mediante la [Amazon Kendraconsola](https://console.aws.amazon.com/kendra/), la [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_TemplateConfiguration.html)API o la [ServiceNowConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_ServiceNowConfiguration.html)API.

Amazon Kendratiene dos versiones del ServiceNow conector. Las características compatibles de cada versión incluyen:

**ServiceNow conector V1.0/API [ServiceNowConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_ServiceNowConfiguration.html)**
+ Asignaciones de campos
+ ServiceNow versiones de instancia: Londres, Otras
+ Filtros de inclusión/exclusión

**ServiceNow conector V2.0/API [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_TemplateConfiguration.html)**
+ Asignaciones de campos
+ Control de acceso de usuarios
+ Filtros de inclusión/exclusión
+ Sincronizaciones completas e incrementales del contenido
+ ServiceNow versiones de instancia: Roma, Sandiego, Tokio, otras
+ Nube privada virtual (VPC)

**nota**  
ServiceNow el conector ServiceNowConfiguration V1.0/API finalizó en 2023. Recomendamos migrar o utilizar el ServiceNow conector V2.0/API. TemplateConfiguration 

Para solucionar problemas del conector de la fuente de Amazon Kendra ServiceNow datos, consulte. [Solución de problemas con los orígenes de datos](troubleshooting-data-sources.md)

**Topics**
+ [

# ServiceNow conector V1.0
](data-source-v1-servicenow.md)
+ [

# ServiceNow conector V2.0
](data-source-v2-servicenow.md)
+ [

# Especificar los documentos que se van a indexar con una consulta
](servicenow-query.md)

# ServiceNow conector V1.0


ServiceNow proporciona un sistema de administración de servicios basado en la nube para crear y administrar flujos de trabajo a nivel de organización, como los servicios de TI, los sistemas de emisión de tickets y el soporte. Puede utilizarlo Amazon Kendra para indexar sus ServiceNow catálogos, artículos de conocimiento y sus anexos.

**nota**  
ServiceNow el conector ServiceNowConfiguration V1.0/API finalizó en 2023. Recomendamos migrar o utilizar el ServiceNow conector V2.0/API. TemplateConfiguration 

Para solucionar problemas del conector de la fuente de Amazon Kendra ServiceNow datos, consulte. [Solución de problemas con los orígenes de datos](troubleshooting-data-sources.md)

**Topics**
+ [

## Características admitidas
](#supported-features-v1-servicenow)
+ [

## Requisitos previos
](#prerequisites-v1-servicenow)
+ [

## Instrucciones de conexión
](#data-source-procedure-v1-servicenow)
+ [

## Más información
](#servicenow-v1-learn-more)

## Características admitidas


Amazon KendraServiceNow el conector de fuente de datos admite las siguientes funciones:
+ ServiceNow versiones de instancia: Londres, Otras
+ Patrones de inclusión/exclusión: catálogos de servicios, artículos de conocimiento y sus archivos adjuntos

## Requisitos previos


Antes de poder utilizarla Amazon Kendra para indexar la fuente de ServiceNow datos, realiza estos cambios en tus AWS cuentas ServiceNow y.

**En ServiceNow, asegúrate de tener:**
+ Creó una cuenta de ServiceNow administrador y creó una ServiceNow instancia.
+ Ha copiado el host de la URL de la ServiceNow instancia. Por ejemplo, si la URL de la instancia es*https://your-domain.service-now.com*, el formato de la URL del host que introduzcas será*your-domain.service-now.com*.
+ Apuntó sus credenciales de autenticación básicas, que contienen un nombre de usuario y una contraseña Amazon Kendra para poder conectarse a la ServiceNow instancia.
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).
+ **Opcional:** configuraste un token de credenciales OAuth 2.0 que puede identificar Amazon Kendra y generar un nombre de usuario, una contraseña, un ID de cliente y un secreto de cliente. El nombre de usuario y la contraseña deben proporcionar acceso a la base de ServiceNow conocimientos y al catálogo de servicios. Consulte [ServiceNow la documentación sobre la autenticación OAuth 2.0](https://www.servicenow.com/docs/bundle/utah-platform-security/page/integrate/single-sign-on/concept/c_Authentication.html) para obtener más información.
+ Ha agregado los siguientes permisos:
  + kb\$1category
  + kb\$1knowledge
  + kb\$1knowledge\$1base
  + kb\$1uc\$1cannot\$1read\$1mtom
  + kb\$1uc\$1can\$1read\$1mtom
  + sc\$1catalog
  + sc\$1category
  + sc\$1cat\$1item
  + sys\$1attachment
  + sys\$1attachment\$1doc
  + sys\$1user\$1role
+ Comprobó que cada documento es único en ServiceNow las demás fuentes de datos que vaya a utilizar para el mismo índice y entre ellas. Cada origen de datos que desee utilizar para un índice no debe contener el mismo documento en varios orígenes de datos. IDs Los documentos son globales para un índice y deben ser únicos por índice.

**En tuCuenta de AWS, asegúrate de tener:**
+ [Creó un Amazon Kendra índice](https://docs.aws.amazon.com/kendra/latest/dg/create-index.html) y, si usa la API, anotó el ID del índice.
+ [Creó un IAM rol](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds) para su fuente de datos y, si usa la API, anotó el ARN del IAM rol.
**nota**  
Si cambias el tipo de autenticación y las credenciales, debes actualizar tu IAM rol para acceder al ID AWS Secrets Manager secreto correcto.
+ Guardó sus credenciales de ServiceNow autenticación en un AWS Secrets Manager secreto y, si usa la API, anotó el ARN del secreto.
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).

Si no tiene un IAM rol o secreto existente, puede usar la consola para crear un nuevo IAM rol y un Secrets Manager secreto al conectar su fuente de ServiceNow datos. Amazon Kendra Si utiliza la API, debe proporcionar el ARN de un IAM rol y un Secrets Manager secreto existentes y un ID de índice.

## Instrucciones de conexión


Para conectarse Amazon Kendra a su fuente de ServiceNow datos, debe proporcionar los detalles necesarios de la fuente de ServiceNow datos para que Amazon Kendra pueda acceder a sus datos. Si aún no lo ha configurado ServiceNow , Amazon Kendra consulte[Requisitos previos](#prerequisites-v1-servicenow).

------
#### [ Console ]

**Para conectarse Amazon Kendra a ServiceNow** 

1. Inicie sesión en la consola AWS de administración y abra la [Amazon Kendraconsola](https://console.aws.amazon.com/kendra/).

1. En el panel de navegación izquierdo, elija **Índices** y, a continuación, elija el índice que desee usar de la lista de índices.
**nota**  
Puede elegir configurar o editar los ajustes de **Control de acceso de usuarios** en la **Configuración del índice**. 

1. En la página **Introducción**, seleccione **Agregar origen de datos**.

1. En la página **Agregar fuente de datos**, elija el **ServiceNowconector V1.0** y, a continuación, elija **Agregar fuente de datos**.

1. En la página **Especificar detalles del origen de datos**, introduzca la siguiente información:

   1. En **Nombre y descripción**, en **Nombre del origen de datos**: introduzca un nombre para el origen de datos. Puede incluir guiones, pero no espacios.

   1. (Opcional)** Descripción**: introduzca una descripción opcional para el origen de datos.

   1. En **Idioma predeterminado**: elija un idioma para filtrar los documentos para el índice. A menos que especifique lo contrario, el idioma predeterminado es el inglés. El idioma especificado en los metadatos del documento anula el idioma seleccionado.

   1. En **Etiquetas**, para **Agregar nueva etiqueta**: incluya etiquetas opcionales para buscar y filtrar sus recursos o realizar un seguimiento de sus AWS costos.

   1. Elija **Siguiente**.

1. En la página **Definir acceso y seguridad**, introduzca la siguiente información:

   1. **ServiceNow host**: introduzca la URL del ServiceNow host.

   1. **ServiceNow versión**: seleccione su ServiceNow versión.

   1. Elija entre **Autenticación básica** y **Autenticación OAuth 2.0** según el caso de uso.

   1. **AWS Secrets Managersecreto**: elija un secreto existente o cree uno nuevo Secrets Manager para almacenar sus credenciales de ServiceNow autenticación. Si decide crear un secreto nuevo, se abrirá una ventana de secreto de AWS Secrets Manager.

      1. **Nombre del secreto**: un nombre para su secreto. El prefijo 'AmazonKendra- ServiceNow -' se añade automáticamente a tu nombre secreto.

      1. **Si utilizas la autenticación básica, introduce el **nombre secreto, el nombre** de **usuario** y la contraseña de tu cuenta.** ServiceNow 

         Si utilizas OAuth2 la autenticación: introduce el **nombre secreto, el nombre** de **usuario**, la **contraseña**, el **ID de cliente y el secreto de cliente** **que creaste en tu cuenta**. ServiceNow 

      1. Haga clic en **Guardar y agregar secreto**.

   1. **IAMrol**: elige un IAM rol existente o crea uno nuevo IAM para acceder a las credenciales de tu repositorio y al contenido del índice.
**nota**  
IAMlos roles utilizados para los índices no se pueden usar para las fuentes de datos. Si no está seguro de si un rol existente se utiliza para un índice o para las preguntas frecuentes, elija **Crear un nuevo rol** para evitar errores.

   1. Elija **Siguiente**.

1. En la página **Configurar ajustes de sincronización**, introduzca la siguiente información:

   1. **Incluir artículos de conocimiento**: elija si desea indexar los artículos de conocimiento.

   1. **Tipo de artículos de conocimiento**: elija entre **incluir solo artículos públicos** e **Incluir artículos según una consulta de ServiceNow filtro según** su caso de uso. Si selecciona **Incluir artículos según una consulta de ServiceNow filtro**, debe introducir una **consulta de filtro** copiada de su ServiceNow cuenta.

   1. **Incluir archivos adjuntos de artículos de conocimiento**: elija si desea indexar los archivos adjuntos de los artículos de conocimiento. También puede seleccionar tipos de archivos específicos para indexarlos.

   1. **Incluir elementos del catálogo**: elija si desea indexar los elementos del catálogo.

   1. **Incluir archivos adjuntos de elementos del catálogo**: elija si desea indexar los archivos adjuntos de los elementos del catálogo. También puede seleccionar tipos de archivos específicos para indexarlos.

   1. **Frecuencia**: la frecuencia con la Amazon Kendra que se sincronizará con la fuente de datos.

   1. Elija **Siguiente**.

1. En la página **Establecer asignaciones de campos**, especifique la siguiente información:

   1. **Artículos de conocimiento** y **catálogo de servicios**: seleccione entre los campos de fuentes de datos predeterminados Amazon Kendra generados y otras asignaciones de campos sugeridas que desee asignar a su índice. 

   1.  **Agregar campo**: para agregar campos de origen de datos personalizados para crear un nombre de campo de índice al que asignarlos y el tipo de datos del campo.

   1. Elija **Siguiente**.

1. En la página **Revisar y crear**, compruebe que la información que ha introducido es correcta y, a continuación, seleccione **Añadir origen de datos**. También puede elegir editar la información desde esta página. El origen de datos aparecerá en la página **Orígenes de datos** una vez que el origen de datos se haya agregado correctamente.

------
#### [ API ]

**Para conectarse a Amazon Kendra ServiceNow**

Debe especificar lo siguiente mediante la [ServiceNowConfiguration API](https://docs.aws.amazon.com/kendra/latest/APIReference/API_ServiceNowConfiguration.html):
+ **URL de la fuente de datos**: especifique la ServiceNow URL. El punto final del host debe tener el siguiente aspecto:*your-domain.service-now.com*.
+ **Instancia de host de la fuente de datos**: especifique la versión de la instancia de ServiceNow host como `LONDON` o`OTHERS`.
+ **Nombre secreto de recurso de Amazon (ARN): proporcione** el nombre de recurso de Amazon (ARN) de un Secrets Manager secreto que contenga las credenciales de autenticación que creó en su cuenta. ServiceNow 

   Si está utilizando la autenticación básica, el secreto se almacena en una estructura JSON con las siguientes claves:

  ```
  {
      "username": "user name",
      "password": "password"
  }
  ```

  Si utiliza la OAuth2 autenticación, el secreto se almacena en una estructura JSON con las siguientes claves:

  ```
  {
      "username": "user name",
      "password": "password",
      "clientId": "client id",
      "clientSecret": "client secret"
  }
  ```
+ **IAMrol**: especifique `RoleArn` cuándo llama `CreateDataSource` para proporcionar a un IAM rol permisos para acceder a su Secrets Manager secreto y para llamar al público requerido APIs para el ServiceNow conector yAmazon Kendra. Para obtener más información, consulte [Roles de IAM para orígenes de datos de ServiceNow ](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds).

También puede añadir las siguientes características opcionales:
+  **Asignaciones de campos**: elija asignar los campos del origen de datos de ServiceNow a los campos de índice de Amazon Kendra. Para obtener más información, consulte [Asignación de campos de origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/field-mapping.html).
**nota**  
El campo del cuerpo del documento o el cuerpo del documento equivalente de sus documentos es obligatorio Amazon Kendra para poder buscarlos. Debe asignar el nombre del campo del cuerpo del documento en el origen de datos al nombre del campo del índice `_document_body`. Todos los demás campos son opcionales.
+  **Filtros de inclusión y exclusión**: especifique si desea incluir o excluir determinados archivos adjuntos de catálogos y artículos de conocimiento.
**nota**  
La mayoría de los orígenes de datos utilizan patrones de expresiones regulares, que son patrones de inclusión o exclusión denominados filtros. Si especifica un filtro de inclusión, solo se indexará el contenido que coincida con el filtro de inclusión. Los documentos que no coincidan con el filtro de inclusión no se indexan. Si especifica un filtro de inclusión y exclusión, los documentos que coincidan con el filtro de exclusión no se indexarán, aunque coincidan con el filtro de inclusión.
+ **Parámetros de indexación**: también puede optar por especificar si desea:
  + Indexar artículos de conocimiento y catálogos de servicios, o ambos. Si decide indexar artículos de conocimiento y elementos del catálogo de servicios, debe proporcionar el nombre del ServiceNow campo que está asignado al campo de contenido del documento de índice en el Amazon Kendra índice.
  + Indexar los archivos adjuntos de los artículos de conocimiento y los elementos del catálogo.
  + Utilice una ServiceNow consulta que seleccione documentos de una o más bases de conocimiento. Las bases de conocimiento pueden ser públicas o privadas. Para obtener más información, consulte [Especificar documentos a indexar con una consulta](https://docs.aws.amazon.com/kendra/latest/dg/servicenow-query.html).

------

## Más información


Para obtener más información sobre la integración Amazon Kendra con la fuente de ServiceNow datos, consulte:
+ [Cómo empezar a usar Amazon Kendra ServiceNow Online Connector](https://aws.amazon.com/blogs/machine-learning/getting-started-with-amazon-kendra-servicenow-online-connector/)

# ServiceNow conector V2.0


ServiceNow proporciona un sistema de administración de servicios basado en la nube para crear y administrar flujos de trabajo a nivel de organización, como los servicios de TI, los sistemas de emisión de tickets y el soporte. Puede utilizarlo Amazon Kendra para indexar sus ServiceNow catálogos, artículos de conocimiento, incidentes y sus archivos adjuntos.

Para solucionar problemas del conector de la fuente de Amazon Kendra ServiceNow datos, consulte[Solución de problemas con los orígenes de datos](troubleshooting-data-sources.md).

**Topics**
+ [

## Características admitidas
](#supported-features-v2-servicenow)
+ [

## Requisitos previos
](#prerequisites-v2-servicenow)
+ [

## Instrucciones de conexión
](#data-source-procedure-v2-servicenow)
+ [

## Más información
](#servicenow-learn-more)

## Características admitidas


Amazon KendraServiceNow el conector de fuente de datos admite las siguientes funciones:
+ Asignaciones de campos
+ Control de acceso de usuarios
+ Filtros de inclusión/exclusión
+ Sincronizaciones completas e incrementales del contenido
+ ServiceNow versiones de instancia: Roma, Sandiego, Tokio, otras
+ Nube privada virtual (VPC)

## Requisitos previos


Antes de poder utilizarla Amazon Kendra para indexar la fuente de ServiceNow datos, realiza estos cambios en tus AWS cuentas ServiceNow y cuentas.

**En ServiceNow, asegúrate de tener:**
+ Ha creado una instancia de Personal o Enterprise Developer y dispone de una instancia de ServiceNow con un rol administrativo.
+ Ha copiado el host de la URL de la ServiceNow instancia. El formato de la URL del host que introduzcas es*your-domain.service-now.com*. Necesita la URL de la instancia de ServiceNow para conectarse a Amazon Kendra.
+ Apuntó sus credenciales de autenticación básicas, es decir, un nombre de usuario y una contraseña Amazon Kendra para poder conectarse a la ServiceNow instancia.
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).
+ **Opcional:** credenciales de cliente OAuth 2.0 configuradas que pueden identificarse Amazon Kendra mediante un nombre de usuario, una contraseña, un ID de cliente generado y un secreto de cliente. Consulte [ServiceNow la documentación sobre la autenticación OAuth 2.0](https://www.servicenow.com/docs/bundle/utah-platform-security/page/integrate/single-sign-on/concept/c_Authentication.html) para obtener más información.
+ Ha agregado los siguientes permisos:
  + kb\$1category
  + kb\$1knowledge
  + kb\$1knowledge\$1base
  + kb\$1uc\$1cannot\$1read\$1mtom
  + kb\$1uc\$1can\$1read\$1mtom
  + sc\$1catalog
  + sc\$1category
  + sc\$1cat\$1item
  + sys\$1attachment
  + sys\$1attachment\$1doc
  + sys\$1user\$1role
+ Comprobó que cada documento es único en ServiceNow las demás fuentes de datos que vaya a utilizar para el mismo índice y entre ellas. Cada origen de datos que desee utilizar para un índice no debe contener el mismo documento en varios orígenes de datos. IDs Los documentos son globales para un índice y deben ser únicos por índice.

**En tuCuenta de AWS, asegúrate de tener:**
+ [Creó un Amazon Kendra índice](https://docs.aws.amazon.com/kendra/latest/dg/create-index.html) y, si usa la API, anotó el ID del índice.
+ [Creó un IAM rol](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds) para su fuente de datos y, si usa la API, anotó el ARN del IAM rol.
**nota**  
Si cambias el tipo de autenticación y las credenciales, debes actualizar tu IAM rol para acceder al ID AWS Secrets Manager secreto correcto.
+ Guardó sus credenciales de ServiceNow autenticación en un AWS Secrets Manager secreto y, si usa la API, anotó el ARN del secreto.
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).

Si no tiene un IAM rol o secreto existente, puede usar la consola para crear un nuevo IAM rol y un Secrets Manager secreto al conectar su fuente de ServiceNow datos. Amazon Kendra Si utiliza la API, debe proporcionar el ARN de un IAM rol y un Secrets Manager secreto existentes y un ID de índice.

## Instrucciones de conexión


Para conectarse Amazon Kendra a su fuente de ServiceNow datos, debe proporcionar los detalles necesarios de la fuente de ServiceNow datos para que Amazon Kendra pueda acceder a sus datos. Si aún no lo ha configurado ServiceNow , Amazon Kendra consulte[Requisitos previos](#prerequisites-v2-servicenow).

------
#### [ Console ]

**Para conectarse Amazon Kendra a ServiceNow** 

1. Inicie sesión en la [Amazon Kendraconsola Consola de administración de AWS y ábrala](https://console.aws.amazon.com/kendra/).

1. En el panel de navegación izquierdo, elija **Índices** y, a continuación, elija el índice que desee usar de la lista de índices.
**nota**  
Puede elegir configurar o editar los ajustes de **Control de acceso de usuarios** en la **Configuración del índice**. 

1. En la página **Introducción**, seleccione **Agregar origen de datos**.

1. En la página **Agregar origen de datos**, seleccione el **Conector de ServiceNow ** y, a continuación, seleccione **Agregar conector**. Si usa la versión 2 (si corresponde), elija el **Conector de ServiceNow ** con la etiqueta “V2.0”.

1. En la página **Especificar detalles del origen de datos**, introduzca la siguiente información:

   1. En **Nombre y descripción**, en **Nombre del origen de datos**: introduzca un nombre para el origen de datos. Puede incluir guiones, pero no espacios.

   1. (Opcional)** Descripción**: introduzca una descripción opcional para el origen de datos.

   1. En **Idioma predeterminado**: elija un idioma para filtrar los documentos para el índice. A menos que especifique lo contrario, el idioma predeterminado es el inglés. El idioma especificado en los metadatos del documento anula el idioma seleccionado.

   1. En **Etiquetas**, para **añadir una nueva etiqueta**: incluye etiquetas opcionales para buscar y filtrar tus recursos o realizar un seguimiento de tus AWS costes.

   1. Elija **Siguiente**.

1. En la página **Definir acceso y seguridad**, introduzca la siguiente información:

   1. **ServiceNow host**: introduzca la URL del ServiceNow host. El formato de la URL del host que introduzca es*your-domain.service-now.com*.

   1. **ServiceNow versión**: seleccione la versión de la ServiceNow instancia. Puede elegir entre Roma, Sandiego, Tokio u Otras.

   1. **Autorización**: active o desactive la información de la lista de control de acceso (ACL) para los documentos, si tiene una ACL y desea usarla para el control de acceso. La ACL especifica a qué documentos pueden acceder los usuarios y los grupos. La información de la ACL se utiliza para filtrar los resultados de búsqueda en función del acceso del usuario o su grupo a los documentos. Para obtener más información, consulte [Filtrado de contexto de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#context-filter-user-incl-datasources).

   1. **Autenticación**: elija entre **Autenticación básica** y **Autenticación OAuth 2.0**.

   1. **AWSSecrets Managersecreto**: elija un secreto existente o cree uno nuevo Secrets Manager para almacenar sus credenciales de ServiceNow autenticación. Si decide crear un secreto nuevo, se abrirá una ventana de secreto de AWS Secrets Manager. En la ventana, introduzca la siguiente información:

      1. **Nombre del secreto**: un nombre para su secreto. El prefijo 'AmazonKendra- ServiceNow -' se añade automáticamente a tu nombre secreto.

      1. **Si utilizas la autenticación básica, introduce el **nombre secreto, el nombre** de **usuario** y la contraseña de tu cuenta.** ServiceNow 

         Si utiliza la autenticación OAuth2 .0: introduzca el **nombre secreto, el nombre** de **usuario**, la **contraseña**, el **ID de cliente y el secreto de cliente** que creó en **su** cuenta. ServiceNow 

      1. Guarde y agregue el secreto.

   1. **Nube privada virtual (VPC)**: puede optar por utilizar una VPC. Si es así, debe agregar **Subredes** y **Grupos de seguridad de VPC**.

   1. **Rastreador de identidades**: especifique si se debe activar el rastreador de identidades de Amazon Kendra. El rastreador de identidades utiliza la información de la lista de control de acceso (ACL) de los documentos para filtrar los resultados de la búsqueda en función del acceso del usuario o del grupo a los documentos. Si tiene una ACL para sus documentos y decide utilizarla, también puede optar por activar el rastreador de identidades para configurar el filtrado Amazon Kendra de los resultados de búsqueda por [contexto de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#context-filter-user-incl-datasources). De lo contrario, si el rastreador de identidades está desactivado, todos los documentos se pueden buscar públicamente. Si quieres usar el control de acceso para tus documentos y el rastreador de identidad está desactivado, también puedes usar la [PutPrincipalMapping](https://docs.aws.amazon.com/kendra/latest/APIReference/API_PutPrincipalMapping.html)API para cargar información de acceso de usuarios y grupos para filtrar el contexto de los usuarios.

   1. **IAMrol**: elija un IAM rol existente o cree uno nuevo IAM para acceder a las credenciales del repositorio y al contenido del índice.
**nota**  
IAMlos roles utilizados para los índices no se pueden usar para las fuentes de datos. Si no está seguro de si un rol existente se utiliza para un índice o para las preguntas frecuentes, elija **Crear un nuevo rol** para evitar errores.

   1. Elija **Siguiente**.

1. En la página **Configurar ajustes de sincronización**, introduzca la siguiente información:

   1. En **Artículos de Knowledge**, elija entre las siguientes opciones:
      +  **Artículos de conocimiento**: elija si desea indexar los artículos de conocimiento.
      + **Archivos adjuntos de artículos de conocimiento**: elija si desea indexar los archivos adjuntos de los artículos de conocimiento.
      + **Tipo de artículos de conocimiento**: elija entre **Solo artículos públicos y artículos** de **conocimiento basados en una consulta de ServiceNow filtro** según su caso de uso. Si selecciona **Incluir artículos según una consulta de ServiceNow filtro**, debe introducir una **consulta de filtro** copiada de su ServiceNow cuenta. Entre los ejemplos de consultas de filtro se incluyen: *workflow\$1state=draft^EQ**kb\$1knowledge\$1base=dfc19531bf2021003f07e2c1ac0739ab^text ISNOTEMPTY^EQ*,,*article\$1type=text^active=true^EQ*.
**importante**  
Si elige rastrear solo **artículos públicos, Amazon Kendra rastrea solo los artículos** de conocimiento a los que se les ha asignado una función de acceso público en. ServiceNow
      + **Incluir artículos según el filtro de descripción breve**: especifique patrones de expresión regular para incluir o excluir artículos específicos.

   1. En **Elementos del catálogo de servicios**:
      +  **Elementos del catálogo de servicios**: elija si desea indexar los elementos del catálogo de servicios.
      + **Archivos adjuntos de elementos del catálogo de servicios**: elija si desea indexar los archivos adjuntos de los elementos del catálogo de servicios.
      + **Elementos activos del catálogo de servicios**: elija si desea indexar los elementos activos del catálogo de servicios.
      + **Elementos inactivos del catálogo de servicios**: elija si desea indexar los elementos inactivos del catálogo de servicios.
      + **Consulta de filtrado**: elija incluir los elementos del catálogo de servicios en función de un filtro definido en su instancia. ServiceNow Entre los ejemplos de consultas de filtro se incluyen:*short\$1descriptionLIKEAccess^category=2809952237b1300054b6a3549dbe5dd4^EQ*,*nameSTARTSWITHService^active=true^EQ*.
      + **Incluir los elementos del catálogo de servicios según un filtro de descripción breve**: especifique un patrón de regex para incluir elementos del catálogo específicos.

   1. En **Incidentes**:
      + **Incidentes**: elija si desea indexar los incidentes de servicio.
      + **Archivos adjuntos de incidentes**: elija si desea indexar los archivos adjuntos de incidentes.
      + **Incidentes activos**: elija si desea indexar los incidentes activos.
      + **Incidentes inactivos**: elija si desea indexar los incidentes inactivos.
      + **Tipo de incidente activo**: elija entre **Todos los incidentes**, **Incidentes abiertos**, **Incidentes abiertos: no asignados** e **Incidentes resueltos**, según el caso de uso.
      + **Consulta de filtro**: elige incluir los incidentes en función de un filtro definido en tu ServiceNow instancia. Entre los ejemplos de consultas de filtro se incluyen:*short\$1descriptionLIKETest^urgency=3^state=1^EQ*,*priority=2^category=software^EQ *.
      + **Incluir incidentes según el filtro de descripción breve**: especifique un patrón de regex para incluir incidentes específicos.

   1. En **Configuración adicional**:
      + **Información de ACL**: las listas de control de acceso de las entidades que ha seleccionado se incluyen de forma predeterminada. Al anular la selección de una lista de control de acceso, todos los archivos de esa categoría serán públicos. Las opciones de ACL se desactivan automáticamente para las entidades no seleccionadas. En el caso de los artículos públicos, no se aplica la ACL.
      + Para **Tamaño máximo de archivo**: especifique el límite de tamaño de archivo MBs que Amazon Kendra rastreará. Amazon Kendra rastreará solo los archivos que se encuentren dentro del límite de tamaño que defina. El tamaño de archivo predeterminado es de 50 MB. El tamaño máximo del archivo debe ser mayor que 0 MB y menor o igual que 50 MB.
      + **Patrones de regex de archivos adjuntos**: añada patrones de expresiones regulares para incluir o excluir determinados archivos adjuntos de catálogos, artículos de conocimiento e incidentes. Puede añadir hasta 100 patrones.

   1. **Modo de sincronización**: elija cómo desea actualizar el índice cuando cambie el contenido del origen de datos. Al sincronizar el origen de datos con Amazon Kendra por primera vez, todo el contenido se rastrea y se indexa de forma predeterminada. Debe ejecutar una sincronización completa de los datos si la sincronización inicial falló, incluso si no selecciona la sincronización completa como opción de modo de sincronización.
      + Sincronización completa: se vuelve a indexar todo el contenido, reemplazando el contenido existente cada vez que el origen de datos se sincronice con el índice.
      + Sincronización nueva, modificada o eliminada: indexe solo el contenido nuevo, modificado y eliminado cada vez que la fuente de datos se sincronice con el índice. Amazon Kendrapuede usar el mecanismo de la fuente de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido que ha cambiado desde la última sincronización.

   1. En **Programación de ejecución de sincronización**, en **Frecuencia**: elija la frecuencia con la que desea sincronizar el contenido del origen de datos y actualizar el índice.

   1. Elija **Siguiente**.

1. En la página **Establecer asignaciones de campos**, especifique la siguiente información:

   1. **Asignaciones de campos predeterminadas: seleccione entre las** fuentes de datos predeterminadas Amazon Kendra generadas los campos que desee asignar a su índice.

   1.  **Agregar campo**: para agregar campos de origen de datos personalizados para crear un nombre de campo de índice al que asignarlos y el tipo de datos del campo.

   1. Elija **Siguiente**.

1. En la página **Revisar y crear**, compruebe que la información que ha introducido es correcta y, a continuación, seleccione **Añadir origen de datos**. También puede elegir editar la información desde esta página. El origen de datos aparecerá en la página **Orígenes de datos** una vez que el origen de datos se haya agregado correctamente.

------
#### [ API ]

**Para conectarse a Amazon Kendra ServiceNow**

Debe especificar un JSON del [esquema del origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/ds-schemas.html) mediante la API [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_TemplateConfiguration.html). Debe proporcionar la siguiente información:
+ **Origen de datos**: defina el tipo de origen de datos como `SERVICENOWV2` cuando utilice el esquema JSON [https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html](https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html). Además, defina el origen de datos como `TEMPLATE` al llamar a la API [https://docs.aws.amazon.com/kendra/latest/dg/API_CreateDataSource.html](https://docs.aws.amazon.com/kendra/latest/dg/API_CreateDataSource.html).
+ **URL del host**: especifique la versión de la instancia del ServiceNow host. Por ejemplo, *your-domain.service-now.com*.
+ **Tipo de autenticación**: especifique el tipo de autenticación que utiliza, ya sea `OAuth2` para su ServiceNow instancia `basicAuth` o para ella.
+ **ServiceNow versión de instancia**: especifique la ServiceNow instancia que va a utilizar, `Tokyo` `Sandiego``Rome`, o. `Others`
+ **Modo de sincronización**: especifique cómo Amazon Kendra debe actualizar el índice cuando cambie el contenido del origen de datos. Al sincronizar la fuente de datos Amazon Kendra por primera vez, todo el contenido se rastrea e indexa de forma predeterminada. Debe ejecutar una sincronización completa de los datos si la sincronización inicial falló, incluso si no selecciona la sincronización completa como opción de modo de sincronización. Puede elegir entre las siguientes opciones:
  + `FORCED_FULL_CRAWL` para volver a indexar todo el contenido, reemplazando el contenido existente cada vez que el origen de datos se sincronice con el índice.
  + `FULL_CRAWL`para indexar solo el contenido nuevo, modificado y eliminado cada vez que la fuente de datos se sincronice con el índice. Amazon Kendrapuede usar el mecanismo de la fuente de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido que ha cambiado desde la última sincronización.
+ **Nombre secreto de recurso de Amazon (ARN): proporcione** el nombre de recurso de Amazon (ARN) de un Secrets Manager secreto que contenga las credenciales de autenticación que creó en su cuenta. ServiceNow 

  Si utiliza la autenticación básica, el secreto se almacena en una estructura JSON con las siguientes claves:

  ```
  {
      "username": "user name",
      "password": "password"
  }
  ```
+ Si utiliza credenciales de OAuth2 cliente, el secreto se almacena en una estructura JSON con las siguientes claves:

  ```
  {
      "username": "user name",
      "password": "password",
      "clientId": "client id",
      "clientSecret": "client secret"
  }
  ```
+ **IAMrol**: especifique `RoleArn` cuándo llama `CreateDataSource` para proporcionar a un IAM rol permisos para acceder a su Secrets Manager secreto y para llamar al público requerido APIs para el ServiceNow conector yAmazon Kendra. Para obtener más información, consulte [Roles de IAM para orígenes de datos de ServiceNow ](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds).

También puede añadir las siguientes características opcionales:
+  **Nube privada virtual (VPC)**: especifique a `VpcConfiguration` cuándo llamar a `CreateDataSource`. Para obtener más información, consulte [¿Se está configurando Amazon Kendra para usar un Amazon VPC](vpc-configuration.md).
+  **Filtros de inclusión y exclusión**: puede especificar si desea incluir o excluir determinados archivos adjuntos mediante los nombres y tipos de archivos de los artículos de conocimiento, los catálogos de servicios y los incidentes. 
**nota**  
La mayoría de los orígenes de datos utilizan patrones de expresiones regulares, que son patrones de inclusión o exclusión denominados filtros. Si especifica un filtro de inclusión, solo se indexará el contenido que coincida con el filtro de inclusión. Los documentos que no coincidan con el filtro de inclusión no se indexan. Si especifica un filtro de inclusión y exclusión, los documentos que coincidan con el filtro de exclusión no se indexarán, aunque coincidan con el filtro de inclusión.
+  **Documentos específicos para indexar**: puede utilizar una ServiceNow consulta para especificar los documentos que desee de una o más bases de conocimiento, incluidas las bases de conocimiento privadas. El acceso a las bases de conocimiento lo determina el usuario que utilice para conectarse a la ServiceNow instancia. Para obtener más información, consulte [Especificar documentos a indexar con una consulta](https://docs.aws.amazon.com//kendra/latest/dg/servicenow-query.html).
+ **Parámetros de indexación**: también puede optar por especificar si desea:
  + Indexar artículos de conocimiento, catálogos de servicios e incidentes, o todos ellos. Si decide indexar artículos de conocimiento, artículos del catálogo de servicios e incidentes, debe proporcionar el nombre del ServiceNow campo que se asigna al campo de contenido del documento de Amazon Kendra índice del índice.
  + Indexar los archivos adjuntos de los artículos de conocimiento, los elementos del catálogo de servicios y los incidentes.
  + Incluir artículos de conocimiento, elementos del catálogo de servicios e incidentes según el patrón de filtrado `short description`.
  + Elegir filtrar los elementos e incidentes del catálogo de servicios activos e inactivos.
  + Elegir filtrar los incidentes en función de su tipo.
  + Elegir de qué entidades se debe rastrear la ACL.
  + Puede utilizar una ServiceNow consulta para especificar los documentos que desee de una o más bases de conocimiento, incluidas las bases de conocimiento privadas. El acceso a las bases de conocimiento lo determina el usuario que utilice para conectarse a la ServiceNow instancia. Para obtener más información, consulte [Especificar documentos a indexar con una consulta](https://docs.aws.amazon.com//kendra/latest/dg/servicenow-query.html).
+ **Rastreador de identidades**: especifique si se debe activar el rastreador de identidades de Amazon Kendra. El rastreador de identidades utiliza la información de la lista de control de acceso (ACL) de los documentos para filtrar los resultados de la búsqueda en función del acceso del usuario o del grupo a los documentos. Si tiene una ACL para sus documentos y decide utilizarla, también puede optar por activar el rastreador de identidades para configurar el [filtrado Amazon Kendra de los resultados de búsqueda por contexto de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#context-filter-user-incl-datasources). De lo contrario, si el rastreador de identidades está desactivado, todos los documentos se pueden buscar públicamente. Si quieres usar el control de acceso para tus documentos y el rastreador de identidad está desactivado, también puedes usar la [PutPrincipalMapping](https://docs.aws.amazon.com/kendra/latest/APIReference/API_PutPrincipalMapping.html)API para cargar información de acceso de usuarios y grupos para filtrar el contexto de los usuarios.
+  **Asignaciones de campos**: elija asignar los campos del origen de datos de ServiceNow a los campos de índice de Amazon Kendra. Para obtener más información, consulte [Asignación de campos de origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/field-mapping.html).
**nota**  
El campo del cuerpo del documento o el cuerpo del documento equivalente de sus documentos es obligatorio Amazon Kendra para poder buscarlos. Debe asignar el nombre del campo del cuerpo del documento en el origen de datos al nombre del campo del índice `_document_body`. Todos los demás campos son opcionales.

Para obtener una lista de otras claves JSON importantes que debe configurar, consulte el [Esquema de plantilla de ServiceNow ](https://docs.aws.amazon.com/kendra/latest/dg/ds-schemas.html#ds-servicenow-schema).

------

## Más información


Para obtener más información sobre la integración Amazon Kendra con la fuente de ServiceNow datos, consulte:
+ [Para empezar, Amazon Kendra anunciamos el ServiceNow conector actualizado (V2) para Amazon Kendra](https://aws.amazon.com/blogs/machine-learning/announcing-the-updated-servicenow-connector-v2-for-amazon-kendra/)

# Especificar los documentos que se van a indexar con una consulta
Especificar documentos con una consulta

Puede usar una ServiceNow consulta para especificar los documentos que desea incluir en un Amazon Kendra índice. Cuando utiliza una consulta, puede especificar varias bases de conocimiento, incluidas las bases de conocimiento privadas. El acceso a las bases de conocimiento lo determina el usuario que utilices para conectarte a la ServiceNow instancia.

Para crear una consulta, utilice el generador de ServiceNow consultas. Puede usar el creador para generar la consulta y comprobar que devuelve la lista correcta de documentos.

**Para crear una consulta mediante la ServiceNow consola**

1. Inicie sesión en la ServiceNow consola.

1. En el menú de la izquierda, seleccione **Knowledge**, luego **Articles** y, a continuación, **All**.

1. En la parte superior de la página, elija el icono del filtro.

1. Utilice el creador de consultas para crear la consulta.

1. Cuando la consulta esté completa, haga clic con el botón derecho en ella y seleccione **Copy query** para copiarla del creador de consultas. Guarde esta consulta para utilizarla en ellaAmazon Kendra.  
![\[Query builder interface showing Knowledge base filters with options to run, save, and copy query.\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/images/ServiceNowQuery.png)

Recuerde no cambiar ningún parámetro de la consulta al copiarla. Si no se reconoce alguno de los parámetros de la consulta, ServiceNow trata el parámetro como vacío y no lo usa para filtrar los resultados.

# Slack


Slack es una aplicación de comunicación empresarial que permite a los usuarios enviar mensajes y archivos adjuntos a través de varios canales públicos y privados. Puedes usarlo Amazon Kendra para indexar tus canales públicos y privados de Slack, guardar y almacenar mensajes, archivos y archivos adjuntos y mensajes directos y grupales. También puede elegir contenido específico para filtrar.

**nota**  
Amazon Kendraahora es compatible con un conector de Slack actualizado.  
La consola se ha actualizado de forma automática. Todos los conectores nuevos que cree en la consola utilizarán la arquitectura actualizada. Si usa la API, ahora debe usar el objeto [https://docs.aws.amazon.com/kendra/latest/APIReference/API_TemplateConfiguration.html](https://docs.aws.amazon.com/kendra/latest/APIReference/API_TemplateConfiguration.html) en lugar del objeto `SlackConfiguration` para configurar el conector.  
Los conectores configurados con la antigua arquitectura de consola y API seguirán funcionando tal y como estaban configurados. Sin embargo, no podrá editarlos ni actualizarlos. Si desea editar o actualizar la configuración de un conector, deberá crear uno nuevo.  
Se recomienda migrar el flujo de trabajo de los conectores a la versión actualizada. Está previsto que la compatibilidad para los conectores configurados con la arquitectura anterior finalice en junio de 2024.

Puedes conectarte Amazon Kendra a tu fuente de datos de Slack mediante la [Amazon Kendraconsola](https://console.aws.amazon.com/kendra/) o la [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_TemplateConfiguration.html)API.

Para solucionar problemas del conector de fuente de datos de Amazon Kendra Slack, consulta. [Solución de problemas con los orígenes de datos](troubleshooting-data-sources.md)

**Topics**
+ [

## Características admitidas
](#supported-features-slack)
+ [

## Requisitos previos
](#prerequisites-slack)
+ [

## Instrucciones de conexión
](#data-source-procedure-slack)
+ [

## Más información
](#slack-learn-more)

## Características admitidas


Amazon KendraEl conector de fuente de datos de Slack admite las siguientes funciones:
+ Asignaciones de campos
+ Control de acceso de usuarios
+ Filtros de inclusión/exclusión
+ Sincronizaciones completas e incrementales del contenido
+ Nube privada virtual (VPC)

## Requisitos previos


Antes de que puedas Amazon Kendra indexar tu fuente de datos de Slack, realiza estos cambios en tu cuenta y en tu cuenta de Slack. AWS

**En Slack, asegúrese de que:**
+ Has configurado un token de usuario de Slack Bot o un OAuth token de usuario de Slack. OAuth Puedes elegir cualquier token para conectarte Amazon Kendra a tu fuente de datos de Slack. Se necesita un token para usarlo como credenciales de autenticación. Consulte la [documentación de Slack sobre los tokens de acceso](https://api.slack.com/authentication/token-types) para obtener más información.
**nota**  
Si utiliza el token de bot como parte de sus credenciales de Slack, no podrá indexar los mensajes directos ni los mensajes de grupo y deberá añadir el token de bot al canal que desee indexar.
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).
+ Anote el ID de equipo de su espacio de trabajo Slack en la URL de la página principal de su espacio de trabajo Slack. Por ejemplo, *https://app.slack.com/client/T0123456789/... * dónde *T0123456789* está el ID del equipo.
+ Se han agregado los siguientes ámbitos/permisos de Oauth:    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/kendra/latest/dg/data-source-slack.html)
+ Ha comprobado que cada documento es único en Slack y en otros orígenes de datos que vaya a utilizar para el mismo índice. Cada origen de datos que desee utilizar para un índice no debe contener el mismo documento en varios orígenes de datos. IDs Los documentos son globales en relación con un índice y deben ser únicos por índice.

**En el tuyoCuenta de AWS, asegúrate de tener:**
+ [Creó un Amazon Kendra índice](https://docs.aws.amazon.com/kendra/latest/dg/create-index.html) y, si usa la API, anotó el ID del índice.
+ [Creó un IAM rol](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds) para su fuente de datos y, si usa la API, anotó el ARN del IAM rol.
**nota**  
Si cambias el tipo de autenticación y las credenciales, debes actualizar tu IAM rol para acceder al ID AWS Secrets Manager secreto correcto.
+ Ha guardado sus credenciales de autenticación de Slack en un secreto de AWS Secrets Manager y, si utiliza la API, ha anotado el ARN del secreto.
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).

Si no tienes un IAM rol o un secreto existentes, puedes usar la consola para crear un nuevo IAM rol y un Secrets Manager secreto al conectar tu fuente de datos de Slack. Amazon Kendra Si utiliza la API, debe proporcionar el ARN de un IAM rol y un Secrets Manager secreto existentes y un ID de índice.

## Instrucciones de conexión


Para conectarte Amazon Kendra a tu fuente de datos de Slack, debes proporcionar los detalles necesarios de tu fuente de datos de Slack para que Amazon Kendra puedas acceder a tus datos. Si aún no has configurado Slack paraAmazon Kendra, consulta. [Requisitos previos](#prerequisites-slack)

------
#### [ Console ]

**Para conectarte Amazon Kendra a Slack** 

1. Inicia sesión en la [Amazon Kendraconsola Consola de administración de AWS](https://console.aws.amazon.com/kendra/) y ábrela.

1. En el panel de navegación izquierdo, elija **Índices** y, a continuación, elija el índice que desee usar de la lista de índices.
**nota**  
Puede elegir configurar o editar los ajustes de **Control de acceso de usuarios** en la **Configuración del índice**. 

1. En la página **Introducción**, seleccione **Agregar origen de datos**.

1. En la página **Agregar origen de datos**, seleccione el **Conector de Slack** y, a continuación, seleccione **Agregar conector**. Si usa la versión 2 (si corresponde), elija el **Conector de Slack** con la etiqueta “V2.0”.

1. En la página **Especificar detalles del origen de datos**, introduzca la siguiente información:

   1. En **Nombre y descripción**, en **Nombre del origen de datos**: introduzca un nombre para el origen de datos. Puede incluir guiones, pero no espacios.

   1. (Opcional)** Descripción**: introduzca una descripción opcional para el origen de datos.

   1. En **Idioma predeterminado**: elija un idioma para filtrar los documentos para el índice. A menos que especifique lo contrario, el idioma predeterminado es el inglés. El idioma especificado en los metadatos del documento anula el idioma seleccionado.

   1. En **Etiquetas**, para **añadir una nueva etiqueta**: incluye etiquetas opcionales para buscar y filtrar tus recursos o realizar un seguimiento de tus AWS costes.

   1. Elija **Siguiente**.

1. En la página **Definir acceso y seguridad**, introduzca la siguiente información:

   1. En **ID del equipo del espacio de trabajo de Slack**: el ID del equipo de su espacio de trabajo de Slack. Puede encontrar el ID de equipo en la URL de la página principal del espacio de trabajo de Slack. Por ejemplo, *https://app.slack.com/client/T0123456789/...* dónde *T0123456789* está el ID del equipo.

   1. **Autorización**: active o desactive la información de la lista de control de acceso (ACL) para los documentos, si tiene una ACL y desea usarla para el control de acceso. La ACL especifica a qué documentos pueden acceder los usuarios y los grupos. La información de la ACL se utiliza para filtrar los resultados de búsqueda en función del acceso del usuario o su grupo a los documentos. Para obtener más información, consulte [Filtrado de contexto de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#context-filter-user-incl-datasources).

   1. **AWS Secrets Managersecreto**: elige un secreto existente o crea uno nuevo Secrets Manager para almacenar tus credenciales de autenticación de Slack. Si decide crear un secreto nuevo, se abrirá una ventana de secreto de AWS Secrets Manager.

      1. Introduzca la siguiente información en la **ventana Crear un secreto de AWS Secrets Manager**:

         1. **Nombre del secreto**: un nombre para su secreto. El prefijo «AmazonKendra-Slack» se añade automáticamente a tu nombre secreto.

         1. En **Token de Slack**: introduzca los valores de las credenciales de autenticación que ha configurado para Slack. 

      1. Guarde y agregue el secreto.

   1. **Nube privada virtual (VPC)**: puede optar por utilizar una VPC. Si es así, debe agregar **Subredes** y **Grupos de seguridad de VPC**.

   1. **Rastreador de identidades**: especifique si se debe activar el rastreador de identidades de Amazon Kendra. El rastreador de identidades utiliza la información de la lista de control de acceso (ACL) de los documentos para filtrar los resultados de la búsqueda en función del acceso del usuario o del grupo a los documentos. Si tienes una ACL para tus documentos y decides utilizarla, también puedes optar por activar el rastreador de identidades para configurar el filtrado de los Amazon Kendra resultados de búsqueda según el contexto del [usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#context-filter-user-incl-datasources). De lo contrario, si el rastreador de identidades está desactivado, todos los documentos se pueden buscar públicamente. Si quieres usar el control de acceso para tus documentos y el rastreador de identidad está desactivado, también puedes usar la [PutPrincipalMapping](https://docs.aws.amazon.com/kendra/latest/APIReference/API_PutPrincipalMapping.html)API para cargar información de acceso de usuarios y grupos para filtrar el contexto de los usuarios.

   1. **IAMrol**: elija un IAM rol existente o cree uno nuevo IAM para acceder a las credenciales del repositorio y al contenido del índice.
**nota**  
IAMlos roles utilizados para los índices no se pueden usar para las fuentes de datos. Si no está seguro de si un rol existente se utiliza para un índice o para las preguntas frecuentes, elija **Crear un nuevo rol** para evitar errores.

   1. Elija **Siguiente**.

1. En la página **Configurar ajustes de sincronización**, introduzca la siguiente información:

   1. **Seleccionar tipo de contenido**: seleccione las entidades o tipos de contenido de Slack que desea rastrear. Puede elegir entre todos los canales, los canales públicos, los canales privados, los mensajes de grupos y los mensajes privados.

   1. **Seleccionar la fecha de inicio del rastreo**: introduzca la fecha en la que quiere empezar a rastrear el contenido.

   1. En **Configuración adicional**: elija incluir mensajes archivados y de bots y utilice patrones de expresión regular para incluir o excluir determinado contenido.
**nota**  
Si decides incluirlos tanto para el canal IDs como para los nombres de los canales, el conector de Amazon Kendra Slack priorizará los nombres de los canales IDs por encima de los de los canales.  
Si ha elegido incluir determinados mensajes privados y de grupos, el conector de Slack de Amazon Kendra ignorará todos los mensajes privados y de grupos, y solo rastreará los mensajes privados y de grupos que especifique.

   1. **Modo de sincronización**: elija cómo desea actualizar el índice cuando cambie el contenido del origen de datos. Cuando sincronizas tu fuente de datos Amazon Kendra por primera vez, todo el contenido se rastrea e indexa de forma predeterminada. Debe ejecutar una sincronización completa de los datos si la sincronización inicial falló, incluso si no selecciona la sincronización completa como opción de modo de sincronización.
      + Sincronización completa: se vuelve a indexar todo el contenido, reemplazando el contenido existente cada vez que el origen de datos se sincronice con el índice.
      + Sincronización nueva, modificada o eliminada: indexe solo el contenido nuevo, modificado y eliminado cada vez que la fuente de datos se sincronice con el índice. Amazon Kendrapuede usar el mecanismo de la fuente de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido que ha cambiado desde la última sincronización.

   1. En **Programación de ejecución de sincronización**, en **Frecuencia**: elija la frecuencia con la que desea sincronizar el contenido del origen de datos y actualizar el índice.

   1. Elija **Siguiente**.

1. En la página **Establecer asignaciones de campos**, especifique la siguiente información:

   1. **Campos de fuente de datos predeterminados**: seleccione entre los campos de fuente de datos predeterminados Amazon Kendra generados que desee asignar a su índice.

   1.  **Agregar campo**: para agregar campos de origen de datos personalizados para crear un nombre de campo de índice al que asignarlos y el tipo de datos del campo.

   1. Elija **Siguiente**.

1. En la página **Revisar y crear**, compruebe que la información que ha introducido es correcta y, a continuación, seleccione **Añadir origen de datos**. También puede elegir editar la información desde esta página. El origen de datos aparecerá en la página **Orígenes de datos** una vez que el origen de datos se haya agregado correctamente.

------
#### [ API ]

**Para conectarte Amazon Kendra a Slack**

Debe especificar un JSON del [esquema del origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/ds-schemas.html#ds-schema-slack) mediante la API [https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html](https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html). Debe proporcionar la siguiente información:
+ **Origen de datos**: defina el tipo de origen de datos como `SLACK` cuando utilice el esquema JSON [https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html](https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html). Además, defina el origen de datos como `TEMPLATE` al llamar a la API [https://docs.aws.amazon.com/kendra/latest/dg/API_CreateDataSource.html](https://docs.aws.amazon.com/kendra/latest/dg/API_CreateDataSource.html).
+ **ID del equipo del espacio de trabajo Slack**: El ID del equipo de Slack que copió de la URL de su página principal de Slack.
+ **Desde la fecha**: la fecha en la que comenzará a rastrear los datos de su equipo de espacio de trabajo de Slack. La fecha debe seguir este formato: yyyy-mm-dd.
+ **Modo de sincronización**: especifique cómo Amazon Kendra debe actualizar su índice cuando cambie el contenido de la fuente de datos. Al sincronizar el origen de datos con Amazon Kendra por primera vez, todo el contenido se rastrea y se indexa de forma predeterminada. Debe ejecutar una sincronización completa de los datos si la sincronización inicial falló, incluso si no selecciona la sincronización completa como opción de modo de sincronización. Puede elegir entre las siguientes opciones:
  + `FORCED_FULL_CRAWL` para volver a indexar todo el contenido, reemplazando el contenido existente cada vez que el origen de datos se sincronice con el índice.
  + `FULL_CRAWL` para indexar solo el contenido nuevo, modificado y eliminado cada vez que el origen de datos se sincronice con el índice. Amazon Kendra puede utilizar el mecanismo del origen de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido modificado desde la última sincronización.
  + `CHANGE_LOG` para indexar solo el contenido nuevo y modificado cada vez que el origen de datos se sincronice con el índice. Amazon Kendra puede utilizar el mecanismo del origen de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido modificado desde la última sincronización.
+ **Rastreador de identidades**: especifique si se debe activar el rastreador de identidades de Amazon Kendra. El rastreador de identidades utiliza la información de la lista de control de acceso (ACL) de los documentos para filtrar los resultados de la búsqueda en función del acceso del usuario o del grupo a los documentos. Si tiene una ACL para sus documentos y decide utilizarla, también puede optar por activar el rastreador de identidades para configurar el [filtrado Amazon Kendra de los resultados de búsqueda según el contexto del usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#context-filter-user-incl-datasources). De lo contrario, si el rastreador de identidades está desactivado, todos los documentos se pueden buscar públicamente. Si quieres usar el control de acceso para tus documentos y el rastreador de identidad está desactivado, también puedes usar la [PutPrincipalMapping](https://docs.aws.amazon.com/kendra/latest/APIReference/API_PutPrincipalMapping.html)API para cargar información de acceso de usuarios y grupos para filtrar el contexto de los usuarios.
+ **Nombre secreto del recurso de Amazon (ARN): proporciona** el nombre del recurso de Amazon (ARN) de un Secrets Manager secreto que contenga las credenciales de autenticación de tu cuenta de Slack. El secreto se almacena en una estructura JSON con las siguientes claves:

  ```
  {
      "slackToken": "token"
  }
  ```
+ **IAMrol**: especifica `RoleArn` cuándo llamas `CreateDataSource` para proporcionar un IAM rol con permisos para acceder a tu Secrets Manager secreto y para llamar al público APIs requerido para el conector de Slack y. Amazon Kendra Para obtener más información, consulte [Roles de SlackIAM para orígenes de datos de Slack](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds).

También puede añadir las siguientes características opcionales:
+  **Nube privada virtual (VPC)**: especifique a `VpcConfiguration` cuándo llamar a `CreateDataSource`. Para obtener más información, consulte [¿Se está configurando Amazon Kendra para usar un Amazon VPC](vpc-configuration.md).
+ **Canales específicos**: filtre por canales públicos o privados y especifique determinados canales por su ID.
+ **Tipos de canales y mensajes**: determine si Amazon Kendra debe indexar sus canales públicos y privados, sus mensajes de grupos y directos, así como sus mensajes de bots y archivados. Si utiliza un token de bot como parte de sus credenciales de autenticación de Slack, deberá añadir el token de bot al canal que desee indexar. No puede indexar mensajes directos y mensajes de grupo utilizando un token de bot.
+ **Retrospectiva**: puede configurar un parámetro de`lookBack` para que el conector de Slack rastree el contenido actualizado o eliminado hasta un número específico de horas antes de la última sincronización del conector.
+  **Filtros de inclusión y exclusión**: especifique si desea incluir o excluir determinado contenido de Slack. Si utiliza un token de bot como parte de sus credenciales de autenticación de Slack, deberá añadir el token de bot al canal que desee indexar. No puede indexar mensajes directos y mensajes de grupo utilizando un token de bot.
**nota**  
La mayoría de los orígenes de datos utilizan patrones de expresiones regulares, que son patrones de inclusión o exclusión denominados filtros. Si especifica un filtro de inclusión, solo se indexará el contenido que coincida con el filtro de inclusión. Los documentos que no coincidan con el filtro de inclusión no se indexan. Si especifica un filtro de inclusión y exclusión, los documentos que coincidan con el filtro de exclusión no se indexarán, aunque coincidan con el filtro de inclusión.
+  **Asignaciones de campos**: elija asignar los campos del origen de datos de Slack a los campos de índice de Amazon Kendra. Para obtener más información, consulte [Asignación de campos de origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/field-mapping.html).
**nota**  
El campo del cuerpo del documento o el cuerpo del documento equivalente de tus documentos es obligatorio Amazon Kendra para poder buscarlos. Debe asignar el nombre del campo del cuerpo del documento en el origen de datos al nombre del campo del índice `_document_body`. Todos los demás campos son opcionales.

Para obtener una lista de otras claves JSON importantes que debe configurar, consulte el [Esquema de plantilla de Slack](https://docs.aws.amazon.com/kendra/latest/dg/ds-schemas.html#ds-schema-slack).

------

## Más información


Para obtener más información sobre la integración Amazon Kendra con tu fuente de datos de Slack, consulta:
+ [Desentrañe los conocimientos de los espacios de trabajo de Slack con la búsqueda inteligente mediante el conector Slack Amazon Kendra](https://aws.amazon.com/blogs/machine-learning/unravel-the-knowledge-in-slack-workspaces-with-intelligent-search-using-the-amazon-kendra-slack-connector/)

# Zendesk


Zendesk es un sistema de gestión de relaciones con los clientes que ayuda a las empresas a automatizar y mejorar las interacciones de atención al cliente. Puede usarlo Amazon Kendra para indexar los tickets de soporte de Zendesk, los comentarios de los tickets, los archivos adjuntos de los tickets, los artículos del centro de ayuda, los comentarios de los artículos, los archivos adjuntos a los comentarios de los artículos, los temas de la comunidad, las publicaciones de la comunidad y los comentarios de las publicaciones de la comunidad.

Puede filtrar por nombre de organización si quiere indexar los tickets que solo están dentro de una organización específica. También puede elegir establecer una fecha de rastreo para comenzar a rastrear los datos de Zendesk.

Puede conectarse Amazon Kendra a su fuente de datos de Zendesk mediante la [Amazon Kendraconsola](https://console.aws.amazon.com/kendra/) y la [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_TemplateConfiguration.html)API.

Para solucionar problemas del conector de fuentes de datos de Amazon Kendra Zendesk, consulte. [Solución de problemas con los orígenes de datos](troubleshooting-data-sources.md)

**Topics**
+ [

## Características admitidas
](#supported-features-zendesk)
+ [

## Requisitos previos
](#prerequisites-zendesk)
+ [

## Instrucciones de conexión
](#data-source-procedure-zendesk)
+ [

## Más información
](#zendesk-learn-more)
+ [

## Notas
](#zendesk-notes)

## Características admitidas


Amazon KendraEl conector de fuente de datos de Zendesk admite las siguientes funciones:
+ Asignaciones de campos
+ Control de acceso de usuarios
+ Filtros de inclusión/exclusión
+ Sincronizaciones completas e incrementales del contenido y del registro de cambios
+ Nube privada virtual (VPC)

## Requisitos previos


Antes de que pueda utilizarla Amazon Kendra para indexar su fuente de datos de Zendesk, realice estos cambios en su cuenta de Zendesk y en sus cuentas. AWS

**En Zendesk, asegúrese de que:**
+ Creó una cuenta administrativa de Zendesk Suite (Professional/Enterprise).
+ Apuntó la URL de su servidor de Zendesk. Por ejemplo, *https://\$1sub-domain\$1.zendesk.com/*.
**nota**  
(local o en el servidor) Amazon Kendra comprueba si la información de punto final incluida AWS Secrets Manager es la misma que la información de punto final especificada en los detalles de configuración de la fuente de datos. Esto ayuda a evitar el [problema del suplente confuso](https://docs.aws.amazon.com/IAM/latest/UserGuide/confused-deputy.html), que es un problema de seguridad en el que un usuario no tiene permiso para realizar una acción, pero utiliza Amazon Kendra como proxy para acceder al secreto configurado y realizar la acción. Si más adelante cambia la información de punto de conexión, debe crear un nuevo secreto para sincronizar esta información.
+ Configure la autenticación OAuth 2.0 mediante el flujo de concesión de códigos de autorización:

  1. En el Centro de administración, vaya a Aplicaciones e integraciones > APIs > API de Zendesk.

  1. Seleccione la pestaña OAuth Clientes y haga clic en «Agregar OAuth cliente».

  1. Configure los detalles del OAuth cliente: defina el nombre y la descripción del cliente, establezca el tipo de cliente como «Confidencial», añada la redirección adecuada URLs (por ejemplo, https://localhost/callback para realizar pruebas), guarde y almacene de forma segura el ID de cliente y el secreto de cliente generados.

  1.  Asegúrese de que el OAuth cliente tenga el ámbito de «lectura» requerido (o «lectura/escritura» si necesita acceso de escritura). 

  1.  Genere un token de acceso utilizando el flujo de concesión de códigos de autorización: 
     + En un navegador, navegue hasta: `https://{subdomain}.zendesk.com/oauth/authorizations/new?response_type=code&client_id={your_client_id}&redirect_uri={your_redirect_uri}&scope=read`
     +  Autentique y autorice la aplicación cuando se le solicite. 
     +  Tras la autorización, Zendesk redirige al redirect\$1uri con un parámetro de código (por ejemplo, el código de autorización). https://localhost/callback?code=\$1authorization\$1code\$1). Copy 
     +  Cambie el código de autorización por un token de acceso enviando una solicitud POST al punto de conexión del token de Zendesk: 

       ```
       curl -X POST https://{subdomain}.zendesk.com/oauth/tokens \
         -H "Content-Type: application/x-www-form-urlencoded" \
         -d "grant_type=authorization_code&code={authorization_code}&client_id={your_client_id}&client_secret={your_client_secret}&redirect_uri={your_redirect_uri}&scope=read"
       ```
     +  Zendesk responde con un objeto JSON que contiene el access\$1token. Extraiga y guarde de forma segura este token de acceso. 

  1. Guarde el token de acceso generado de forma segura. Este token de acceso se utilizará para la integración de Kendra.
+ 
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).
+ **Opcional:** se instaló un certificado SSL para permitir a Amazon Kendra la conexión.
+ Marcó que cada documento es único en Zendesk y en otras Origen de datos que planea usar para el mismo índice. Cada origen de datos que desee utilizar para un índice no debe contener el mismo documento en varios orígenes de datos. IDs Los documentos son globales para un índice y deben ser únicos por índice.

**En el tuyoCuenta de AWS, asegúrate de tener:**
+ [Creó un Amazon Kendra índice](https://docs.aws.amazon.com/kendra/latest/dg/create-index.html) y, si usa la API, anotó el ID del índice.
+ [Creó un IAM rol](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds) para su fuente de datos y, si usa la API, anotó el ARN del IAM rol.
**nota**  
Si cambias el tipo de autenticación y las credenciales, debes actualizar tu IAM rol para acceder al ID AWS Secrets Manager secreto correcto.
+ Ha guardado sus credenciales de autenticación de Zendesk en un secreto de AWS Secrets Manager y, si utiliza la API, ha anotado el ARN del secreto.
**nota**  
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. **No** se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).

Si no tiene un IAM rol o secreto existente, puede usar la consola para crear un nuevo IAM rol y un Secrets Manager secreto al conectar su fuente de datos de Zendesk. Amazon Kendra Si utiliza la API, debe proporcionar el ARN de un IAM rol y un Secrets Manager secreto existentes y un ID de índice.

## Instrucciones de conexión


Para conectarse Amazon Kendra a su fuente de datos de Zendesk, debe proporcionar los detalles necesarios de su fuente de datos de Zendesk para que Amazon Kendra pueda acceder a sus datos. Si aún no ha configurado Zendesk paraAmazon Kendra, consulte. [Requisitos previos](#prerequisites-zendesk)

------
#### [ Console ]

**Para conectarse Amazon Kendra a Zendesk** 

1. Inicie sesión en la [Amazon Kendraconsola Consola de administración de AWS](https://console.aws.amazon.com/kendra/) y ábrala.

1. En el panel de navegación izquierdo, elija **Índices** y, a continuación, elija el índice que desee usar de la lista de índices.
**nota**  
Puede elegir configurar o editar los ajustes de **Control de acceso de usuarios** en la **Configuración del índice**. 

1. En la página **Introducción**, seleccione **Agregar origen de datos**.

1. En la página **Agregar origen de datos**, seleccione el **Conector de Zendesk** y, a continuación, seleccione **Agregar conector**. Si usa la versión 2 (si corresponde), elija el **Conector de Zendesk** con la etiqueta “V2.0”.

1. En la página **Especificar detalles del origen de datos**, introduzca la siguiente información:

   1. En **Nombre y descripción**, en **Nombre del origen de datos**: introduzca un nombre para el origen de datos. Puede incluir guiones, pero no espacios.

   1. (Opcional)** Descripción**: introduzca una descripción opcional para el origen de datos.

   1. En **Idioma predeterminado**: elija un idioma para filtrar los documentos para el índice. A menos que especifique lo contrario, el idioma predeterminado es el inglés. El idioma especificado en los metadatos del documento anula el idioma seleccionado.

   1. En **Etiquetas**, para **añadir una nueva etiqueta**: incluye etiquetas opcionales para buscar y filtrar tus recursos o realizar un seguimiento de tus AWS costes.

   1. Elija **Siguiente**.

1. En la página **Definir acceso y seguridad**, introduzca la siguiente información:

   1. **URL de Zendesk**: introduzca la URL de su cuenta de Zendesk. Por ejemplo, *https://\$1sub-domain\$1.zendesk.com/*.

   1. **Autorización**: active o desactive la información de la lista de control de acceso (ACL) para los documentos, si tiene una ACL y desea usarla para el control de acceso. La ACL especifica a qué documentos pueden acceder los usuarios y los grupos. La información de la ACL se utiliza para filtrar los resultados de búsqueda en función del acceso del usuario o su grupo a los documentos. Para obtener más información, consulte [Filtrado de contexto de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#context-filter-user-incl-datasources).

   1. **AWS Secrets Managersecreto**: elija un secreto existente o cree uno nuevo para almacenar sus Secrets Manager credenciales de autenticación de Zendesk. Si decide crear un secreto nuevo, se abrirá una ventana de secreto de AWS Secrets Manager.

      1. Cree un secreto nuevo con la siguiente estructura:

         ```
         {
                  "hostUrl": "https://yoursubdomain.zendesk.com/",
                  "accessToken": "your_access_token"
         }
         ```
**nota**  
Para la integración con Kendra, el nombre secreto debe empezar por 'AmazonKendra-Zendesk' seguido del identificador que haya elegido (p. ej., '-Zendesk-'). AmazonKendra MyConnector

      1. Guarde y agregue el secreto.

   1. **Nube privada virtual (VPC)**: puede optar por utilizar una VPC. Si es así, debe agregar **Subredes** y **Grupos de seguridad de VPC**.

   1. **Rastreador de identidades**: especifique si se debe activar el rastreador de identidades de Amazon Kendra. El rastreador de identidades utiliza la información de la lista de control de acceso (ACL) de los documentos para filtrar los resultados de la búsqueda en función del acceso del usuario o del grupo a los documentos. [Si tiene una ACL para sus documentos y decide utilizarla, también puede optar por activar el rastreador de identidad para configurar el filtrado de los resultados Amazon Kendra de búsqueda por contexto de usuario.](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#context-filter-user-incl-datasources) De lo contrario, si el rastreador de identidades está desactivado, todos los documentos se pueden buscar públicamente. Si quieres usar el control de acceso para tus documentos y el rastreador de identidad está desactivado, también puedes usar la [PutPrincipalMapping](https://docs.aws.amazon.com/kendra/latest/APIReference/API_PutPrincipalMapping.html)API para cargar información de acceso de usuarios y grupos para filtrar el contexto de los usuarios.

   1. **IAMrol**: elija un IAM rol existente o cree uno nuevo IAM para acceder a las credenciales del repositorio y al contenido del índice.
**nota**  
IAMlos roles utilizados para los índices no se pueden usar para las fuentes de datos. Si no está seguro de si un rol existente se utiliza para un índice o para las preguntas frecuentes, elija **Crear un nuevo rol** para evitar errores.

   1. Elija **Siguiente**.

1. En la página **Configurar ajustes de sincronización**, introduzca la siguiente información:

   1. **Seleccionar contenido**: seleccione los tipos de contenido que quiera rastrear desde los tickets, hasta los artículos del centro de ayuda, los temas de la comunidad y mucho más.

   1. **Nombre de la organización**: introduzca los nombres de la organización de Zendesk para filtrar contenido.

   1. **Fecha de inicio de la sincronización**: introduzca la fecha a partir de la cual desea rastrear el contenido.

   1. **Patrones regex**: añada patrones de expresiones regulares para incluir o excluir determinados archivos. Puede añadir hasta 100 patrones.

   1. **Modo de sincronización**: elija cómo desea actualizar el índice cuando cambie el contenido del origen de datos. Al sincronizar la fuente de datos Amazon Kendra por primera vez, todo el contenido se rastrea e indexa de forma predeterminada. Debe ejecutar una sincronización completa de los datos si la sincronización inicial falló, incluso si no selecciona la sincronización completa como opción de modo de sincronización.
      + Sincronización completa: se vuelve a indexar todo el contenido, reemplazando el contenido existente cada vez que el origen de datos se sincronice con el índice.
      + Sincronización de lo nuevo y modificado: se indexa solo el contenido nuevo y modificado cada vez que el origen de datos se sincroniza con el índice. Amazon Kendra puede utilizar el mecanismo del origen de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido modificado desde la última sincronización.
      + Sincronización nueva, modificada o eliminada: indexe solo el contenido nuevo, modificado y eliminado cada vez que la fuente de datos se sincronice con el índice. Amazon Kendrapuede usar el mecanismo de la fuente de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido que ha cambiado desde la última sincronización.

   1. En **Programación de ejecución de sincronización** en **Frecuencia**: elija la frecuencia con la que desea sincronizar el contenido del origen de datos y actualizar el índice.

   1. Elija **Siguiente**.

1. En la página **Establecer asignaciones de campos**, especifique la siguiente información:

   1. **Campos de fuente de datos predeterminados**: seleccione entre los campos de fuente de datos predeterminados Amazon Kendra generados que desee asignar a su índice.

   1.  **Agregar campo**: para agregar campos de origen de datos personalizados para crear un nombre de campo de índice al que asignarlos y el tipo de datos del campo.

   1. Elija **Siguiente**.

1. En la página **Revisar y crear**, compruebe que la información que ha introducido es correcta y, a continuación, seleccione **Añadir origen de datos**. También puede elegir editar la información desde esta página. El origen de datos aparecerá en la página **Orígenes de datos** una vez que el origen de datos se haya agregado correctamente.

------
#### [ API ]

**Para conectarse Amazon Kendra a Zendesk**

Debe especificar un JSON del [esquema del origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/ds-schemas.html) mediante la API [TemplateConfiguration](https://docs.aws.amazon.com/kendra/latest/APIReference/API_TemplateConfiguration.html). Debe proporcionar la siguiente información:
+ **Origen de datos**: defina el tipo de origen de datos como `ZENDESK` cuando utilice el esquema JSON [https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html](https://docs.aws.amazon.com/kendra/latest/dg/API_TemplateConfiguration.html). Además, defina el origen de datos como `TEMPLATE` al llamar a la API [https://docs.aws.amazon.com/kendra/latest/dg/API_CreateDataSource.html](https://docs.aws.amazon.com/kendra/latest/dg/API_CreateDataSource.html).
+ **URL del host**: proporcione la URL de su host de Zendesk como parte de la configuración de la conexión o de los detalles del punto de conexión del repositorio. Por ejemplo, * https://yoursubdomain.zendesk.com*.
+  **Registro de cambios**: si Amazon Kendra debe utilizar el mecanismo de registro de cambios del origen de datos de Zendesk para determinar si se debe añadir, actualizar o eliminar un documento del índice.
**nota**  
Utilice el registro de cambios si no quiere que Amazon Kendra digitalice todos los documentos. Si el registro de cambios es grande, es posible que se tarde Amazon Kendra menos en escanear los documentos de la fuente de datos de Zendesk que en procesar el registro de cambios. Si está sincronizando el origen de datos de Zendesk con su índice por primera vez, se escanean todos los documentos. 
+ **Nombre secreto del recurso de Amazon (ARN): proporcione** el nombre del recurso de Amazon (ARN) de un Secrets Manager secreto que contenga las credenciales de autenticación de su cuenta de Zendesk. El secreto se almacena en una estructura JSON con las siguientes claves:

  ```
  {
      "hostUrl": "https://yoursubdomain.zendesk.com",
      "clientId": "client ID",
      "clientSecret": "Zendesk client secret",
      "userName": "Zendesk user name",
      "password": "Zendesk password"
  }
  ```
+ **IAMrol**: especifique `RoleArn` cuándo llama `CreateDataSource` para proporcionar un IAM rol con permisos para acceder a su Secrets Manager secreto y para llamar al público APIs requerido para el conector de Zendesk y. Amazon Kendra Para obtener más información, consulte las [IAMfunciones de los orígenes de datos de Zendesk.](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-ds)

También puede añadir las siguientes características opcionales:
+  **Nube privada virtual (VPC)**: especifique a `VpcConfiguration` cuándo llamar a `CreateDataSource`. Para obtener más información, consulte [¿Se está configurando Amazon Kendra para usar un Amazon VPC](vpc-configuration.md).
+  **Tipos de documentos o contenido**: especifique si desea rastrear:
  + Tickets de Support, comentarios de and/or tickets, adjuntos de comentarios de tickets
  + Artículos del centro de ayuda, anexos y comentarios de artículos
  + Guía los temas, las publicaciones o los comentarios de la comunidad
+  **Filtros de inclusión y exclusión**: especifique si desea incluir o excluir determinado contenido de Slack. Si utiliza un token de bot como parte de sus credenciales de autenticación de Slack, deberá añadir el token de bot al canal que desee indexar. No puede indexar mensajes directos y mensajes de grupo utilizando un token de bot.
**nota**  
La mayoría de los orígenes de datos utilizan patrones de expresiones regulares, que son patrones de inclusión o exclusión denominados filtros. Si especifica un filtro de inclusión, solo se indexará el contenido que coincida con el filtro de inclusión. Los documentos que no coincidan con el filtro de inclusión no se indexan. Si especifica un filtro de inclusión y exclusión, los documentos que coincidan con el filtro de exclusión no se indexarán, aunque coincidan con el filtro de inclusión.
+  **Filtrado de contexto de usuario y control de acceso**: si hay una lista de control de acceso (ACL) para los documentos, Amazon Kendra la rastreará. La información de la ACL se utiliza para filtrar los resultados de búsqueda en función del acceso del usuario o su grupo a los documentos. Para obtener más información, consulte [Filtrado de contexto de usuario](https://docs.aws.amazon.com/kendra/latest/dg/user-context-filter.html#datasource-context-filter).
+  **Asignaciones de campos**: elija asignar los campos del origen de datos de Zendesk a los campos de índice de Amazon Kendra. Para obtener más información, consulte [Asignación de campos de origen de datos](https://docs.aws.amazon.com/kendra/latest/dg/field-mapping.html).
**nota**  
El campo del cuerpo del documento o el cuerpo del documento equivalente de sus documentos es obligatorio Amazon Kendra para poder buscarlos. Debe asignar el nombre del campo del cuerpo del documento en el origen de datos al nombre del campo del índice `_document_body`. Todos los demás campos son opcionales.

Para obtener una lista de otras claves JSON importantes que debe configurar, consulte el [Esquema de plantilla de Zendesk](https://docs.aws.amazon.com/kendra/latest/dg/ds-schemas.html#ds-schema-zendesk).

------

## Más información


Para obtener más información sobre la integración Amazon Kendra con la fuente de datos de Zendesk, consulte:
+ [Descubra información de Zendesk con Amazon Kendra la búsqueda inteligente](https://aws.amazon.com/blogs/machine-learning/discover-insights-from-zendesk-with-amazon-kendra-intelligent-search/)

## Notas

+ Cuando las listas de control de acceso (ACLs) están habilitadas, la opción «Sincronizar solo el contenido nuevo o modificado» no está disponible debido a las limitaciones de la API de Zendesk. Recomendamos usar los modos «Sincronización completa» o «Sincronización de contenido nuevo, modificado o eliminado» en su lugar, o ACLs desactivarlos si necesita usar este modo de sincronización.

# Asignación de campos de origen de datos


Amazon Kendra los conectores de fuentes de datos pueden asignar campos de documentos o contenido de la fuente de datos a los campos Amazon Kendra del índice. De forma predeterminada, cada conector está diseñado para rastrear campos de origen de datos específicos. Los campos de origen de datos predeterminados y sus propiedades no se pueden cambiar ni personalizar. En la Amazon Kendra consola, los campos predeterminados y las propiedades de los campos predeterminados que no se pueden editar aparecen atenuados.

Amazon Kendra Los conectores también le permiten asignar campos de contenido o documentos personalizados de la fuente de datos a los campos personalizados del índice. Por ejemplo, si tiene un campo en su origen de datos llamado “dept” que contiene información de departamento de un documento, puede asignarlo a un campo de índice denominado “Department”. De esta forma, puede utilizar el campo al consultar documentos.

También puede mapear campos Amazon Kendra reservados o comunes, como`_created_at`. Si la fuente de datos tiene un campo denominado «fecha de creación», puede asignarlo al campo Amazon Kendra reservado equivalente denominado. `_created_at` Para obtener más información sobre los campos Amazon Kendra reservados, consulte [Atributos o campos del documento](https://docs.aws.amazon.com/kendra/latest/dg/hiw-document-attributes.html).

Puede asignar campos para la mayoría de orígenes de datos. Puede crear asignaciones de campos para los siguientes orígenes de datos:
+ Adobe Experience Manager
+ Alfresco
+ Aurora (MySQL)
+ Aurora (PostgreSQL)
+ Amazon FSx (Windows)
+ Amazon FSx (NetApp ONTAP)
+ Amazon RDS/Aurora
+ Amazon RDS (Microsoft SQL Server)
+ Amazon RDS (MySQL)
+ Amazon RDS (Oracle)
+ Amazon RDS (PostgreSQL)
+ Amazon Kendra Rastreador web
+ WorkDocs
+ Box
+ Confluence
+ Dropbox
+ Drupal
+ GitHub
+ Unidades de Workspace de Google
+ Gmail
+ IBM DB2
+ Jira
+ Microsoft Exchange
+ Microsoft OneDrive
+ Microsoft SharePoint
+ Microsoft Teams
+ Microsoft SQL Server
+ Microsoft Yammer
+ MySQL
+ Oracle Database
+ PostgreSQL
+ Quip
+ Salesforce
+ ServiceNow
+ Slack
+ Zendesk

Si almacena los documentos en un bucket de S3 o en un origen de datos de S3, especifica los campos mediante un archivo de metadatos JSON. Para obtener más información, consulte [Conector de origen de datos de S3](https://docs.aws.amazon.com/kendra/latest/dg/data-source-s3.html).

La asignación de los campos de origen de datos a un campo de índice es un proceso de tres pasos:

1. Cree un índice. Para obtener más información, consulte [Creación de un índice](https://docs.aws.amazon.com/kendra/latest/dg/create-index.html).

1. Actualice el índice para añadir campos.

1. Cree una fuente de datos e incluya asignaciones de campos para asignar los campos reservados y cualquier campo personalizado a los campos de Amazon Kendra indexación.

Para actualizar el índice y añadir campos personalizados, utilice la consola para editar las asignaciones de campos de la fuente de datos y añadir un campo personalizado o utilice la API. [UpdateIndex](https://docs.aws.amazon.com/kendra/latest/APIReference/API_UpdateIndex.html) Puede añadir un total de 500 campos personalizados a su índice.

Para los orígenes de datos de la base de datos, si el nombre de la columna de la base de datos coincide con el nombre de un campo reservado, el campo y la columna se asignan automáticamente.

Con la [UpdateIndex](https://docs.aws.amazon.com/kendra/latest/APIReference/API_UpdateIndex.html)API, puede añadir campos reservados y personalizados mediante. `DocumentMetadataConfigurationUpdates`

En el siguiente ejemplo de JSON se utiliza `DocumentMetadataConfigurationUpdates` para agregar al índice un campo denominado “Department”.

```
"DocumentmetadataConfigurationUpdates": [
   {
       "Name": "Department",
       "Type": "STRING_VALUE"
   }
]
```

Al crear el campo, tiene la opción de configurar cómo se utiliza el campo en las búsquedas. Puede elegir entre las siguientes opciones:
+ **Visualizable**: determina si el campo se devuelve en la respuesta de la consulta. El valor predeterminado es `true`.
+ **Facetable**: indica que el campo se puede utilizar para crear facetas. El valor predeterminado es `false`.
+ **Buscable**: determina si el campo se utiliza en la búsqueda. El valor predeterminado es `true` para los campos de cadena y `false` para los campos de número y fecha.
+ **Ordenable**: indica que el campo se puede utilizar para ordenar los resultados de búsqueda. Solo se puede configurar para campos de fecha, número y cadena. No se puede configurar para los campos de lista de cadenas.

En el siguiente ejemplo de JSON se utiliza `DocumentMetadataConfigurationUpdates` para agregar al índice un campo denominado “Department” y marcarlo como facetable.

```
"DocumentMetadataConfigurationUpdates": [
   {
       "Name": "Department",
       "Type": "STRING_VALUE",
       "Search": {
           "Facetable": true
       }
   }
]
```

## Uso de campos de documentos comunes o Amazon Kendra reservados


Con la [UpdateIndex API](https://docs.aws.amazon.com/kendra/latest/APIReference/API_UpdateIndex.html), puede crear campos reservados o comunes utilizando `DocumentMetadataConfigurationUpdates` y especificando el nombre del campo de índice Amazon Kendra reservado para asignarlo al attribute/field nombre de su documento equivalente. También puede crear campos personalizados. Si utiliza un conector de fuente de datos, la mayoría incluye asignaciones de campos que asignan los campos del documento de la fuente de datos a campos de Amazon Kendra indexación. Si utiliza la consola, los campos se actualizan seleccionando el origen de datos, seleccionando la acción de edición y, a continuación, pasando a la sección de asignación de campos para configurar el origen de datos.

Puede configurar el objeto `Search` para establecer un campo como visualizable, facetable, buscable y ordenable. Puede configurar el objeto `Relevance` para establecer el orden de clasificación, duración de potenciación o período de tiempo de un campo para aplicarlos a los valores de potenciación, actualización, valor de importancia y valores de importancia asignados a valores de campo específicos. Si utiliza la consola, puede configurar los ajustes de búsqueda de un campo seleccionando la opción de faceta en el menú de navegación. Para configurar el ajuste de relevancia, seleccione la opción de buscar en su índice en el menú de navegación, introduzca una consulta y utilice las opciones del panel lateral para ajustar la relevancia de la búsqueda. No puede cambiar el tipo de campo una vez que este se ha creado.

Amazon Kendra tiene los siguientes campos de documento reservados o comunes que puede usar:
+ `_authors`: una lista de uno o más autores responsables del contenido del documento.
+ `_category`: una categoría que coloca un documento en un grupo específico.
+ `_created_at`: la fecha y hora en formato ISO 8601 de creación del documento. Por ejemplo, 2012-03-25T12:30:10\$101:00 es el formato de fecha y hora ISO 8601 para el 25 de marzo de 2012, a las 12.30 h (más 10 segundos) en el horario de Europa Central.
+ `_data_source_id`: el identificador del origen de datos que contiene el documento.
+ `_document_body`: el contenido del documento.
+ `_document_id`: un identificador único del documento.
+ `_document_title`: el título del documento.
+ `_excerpt_page_number`: el número de página de un archivo PDF en el que aparece el fragmento del documento. Si el índice se creó antes del 8 de septiembre de 2020, debe volver a indexar los documentos antes de poder utilizar este atributo.
+ `_faq_id`: si se trata de un documento tipo pregunta-respuesta (preguntas frecuentes), un identificador único para las preguntas frecuentes.
+ `_file_type`: el tipo de archivo del documento, como pdf o doc.
+ `_last_updated_at`: la fecha y hora en formato ISO 8601 de última actualización del documento. Por ejemplo, 2012-03-25T12:30:10\$101:00 es el formato de fecha y hora ISO 8601 para el 25 de marzo de 2012, a las 12.30 h (más 10 segundos) en el horario de Europa Central.
+ `_source_uri`: el URI en el que está disponible el documento. Por ejemplo, el URI del documento en el sitio web de una empresa.
+ `_version`: un identificador de la versión específica de un documento.
+ `_view_count`: el número de veces que se ha visto el documento.
+ `_language_code` (cadena): el código de un idioma que se aplica al documento. Este valor se define por defecto en inglés si no especifica un idioma. Para obtener más información acerca de los idiomas admitidos, incluidos sus códigos, consulte [Adición de documentos en idiomas distintos del inglés](https://docs.aws.amazon.com/kendra/latest/dg/in-adding-languages.html).

En el caso de campos personalizados, estos campos se crean mediante `DocumentMetadataConfigurationUpdates` con la API `UpdateIndex`, del mismo modo que cuando se crea un campo reservado o común. Debe establecer el tipo de datos adecuado para el campo personalizado. Si utiliza la consola, los campos se actualizan seleccionando el origen de datos, seleccionando la acción de edición y, a continuación, pasando a la sección de asignación de campos para configurar el origen de datos. Algunos orígenes de datos no admiten la adición de campos nuevos o campos personalizados. No puede cambiar el tipo de campo una vez que este se ha creado.

Los siguientes son los tipos que puede configurar para los campos personalizados:
+ Date
+ Número
+ Cadena
+ Lista de cadenas

Si ha agregado documentos al índice mediante la [BatchPutDocument](https://docs.aws.amazon.com/kendra/latest/APIReference/API_BatchPutDocument.html)API, `Attributes` muestra fields/attributes los documentos y crea campos con el `DocumentAttribute` objeto.

En el caso de los documentos indexados a partir de una fuente de Amazon S3 datos, los campos se crean mediante un [archivo de metadatos JSON](https://docs.aws.amazon.com/kendra/latest/dg/s3-metadata.html) que incluye la información de los campos.

Si utiliza una base de datos compatible como origen de datos, puede configurar los campos mediante la opción de [asignación de campos](https://docs.aws.amazon.com/kendra/latest/dg/data-source-database.html#data-source-procedure-database).

# Adición de documentos en idiomas distintos del inglés


Puede indexar documentos en varios idiomas. Si no especifica un idioma, Amazon Kendra indexa los documentos en inglés de forma predeterminada. El código de idioma de un documento se incluye en los metadatos del documento como un campo. Consulte [Asignaciones de campos](https://docs.aws.amazon.com/kendra/latest/dg/field-mapping.html) y [Atributos personalizados](https://docs.aws.amazon.com/kendra/latest/dg/custom-attributes.html) para obtener más información sobre el campo `_language_code` de un documento.

Cuando llame [CreateDataSource](https://docs.aws.amazon.com/kendra/latest/APIReference/API_CreateDataSource.html), puede especificar el código de idioma de todos los documentos de la fuente de datos. Si un documento no contiene un código de idioma especificado en un campo de metadatos, el documento se indexa utilizando el código de idioma especificado para todos los documentos en el nivel de origen de datos. En la consola, solo puede indexar documentos en un idioma compatible en el nivel del origen de datos. Vaya a **Orígenes de datos**, luego a la página **Especificar detalles del origen de datos** y elija un idioma en el menú desplegable **Idioma**.

También puede buscar o consultar documentos en un idioma compatible. Para obtener más información, consulte [Buscar en idiomas](https://docs.aws.amazon.com/kendra/latest/dg/searching-example.html#searching-index-languages).

Se admiten los siguientes idiomas y sus códigos (el inglés o `en` se admite de forma predeterminada si no especifica un idioma). En esta tabla se incluyen los idiomas Amazon Kendra compatibles con la búsqueda semántica completa, así como los idiomas que solo admiten la coincidencia simple de palabras clave. Los idiomas que admiten la búsqueda semántica completa se marcan con un asterisco y aparecen en negrita en la tabla siguiente. La búsqueda semántica completa también admite el inglés (idioma predeterminado).


| **Nombre del idioma** | **Código de idioma** | 
| --- | --- | 
| Árabe | ar | 
| Armenio | hy | 
| Euskera | eu | 
| Bengalí | bn | 
| Búlgaro | bg | 
| Catalán | ca | 
| Chino: simplificado y tradicional\$1 | zh | 
| Checo | cs | 
| Danés | da | 
| Neerlandés | nl | 
| Finés | fi | 
| Francés: incluye francés (Canadá)\$1 | fr | 
| Gallego | gl | 
| Alemán\$1 | de | 
| Griego | el | 
| Hindi | hi | 
| Húngaro | hu | 
| Indonesio | id | 
| Irlandés | ga | 
| Italiano | it | 
| Japonés\$1 | ja | 
| Coreano\$1 | ko | 
| Letón | lv | 
| Lituano | lt | 
| Noruego | no | 
| Persa | fa | 
| Portugués | pt | 
| Portugués (Brasil)\$1 | pt-BR | 
| Rumano | ro | 
| Ruso | ru | 
| Sorani | ckb | 
| Español: incluye español (México)\$1 | es | 
| Sueco | sv | 
| Turco | tr | 

*\$1Se admite la búsqueda semántica en este idioma.*

Para los idiomas que admiten la búsqueda semántica, se admiten las siguientes características.
+ La relevancia del documento va más allá de la simple coincidencia de palabras clave.
+ FAQs más allá de la simple coincidencia de palabras clave.
+ Extraer respuestas de documentos en función de su comprensión Amazon Kendra lectora.
+ Buckets de confianza (muy alta, alta, media y baja) de los resultados de búsqueda.

Para los idiomas que no admiten la búsqueda semántica, se admite la búsqueda simple de palabras clave para determinar la relevancia del documento y. FAQs

[Los sinónimos](https://docs.aws.amazon.com/kendra/latest/dg/index-synonyms.html) (incluidos los sinónimos personalizados), el [aprendizaje gradual y los comentarios](https://docs.aws.amazon.com/kendra/latest/dg/submitting-feedback.html) y las [sugerencias de consultas](https://docs.aws.amazon.com/kendra/latest/dg/query-suggestions.html) solo se admiten en inglés (idioma predeterminado).

# ¿Se está configurando Amazon Kendra para usar un Amazon VPC


Amazon Kendra puede conectarse a una nube privada virtual (VPC) que haya creado Amazon Virtual Private Cloud para indexar el contenido almacenado en las fuentes de datos que se ejecutan en su nube privada. Al crear un conector de origen de datos, puede proporcionar identificadores de subred y grupo de seguridad para la subred que contiene el origen de datos. Con esta información, Amazon Kendra crea una interfaz de red elástica que utiliza para comunicarse de forma segura con la fuente de datos de la VPC.

Para configurar un conector de fuente de Amazon Kendra datos Amazon VPC, puede utilizar la operación Consola de administración de AWS o la [CreateDataSource](https://docs.aws.amazon.com/kendra/latest/APIReference/API_CreateDataSource.html)API. Si usa la consola, conecta una VPC durante el proceso de configuración del conector.

**nota**  
La Amazon VPC función es opcional al configurar un conector de fuente de Amazon Kendra datos. Si se puede acceder a la fuente de datos desde la Internet pública, no es necesario que habilite la Amazon VPC función. No todos los conectores de orígenes de datos de Amazon Kendra admiten Amazon VPC.

Si la fuente de datos no se está ejecutando Amazon VPC y no se puede acceder a ella desde la Internet pública, primero debe conectar la fuente de datos a la VPC mediante una red privada virtual (VPN). A continuación, puede conectar su fuente de datos Amazon Kendra mediante una combinación de Amazon VPC y AWS Virtual Private Network. Para obtener información sobre la configuración de una VPN, consulte la [Documentación de Site-to-Site VPN](https://docs.aws.amazon.com/vpn/).

**Topics**
+ [

# Configuración del Amazon VPC soporte para Amazon Kendra conectores
](connector-vpc-steps.md)
+ [

# Configure una fuente Amazon Kendra de datos a la que conectarse Amazon VPC
](connector-vpc-setup.md)
+ [

# Conexión a una base de datos en una VPC
](vpc-example.md)
+ [

# Solución de problemas de conexión de VPC
](vpc-connector-troubleshoot.md)

# Configuración del Amazon VPC soporte para Amazon Kendra conectores
Configurando Amazon VPC

Para Amazon VPC configurarlo para su uso con Amazon Kendra los conectores, siga los siguientes pasos.

**Topics**
+ [

## Paso 1. Cree Amazon VPC subredes para Amazon Kendra
](#connector-vpc-prerequisites-1)
+ [

## Paso 2. Cree grupos de Amazon VPC seguridad para Amazon Kendra
](#connector-vpc-prerequisites-2)
+ [

## Paso 3. Configure su fuente de datos externa y Amazon VPC
](#connector-vpc-prerequisites-3)

## Paso 1. Cree Amazon VPC subredes para Amazon Kendra


Cree o elija una Amazon VPC subred existente que Amazon Kendra pueda usar para acceder a su fuente de datos. Las subredes preparadas deben estar en una de las siguientes zonas de disponibilidad Regiones de AWS y en una de las siguientes zonas:
+ Oeste de EE. UU. (Oregón)/us-west-2—usw2-az1, usw2-az2, usw2-az3
+ Este de EE. UU. (Norte de Virginia)/us-east-1—use1-az1, use1-az2, use1-az4
+ Este de EE. UU. (Ohio)/us-east-2—use2-az1, use2-az2, use2-az3
+ Asia-Pacífico (Tokio)/ap-northeast-1—apne1-az1, apne1-az2, apne1-az4
+ Asia-Pacífico (Bombay)/ap-south-1—aps1-az1, aps1-az2, aps1-az3
+ Asia-Pacífico (Singapur)/ap-southeast-1—apse1-az1, apse1-az2, apse1-az3
+ Asia-Pacífico (Sídney)/ap-southeast-2—apse2-az1, apse2-az2, apse2-az3
+ Canadá (centro)/ca-central-1—cac1-az1, cac1-az2, cac1-az4
+ Europa (Irlanda)/eu-west-1—euw1-az1, uew1-az2, euw1-az3
+ Europa (Londres)/eu-west-2—euw2-az1, euw2-az2, euw2-az3

Debe poder acceder a su origen de datos desde las subredes que proporcionó al conector de Amazon Kendra .

Para obtener más información sobre cómo configurar las Amazon VPC subredes, consulte [Subnets for your Amazon VPC](https://docs.aws.amazon.com/vpc/latest/userguide/configure-subnets.html) en la Guía del usuario de Amazon *VPC*.

Si Amazon Kendra debe enrutar la conexión entre dos o más subredes, puede preparar varias subredes. Por ejemplo, la subred que contiene el origen de datos no tiene direcciones IP. En ese caso, puede proporcionar Amazon Kendra una subred adicional que tenga suficientes direcciones IP y esté conectada a la primera subred. Si enumera varias subredes, las subredes deben poder comunicarse entre sí.

## Paso 2. Cree grupos de Amazon VPC seguridad para Amazon Kendra


Para conectar el conector de la fuente de Amazon Kendra datos Amazon VPC, debe preparar uno o más grupos de seguridad de la VPC para asignarlos. Amazon Kendra Los grupos de seguridad se asociarán a la interfaz de red elástica creada por Amazon Kendra. Esta interfaz de red controla el tráfico entrante y saliente Amazon Kendra al acceder a las subredes. Amazon VPC 

Asegúrese de que las reglas de salida de su grupo de seguridad permitan que el tráfico de los conectores de orígenes de datos de Amazon Kendra accedan a las subredes y al origen de datos con las que se va a sincronizar. Por ejemplo, puede usar un conector de MySQL para sincronizar desde una base de datos de MySQL. Si utiliza el puerto predeterminado, los grupos de seguridad deben permitir el acceso Amazon Kendra al puerto 3306 del host que ejecuta la base de datos.

Se recomienda configurar un grupo de seguridad predeterminado con los siguientes valores Amazon Kendra para su uso:
+ **Reglas de entrada**: si decide dejar este campo vacío, se bloqueará todo el tráfico entrante.
+ **Reglas de salida**: agregue una regla para permitir que todo el tráfico saliente Amazon Kendra pueda iniciar las solicitudes de sincronización desde su fuente de datos.
  + **Versión IP**: IPv4
  + **Tipo**: todo el tráfico
  + **Protocolo**: todo el tráfico
  + **Rango de puertos**: todos
  + **Destino**: 0.0.0.0/0

Para obtener más información sobre cómo configurar los grupos Amazon VPC de seguridad, consulte [Reglas de grupos de seguridad](https://docs.aws.amazon.com/vpc/latest/userguide/security-group-rules.html) en la Guía del *usuario de Amazon VPC*.

## Paso 3. Configure su fuente de datos externa y Amazon VPC


Asegúrese de que la fuente de datos externa tenga la configuración de permisos y los ajustes de red correctos para acceder Amazon Kendra a ella. Encontrará instrucciones detalladas sobre cómo configurar los orígenes de datos en la sección de requisitos previos de la página de cada conector.

Además, compruebe la Amazon VPC configuración y asegúrese de que se pueda acceder a la fuente de datos externa desde la subred a la que vaya a realizar la asignación. Amazon Kendra Para ello, le recomendamos que cree una Amazon EC2 instancia en la misma subred con los mismos grupos de seguridad y pruebe el acceso a la fuente de datos desde esta instancia. Amazon EC2 Para obtener más información, consulta [Solución de problemas de Amazon VPC conexión](https://docs.aws.amazon.com/kendra/latest/dg/vpc-connector-troubleshoot.html). 

# Configure una fuente Amazon Kendra de datos a la que conectarse Amazon VPC
Conectarse a Amazon VPC

Al añadir una nueva fuente de datos Amazon Kendra, puede utilizar la Amazon VPC función si el conector de fuente de datos seleccionado es compatible con esta función. 

Puede configurar una nueva fuente de Amazon Kendra datos si Amazon VPC está habilitada mediante la API Consola de administración de AWS o la Amazon Kendra API. En concreto, utilice la operación de la API [https://docs.aws.amazon.com/kendra/latest/APIReference/API_CreateDataSource.html](https://docs.aws.amazon.com/kendra/latest/APIReference/API_CreateDataSource.html) y, a continuación, utilice el parámetro `VpcConfiguration` para proporcionar la siguiente información:
+ `SubnetIds`— Una lista de identificadores de subredes Amazon VPC 
+ `SecurityGroupIds`— Una lista de identificadores de grupos de seguridad Amazon VPC 

Si utiliza la consola, proporciona la Amazon VPC información necesaria durante la configuración del conector. Para utilizar la consola para habilitar la característica Amazon VPC para un conector, primero debe elegir una Amazon VPC. A continuación, debe proporcionar los identificadores de cualquier subred de Amazon VPC y los identificadores de cualquier grupo de seguridad de Amazon VPC. Puede elegir las subredes de Amazon VPC y los grupos de seguridad de Amazon VPC que creó en [Configuración de Amazon VPC](https://docs.aws.amazon.com/kendra/latest/dg/connector-vpc-steps.html) o utilizar cualquiera de los existentes.

**Topics**
+ [

## Visualización de Amazon VPC los identificadores
](#viewing-vpc-identifiers)
+ [

## Comprobando su función de fuente de IAM datos
](#vpc-iam-roles)

## Visualización de Amazon VPC los identificadores


Los identificadores de las subredes y los grupos de seguridad se configuran en la consola. Amazon VPC Para ver los identificadores, utilice los siguientes procedimientos.

**Para ver los identificadores de subred**

1. Inicie sesión en la consola de Amazon VPC Consola de administración de AWS y ábrala en. [https://console.aws.amazon.com/vpc/](https://console.aws.amazon.com/vpc/)

1. En el panel de navegación, elija **Subredes**.

1. En la lista **Subredes**, elija la subred que contiene el servidor de base de datos.

1. En la pestaña **Detalles**, tome nota del identificador del campo **ID de subred**.

**Para ver los identificadores de grupos de seguridad**

1. Inicie sesión en la consola de Amazon VPC Consola de administración de AWS y ábrala en. [https://console.aws.amazon.com/vpc/](https://console.aws.amazon.com/vpc/)

1. En el panel de navegación, elija **Grupos de seguridad**.

1. En la lista de grupos de seguridad, elija el grupo para el que desea el identificador.

1. En la pestaña **Detalles**, tome nota del identificador del campo **ID de grupo de seguridad**.

## Comprobando su función de fuente de IAM datos


Asegúrese de que su función de fuente de datos AWS Identity and Access Management IAM(conector) contenga permisos para acceder a su Amazon VPC.

Si usa la consola para crear un nuevo rol para su IAM rol, agrega Amazon Kendra automáticamente los permisos correctos a su IAM rol en su nombre. Si utilizas la API o utilizas un IAM rol existente, comprueba que tu rol contenga permisos de acceso Amazon VPC. Para comprobar que tiene los permisos correctos, consulte [Roles de IAM para VPC](https://docs.aws.amazon.com/kendra/latest/dg/iam-roles.html#iam-roles-vpc).

Puede modificar un origen de datos existente para usar una subred de Amazon VPC diferente. Sin embargo, compruebe la IAM función de la fuente de datos y, si es necesario, modifíquela para que refleje el cambio y que el conector de la fuente de Amazon Kendra datos funcione correctamente.

# Conexión a una base de datos en una VPC
Conexión a una base de datos

En el ejemplo siguiente se muestra cómo conectar una base de datos de MySQL que se ejecuta en una nube privada virtual (VPC). En el ejemplo se supone que está empezando por la VPC predeterminada y que necesita crear una base de datos de MySQL. Si ya tiene una VPC, asegúrese de que esté configurada como se muestra. Si tiene una base de datos de MySQL, puede utilizarla en lugar de crear una nueva.

**Topics**
+ [

## Paso 1: Configurar una VPC
](#vpc-example-1)
+ [

## Paso 2: crear y configurar grupos de seguridad
](#vpc-example-2)
+ [

## Paso 3: Crear una base de datos
](#vpc-example-3)
+ [

## Paso 4: crear un conector de origen de datos
](#vpc-example-4)

## Paso 1: Configurar una VPC


Configure su VPC para tener una subred privada y un grupo de seguridad para Amazon Kendra para obtener acceso a una base de datos MySQL que se ejecute en la subred. Las subredes proporcionadas en la configuración de la VPC deben estar en la región Oeste de EE. UU. (Oregón), en la región Este de EE. UU. (Norte de Virginia) o en la región Europa (Irlanda).

**Para configurar una VPC mediante Amazon VPC**

1. Inicie sesión en la consola de Amazon VPC Consola de administración de AWS y ábrala en. [https://console.aws.amazon.com/vpc/](https://console.aws.amazon.com/vpc/)

1. En el panel de navegación, elija **Route Tables** (Tablas de enrutamiento) y, a continuación, elija **Create route table** (Crear tabla de enrutamiento).

1. En el campo **Nombre**, introduzca **Private subnet route table**. **En el menú desplegable **VPC**, seleccione su VPC y, a continuación, elija Crear tabla de enrutamiento**. Elija **Close** (Cerrar) para volver a la lista de tablas de enrutamiento.

1. En el panel de navegación, elija **Puertas de enlace NAT** y luego elija **Crear puerta de enlace NAT**.

1. En el menú desplegable **Subred**, seleccione la subred que es la subred pública. Anote los ID de subred.

1. Si no tiene una dirección IP elástica, elija **Create New EIP** (Crear nueva EIP), elija **Create a NAT Gateway** (Crear gateway NAT) y, a continuación, elija **Close** (Cerrar).

1. En el panel de navegación, elija **Tablas de enrutamiento**.

1. En la lista de tablas de enrutamiento, elija la **tabla de enrutamiento de la subred privada** creada en el paso 3. En **Acciones**, elija **Editar rutas**. 

1. Seleccione **Add route** (Añadir ruta). Para el destino, introduzca **0.0.0.0/0** para permitir todo el tráfico saliente a Internet. En **Target** (Destino), elija **NAT Gateway** (Gateway NAT) y luego, el gateway creado en el paso 4. Elija **Guardar cambios** y después **Cerrar**.

1. En el menú **Actions** (Acciones), elija **Edit subnet associations** (Editar asociaciones de subred).

1. Elija las subredes que quiere que sean privadas. No elija la subred con la gateway NAT que ha indicado anteriormente. Elija **Guardar asociaciones** cuando haya terminado.

## Paso 2: crear y configurar grupos de seguridad


A continuación, configure los grupos de seguridad para su base de datos.

**Para crear y configurar grupos de seguridad**

1. Inicie sesión en la consola de Amazon VPC Consola de administración de AWS y ábrala en. [https://console.aws.amazon.com/vpc/](https://console.aws.amazon.com/vpc/)

1. En la descripción de su VPC, anote el IPv4 CIDR.

1. En el panel de navegación, elija **Grupos de seguridad** y, a continuación, elija **Crear un grupo de seguridad**.

1. En **Nombre del grupo de seguridad**, introduzca **DataSourceInboundSecurityGroup**. Proporcione una descripción y, a continuación, elija su VPC en la lista. Elija **Crear grupo de seguridad** y luego seleccione **Cerrar**.

1. Elija la pestaña **Reglas de entrada**.

1. Elija **Editar reglas de entrada** y, a continuación, **Añadir regla**.

1. En una base de datos, escriba el número de puerto para **Rango de puertos**. Por ejemplo, para MySQL es **3306**, y, para HTTPS, es **443**. Para **Source** (Origen), escriba el enrutamiento entre dominios sin clases (CIDR) de la VPC. Elija **Save** (Guardar) y, a continuación, elija **Close ** (Cerrar).

El grupo de seguridad permite que cualquier persona de la VPC se conecte a la base de datos y permite conexiones salientes a Internet.

## Paso 3: Crear una base de datos


Cree una base de datos para guardar los documentos, o puede utilizar la base de datos existente.

Para obtener instrucciones sobre cómo crear una base de datos de MySQL, consulte [https://docs.aws.amazon.com/kendra/latest/dg/data-source-mysql.html](https://docs.aws.amazon.com/kendra/latest/dg/data-source-mysql.html).

## Paso 4: crear un conector de origen de datos


Después de configurar la VPC y crear la base de datos, puede crear un conector de origen de datos para la base de datos. Para obtener información sobre los conectores de bases de datos Amazon Kendra compatibles, consulte Conectores [compatibles](https://docs.aws.amazon.com/kendra/latest/dg/data-sources.html).

Para la base de datos, asegúrese de configurar la VPC, las subredes privadas que creó en la VPC y el grupo de seguridad que creó en la VPC.

# Solución de problemas de conexión de VPC


Si tiene algún problema con la conexión de la nube privada virtual (VPC), compruebe que IAM los permisos, la configuración del grupo de seguridad y las tablas de enrutamiento de la subred estén configurados correctamente.

Una posible causa de un error en la sincronización del conector de la fuente de datos es que es posible que no se pueda acceder a la fuente de datos desde la subred a la que la asignó. Amazon Kendra Para solucionar este problema, te recomendamos que crees una Amazon EC2 instancia con la misma configuración. Amazon VPC A continuación, intenta acceder a la fuente de datos desde esta Amazon EC2 instancia mediante llamadas a la API REST u otros métodos (según el tipo específico de fuente de datos).

Si accedes correctamente a la fuente de datos desde la Amazon EC2 instancia que has creado, significa que se puede acceder a la fuente de datos desde esta subred. Por lo tanto, el problema de sincronización no está relacionado con que la fuente de datos no pueda acceder a ella. Amazon VPC

Si no puedes acceder a tu Amazon EC2 instancia desde la configuración de tu VPC y validarla con la Amazon EC2 instancia que has creado, tendrás que seguir solucionando los problemas. Por ejemplo, si tienes un Amazon S3 conector cuya sincronización ha fallado debido a errores relacionados con problemas de conexión, puedes configurar una Amazon EC2 instancia con la misma Amazon VPC configuración que asignaste a tu Amazon S3 conector. A continuación, utilice esta instancia de Amazon EC2 para comprobar si la Amazon VPC se ha configurado correctamente.

A continuación, se muestra un ejemplo de cómo configurar una Amazon EC2 instancia para solucionar problemas de Amazon VPC conexión con una fuente de Amazon S3 datos.

**Topics**
+ [

## Paso 1: lanza una instancia Amazon EC2
](#vpc-connector-troubleshoot-1)
+ [

## Paso 2: Conectarse a la Amazon EC2 instancia
](#vpc-connector-troubleshoot-2)
+ [

## Paso 3: Probar el Amazon S3 acceso
](#vpc-connector-troubleshoot-3)

## Paso 1: lanza una instancia Amazon EC2


1. Inicie sesión en la consola Amazon EC2 Consola de administración de AWS y ábrala en. [https://console.aws.amazon.com/ec2/](https://console.aws.amazon.com/ec2/)

1. Seleccione **Lanzar una instancia**.

1. Elija **Configuración de red**, luego elija **Editar** y realice lo siguiente:

   1. Elija la misma VPC y la misma **subred** a las que las asignó. Amazon Kendra

   1. En **Firewall (grupos de seguridad)**, elija **Seleccionar un grupo de seguridad existente**. A continuación, seleccione el grupo de seguridad al que lo asignó. Amazon Kendra
**nota**  
El grupo de seguridad debe permitir que el tráfico saliente a Amazon S3.

   1. Configure la opción **Asignar automáticamente una IP pública** en **Desactivar**.

   1. En **Detalles avanzados**, haga lo siguiente: 
      + En el **perfil de instancia de IAM**, seleccione **Crear un nuevo perfil de IAM** para crear y adjuntar un perfil de IAM instancia a su instancia. Asegúrese de que el perfil tenga permisos de acceso a Amazon S3. Para obtener más información, consulta [¿Cómo puedo conceder a mi Amazon EC2 instancia acceso a un Amazon S3 bucket](https://repost.aws/knowledge-center/ec2-instance-access-s3-bucket)? en AWS re:Post.
      + Deje el resto de la configuración predeterminada.

   1. Revisa y lanza la Amazon EC2 instancia.

## Paso 2: Conectarse a la Amazon EC2 instancia


Una vez que la Amazon EC2 instancia esté en ejecución, vaya a la página de detalles de la instancia y conéctese a ella. Para ello, siga estos pasos en [Conéctese a las instancias sin necesidad de una dirección IPv4 pública mediante el punto de conexión de EC2 Instance Connect](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/connect-with-ec2-instance-connect-endpoint.html) en la *Guía del usuario de instancias de Linux de Amazon EC2 *.

## Paso 3: Probar el Amazon S3 acceso


Una vez que te hayas conectado al terminal de tu Amazon EC2 instancia, ejecuta un AWS CLI comando para probar la conexión de esta subred privada a tu Amazon S3 bucket.

Para probar el Amazon S3 acceso, escribe el siguiente AWS CLI comando en: AWS CLI`aws s3 ls`

Cuando se ejecute el AWS CLI comando, revise lo siguiente:
+ Si has configurado correctamente los IAM permisos necesarios y tu Amazon S3 configuración es correcta, deberías ver una lista de tus Amazon S3 depósitos.
+ Si ves errores de permisos, por ejemplo`Access Denied`, es probable que la configuración de tu VPC sea correcta, pero hay algún problema con tus IAM permisos o Amazon S3 con tu política de bucket.

Si se agota el tiempo de espera del comando, es probable que se esté agotando el tiempo de espera de la conexión porque la configuración de la VPC es incorrecta y la instancia de Amazon EC2 no puede acceder a Amazon S3 desde la subred. Vuelva a configurar la VPC e inténtelo de nuevo.