Recursos compatíveis Pré-requisitos Instruções de conexão

OneDrive Conector Microsoft V2.0

A Microsoft OneDrive é um serviço de armazenamento baseado em nuvem que você pode usar para armazenar, compartilhar e hospedar seu conteúdo. Você pode usar Amazon Kendra para indexar sua fonte OneDrive de dados.

Você pode se conectar Amazon Kendra à sua fonte de OneDrive dados usando o Amazon Kendra console e a OneDriveConfigurationAPI.

nota

O suporte para o OneDrive Connector V1.0/ OneDriveConfiguration API está programado para terminar em junho de 2023. Recomendamos usar o OneDrive Connector V2.0/ TemplateConfiguration API. A versão 2.0 fornece funcionalidade adicional ACLs e de rastreador de identidade.

Para solucionar problemas do conector da fonte de Amazon Kendra OneDrive dados, consulteSolucionar problemas de origens de dados.

Recursos compatíveis

Amazon Kendra OneDrive o conector de fonte de dados oferece suporte aos seguintes recursos:

Mapeamentos de campos
Controle de acesso do usuário
Filtros de inclusão/exclusão
Sincronizações completas e incrementais de conteúdo
Nuvem privada virtual (VPC)

Pré-requisitos

Antes de poder usar Amazon Kendra para indexar sua fonte de OneDrive dados, faça essas alterações em suas OneDrive AWS contas.

Em OneDrive, verifique se você tem:

Criou uma OneDrive conta no Office 365.
Anotou o ID de inquilino do Microsoft 365. Você pode encontrar sua ID de locatário nas Propriedades do Portal do Azure Active Directory ou em seu OAuth aplicativo.
Criou um OAuth aplicativo no portal do Azure e anotou a ID do cliente e o segredo do cliente ou as credenciais do cliente usadas para autenticação com um AWS Secrets Manager segredo. Consulte mais informações no tutorial da Microsoft e no exemplo de registro de aplicação.

nota
Quando você cria ou registra uma aplicação no portal do Azure, o ID do segredo representa o valor real do segredo. Você deve anotar ou salvar o valor real do segredo imediatamente ao criar o segredo e a aplicação. É possível acessar o segredo selecionando o nome da aplicação no portal do Azure e acessando a opção de menu sobre certificados e segredos.
É possível acessar o ID de cliente selecionando o nome da aplicação no portal do Azure e acessando a página de visão geral. O ID da aplicação (cliente) é o ID de cliente.

nota
É recomendável atualizar ou alternar regularmente suas credenciais e senhas. Forneça somente o nível de acesso necessário para sua própria segurança. Não recomendamos que você reutilize credenciais e senhas nas fontes de dados e nas versões 1.0 e 2.0 do conector (quando for aplicável).
Usou o ID da aplicação AD para registrar uma chave secreta para a aplicação no site do AD. A chave secreta deve conter o ID da aplicação e uma chave secreta.
Copiou o domínio AD da organização.
As seguintes permissões foram adicionadas ao seu aplicativo AD na opção Microsoft Graph:
- Leia arquivos em todos os conjuntos de sites (File.Read.All)
- Leia o perfil completo de todos os usuários (User.Read.All)
- Leia todos os grupos (Group.Read.All)
- Leia todas as notas (Notes.Read.All)
Copiou a lista de usuários cujos documentos devem ser indexados. Você pode optar por fornecer uma lista de nomes de usuário ou pode fornecer os nomes de usuário em um arquivo armazenado em um Amazon S3. Depois de criar a fonte de dados, você poderá:
- Modifique a lista de usuários.
- Mude de uma lista de usuários para uma lista armazenada em um Amazon S3 bucket.
- Altere a localização do Amazon S3 bucket de uma lista de usuários. Se você alterar a localização do bucket, também deverá atualizar a IAM função da fonte de dados para que ela tenha acesso ao bucket.
  
  nota
  Se você armazenar a lista de nomes de usuário em um Amazon S3 bucket, a IAM política da fonte de dados deverá fornecer acesso ao bucket e acesso à chave com a qual o bucket foi criptografado, se houver.
  O OneDrive conector usa e-mail das informações de contato presentes nas propriedades do usuário do Onedrive. Certifique-se de que o usuário cujos dados você deseja rastrear tenha o campo de e-mail configurado na página Informações de contato, pois para novos usuários, isso pode estar em branco.

Em sua AWS conta, verifique se você tem:

Criou um Amazon Kendra índice e, se estiver usando a API, anotei o ID do índice.
Criou uma IAM função para sua fonte de dados e, se estiver usando a API, anotei o ARN da IAM função.
Armazenou suas credenciais de OneDrive autenticação em um AWS Secrets Manager segredo e, se estiver usando a API, anotou o ARN do segredo.

Se você não tiver uma IAM função ou segredo existente, poderá usar o console para criar uma nova IAM função e um novo Secrets Manager segredo ao conectar sua fonte de OneDrive dados Amazon Kendra a. Se você estiver usando a API, deverá fornecer o ARN de uma IAM função e Secrets Manager segredo existentes e um ID de índice.

Instruções de conexão

Para se conectar Amazon Kendra à sua fonte de OneDrive dados, você deve fornecer detalhes de suas OneDrive credenciais para que Amazon Kendra possa acessar seus dados. Se você ainda não configurou OneDrive para Amazon Kendra, consultePré-requisitos.

Console

Para se conectar Amazon Kendra a OneDrive

Faça login no Console de gerenciamento da AWS e abra o Amazon Kendra console.
No painel de navegação esquerdo, escolha Índices e, em seguida, escolha o índice que deseja usar na lista de índices.

nota
Você pode escolher definir ou editar as configurações de Controle de acesso do usuário em Configurações do índice.
Na página Introdução, escolha Adicionar fonte de dados.
Na página Adicionar fonte de dados, escolha o Conector do OneDrive e selecione Adicionar conector. Se estiver usando a versão 2 (se aplicável), escolha o Conector do OneDrive com a tag “V2.0”.
Na página Especar detalhes da fonte de dados, insira as seguintes informações:
1. Em Nome e descrição, em Nome da fonte de dados: insira um nome para a fonte de dados. Você pode incluir hífens, mas não espaços.
2. (Opcional) Descrição: insira uma descrição opcional para a fonte de dados.
3. Em Idioma padrão: escolha um idioma para filtrar os documentos do índice. A menos que você especifique o contrário, o idioma padrão é o inglês. O idioma especificado nos metadados do documento substitui o idioma selecionado.
4. Em Tags, em Adicionar nova tag — Inclua tags opcionais para pesquisar e filtrar seus recursos ou monitorar seus AWS custos.
5. Escolha Próximo.
Na página Definir seção e segurança, insira as informações a seguir:
1. OneDrive ID do inquilino — Insira o ID do OneDrive inquilino sem o protocolo.
2. Autorização: ative ou desative as informações da lista de controle de acesso (ACL) para seus documentos, caso tenha uma ACL e queira usá-la para controle de acesso. A ACL especifica quais documentos usuários e grupos podem acessar. As informações da ACL são usadas para filtrar os resultados da pesquisa com base no acesso do usuário ou do grupo aos documentos. Para obter mais informações, consulte Filtrar o contexto do usuário.
3. Em Autenticação: escolha entre Novo e Existente..
4. 1. Se você escolher Existente, selecione uma senha existente em Selecionar senha.
  2. Se você escolher Novo, insira as seguintes informações na seção Nova senha AWS Secrets Manager :
    1. Senha: um nome para sua senha. O prefixo 'AmazonKendra- OneDrive -' é adicionado automaticamente ao seu nome secreto.
    2. Em ID do cliente e Segredo do cliente: insira o ID do cliente e o segredo do cliente.
5. Nuvem privada virtual (VPC): você pode escolher usar uma VPC. Nesse caso, você deve adicionar sub-redes e grupos de segurança da VPC.
6. Crawler de identidade: especifique se deseja ativar o crawler de identidade do Amazon Kendra. O crawler de identidade usa as informações da lista de controle de acesso (ACL) de seus documentos para filtrar os resultados da pesquisa com base no acesso do usuário ou do grupo aos documentos. Se você tiver uma ACL para seus documentos e optar por usá-la, também poderá optar por ativar o rastreador de identidade para configurar a filtragem de contexto Amazon Kendra do usuário dos resultados da pesquisa. Caso contrário, se o crawler de identidade estiver desativado, todos os documentos poderão ser pesquisados publicamente. Se você quiser usar o controle de acesso para seus documentos e o rastreador de identidade estiver desativado, você também pode usar a PutPrincipalMappingAPI para carregar informações de acesso de usuários e grupos para filtragem de contexto do usuário.
7. IAM função — Escolha uma IAM função existente ou crie uma nova IAM função para acessar as credenciais do repositório e indexar o conteúdo.
  
  nota
  IAM as funções usadas para índices não podem ser usadas para fontes de dados. Se você não tiver certeza se uma função existente é usada para um índice ou perguntas frequentes, escolha Criar uma nova função para evitar erros.
8. Escolha Próximo.
Na página Configurar configurações de sincronização, insira as seguintes informações:
1. Para Escopo de sincronização — Escolha quais OneDrive dados dos usuários serão indexados. Você pode adicionar no máximo 10 usuários manualmente.
2. Para as Configurações adicionais, adicione padrões de expressão regular para incluir ou excluir determinados arquivos. Você pode adicionar até 100 padrões.
3. Modo de sincronização: escolha como você deseja atualizar o índice quando o conteúdo da fonte de dados for alterado. Quando você sincroniza sua fonte de dados Amazon Kendra pela primeira vez, todo o conteúdo é rastreado e indexado por padrão. Você deve executar uma sincronização completa dos seus dados se o processo inicial falhar, mesmo que não escolha essa opção de modo de sincronização.
  - Sincronização total: indexa novamente todo o conteúdo, substituindo o já existente sempre que a fonte de dado é sincronizada com o índice.
  - Sincronização nova e modificada: indexe somente o conteúdo novo e modificado sempre que a fonte de dados é sincronizada com o índice. O Amazon Kendra pode usar o mecanismo da fonte de dados para rastrear alterações no conteúdo e indexar o conteúdo que foi alterado desde a última sincronização.
  - Sincronização nova, modificada e excluída: indexe somente conteúdo novo, modificado e excluído sempre que sua fonte de dados for sincronizada com seu índice. Amazon Kendra pode usar o mecanismo da sua fonte de dados para rastrear alterações no conteúdo e indexar o conteúdo que foi alterado desde a última sincronização.
4. Em Programação de execução de sincronização, em Frequência: escolha com que frequência sincronizar o conteúdo da fonte de dados e atualizar o índice.
5. Escolha Próximo.
Na página Definir mapeamentos de campo, insira as seguintes informações:
1. Campos de fonte de dados padrão — Selecione entre os campos de fonte de dados padrão Amazon Kendra gerados que você deseja mapear para o seu índice.
2. Escolha Próximo.
Na página Revisar e criar, verifique se as informações inseridas estão corretas e selecione Adicionar fonte de dados. Você também pode optar por editar as informações a partir desta página. Sua fonte de dados aparecerá na página Fontes de dados depois que a fonte de dados for adicionada com sucesso.

API

Para se conectar Amazon Kendra a OneDrive

Você deve especificar um JSON do esquema da fonte de dados usando a API TemplateConfiguration. Você deve fornecer as seguintes informações:

Fonte de dados: especifique o tipo de fonte de dados como ONEDRIVEV2 ao usar o esquema JSON TemplateConfiguration. Também especifique a fonte de dados como TEMPLATE quando você chama a API CreateDataSource.
ID do inquilino: especifique o ID do inquilino do Microsoft 365. Você pode encontrar sua ID de locatário nas Propriedades do Portal do Azure Active Directory ou em seu OAuth aplicativo.
Modo de sincronização — Amazon Kendra especifique como atualizar seu índice quando o conteúdo da fonte de dados for alterado. Ao sincronizar a fonte de dados com o Amazon Kendra pela primeira vez, é feito crawling de e indexação de todo o conteúdo por padrão. Você deve executar uma sincronização completa dos dados se a sincronização inicial falhar, mesmo que não escolha essa opção de modo de sincronização. Escolha uma das seguintes opções:
- FORCED_FULL_CRAWL para indexar novamente todo o conteúdo, substituindo o já existente sempre que a fonte de dado é sincronizada com o índice.
- FULL_CRAWL para indexar somente o conteúdo novo, modificado e excluído sempre que a fonte de dados é sincronizada com o índice. O Amazon Kendra pode usar o mecanismo da fonte de dados para rastrear alterações no conteúdo e indexar o conteúdo que foi alterado desde a última sincronização.
- CHANGE_LOG para indexar somente o conteúdo novo e modificado sempre que a fonte de dados é sincronizada com o índice. O Amazon Kendra pode usar o mecanismo da fonte de dados para rastrear alterações no conteúdo e indexar o conteúdo que foi alterado desde a última sincronização.
Nome de recurso secreto da Amazon (ARN) — Forneça o nome de recurso da Amazon (ARN) de um Secrets Manager segredo que contenha as credenciais de autenticação que você criou em sua conta. OneDrive

Se você usa a autenticação OAuth 2.0, o segredo é armazenado em uma estrutura JSON com as seguintes chaves:
```
{
    "clientId": "client ID",
    "clientSecret": "client secret"
}
```
IAM role — Especifique RoleArn quando você liga CreateDataSource para fornecer uma IAM função com permissões para acessar seu Secrets Manager segredo e chamar o público necessário APIs para o OneDrive conector e. Amazon Kendra Para obter mais informações, consulte Funções para o IAM das fontes de dados do OneDrive .

Você também pode adicionar os seguintes recursos opcionais:

Nuvem privada virtual (VPC): especifique a VpcConfiguration quando ao chamar CreateDataSource. Para obter mais informações, consulte Configurando Amazon Kendra para usar um Amazon VPC.
Filtros de inclusão e exclusão — você pode especificar se deseja incluir ou excluir determinados arquivos, OneNote seções e OneNote páginas.

nota
A maioria das fontes de dados usa padrões de expressão regular, que são padrões de inclusão ou exclusão chamados de filtros. Se você especificar um filtro de inclusão, somente o conteúdo que corresponda ao filtro de inclusão será indexado. Qualquer documento que não corresponda ao filtro de inclusão não é indexado. Se especificar um filtro de inclusão e exclusão, os documentos que corresponderem ao filtro de exclusão não serão indexados, mesmo que correspondam ao filtro de inclusão.
Crawler de identidade: especifique se deseja ativar o crawler de identidade do Amazon Kendra. O crawler de identidade usa as informações da lista de controle de acesso (ACL) de seus documentos para filtrar os resultados da pesquisa com base no acesso do usuário ou do grupo aos documentos. Se você tiver uma ACL para seus documentos e optar por usá-la, também poderá optar por ativar o rastreador de identidade para configurar a filtragem de contexto Amazon Kendra do usuário dos resultados da pesquisa. Caso contrário, se o crawler de identidade estiver desativado, todos os documentos poderão ser pesquisados publicamente. Se você quiser usar o controle de acesso para seus documentos e o rastreador de identidade estiver desativado, você também pode usar a PutPrincipalMappingAPI para carregar informações de acesso de usuários e grupos para filtragem de contexto do usuário.
Mapeamentos de campo — Você só pode mapear campos de índice incorporados ou comuns para o conector. Amazon Kendra OneDrive O mapeamento de campo personalizado não está disponível para o OneDrive conector devido às limitações da API. Para obter mais informações, consulte Mapear campos de fonte de dados.

Para ver uma lista de outras chaves JSON importantes a serem configuradas, consulte o Esquema do modelo do OneDrive .

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

OneDrive Conector Microsoft V1.0

Microsoft SharePoint