Conectar uma base de conhecimento a uma fonte de dados personalizada

Importante

Para uma precisão de recuperação otimizada e uma experiência gerenciada, recomendamos o Amazon Bedrock Managed Knowledge Base.

Em vez de escolher um serviço de fonte de dados compatível, você pode se conectar a uma fonte de dados personalizada para obter as seguintes vantagens:

Flexibilidade e controle sobre os tipos de dados aos quais você deseja que sua base de conhecimento tenha acesso.
A capacidade de usar as operações de API KnowledgeBaseDocuments para ingerir ou excluir documentos diretamente sem a necessidade de sincronizar as alterações.
A capacidade de visualizar documentos em sua fonte de dados diretamente por meio do console ou da API do Amazon Bedrock.
A capacidade de carregar documentos na fonte de dados diretamente no Console de gerenciamento da AWS ou adicioná-los em linha.
A capacidade de adicionar metadados diretamente a cada documento para adicionar ou atualizar um documento na fonte de dados. Para ter mais informações sobre como usar metadados para filtragem ao recuperar informações de uma fonte de dados, consulte a guia Metadados e filtragem em Configurar e personalizar consultas e geração de respostas.

Suporte de conteúdo multimodal

As fontes de dados personalizadas oferecem suporte a conteúdo multimodal, incluindo arquivos de imagens, áudio e vídeo de até 10 MB codificados em base64. Para obter uma orientação abrangente sobre como trabalhar com conteúdo multimodal, consulte. Crie uma base de conhecimento para conteúdo multimodal

Para conectar uma base de conhecimento a uma fonte de dados personalizada, envie uma CreateDataSourcesolicitação com um endpoint de tempo de construção do Agents for Amazon Bedrock. Especifique o knowledgeBaseId da base de conhecimento com a qual você quer se conectar, forneça um name à fonte de dados e especifique o campo type na dataSourceConfiguration como CUSTOM. A seguir é apresentado um exemplo mínimo para criar essa fonte de dados:


PUT /knowledgebases/KB12345678/datasources/ HTTP/1.1
Content-type: application/json

{
    "name": "MyCustomDataSource",
    "dataSourceConfiguration": {
        "type": "CUSTOM"
    }
}

Você pode incluir qualquer um dos seguintes campos opcionais para configurar a fonte de dados:

Campo	Caso de uso
descrição	Para fornecer uma descrição da fonte de dados.
clientToken	Para garantir que a solicitação de API seja concluída apenas uma vez. Para obter mais informações, consulte Ensuring idempotency.
servidor SideEncryptionConfiguration	Para especificar uma chave do KMS personalizada para armazenamento de dados temporário enquanto converte seus dados em incorporações. Para obter mais informações, consulte Criptografia de armazenamento de dados temporário durante a ingestão de dados.
dados DeletionPolicy	Para configurar o que fazer com as incorporações de vetores da fonte de dados em seu armazenamento de vetores, se você excluir a fonte de dados. Especifique `RETAIN` para reter os dados no armazenamento de vetores ou a opção padrão `DELETE` para excluí-los.
vetor IngestionConfiguration	Para configurar as opções de ingestão da fonte de dados. Veja a seguir mais informações.

O vectorIngestionConfiguration campo mapeia para um VectorIngestionConfigurationobjeto contendo os seguintes campos:

chunkingConfiguration: para configurar a estratégia a ser usada para fragmentar os documentos na fonte de dados. Para ter mais informações sobre fragmentação, consulte Como a fragmentação de conteúdo funciona para bases de conhecimento.
parsingConfiguration: para configurar a estratégia a ser usada para analisar a fonte de dados. Para ter mais informações sobre as opções de análise, consulte Opções de análise para a fonte de dados.
personalizado TransformationConfiguration — Para personalizar como os dados são transformados e aplicar uma função Lambda para maior personalização. Para ter mais informações sobre como personalizar a fragmentação de dados e o processamento de metadados com uma função do Lambda, consulte Usar uma função do Lambda de transformação personalizada para definir como os dados são ingeridos.

Depois de configurar sua fonte de dados personalizada, você pode adicionar documentos a ela e inseri-los diretamente na base de conhecimento. Ao contrário de outras fontes de dados, as fontes de dados personalizadas não precisam ser sincronizadas. Para saber como ingerir documentos diretamente, consulte Ingerir alterações diretamente em uma base de conhecimento.

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Web Crawler

Personalizar a ingestão para uma fonte de dados