As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Conectar uma base de conhecimento a uma fonte de dados personalizada
Em vez de escolher um serviço de fonte de dados compatível, você pode se conectar a uma fonte de dados personalizada para obter as seguintes vantagens:
-
Flexibilidade e controle sobre os tipos de dados aos quais você deseja que sua base de conhecimento tenha acesso.
-
A capacidade de usar as operações de API
KnowledgeBaseDocumentspara ingerir ou excluir documentos diretamente sem a necessidade de sincronizar as alterações. -
A capacidade de visualizar documentos em sua fonte de dados diretamente por meio do console ou da API do Amazon Bedrock.
-
A capacidade de carregar documentos na fonte de dados diretamente no Console de gerenciamento da AWS ou adicioná-los em linha.
-
A capacidade de adicionar metadados diretamente a cada documento para adicionar ou atualizar um documento na fonte de dados. Para ter mais informações sobre como usar metadados para filtragem ao recuperar informações de uma fonte de dados, consulte a guia Metadados e filtragem em Configurar e personalizar consultas e geração de respostas.
Suporte de conteúdo multimodal
As fontes de dados personalizadas oferecem suporte a conteúdo multimodal, incluindo arquivos de imagens, áudio e vídeo de até 10 MB codificados em base64. Para obter uma orientação abrangente sobre como trabalhar com conteúdo multimodal, consulte. Crie uma base de conhecimento para conteúdo multimodal
Para conectar uma base de conhecimento a uma fonte de dados personalizada, envie uma CreateDataSourcesolicitação com um endpoint de tempo de construção do Agents for Amazon Bedrock. Especifique o knowledgeBaseId da base de conhecimento com a qual você quer se conectar, forneça um name à fonte de dados e especifique o campo type na dataSourceConfiguration como CUSTOM. A seguir é apresentado um exemplo mínimo para criar essa fonte de dados:
PUT /knowledgebases/KB12345678/datasources/ HTTP/1.1 Content-type: application/json { "name": "MyCustomDataSource", "dataSourceConfiguration": { "type": "CUSTOM" } }
Você pode incluir qualquer um dos seguintes campos opcionais para configurar a fonte de dados:
| Campo | Caso de uso |
|---|---|
| descrição | Para fornecer uma descrição da fonte de dados. |
| clientToken | Para garantir que a solicitação de API seja concluída apenas uma vez. Para obter mais informações, consulte Ensuring idempotency. |
| serverSideEncryptionConfiguração | Para especificar uma chave do KMS personalizada para armazenamento de dados temporário enquanto converte seus dados em incorporações. Para obter mais informações, consulte Criptografia de armazenamento de dados temporário durante a ingestão de dados. |
| dataDeletionPolicy | Para configurar o que fazer com as incorporações de vetores da fonte de dados em seu armazenamento de vetores, se você excluir a fonte de dados. Especifique RETAIN para reter os dados no armazenamento de vetores ou a opção padrão DELETE para excluí-los. |
| vectorIngestionConfiguration | Para configurar as opções de ingestão da fonte de dados. Veja a seguir mais informações. |
O vectorIngestionConfiguration campo mapeia para um VectorIngestionConfigurationobjeto contendo os seguintes campos:
-
chunkingConfiguration: para configurar a estratégia a ser usada para fragmentar os documentos na fonte de dados. Para ter mais informações sobre fragmentação, consulte Como a fragmentação de conteúdo funciona para bases de conhecimento.
-
parsingConfiguration: para configurar a estratégia a ser usada para analisar a fonte de dados. Para ter mais informações sobre as opções de análise, consulte Opções de análise para a fonte de dados.
-
customTransformationConfiguration — Personalizar como os dados são transformados e aplicar uma função Lambda para maior personalização. Para ter mais informações sobre como personalizar a fragmentação de dados e o processamento de metadados com uma função do Lambda, consulte Usar uma função do Lambda de transformação personalizada para definir como os dados são ingeridos.
Depois de configurar sua fonte de dados personalizada, você pode adicionar documentos a ela e inseri-los diretamente na base de conhecimento. Ao contrário de outras fontes de dados, as fontes de dados personalizadas não precisam ser sincronizadas. Para saber como ingerir documentos diretamente, consulte Ingerir alterações diretamente em uma base de conhecimento.