Solução de problemas de bases de conhecimento multimodais - Amazon Bedrock

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Solução de problemas de bases de conhecimento multimodais

Esta seção fornece orientação para resolver problemas comuns encontrados ao trabalhar com bases de conhecimento multimodais. As informações de solução de problemas são organizadas por limitações gerais, cenários de erro comuns com suas causas e soluções e recomendações de otimização de desempenho. Use essas informações para diagnosticar e resolver problemas durante a configuração, ingestão ou consulta do seu conteúdo multimodal.

Limitações gerais

Esteja ciente dessas limitações atuais ao trabalhar com bases de conhecimento multimodais:

  • Limites de tamanho de arquivo: máximo de 1,5 GB por arquivo de vídeo, 1 GB por arquivo de áudio (Nova Multimodal Embeddings) ou 1,5 GB por arquivo (BDA)

  • Arquivos por tarefa de ingestão: máximo de 15.000 arquivos por tarefa (Nova Multimodal Embeddings) ou 1.000 arquivos por tarefa (BDA)

  • Limites de consulta: máximo de uma imagem por consulta

  • Restrições de fonte de dados: somente o Amazon S3 e fontes de dados personalizadas oferecem suporte a conteúdo multimodal

  • Limitações de fragmentação do BDA: ao usar o Bedrock Data Automation com fragmentação de tamanho fixo, as configurações de porcentagem de sobreposição não são aplicadas ao conteúdo de áudio e vídeo

  • Limites de trabalhos simultâneos do BDA: limite padrão de 20 trabalhos simultâneos do BDA. Para processamento em grande escala, considere solicitar um aumento da cota de serviço

  • Limitações do modelo Reranker: os modelos Reranker não são compatíveis com conteúdo multimodal

  • Limitações de sumarização: o resumo de respostas de recuperação contendo conteúdo não textual não é suportado

  • Limitações de entrada da consulta: a entrada contendo texto e imagem não é suportada atualmente. Você pode usar consultas de texto ou imagem, mas não as duas simultaneamente.

  • Filtros de conteúdo de imagem de proteção: ao usar consultas de imagem com uma grade de proteção que tenha filtros de conteúdo de imagem configurados, a imagem de entrada será avaliada em relação à grade de proteção e poderá ser bloqueada se violar os limites de filtro configurados

  • Incompatibilidade de entrada e tipo: por padrão, a entrada é considerada texto quando o tipo não é especificado. Ao usar modalidades diferentes de texto, você deve especificar o tipo correto

Erros e soluções comuns

Se você encontrar problemas com sua base de conhecimento multimodal, analise estes cenários comuns:

Erro 4xx ao usar consultas de imagem

Causa: tentativa de usar consultas de imagem com modelos de incorporação somente de texto ou bases de conhecimento processadas pelo BDA.

Solução: escolha Amazon Nova Multimodal Embeddings ao criar sua base de conhecimento para suporte à consulta de imagens.

RAG retorna erro 4xx com conteúdo multimodal

Causa: Uso RetrieveAndGenerate com base de conhecimento contendo somente conteúdo multimodal e o modelo Amazon Nova Multimodal Embeddings.

Solução: use o analisador BDA para a funcionalidade RAG ou garanta que sua base de conhecimento contenha conteúdo de texto.

Erro necessário no destino de armazenamento multimodal

Causa: Usar o Nova Multimodal Embeddings sem configurar um destino de armazenamento multimodal.

Solução: especifique um destino de armazenamento multimodal ao usar o Nova Multimodal Embeddings.

A fonte de dados e o armazenamento multimodal usam o mesmo bucket S3

Causa: Configurar sua fonte de dados e destino de armazenamento multimodal para usar o mesmo bucket do Amazon S3 sem prefixos de inclusão adequados.

Solução: use buckets separados para fonte de dados e armazenamento multimodal ou configure prefixos de inclusão para evitar a reingestão de arquivos de mídia extraídos.

O prefixo de inclusão não pode começar com “aws/”

Causa: Usar um prefixo de inclusão que começa com “aws/” quando sua fonte de dados e destino de armazenamento multimodal compartilham o mesmo bucket do Amazon S3.

Solução: especifique um prefixo de inclusão diferente. O caminho “aws/” é reservado para armazenamento de mídia extraído e não pode ser usado como prefixo de inclusão para evitar a reingestão de conteúdo processado.

A ingestão de BDA ignora o conteúdo multimodal

Causa: a base de conhecimento foi criada sem um destino de armazenamento multimodal e, em seguida, a fonte de dados do BDA foi adicionada com conteúdo multimodal.

Solução: recrie a base de conhecimento com um destino de armazenamento multimodal configurado para permitir o processamento BDA de arquivos de áudio, vídeo e imagem.

Base de conhecimento criada sem modelo de incorporação multimodal

Causa: A base de conhecimento foi criada com um modelo de incorporação somente de texto, limitando os recursos multimodais.

Solução: Crie uma nova base de conhecimento com o Nova Multimodal Embeddings para permitir o processamento multimodal nativo e as consultas baseadas em imagens.

Gerenciamento de dados transitórios com políticas de ciclo de vida do Amazon S3

Ao usar o Nova Multimodal Embeddings, o Amazon Bedrock armazena dados transitórios em seu destino de armazenamento multimodal e tenta excluí-los após a conclusão do processamento. Recomendamos aplicar uma política de ciclo de vida no caminho de dados transitórios para garantir que ele expire adequadamente.

Console
Para criar uma regra de ciclo de vida usando o console
  1. Abra o console Amazon S3.

  2. Navegue até o destino de armazenamento multimodal que você configurou para sua Base de Conhecimento.

  3. Escolha a guia Gerenciamento e selecione Criar regra de ciclo de vida.

  4. Em Nome da regra do ciclo de vida, insira. Transient Data Deletion

  5. Em Tipo de filtro, escolha Limitar o escopo dessa regra usando um ou mais filtros.

  6. Em Prefixo, insira o caminho de dados transitório para sua base de conhecimento e fonte de dados.

    Substitua os valores do espaço reservado no prefixo a seguir pelos seus identificadores reais:

    aws/bedrock/knowledge_bases/knowledge-base-id/data-source-id/transient_data
    Importante

    Não aplique políticas de ciclo de vida a todo o bucket ou ao prefixo “aws/”, pois isso excluirá seu conteúdo multimodal e causará falhas na recuperação. Use somente o caminho de dados transitórios específico mostrado acima.

  7. Em Ações da regra do ciclo de vida, selecione Expirar versões atuais dos objetos.

  8. Em Dias após a criação do objeto, insira1.

  9. Escolha Criar regra.

AWS CLI
Para criar uma regra de ciclo de vida usando o AWS CLI
  1. Crie um arquivo JSON chamado lifecycle-policy.json com o conteúdo a seguir.

    Substitua os valores do espaço reservado por seus identificadores reais:

    • knowledge-base-id- Seu identificador da base de conhecimento

    • data-source-id- Seu identificador de fonte de dados

    { "Rules": [ { "ID": "TransientDataDeletion", "Status": "Enabled", "Filter": { "Prefix": "aws/bedrock/knowledge_bases/knowledge-base-id/data-source-id/transient_data" }, "Expiration": { "Days": 1 } } ] }
  2. Aplique a política de ciclo de vida ao seu bucket. Substitua your-multimodal-storage-bucket pelo nome do bucket real.

    aws s3api put-bucket-lifecycle-configuration \ --bucket your-multimodal-storage-bucket \ --lifecycle-configuration file://lifecycle-policy.json
  3. Verifique se a política de ciclo de vida foi aplicada:

    aws s3api get-bucket-lifecycle-configuration \ --bucket your-multimodal-storage-bucket

Para obter mais informações sobre as políticas de ciclo de vida do Amazon S3, consulte Gerenciamento do ciclo de vida de objetos no Guia do usuário do Amazon S3.

Considerações sobre a performance

Para um desempenho ideal com sua base de conhecimento multimodal, considere estes fatores:

  • Tempo de processamento: o processamento do BDA demora mais devido à conversão de conteúdo

  • Latência da consulta: as consultas de imagem podem ter maior latência do que as consultas de texto

  • Duração da fragmentação: durações mais longas de fragmentos de áudio/vídeo aumentam o tempo de processamento, mas podem melhorar a precisão