As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Solução de problemas de bases de conhecimento multimodais
Esta seção fornece orientação para resolver problemas comuns encontrados ao trabalhar com bases de conhecimento multimodais. As informações de solução de problemas são organizadas por limitações gerais, cenários de erro comuns com suas causas e soluções e recomendações de otimização de desempenho. Use essas informações para diagnosticar e resolver problemas durante a configuração, ingestão ou consulta do seu conteúdo multimodal.
Limitações gerais
Esteja ciente dessas limitações atuais ao trabalhar com bases de conhecimento multimodais:
-
Limites de tamanho de arquivo: máximo de 1,5 GB por arquivo de vídeo, 1 GB por arquivo de áudio (Nova Multimodal Embeddings) ou 1,5 GB por arquivo (BDA)
-
Arquivos por tarefa de ingestão: máximo de 15.000 arquivos por tarefa (Nova Multimodal Embeddings) ou 1.000 arquivos por tarefa (BDA)
-
Limites de consulta: máximo de uma imagem por consulta
-
Restrições de fonte de dados: somente o Amazon S3 e fontes de dados personalizadas oferecem suporte a conteúdo multimodal
-
Limitações de fragmentação do BDA: ao usar o Bedrock Data Automation com fragmentação de tamanho fixo, as configurações de porcentagem de sobreposição não são aplicadas ao conteúdo de áudio e vídeo
-
Limites de trabalhos simultâneos do BDA: limite padrão de 20 trabalhos simultâneos do BDA. Para processamento em grande escala, considere solicitar um aumento da cota de serviço
-
Limitações do modelo Reranker: os modelos Reranker não são compatíveis com conteúdo multimodal
-
Limitações de sumarização: o resumo de respostas de recuperação contendo conteúdo não textual não é suportado
-
Limitações de entrada da consulta: a entrada contendo texto e imagem não é suportada atualmente. Você pode usar consultas de texto ou imagem, mas não as duas simultaneamente.
-
Filtros de conteúdo de imagem de proteção: ao usar consultas de imagem com uma grade de proteção que tenha filtros de conteúdo de imagem configurados, a imagem de entrada será avaliada em relação à grade de proteção e poderá ser bloqueada se violar os limites de filtro configurados
-
Incompatibilidade de entrada e tipo: por padrão, a entrada é considerada texto quando o tipo não é especificado. Ao usar modalidades diferentes de texto, você deve especificar o tipo correto
Erros e soluções comuns
Se você encontrar problemas com sua base de conhecimento multimodal, analise estes cenários comuns:
- Erro 4xx ao usar consultas de imagem
-
Causa: tentativa de usar consultas de imagem com modelos de incorporação somente de texto ou bases de conhecimento processadas pelo BDA.
Solução: escolha Amazon Nova Multimodal Embeddings ao criar sua base de conhecimento para suporte à consulta de imagens.
- RAG retorna erro 4xx com conteúdo multimodal
-
Causa: Uso
RetrieveAndGeneratecom base de conhecimento contendo somente conteúdo multimodal e o modelo Amazon Nova Multimodal Embeddings.Solução: use o analisador BDA para a funcionalidade RAG ou garanta que sua base de conhecimento contenha conteúdo de texto.
- Erro necessário no destino de armazenamento multimodal
-
Causa: Usar o Nova Multimodal Embeddings sem configurar um destino de armazenamento multimodal.
Solução: especifique um destino de armazenamento multimodal ao usar o Nova Multimodal Embeddings.
- A fonte de dados e o armazenamento multimodal usam o mesmo bucket S3
-
Causa: Configurar sua fonte de dados e destino de armazenamento multimodal para usar o mesmo bucket do Amazon S3 sem prefixos de inclusão adequados.
Solução: use buckets separados para fonte de dados e armazenamento multimodal ou configure prefixos de inclusão para evitar a reingestão de arquivos de mídia extraídos.
- O prefixo de inclusão não pode começar com “aws/”
-
Causa: Usar um prefixo de inclusão que começa com “aws/” quando sua fonte de dados e destino de armazenamento multimodal compartilham o mesmo bucket do Amazon S3.
Solução: especifique um prefixo de inclusão diferente. O caminho “aws/” é reservado para armazenamento de mídia extraído e não pode ser usado como prefixo de inclusão para evitar a reingestão de conteúdo processado.
- A ingestão de BDA ignora o conteúdo multimodal
-
Causa: a base de conhecimento foi criada sem um destino de armazenamento multimodal e, em seguida, a fonte de dados do BDA foi adicionada com conteúdo multimodal.
Solução: recrie a base de conhecimento com um destino de armazenamento multimodal configurado para permitir o processamento BDA de arquivos de áudio, vídeo e imagem.
- Base de conhecimento criada sem modelo de incorporação multimodal
-
Causa: A base de conhecimento foi criada com um modelo de incorporação somente de texto, limitando os recursos multimodais.
Solução: Crie uma nova base de conhecimento com o Nova Multimodal Embeddings para permitir o processamento multimodal nativo e as consultas baseadas em imagens.
Gerenciamento de dados transitórios com políticas de ciclo de vida do Amazon S3
Ao usar o Nova Multimodal Embeddings, o Amazon Bedrock armazena dados transitórios em seu destino de armazenamento multimodal e tenta excluí-los após a conclusão do processamento. Recomendamos aplicar uma política de ciclo de vida no caminho de dados transitórios para garantir que ele expire adequadamente.
Para obter mais informações sobre as políticas de ciclo de vida do Amazon S3, consulte Gerenciamento do ciclo de vida de objetos no Guia do usuário do Amazon S3.
Considerações sobre a performance
Para um desempenho ideal com sua base de conhecimento multimodal, considere estes fatores:
-
Tempo de processamento: o processamento do BDA demora mais devido à conversão de conteúdo
-
Latência da consulta: as consultas de imagem podem ter maior latência do que as consultas de texto
-
Duração da fragmentação: durações mais longas de fragmentos de áudio/vídeo aumentam o tempo de processamento, mas podem melhorar a precisão