Pré-requisitos para bases de conhecimento multimodais - Amazon Bedrock

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Pré-requisitos para bases de conhecimento multimodais

As bases de conhecimento multimodais do Amazon Bedrock exigem configurações adicionais além das bases de conhecimento padrão para processar conteúdo de imagens, áudio e vídeo. Os pré-requisitos específicos dependem da abordagem de processamento e da configuração de armazenamento escolhidas.

Antes de criar uma base de conhecimento multimodal, você deve atender aos seguintes pré-requisitos:

Pré-requisitos

  1. Seus dados devem estar em um conector de fonte de dados compatível. O conteúdo multimodal só é compatível com o Amazon S3 e fontes de dados personalizadas.

  2. (Opcional) Configurar o seu próprio armazenamento de vetores compatível. É possível ignorar essa etapa caso pretenda usar o Console de gerenciamento da AWS para criar um armazenamento de vetores automaticamente para você.

  3. Crie uma função de serviço personalizada AWS Identity and Access Management (IAM) com as permissões adequadas para processamento multimodal. Para mais detalhes, consulte Permissões para conteúdo multimodal.

    nota

    Se você estiver usando o console, o Amazon Bedrock Knowledge Bases configurará automaticamente as permissões para você.

  4. (Opcional) Defina configurações adicionais de segurança seguindo as etapas em Criptografia de recursos da base de conhecimento.

  5. Se você planeja usar a operação de RetrieveAndGenerateAPI com conteúdo processado pelo BDA, solicite acesso aos modelos que você usará nas regiões em que os usará seguindo as etapas em. Acessar modelos de base do Amazon Bedrock

Permissões para conteúdo multimodal

As bases de conhecimento multimodais exigem permissões adicionais além das permissões padrão da base de conhecimento. As permissões específicas dependem da abordagem de processamento e da configuração de armazenamento escolhidas.

Você deve configurar as seguintes permissões com base em sua abordagem de processamento multimodal:

  • Permissões do Nova Multimodal Embeddings: necessárias ao usar o Nova Multimodal Embeddings para pesquisas diretas de similaridade visual e de áudio. Inclui permissões para invocação assíncrona de modelos e acesso ao armazenamento multimodal.

  • Permissões do Bedrock Data Automation (BDA): necessárias ao usar o BDA para converter conteúdo multimodal em representações de texto. Inclui permissões para invocação de automação de dados e monitoramento de status.

  • Permissões de chave KMS gerenciadas pelo cliente: necessárias ao usar chaves de criptografia gerenciadas pelo cliente com processamento de BDA. Inclui permissões para operações-chave e criação de subsídios.

  • Permissões de armazenamento multimodal: necessárias ao configurar um destino de armazenamento multimodal. Inclui permissões padrão do S3 para o bucket de armazenamento.

Para políticas detalhadas do IAM e configuração de step-by-step permissões, consultePermissões para conteúdo multimodal.

Requisitos de armazenamento

Incorporações multimodais Nova

Obrigatório: Você deve configurar um destino de armazenamento multimodal. Esse destino armazena cópias de seus arquivos multimídia para recuperação e garante a disponibilidade mesmo se os arquivos de origem forem modificados ou excluídos.

Automação de dados Bedrock (BDA)

Opcional: você pode configurar um bucket de armazenamento multimodal para maior confiabilidade e também para recuperar o arquivo em tempo de execução. No entanto, isso não é obrigatório, pois o BDA converte conteúdo em texto.

nota

Se você selecionar o analisador BDA sem configurar um bucket de armazenamento multimodal, somente a análise de texto estará disponível. Para aproveitar os recursos de análise multimodal com o BDA (processamento de imagens, áudio e vídeo), você deve configurar um destino de armazenamento multimodal.

Configuração de destino de armazenamento multimodal

Ao configurar seu destino de armazenamento multimodal, considere o seguinte:

  • Use buckets separados (recomendado): configure diferentes buckets do Amazon S3 para sua fonte de dados e destino de armazenamento multimodal. Isso fornece a configuração mais simples e evita possíveis conflitos.

  • Se estiver usando o mesmo bucket: você deve especificar um prefixo de inclusão para sua fonte de dados que limite o conteúdo que é ingerido. Isso evita a reingestão dos arquivos de mídia extraídos.

  • Evite o prefixo “aws/”: ao usar o mesmo bucket para a fonte de dados e o destino de armazenamento multimodal, não use prefixos de inclusão começando com “aws/”, pois esse caminho é reservado para armazenamento de mídia extraído.