Notas antes de ativar os esquemas de incorporação vetorial em tempo real - Amazon Managed Streaming for Apache Kafka

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Notas antes de ativar os esquemas de incorporação vetorial em tempo real

A aplicação Managed Service for Apache Flink só é compatível com texto não estruturado ou dados JSON no fluxo de entrada.

Dois modos de processamento de entrada são compatíveis:

  • Quando os dados de entrada são texto não estruturado, toda a mensagem de texto é incorporada. O banco de dados vetorial contém o texto original e a incorporação gerada.

  • Quando os dados de entrada estão no formato JSON, a aplicação permite que você configure e especifique uma ou mais chaves dentro do valor do objeto JSON para usar no processo de incorporação. Se houver mais de uma chave, todas as chaves serão vetorizadas juntas e indexadas no banco de dados vetorial. O banco de dados vetorial conterá a mensagem original e a incorporação gerada.

Geração de incorporação: a aplicação suporta todos os modelos de incorporação de texto fornecidos exclusivamente pelo Bedrock.

Persista no armazenamento de banco de dados vetorial: o aplicativo usa um OpenSearch cluster existente (provisionado ou sem servidor) na conta do cliente como destino para dados incorporados persistentes. Ao usar o Opensearch Serverless para criar um índice vetorial, sempre use o nome do embedded_data do campo vetorial.

Semelhante aos esquemas do MSF, espera-se que você gerencie a infraestrutura para executar o código associado ao esquema de incorporação vetorial em tempo real.

Semelhante ao MSF Blueprints, depois que um aplicativo MSF é criado, ele deve ser iniciado exclusivamente na AWS conta usando o console ou a CLI. AWS não iniciará o aplicativo MSF para você. Você precisa chamar a StartApplication API (por meio da CLI ou do console) para executar o aplicativo.

Movimentação de dados entre contas: o aplicativo não permite que você mova dados entre o fluxo de entrada e os destinos vetoriais que residem em AWS contas diferentes.