Notas antes de ativar os esquemas de incorporação vetorial em tempo real
A aplicação Managed Service for Apache Flink só é compatível com texto não estruturado ou dados JSON no fluxo de entrada.
Dois modos de processamento de entrada são compatíveis:
Quando os dados de entrada são texto não estruturado, toda a mensagem de texto é incorporada. O banco de dados vetorial contém o texto original e a incorporação gerada.
Quando os dados de entrada estão no formato JSON, a aplicação permite que você configure e especifique uma ou mais chaves dentro do valor do objeto JSON para usar no processo de incorporação. Se houver mais de uma chave, todas as chaves serão vetorizadas juntas e indexadas no banco de dados vetorial. O banco de dados vetorial conterá a mensagem original e a incorporação gerada.
Geração de incorporação: a aplicação suporta todos os modelos de incorporação de texto fornecidos exclusivamente pelo Bedrock.
Persistir no armazenamento de banco de dados vetorial: a aplicação usa um cluster existente (provisionado ou sem servidor) do OpenSearch na conta do cliente como destino para dados incorporados persistentes. Ao usar o Opensearch Serverless para criar um índice vetorial, sempre use o nome do embedded_data do campo vetorial.
Semelhante aos esquemas do MSF, espera-se que você gerencie a infraestrutura para executar o código associado ao esquema de incorporação vetorial em tempo real.
Semelhante aos esquemas do MSF, depois que uma aplicação MSF for criada, ela deverá ser iniciada exclusivamente na conta da AWS usando o console ou a CLI. AWS não iniciará a aplicação MSF para você. Você precisa chamar a API StartApplication (por meio da CLI ou do console) para executar o aplicativo.
Movimentação de dados entre contas: a aplicação não permite que você mova dados entre o fluxo de entrada e os destinos vetoriais que residem em contas diferentes da AWS.