As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Visão geral dos vetores
Os vetores são representações numéricas que ajudam as máquinas a entender e processar dados. Na IA generativa, eles servem a dois propósitos principais:
-
Representando espaços latentes que capturam a estrutura de dados em formato comprimido
-
Criação de incorporações para dados, como palavras, frases e imagens
Modelos de incorporação como Word2Vec GloVe
-
Aprenda com o contexto para representar palavras como vetores
-
Coloque palavras similares mais próximas umas das outras no espaço vetorial
-
Permita que as máquinas processem dados em um espaço contínuo
O diagrama a seguir fornece uma visão geral de alto nível do processo de incorporação:
-
Um bucket do Amazon Simple Storage Service (Amazon S3) contém arquivos que são as fontes de dados a partir das quais o sistema lerá e processará informações. O bucket do Amazon S3 é especificado durante a configuração da base de conhecimento Amazon Bedrock, que também inclui a sincronização de dados com a base de conhecimento.
-
O modelo de incorporação converte os dados brutos dos arquivos de objetos no bucket do Amazon S3 em incorporações vetoriais. Por exemplo,
Object1é convertido em um vetor[0.6, 0.7, ...]que representa seu conteúdo em um espaço multidimensional.
As incorporações de palavras são cruciais para o processamento de linguagem natural (PNL) porque fazem o seguinte:
-
Capture relações semânticas entre palavras
-
Permita a geração de texto contextualmente relevante
-
Potencialize grandes modelos de linguagem (LLMs) para produzir respostas semelhantes às humanas