

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Ikhtisar vektor
<a name="vectors"></a>

*Vektor* adalah representasi numerik yang membantu mesin memahami dan memproses data. Dalam AI generatif, mereka melayani dua tujuan utama:
+ Mewakili ruang laten yang menangkap struktur data dalam bentuk terkompresi
+ Membuat embeddings untuk data, seperti kata-kata, kalimat, dan gambar

*Model penyematan seperti [Word2Vec](https://aws.amazon.com/what-is/embeddings-in-machine-learning/),, [GloVe](https://github.com/stanfordnlp/GloVe)dan [Amazon Titan Text Embeddings](https://docs.aws.amazon.com/bedrock/latest/userguide/titan-embedding-models.html) mengubah data menjadi vektor melalui proses yang disebut embedding.* Model penyematan ini dapat melakukan hal berikut:
+ Belajar dari konteks untuk merepresentasikan kata-kata sebagai vektor
+ Tempatkan kata-kata serupa lebih dekat bersama dalam ruang vektor
+ Memungkinkan mesin untuk memproses data dalam ruang kontinu

Diagram berikut memberikan gambaran tingkat tinggi dari proses penyematan:

1. Bucket [Amazon Simple Storage Service (Amazon S3](https://docs.aws.amazon.com/AmazonS3/latest/userguide/Welcome.html)) berisi file yang merupakan sumber data dari mana sistem akan membaca dan memproses informasi. Bucket Amazon S3 ditentukan selama konfigurasi basis pengetahuan [Amazon Bedrock](https://docs.aws.amazon.com/bedrock/latest/userguide/what-is-bedrock.html), yang juga mencakup [sinkronisasi data dengan](https://docs.aws.amazon.com/bedrock/latest/userguide/kb-data-source-sync-ingest.html) basis pengetahuan.

1. Model penyematan mengonversi data mentah dari file objek di bucket Amazon S3 menjadi penyematan vektor. Misalnya, `Object1` diubah menjadi vektor `[0.6, 0.7, ...]` yang mewakili isinya dalam ruang multi-dimensi.

![Model penyematan mengonversi objek di bucket Amazon S3 menjadi penyematan vektor.](http://docs.aws.amazon.com/id_id/prescriptive-guidance/latest/choosing-an-aws-vector-database-for-rag-use-cases/images/vector-databases.png)


Penyematan kata sangat penting untuk pemrosesan bahasa alami (NLP) karena mereka melakukan hal berikut:
+ Tangkap hubungan semantik antar kata
+ Aktifkan pembuatan teks yang relevan secara kontekstual
+ Kekuatan model bahasa besar (LLMs) untuk menghasilkan respons seperti manusia