

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Sinkronkan data Anda dengan basis pengetahuan Amazon Bedrock Anda
<a name="kb-data-source-sync-ingest"></a>

Setelah Anda membuat basis pengetahuan Anda, Anda menelan atau menyinkronkan data Anda sehingga data dapat ditanyakan. Ingestion mengubah data mentah di sumber data Anda menjadi embeddings vektor, berdasarkan model penyematan vektor dan konfigurasi yang Anda tentukan.

Sebelum Anda mulai menelan, periksa apakah sumber data Anda memenuhi kondisi berikut:
+ Anda telah mengonfigurasi informasi koneksi untuk sumber data Anda. Untuk mengonfigurasi konektor sumber data untuk merayapi data dari repositori sumber data, lihat Konektor sumber [data yang didukung](https://docs.aws.amazon.com/bedrock/latest/userguide/data-source-connectors.html). Anda mengonfigurasi sumber data Anda sebagai bagian dari pembuatan basis pengetahuan Anda.
+ Anda telah mengonfigurasi model penyematan vektor dan penyimpanan vektor pilihan Anda. Lihat [model penyematan vektor yang didukung](https://docs.aws.amazon.com/bedrock/latest/userguide/knowledge-base-supported.html) dan [penyimpanan vektor untuk](https://docs.aws.amazon.com/bedrock/latest/userguide/knowledge-base-setup.html) basis pengetahuan. Anda mengonfigurasi penyematan vektor Anda sebagai bagian dari pembuatan basis pengetahuan Anda.
+ File dalam format yang didukung. Untuk informasi selengkapnya, lihat [Format dokumen Dukungan](https://docs.aws.amazon.com/bedrock/latest/userguide/knowledge-base-ds.html#kb-ds-supported-doc-formats-limits).
+ File tidak melebihi **ukuran file pekerjaan Ingestion** yang ditentukan di [titik akhir Amazon Bedrock dan](https://docs.aws.amazon.com/general/latest/gr/bedrock.html) kuota di. Referensi Umum AWS
+ Jika sumber data Anda berisi file metadata, periksa kondisi berikut untuk memastikan bahwa file metadata tidak diabaikan:
  + Setiap `.metadata.json` file berbagi nama file dan ekstensi yang sama dengan file sumber yang terkait dengannya.
  + Jika indeks vektor untuk basis pengetahuan Anda ada di penyimpanan vektor Amazon OpenSearch Tanpa Server, periksa apakah indeks vektor dikonfigurasi dengan mesin. `faiss` Jika indeks vektor dikonfigurasi dengan `nmslib` mesin, Anda harus melakukan salah satu hal berikut:
    + [Buat basis pengetahuan baru](knowledge-base-create.md) di konsol dan biarkan Amazon Bedrock secara otomatis membuat indeks vektor di Amazon OpenSearch Tanpa Server untuk Anda.
    + [Buat indeks vektor lain](knowledge-base-setup.md) di toko vektor dan pilih `faiss` sebagai **Mesin**. Kemudian [buat basis pengetahuan baru](knowledge-base-create.md) dan tentukan indeks vektor baru.
  + Jika indeks vektor untuk basis pengetahuan Anda berada di kluster database Amazon Aurora, sebaiknya gunakan bidang metadata khusus untuk menyimpan semua metadata Anda dalam satu kolom dan membuat indeks di kolom ini. Jika Anda tidak menyediakan bidang metadata kustom, Anda harus memeriksa bahwa tabel untuk indeks Anda berisi kolom untuk setiap properti metadata dalam file metadata Anda sebelum memulai konsumsi. Untuk informasi selengkapnya, lihat [Prasyarat untuk menggunakan penyimpanan vektor yang Anda buat untuk basis pengetahuan](knowledge-base-setup.md).

Setiap kali Anda menambahkan, memodifikasi, atau menghapus file dari sumber data Anda, Anda harus menyinkronkan sumber data sehingga diindeks ulang ke basis pengetahuan. Sinkronisasi bersifat bertahap, jadi Amazon Bedrock hanya memproses dokumen yang ditambahkan, dimodifikasi, atau dihapus sejak sinkronisasi terakhir.

Untuk mempelajari cara memasukkan data Anda ke dalam basis pengetahuan Anda dan menyinkronkan dengan data terbaru Anda, pilih tab untuk metode pilihan Anda, lalu ikuti langkah-langkahnya:

------
#### [ Console ]

**Untuk menyerap data Anda ke dalam basis pengetahuan Anda dan menyinkronkan dengan data terbaru Anda**

1. Buka konsol Amazon Bedrock di [https://console.aws.amazon.com/bedrock/](https://console.aws.amazon.com/bedrock/).

1. Dari panel navigasi kiri, pilih **Basis pengetahuan dan pilih basis** pengetahuan Anda.

1. Di bagian **Sumber data**, pilih **Sinkronkan** untuk memulai konsumsi data atau menyinkronkan data terbaru Anda. Untuk menghentikan sinkronisasi sumber data yang saat ini, pilih **Berhenti**. Sumber data saat ini harus disinkronkan untuk menghentikan sinkronisasi sumber data. Anda dapat memilih **Sinkronkan** lagi untuk menyerap sisa data Anda.

1. Ketika konsumsi data selesai, spanduk sukses hijau muncul jika berhasil.
**catatan**  
Setelah sinkronisasi data selesai, mungkin diperlukan beberapa menit agar penyematan vektor data yang baru disinkronkan tercermin dalam basis pengetahuan Anda dan tersedia untuk kueri jika Anda menggunakan penyimpanan vektor selain Amazon Aurora (RDS).

1. Anda dapat memilih sumber data untuk melihat **riwayat Sinkronisasi**. Pilih **Lihat peringatan** untuk melihat mengapa pekerjaan penyerapan data gagal.

------
#### [ API ]

Untuk memasukkan data Anda ke basis pengetahuan Anda dan menyinkronkan dengan data terbaru Anda, kirim [StartIngestionJob](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_StartIngestionJob.html)permintaan dengan titik akhir waktu [build Agen untuk Amazon Bedrock](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#bra-bt). Tentukan `knowledgeBaseId` dan`dataSourceId`. Anda juga dapat menghentikan pekerjaan penyerapan data yang sedang berjalan dengan mengirimkan permintaan. [StopIngestionJob](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_StopIngestionJob.html) Tentukan`dataSourceId`,`ingestionJobId`, dan`knowledgeBaseId`. Pekerjaan penyerapan data harus sedang berjalan untuk menghentikan konsumsi data. Anda dapat mengirim `StartIngestionJob` permintaan lagi untuk menelan sisa data Anda saat Anda siap.

Gunakan yang `ingestionJobId` dikembalikan dalam respons dalam [GetIngestionJob](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_GetIngestionJob.html)permintaan dengan [titik akhir waktu build Agen untuk Amazon Bedrock](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#bra-bt) untuk melacak status pekerjaan konsumsi. Selain itu, tentukan `knowledgeBaseId` dan`dataSourceId`.
+ Ketika pekerjaan konsumsi selesai, responsnya adalah`status`. `COMPLETE`
**catatan**  
Setelah penyerapan data selesai, mungkin diperlukan beberapa menit agar penyematan vektor dari data yang baru dicerna tersedia di penyimpanan vektor untuk kueri jika Anda menggunakan penyimpanan vektor selain Amazon Aurora (RDS).
+ `statistics`Objek dalam respons mengembalikan informasi tentang apakah konsumsi berhasil atau tidak untuk dokumen dalam sumber data.

Anda juga dapat melihat informasi untuk semua pekerjaan konsumsi untuk sumber data dengan mengirimkan [ListIngestionJobs](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_ListIngestionJobs.html)permintaan dengan titik akhir waktu pembuatan [Agen untuk Amazon Bedrock](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#bra-bt). Tentukan `dataSourceId` `knowledgeBaseId` dan basis pengetahuan tempat data dicerna.
+ Filter untuk hasil dengan menentukan status untuk mencari di `filters` objek.
+ Urutkan berdasarkan waktu pekerjaan dimulai atau status pekerjaan dengan menentukan `sortBy` objek. Anda dapat mengurutkan dalam urutan naik atau turun.
+ Mengatur jumlah maksimum hasil untuk kembali dalam respon di `maxResults` lapangan. Jika ada lebih banyak hasil daripada nomor yang Anda tetapkan, respons akan mengembalikan permintaan `nextToken` yang dapat Anda kirim dalam [ListIngestionJobs](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_ListIngestionJobs.html)permintaan lain untuk melihat kumpulan pekerjaan berikutnya.

------