Menggunakan AWS CloudFormation untuk mengatur inferensi jarak jauh untuk pencarian semantik - OpenSearch Layanan Amazon

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Menggunakan AWS CloudFormation untuk mengatur inferensi jarak jauh untuk pencarian semantik

Dimulai dengan OpenSearch versi 2.9, Anda dapat menggunakan inferensi jarak jauh dengan pencarian semantik untuk meng-host model machine learning (ML) Anda sendiri. Inferensi jarak jauh menggunakan plugin MLCommons.

Dengan inferensi jarak jauh, Anda dapat meng-host inferensi model Anda dari jarak jauh pada layanan ML, seperti Amazon AI SageMaker dan Amazon Bedrock, dan menghubungkannya ke Amazon OpenSearch Service dengan konektor ML.

Untuk memudahkan penyiapan inferensi jarak jauh, Amazon OpenSearch Service menyediakan AWS CloudFormationtemplate di konsol. CloudFormation adalah Layanan AWS tempat Anda dapat, menyediakan, dan mengelola AWS dan sumber daya pihak ketiga dengan memperlakukan infrastruktur sebagai kode.

OpenSearch CloudFormation Template mengotomatiskan proses penyediaan model untuk Anda, sehingga Anda dapat dengan mudah membuat model di domain OpenSearch Layanan Anda dan kemudian menggunakan ID model untuk menyerap data dan menjalankan kueri penelusuran saraf.

Saat Anda menggunakan encoder neural sparse dengan OpenSearch Service versi 2.12 dan seterusnya, sebaiknya Anda menggunakan model tokenizer secara lokal alih-alih menerapkan dari jarak jauh. Untuk informasi selengkapnya, lihat Model pengkodean jarang dalam dokumentasi. OpenSearch

AWS CloudFormation Template yang tersedia

Template AWS CloudFormation machine learning (ML) berikut tersedia untuk digunakan:

Templat Amazon Bedrock
Integrasi Penyematan Teks Amazon Titan

Terhubung ke model MS yang dihosting Amazon Bedrock, menghilangkan kebutuhan akan penerapan model terpisah, dan menggunakan titik akhir Amazon Bedrock yang telah ditentukan sebelumnya. Untuk informasi selengkapnya, lihat Embeddings Teks Amazon Titan di Panduan Pengguna Amazon Bedrock.

Cohere Embed Integrasi

Menyediakan akses ke model Cohere Embed, dan dioptimalkan untuk alur kerja pemrosesan teks tertentu. Untuk informasi selengkapnya, lihat Sematkan di situs web dokumen Cohere.

Embeddings Multimodal Amazon Titan

Mendukung penyematan teks dan gambar, dan memungkinkan kemampuan pencarian multimodal. Untuk informasi selengkapnya, lihat Amazon Titan Multimodal Embeddings di Panduan Pengguna Amazon Bedrock.

Templat integrasi server MCP
Integrasi server MCP

Menyebarkan Amazon Bedrock AgentCore Runtime, menyediakan titik akhir agen, menangani otentikasi masuk dan keluar, serta mendukung otentikasi perusahaan. OAuth

SageMaker Templat Amazon
Integrasi dengan model penyematan teks melalui Amazon SageMaker

Menerapkan model penyematan teks di Amazon SageMaker Runtime, membuat peran IAM untuk akses artefak model, dan menetapkan konektor ML untuk pencarian semantik.

Integrasi dengan Sparse Encoders melalui SageMaker

Menyiapkan model pengkodean jarang untuk pencarian saraf, membuat AWS Lambda fungsi untuk manajemen konektor, dan mengembalikan model IDs untuk digunakan segera.

Prasyarat

Untuk menggunakan CloudFormation template dengan OpenSearch Service, lengkapi prasyarat berikut.

Menyiapkan domain OpenSearch Layanan

Sebelum dapat menggunakan CloudFormation templat, Anda harus menyiapkan domain OpenSearch Layanan Amazon dengan versi 2.9 atau yang lebih baru dan kontrol akses berbutir halus diaktifkan. Buat peran backend OpenSearch Layanan untuk memberikan izin plugin MLCommons untuk membuat konektor untuk Anda.

CloudFormation Template membuat peran Lambda IAM untuk Anda dengan nama defaultLambdaInvokeOpenSearchMLCommonsRole, yang dapat Anda ganti jika Anda ingin memilih nama yang berbeda. Setelah template membuat peran IAM ini, Anda perlu memberikan izin fungsi Lambda untuk memanggil domain Layanan OpenSearch Anda. Untuk melakukannya, petakan peran yang diberi nama ml_full_access ke peran backend OpenSearch Service Anda dengan langkah-langkah berikut:

  1. Arahkan ke plugin OpenSearch Dasbor untuk domain OpenSearch Layanan Anda. Anda dapat menemukan titik akhir Dasbor di dasbor domain Anda di konsol OpenSearch Layanan.

  2. Dari menu utama pilih Keamanan, Peran, dan pilih peran ml_full_access.

  3. Pilih Pengguna yang Dipetakan, Kelola pemetaan.

  4. Di bawah peran Backend, tambahkan ARN dari peran Lambda yang memerlukan izin untuk memanggil domain Anda.

    arn:aws:iam::account-id:role/role-name
  5. Pilih Peta dan konfirmasikan pengguna atau peran muncul di bawah Pengguna yang dipetakan.

Setelah Anda memetakan peran, navigasikan ke konfigurasi keamanan domain Anda dan tambahkan peran Lambda IAM ke kebijakan akses Layanan OpenSearch Anda.

Aktifkan izin pada Anda Akun AWS

Anda Akun AWS harus memiliki izin untuk mengakses CloudFormation dan Lambda, bersama dengan mana pun yang Layanan AWS Anda pilih untuk template Anda — baik Runtime SageMaker atau Amazon Bedrock.

Jika Anda menggunakan Amazon Bedrock, Anda juga harus mendaftarkan model Anda. Lihat Akses model di Panduan Pengguna Amazon Bedrock untuk mendaftarkan model Anda.

Jika Anda menggunakan bucket Amazon S3 Anda sendiri untuk menyediakan artefak model, Anda harus menambahkan peran CloudFormation IAM ke kebijakan akses S3 Anda. Untuk informasi lebih lanjut, lihat Menambahkan dan menghapus izin identitas IAM dalam Panduan Pengguna IAM.