Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Menggunakan pipeline OpenSearch Ingestion dengan Confluent Cloud Kafka
Anda dapat menggunakan pipeline OpenSearch Ingestion untuk mengalirkan data dari cluster Confluent Cloud Kafka ke domain OpenSearch Amazon Service dan koleksi Tanpa Server. OpenSearch OpenSearch Ingestion mendukung konfigurasi jaringan publik dan pribadi untuk streaming data dari cluster Confluent Cloud Kafka ke domain atau koleksi yang dikelola oleh Layanan atau Tanpa Server. OpenSearch OpenSearch
Konektivitas ke cluster Kafka publik Confluent Cloud
Anda dapat menggunakan pipeline OpenSearch Ingestion untuk memigrasikan data dari cluster Confluent Cloud Kafka dengan konfigurasi publik, yang berarti bahwa nama DNS domain dapat diselesaikan secara publik. Untuk melakukannya, siapkan pipeline OpenSearch Ingestion dengan cluster Kafka publik Confluent Cloud sebagai sumber dan OpenSearch Layanan atau OpenSearch Tanpa Server sebagai tujuan. Ini memproses data streaming Anda dari kluster sumber yang dikelola sendiri ke domain atau AWS koleksi tujuan yang dikelola.
Prasyarat
Sebelum Anda membuat pipeline OpenSearch Ingestion, lakukan langkah-langkah berikut:
-
Buat cluster cluster Confluent Cloud Kafka yang bertindak sebagai sumber. Cluster harus berisi data yang ingin Anda konsumsi ke dalam OpenSearch Service.
-
Buat domain OpenSearch Layanan atau koleksi OpenSearch Tanpa Server tempat Anda ingin memigrasikan data. Untuk informasi selengkapnya, lihat Membuat domain OpenSearch Layanan dan Membuat koleksi.
-
Siapkan otentikasi di cluster Confluent Cloud Kafka Anda dengan. AWS Secrets Manager Aktifkan rotasi rahasia dengan mengikuti langkah-langkah di Putar AWS Secrets Manager rahasia.
-
Lampirkan kebijakan berbasis sumber daya ke domain Anda atau kebijakan akses data ke koleksi Anda. Kebijakan akses ini memungkinkan OpenSearch Ingestion untuk menulis data dari klaster yang dikelola sendiri ke domain atau koleksi Anda.
Contoh kebijakan akses domain berikut memungkinkan peran pipeline, yang Anda buat pada langkah berikutnya, untuk menulis data ke domain. Pastikan Anda memperbarui
resource
dengan ARN Anda sendiri.Untuk membuat peran IAM dengan izin yang benar untuk mengakses data tulis ke koleksi atau domain, lihat. Menyiapkan peran dan pengguna di Amazon OpenSearch Ingestion
Langkah 1: Konfigurasikan peran pipeline
Setelah Anda menyiapkan prasyarat pipeline cluster Confluent Cloud Kafka, konfigurasikan peran pipeline yang ingin Anda gunakan dalam konfigurasi pipeline, dan tambahkan izin untuk menulis ke domain OpenSearch Layanan atau koleksi OpenSearch Tanpa Server, serta izin untuk membaca rahasia dari Secrets Manager.
Izin berikut diperlukan untuk mengelola antarmuka jaringan:
Berikut ini adalah izin yang diperlukan untuk membaca rahasia dari AWS Secrets Manager layanan:
Izin berikut diperlukan untuk menulis ke domain OpenSearch Layanan Amazon:
{ "Statement": [ { "Effect": "Allow", "Principal": { "AWS": "arn:aws:iam::
account-id
:role/pipeline-role
" }, "Action": ["es:DescribeDomain", "es:ESHttp*"], "Resource": "arn:aws:es:region
:account-id
:domain/domain-name
/*" } ] }
Langkah 2: Buat pipa
Anda kemudian dapat mengonfigurasi pipeline OpenSearch Ingestion seperti berikut ini, yang menentukan Confluent Cloud Kafka Anda sebagai sumbernya.
Anda dapat menentukan beberapa domain OpenSearch Layanan sebagai tujuan untuk data Anda. Kemampuan ini memungkinkan routing bersyarat atau replikasi data yang masuk ke beberapa domain Layanan. OpenSearch
Anda juga dapat memigrasikan data dari cluster Confluent Kafka sumber ke koleksi VPC Tanpa Server OpenSearch . Pastikan Anda menyediakan kebijakan akses jaringan dalam konfigurasi pipeline. Anda dapat menggunakan registri skema Confluent untuk menentukan skema Confluent.
version: "2" kafka-pipeline: source: kafka: encryption: type: "ssl" topics: - name: "
topic-name
" group_id: "group-id
" bootstrap_servers: - "bootstrap-server
.us-east-1
.aws.private.confluent.cloud:9092" authentication: sasl: plain: username: ${aws_secrets:confluent-kafka-secret:username
} password: ${aws_secrets:confluent-kafka-secret:password
} schema: type: confluent registry_url: https://my-registry
.us-east-1
.aws.confluent.cloud api_key: "${{aws_secrets:schema-secret:schema_registry_api_key
}}" api_secret: "${{aws_secrets:schema-secret:schema_registry_api_secret
}}" basic_auth_credentials_source: "USER_INFO" sink: - opensearch: hosts: ["https://search-mydomain.us-east-1.es.amazonaws.com
"] aws: region: "us-east-1
" aws: secrets: confluent-kafka-secret: secret_id: "my-kafka-secret
" region: "us-east-1
" schema-secret: secret_id: "my-self-managed-kafka-schema
" region: "us-east-1
"
Anda dapat menggunakan cetak biru yang telah dikonfigurasi sebelumnya untuk membuat pipeline ini. Untuk informasi selengkapnya, lihat Bekerja dengan cetak biru.
Konektivitas ke cluster Confluent Cloud Kafka di VPC
Anda juga dapat menggunakan pipeline OpenSearch Ingestion untuk memigrasikan data dari cluster Confluent Cloud Kafka yang berjalan di VPC. Untuk melakukannya, siapkan pipeline OpenSearch Ingestion dengan cluster Confluent Cloud Kafka sebagai sumber dan OpenSearch Layanan atau OpenSearch Tanpa Server sebagai tujuan. Ini memproses data streaming Anda dari cluster sumber Confluent Cloud Kafka ke domain atau koleksi tujuan yang AWS dikelola.
OpenSearch Ingestion mendukung cluster Confluent Cloud Kafka yang dikonfigurasi di semua mode jaringan yang didukung di Confluent. Mode konfigurasi jaringan berikut didukung sebagai sumber dalam OpenSearch Ingestion:
-
AWS Pengintip VPC
-
AWS PrivateLink untuk cluster khusus
-
AWS PrivateLink untuk klaster Enterprise
-
AWS Transit Gateway
Prasyarat
Sebelum Anda membuat pipeline OpenSearch Ingestion, lakukan langkah-langkah berikut:
-
Buat cluster Confluent Cloud Kafka dengan konfigurasi jaringan VPC yang berisi data yang ingin Anda konsumsi ke dalam Layanan. OpenSearch
-
Buat domain OpenSearch Layanan atau koleksi OpenSearch Tanpa Server tempat Anda ingin memigrasikan data. Untuk informasi selengkapnya, lihat Untuk informasi lebih lanjut, lihat Membuat domain OpenSearch Layanan danMembuat koleksi.
-
Siapkan otentikasi di cluster Confluent Cloud Kafka Anda dengan. AWS Secrets Manager Aktifkan rotasi rahasia dengan mengikuti langkah-langkah di Putar AWS Secrets Manager rahasia.
-
Dapatkan ID VPC yang memiliki akses ke cluster Confluent Cloud Kafka. Pilih VPC CIDR yang akan digunakan oleh Ingestion. OpenSearch
catatan
Jika Anda menggunakan AWS Management Console untuk membuat pipeline, Anda juga harus melampirkan pipeline OpenSearch Ingestion Anda ke VPC Anda untuk menggunakan cluster Confluent Cloud Kafka. Untuk melakukannya, cari bagian Konfigurasi jaringan, pilih kotak centang Lampirkan ke VPC, dan pilih CIDR Anda dari salah satu opsi default yang disediakan, atau pilih sendiri. Anda dapat menggunakan CIDR apa pun dari ruang alamat pribadi seperti yang didefinisikan dalam Praktik Terkini Terbaik RFC 1918
. Untuk menyediakan CIDR khusus, pilih Lainnya dari menu tarik-turun. Untuk menghindari tabrakan dalam alamat IP antara OpenSearch Ingestion dan self-managed OpenSearch, pastikan bahwa OpenSearch VPC CIDR yang dikelola sendiri berbeda dari CIDR untuk Ingestion. OpenSearch
-
Lampirkan kebijakan berbasis sumber daya ke domain Anda atau kebijakan akses data ke koleksi Anda. Kebijakan akses ini memungkinkan OpenSearch Ingestion untuk menulis data dari klaster yang dikelola sendiri ke domain atau koleksi Anda.
catatan
Jika Anda menggunakan AWS PrivateLink untuk menghubungkan Confluent Cloud Kafka Anda, Anda harus mengkonfigurasi VPC DHCP Options. Nama host DNS dan resolusi DNS harus diaktifkan.
Secara khusus, gunakan opsi set nilai berikut:
domain-name: aws.private.confluent.cloud domain-name-servers: AmazonProvidedDNS
Perubahan ini memastikan bahwa resolusi DNS untuk PrivateLink titik akhir Confluent berfungsi dengan benar di dalam VPC.
Contoh kebijakan akses domain berikut memungkinkan peran pipeline, yang Anda buat pada langkah berikutnya, untuk menulis data ke domain. Pastikan Anda memperbarui
resource
dengan ARN Anda sendiri.Untuk membuat peran IAM dengan izin yang benar untuk mengakses data tulis ke koleksi atau domain, lihat. Menyiapkan peran dan pengguna di Amazon OpenSearch Ingestion
Langkah 1: Konfigurasikan peran pipeline
Setelah prasyarat pipeline disiapkan, konfigurasikan peran pipeline yang ingin Anda gunakan dalam konfigurasi pipeline, dan tambahkan izin berikut dalam peran:
Anda harus memberikan EC2 izin Amazon di atas pada peran IAM yang Anda gunakan untuk membuat pipeline OpenSearch Ingestion karena pipeline menggunakan izin ini untuk membuat dan menghapus antarmuka jaringan di VPC Anda. Pipeline hanya dapat mengakses cluster Kafka melalui antarmuka jaringan ini.
Langkah 2: Buat pipa
Anda kemudian dapat mengonfigurasi pipeline OpenSearch Ingestion seperti berikut ini, yang menentukan Kafka sebagai sumbernya.
Anda dapat menentukan beberapa domain OpenSearch Layanan sebagai tujuan untuk data Anda. Kemampuan ini memungkinkan routing bersyarat atau replikasi data yang masuk ke beberapa domain Layanan. OpenSearch
Anda juga dapat memigrasikan data dari cluster Confluent Kafka sumber ke koleksi VPC Tanpa Server OpenSearch . Pastikan Anda menyediakan kebijakan akses jaringan dalam konfigurasi pipeline. Anda dapat menggunakan registri skema Confluent untuk menentukan skema Confluent.
version: "2" kafka-pipeline: source: kafka: encryption: type: "ssl" topics: - name: "
topic-name
" group_id: "group-id
" bootstrap_servers: - "bootstrap-server
.us-east-1
.aws.private.confluent.cloud:9092" authentication: sasl: plain: username: ${aws_secrets:confluent-kafka-secret:username
} password: ${aws_secrets:confluent-kafka-secret:password
} schema: type: confluent registry_url: https://my-registry
.us-east-1
.aws.confluent.cloud api_key: "${{aws_secrets:schema-secret:schema_registry_api_key
}}" api_secret: "${{aws_secrets:schema-secret:schema_registry_api_secret
}}" basic_auth_credentials_source: "USER_INFO" sink: - opensearch: hosts: ["https://search-mydomain.us-east-1.es.amazonaws.com
"] aws: region: "us-east-1
" index: "confluent-index
" extension: aws: secrets: confluent-kafka-secret: secret_id: "my-kafka-secret
" region: "us-east-1
" schema-secret: secret_id: "my-self-managed-kafka-schema
" region: "us-east-2
"