Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Menggunakan driver Amazon EBS CSI di SageMaker HyperPod kluster EKS
SageMaker HyperPod mendukung driver Amazon Elastic Block Store (Amazon EBS) Container Storage Interface (CSI), yang mengelola siklus hidup volume Amazon EBS sebagai penyimpanan untuk volume Kubernetes yang Anda buat. Dengan driver Amazon EBS CSI, Anda dapat membuat, melampirkan, dan mengelola volume Amazon EBS untuk beban kerja pembelajaran mesin yang berjalan di cluster SageMaker HyperPod dengan orkestrasi Amazon EKS.
Dalam topik ini:
Kemampuan penyimpanan kunci
Driver Amazon EBS CSI aktif SageMaker HyperPod mendukung kemampuan penyimpanan berikut.
-
Penyediaan dinamis: Secara otomatis membuat volume Amazon EBS dan volume persisten terkait dari.
PersistentVolumeClaimsParameter dapat diteruskan StorageClassuntuk kontrol halus atas pembuatan volume. -
Pengubahan ukuran volume: Memperluas volume yang ada dengan memperbarui spesifikasi
PersistentVolumeClaimsukuran tanpa mengganggu beban kerja yang sedang berjalan. Ini sangat penting untuk menangani repositori model yang sedang tumbuh atau beradaptasi dengan node yang lebih besar tanpa gangguan layanan. -
Snapshot volume: Membuat point-in-time snapshot volume untuk pencadangan, pemulihan, dan pembuatan versi data.
-
Volume blok: Menyediakan akses perangkat blok mentah untuk aplikasi berkinerja tinggi yang membutuhkan akses penyimpanan langsung.
-
Modifikasi volume: Mengubah properti volume seperti jenis, operasi input atau output per detik (IOPS), atau throughput menggunakan kelas atribut volume
.
Untuk informasi selengkapnya tentang driver Amazon EBS CSI, lihat Menggunakan penyimpanan volume Kubernetes dengan Amazon EBS dari Panduan Pengguna Amazon EKS.
Untuk informasi selengkapnya tentang penyimpanan ke pod di klaster Anda, lihat Penyimpanan dari Dokumentasi
Kasus penggunaan
Integrasi driver Amazon EBS CSI memungkinkan beberapa kasus penggunaan utama untuk beban kerja pelatihan dan inferensi pada kluster EKS. SageMaker HyperPod
Beban kerja pelatihan
-
Penyimpanan kumpulan data: Volume penyediaan untuk kumpulan data pelatihan yang bertahan di seluruh pod dimulai ulang
-
Penyimpanan pos pemeriksaan: Simpan pos pemeriksaan model dan hasil pelatihan menengah
-
Artefak bersama: Akses kumpulan data umum dan artefak model di beberapa pekerjaan pelatihan
Beban kerja inferensi
-
Penyimpanan model: Secara dinamis menyediakan volume berukuran tepat berdasarkan persyaratan model
-
Container caching: Buat penyimpanan sementara untuk meningkatkan kinerja inferensi
-
Pencatatan peristiwa: Simpan hasil inferensi dan log dengan penyimpanan persisten
Menyiapkan driver Amazon EBS CSI di SageMaker HyperPod cluster EKS
Driver Amazon Elastic Block Store (Amazon EBS) Container Storage Interface (CSI) memungkinkan Anda menyediakan dan mengelola volume Amazon EBS secara dinamis untuk beban kerja kontainer yang berjalan di cluster dengan orkestrasi EKS. SageMaker HyperPod Bagian ini memandu Anda untuk menginstal dan mengonfigurasi driver Amazon EBS CSI untuk mengaktifkan penyimpanan persisten untuk beban kerja pembelajaran mesin Anda.
Prasyarat
Sebelum memulai, lakukan hal berikut:
Izin tambahan
Untuk menyiapkan add-on driver Amazon EBS CSI, ikuti petunjuk di Gunakan penyimpanan volume Kubernetes dengan Amazon EBS dari Panduan Pengguna Amazon EKS. Anda juga harus menambahkan izin tambahan berikut ke peran IAM yang digunakan untuk menjalankan add-on driver. Perhatikan bahwa ini adalah peran IAM yang ditentukan dalam konfigurasi akun layanan Anda untuk add-on driver, bukan peran eksekusi HyperPod klaster.
Menggunakan APIs
Sebagai alternatif, Anda dapat menggunakan operasi AttachClusterNodeVolumedan DetachClusterNodeVolumeAPI untuk melampirkan dan melepaskan volume Amazon EBS Anda ke instans cluster SageMaker HyperPod EKS.
Persyaratan utama untuk menggunakan ini APIs termasuk yang berikut ini.
-
Volume Amazon EBS dan kluster SageMaker HyperPod EKS harus dimiliki oleh yang sama Akun AWS.
-
Prinsipal panggilan memerlukan izin minimum khusus untuk berhasil melakukan operasi melampirkan atau melepaskan. Untuk informasi selengkapnya tentang izin minimum, lihat bagian berikut.
-
Setelah melampirkan volume ke HyperPod node Anda, ikuti instruksi dalam Mengakses node SageMaker HyperPod cluster untuk mengakses node cluster, dan Buat volume tersedia untuk digunakan untuk me-mount volume yang terpasang.
Izin yang diperlukan untuk sagemaker:AttachClusterNodeVolume
Izin yang diperlukan untuk sagemaker:DetachClusterNodeVolume
Izin yang diperlukan untuk kunci AWS KMS
Tambahkan AWS KMS izin berikut hanya jika Anda menggunakan kunci KMS yang dikelola pelanggan untuk mengenkripsi volume Amazon EBS yang dilampirkan ke node cluster. HyperPod Izin ini tidak diperlukan jika Anda menggunakan kunci KMS yang AWS dikelola (opsi enkripsi default).
catatan
AWS KMS Izin ini tidak diperlukan sagemaker:DetachClusterNodeVolume saat melepaskan volume Cluster Auto Volume Attachment (CAVA) yang dienkripsi dengan kunci KMS yang dikelola pelanggan.