Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Blok Kapasitas untuk ML
Blok Kapasitas untuk ML memungkinkan Anda untuk memesan instans komputasi akselerasi berbasis GPU di masa mendatang untuk mendukung beban kerja machine learning (ML) berdurasi pendek Anda. Instans yang berjalan di dalam Blok Kapasitas secara otomatis ditempatkan berdekatan di dalam Amazon EC2 UltraClusters
Anda juga dapat menggunakan Blok Kapasitas untuk menyimpan kapasitas untuk Amazon EC2 UltraServers. UltraServers sambungkan beberapa EC2 instans Amazon dalam interkoneksi akselerator bandwidth tinggi latensi rendah. Anda dapat menggunakannya UltraServers untuk menangani AI/ML beban kerja komputasi dan memori yang paling intensif dalam pelatihan, fine-tuning, dan inferensi. Untuk informasi selengkapnya, lihat Amazon EC2 UltraServers
Dengan Blok Kapasitas, Anda dapat melihat kapan kapasitas instans GPU tersedia di masa mendatang, dan Anda dapat menjadwalkan Blok Kapasitas untuk memulai pada waktu yang paling sesuai untuk Anda. Saat Anda memesan Blok Kapasitas, Anda mendapatkan jaminan kapasitas yang dapat diprediksi untuk instans GPU dengan membayar jumlah waktu yang Anda butuhkan saja. Kami merekomendasikan Blok Kapasitas saat Anda GPUs perlu mendukung beban kerja ML Anda selama berhari-hari atau berminggu-minggu dan tidak ingin membayar reservasi saat instans GPU Anda tidak digunakan.
Berikut ini adalah beberapa kasus penggunaan umum untuk Blok Kapasitas.
-
Pelatihan model ML dan fine-tuning — Dapatkan akses tanpa gangguan ke instans GPU yang Anda pesan untuk menyelesaikan pelatihan model dan fine-tuning.
-
Eksperimen dan prototipe ML — Jalankan eksperimen dan bangun prototipe yang memerlukan instans GPU untuk jangka waktu pendek.
Blok Kapasitas tersedia untuk jenis instans tertentu di beberapa AWS Wilayah. Untuk informasi lebih lanjut, lihatJenis dan Wilayah instans yang didukung.
Anda dapat memesan Blok Kapasitas dengan waktu mulai reservasi hingga delapan minggu ke depan. Setiap Blok Kapasitas dapat memiliki hingga 64 instans, dan Anda dapat memiliki hingga 256 instans di seluruh Blok Kapasitas.
Jenis dan Wilayah instans yang didukung
Instance dan UltraServer Capacity Blocks dapat digunakan dengan tipe dan AWS wilayah instance berikut.
catatan
Ukuran Blok Kapasitas 64 instans tidak didukung untuk semua jenis instans secara keseluruhan Wilayah AWS.
Blok Kapasitas Instance
-
p6-b300.48xlargeAS Barat (Oregon) —
us-west-2
-
p6-b200.48xlargeAS Timur (Virginia N.) -
us-east-1AS Timur (Ohio) —
us-east-2AS Barat (Oregon) —
us-west-2
-
p5.4xlargeAS Timur (Virginia N.) -
us-east-1AS Timur (Ohio) —
us-east-2AS Barat (Oregon) —
us-west-2Eropa (London) —
eu-west-2Asia Pasifik (Mumbai) —
ap-south-1Asia Pasifik (Tokyo) —
ap-northeast-1Asia Pasifik (Sydney) —
ap-southeast-2Amerika Selatan (São Paulo) —
sa-east-1
-
p5.48xlargeAS Timur (Virginia N.)
us-east-1AS Timur (Ohio) —
us-east-2AS Barat (California N.) -
us-west-1AS Barat (Oregon) —
us-west-2Eropa (Stockholm) —
eu-north-1Eropa (London) —
eu-west-2Amerika Selatan (São Paulo) —
sa-east-1Asia Pasifik (Tokyo) —
ap-northeast-1Asia Pasifik (Mumbai) —
ap-south-1Asia Pasifik (Sydney) —
ap-southeast-2Asia Pasifik (Jakarta) —
ap-southeast-3
-
p5e.48xlargeAS Timur (Virginia N.)
us-east-1AS Timur (Ohio) —
us-east-2AS Barat (California N.) -
us-west-1AS Barat (Oregon) —
us-west-2Eropa (Stockholm) —
eu-north-1Eropa (London) —
eu-west-2Eropa (Spanyol) —
eu-south-2Amerika Selatan (São Paulo) —
sa-east-1Asia Pasifik (Tokyo) —
ap-northeast-1Asia Pasifik (Seoul) -
ap-northeast-2Asia Pasifik (Mumbai) —
ap-south-1Asia Pasifik (Jakarta) —
ap-southeast-3
-
p4d.24xlargeAS Timur (Virginia N.)
us-east-1AS Timur (Ohio) —
us-east-2AS Barat (Oregon) —
us-west-2
-
p4de.24xlargeAS Timur (Virginia N.)
us-east-1AS Barat (Oregon) —
us-west-2
-
trn1.32xlargeAS Timur (Virginia N.)
us-east-1AS Timur (Ohio) —
us-east-2AS Barat (California N.) -
us-west-1AS Barat (Oregon) —
us-west-2Eropa (Stockholm) —
eu-north-1Asia Pasifik (Mumbai) —
ap-south-1Asia Pasifik (Sydney) —
ap-southeast-2Asia Pasifik (Melbourne) —
ap-southeast-4
-
trn2.3xlargeAsia Pasifik (Melbourne) —
ap-southeast-4Amerika Selatan (São Paulo) —
sa-east-1
-
trn2.48xlargeAS Timur (Ohio) —
us-east-2
UltraServer Blok Kapasitas
-
Trn2AS Timur (Ohio) —
us-east-2
-
P6e-GB200Zona Lokal Dallas (Virginia N.)
us-east-1-dfw-2a
Platform yang didukung
Blok Kapasitas untuk L saat ini mendukung instance dan hanya UltraServers dengan penyewaan default. Saat Anda menggunakan Konsol Manajemen AWS untuk membeli Blok Kapasitas, opsi platform default adalah Linux/UNIX. Saat Anda menggunakan AWS Command Line Interface (AWS CLI) atau AWS SDK untuk membeli Blok Kapasitas, opsi platform berikut tersedia:
-
Linux/UNIX
-
Linux Red Hat Enterprise
-
RHEL dengan HA
-
SUSE Linux
-
Ubuntu Pro
Pertimbangan-pertimbangan
Sebelum Anda menggunakan Blok Kapasitas, pertimbangkan detail dan batasan berikut.
-
Jika kami mendeteksi gangguan yang berdampak pada Blok UltraServer Kapasitas, kami akan memberi tahu Anda tetapi umumnya tidak akan mengambil tindakan untuk menghentikan instans Anda di Blok Kapasitas. Ini untuk meminimalkan gangguan yang tidak disengaja pada beban kerja Anda. Anda dapat terus menggunakan Blok UltraServer Kapasitas sebagaimana adanya setelah menerima pemberitahuan ini atau meminta perbaikan dengan menghentikan semua instance pada blok kapasitas dan mengirimkan kasus dukungan. AWS Setelah kami menerima kasus dukungan Anda, kami akan memberi tahu Anda ketika kami telah menyelesaikan remediasi dan Anda dapat meluncurkan kembali instans ke Blok Kapasitas Anda. UltraServer
-
Untuk Blok
P6e-GB200UltraServer Kapasitas, Anda harus menghentikan instans Anda setidaknya 60 menit sebelum waktu akhir Blok Kapasitas. -
Untuk menggunakan Blok
P6e-GB200UltraServer Kapasitas, Anda harus memilih ke Zona Lokal Zona Lokal Dallas (Virginia N.). -
Setiap Blok Kapasitas dapat memiliki hingga 64 instans, dan Anda dapat memiliki hingga 256 instans di seluruh Blok Kapasitas.
-
Anda dapat menjelaskan penawaran Blok Kapasitas yang dapat dimulai segera setelah 30 menit.
-
Blok Kapasitas berakhir pada 11:30 Waktu Universal Terkoordinasi (UTC).
-
Proses pengakhiran untuk instans yang berjalan di Blok Kapasitas dimulai pada pukul 11:00 Waktu Universal Terkoordinasi (UTC) pada hari terakhir reservasi.
-
Blok Kapasitas dapat dipesan dengan waktu mulai hingga 8 minggu di masa mendatang.
-
Pembatalan Blok Kapasitas tidak diizinkan.
-
Blok Kapasitas tidak dapat dipindahkan atau dipecah.
-
Blok Kapasitas tidak dapat dibagikan di seluruh AWS akun atau di dalam AWS Organisasi Anda.
-
Hanya Blok UltraServer Kapasitas yang dapat digunakan dengan grup sumber daya. Blok Kapasitas Instance tidak dapat digunakan dengan grup sumber daya. Untuk informasi selengkapnya, lihat Buat grup sumber daya untuk Blok UltraServer Kapasitas.
-
Jumlah total instans yang dapat dicadangkan di Blok Kapasitas di semua akun di AWS Organisasi Anda tidak dapat melebihi 256 instans pada tanggal tertentu.
-
Untuk menggunakan Blok Kapasitas, instans harus secara khusus menargetkan ID reservasi.
-
Instans dalam Blok Kapasitas tidak diperhitungkan dalam batas Instans Sesuai Permintaan Anda.
-
Untuk instans P5 yang menggunakan AMI kustom, pastikan Anda memiliki perangkat lunak dan konfigurasi yang diperlukan untuk EFA.
-
Untuk grup node terkelola Amazon EKS, lihat Membuat grup simpul terkelola dengan Blok EC2 Kapasitas Amazon untuk ML. Untuk grup node yang dikelola sendiri Amazon EKS, lihat Menggunakan Blok Kapasitas untuk MLdengan node yang dikelola sendiri.
Sumber daya terkait
Setelah Anda membuat Blok Kapasitas, Anda dapat melakukan hal berikut dengan Blok Kapasitas:
-
Luncurkan instance ke dalam Blok Kapasitas. Untuk informasi selengkapnya, lihat Luncurkan instance menggunakan Blok Kapasitas.
-
Buat grup EC2 Auto Scaling Amazon. Untuk informasi selengkapnya, lihat Menggunakan Blok Kapasitas untuk beban kerja pembelajaran mesin di Panduan Pengguna Amazon EC2 Auto Scaling.
catatan
Jika Anda menggunakan Amazon EC2 Auto Scaling atau Amazon EKS, Anda dapat menjadwalkan penskalaan untuk dijalankan di awal reservasi Blok Kapasitas. Dengan penskalaan terjadwal, AWS secara otomatis menangani percobaan ulang untuk Anda, jadi Anda tidak perlu khawatir menerapkan logika coba lagi untuk menangani kegagalan sementara.
-
Tingkatkan alur kerja ML dengan AWS ParallelCluster. Untuk informasi selengkapnya, lihat Meningkatkan alur kerja ML dengan dan Blok EC2 Kapasitas AWS ParallelCluster Amazon untuk
ML.
Untuk informasi lebih lanjut tentang AWS ParallelCluster, lihat Apa itu AWS ParallelCluster.