Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Konfigurasi estimator dengan parameter untuk pembuatan profil dasar menggunakan modul Amazon SageMaker Debugger Python
Secara default, pembuatan profil dasar SageMaker Debugger aktif secara default dan memantau metrik pemanfaatan sumber daya, seperti pemanfaatan CPU, pemanfaatan GPU, pemanfaatan memori GPU, Jaringan, dan waktu tunggu I/O, dari semua pekerjaan pelatihan yang diajukan menggunakan Amazon Python SDK. SageMaker SageMaker
Jika Anda ingin mengakses dasbor metrik pemanfaatan sumber daya dari pekerjaan pelatihan Anda di SageMaker Studio, Anda dapat melompat ke halaman. Amazon SageMaker Debugger UI di Eksperimen Klasik Amazon SageMaker Studio
Jika Anda ingin mengaktifkan aturan yang mendeteksi masalah pemanfaatan sumber daya sistem secara otomatis, Anda dapat menambahkan rules
parameter di objek estimator untuk mengaktifkan aturan.
penting
Untuk menggunakan fitur SageMaker Debugger terbaru, Anda perlu memutakhirkan SageMaker Python SDK dan pustaka klien. SMDebug
Di kernel IPython Anda, Jupyter Notebook, JupyterLab atau lingkungan, jalankan kode berikut untuk menginstal versi terbaru dari pustaka dan restart kernel.
import sys import IPython !{sys.executable} -m pip install -U sagemaker smdebug IPython.Application.instance().kernel.do_shutdown(True)
Template kode untuk mengonfigurasi objek estimator SageMaker AI dengan modul SageMaker Debugger Python di AI Python SDK SageMaker
Untuk menyesuaikan konfigurasi profil dasar (profiler_config
) atau menambahkan aturan profiler (rules
), pilih salah satu tab untuk mendapatkan templat untuk menyiapkan estimator AI. SageMaker Di halaman berikutnya, Anda dapat menemukan informasi lebih lanjut tentang cara mengkonfigurasi dua parameter.
catatan
Contoh kode berikut tidak dapat dieksekusi secara langsung. Lanjutkan ke bagian berikutnya untuk mempelajari cara mengkonfigurasi setiap parameter.
Berikut ini memberikan deskripsi singkat tentang parameter.
-
profiler_config
— Konfigurasikan Debugger untuk mengumpulkan metrik sistem dan metrik kerangka kerja dari pekerjaan pelatihan Anda dan simpan ke URI bucket S3 atau mesin lokal Anda yang aman. Anda dapat mengatur seberapa sering atau longgar mengumpulkan metrik sistem. Untuk mempelajari cara mengkonfigurasiprofiler_config
parameter, lihat Konfigurasikan pengaturan untuk pembuatan profil dasar pemanfaatan sumber daya sistem danKonfigurasi estimator untuk pembuatan profil kerangka kerja. -
rules
— Konfigurasikan parameter ini untuk mengaktifkan aturan bawaan SageMaker Debugger yang ingin Anda jalankan secara paralel. Pastikan bahwa pekerjaan pelatihan Anda memiliki akses ke bucket S3 ini. Aturan berjalan pada wadah pemrosesan dan secara otomatis menganalisis pekerjaan pelatihan Anda untuk menemukan masalah kinerja komputasi dan operasional. ProfilerReportAturan ini adalah aturan paling terintegrasi yang menjalankan semua aturan pembuatan profil bawaan dan menyimpan hasil pembuatan profil sebagai laporan ke dalam bucket S3 aman Anda. Untuk mempelajari cara mengkonfigurasirules
parameter, lihatMenggunakan aturan profiler bawaan yang dikelola oleh Amazon SageMaker Debugger.
catatan
Debugger menyimpan data keluaran dengan aman di subfolder bucket S3 default Anda. Misalnya, format URI bucket S3 default adalahs3://sagemaker-<region>-<12digit_account_id>/<base-job-name>/<debugger-subfolders>/
. Ada tiga subfolder yang dibuat oleh Debugger:debug-output
,, profiler-output
dan. rule-output
Anda juga dapat mengambil bucket S3 default URIs menggunakan classmethods estimator SageMaker AI.
Lihat topik berikut untuk mengetahui cara mengonfigurasi parameter khusus Debugger secara detail.