Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Lampiran
Pantau hasil pelatihan melalui HyperPod resep
SageMaker HyperPod resep menawarkan integrasi Tensorboard untuk menganalisis perilaku pelatihan. Resep-resep ini juga menggabungkan VizTracer, yang merupakan alat overhead rendah untuk melacak dan memvisualisasikan eksekusi kode Python. Untuk informasi selengkapnya, lihat VizTracer
Log tensorboard dihasilkan dan disimpan di dalam file. log_dir Untuk mengakses dan menganalisis log ini secara lokal, gunakan prosedur berikut:
-
Unduh folder eksperimen Tensorboard dari lingkungan pelatihan Anda ke mesin lokal Anda.
-
Buka terminal atau command prompt pada mesin lokal Anda.
-
Arahkan ke direktori yang berisi folder eksperimen yang diunduh.
-
Luncurkan Tensorboard dengan menjalankan perintah:
tensorboard --port=<port> --bind_all --logdir experiment. -
Buka browser web Anda dan kunjungi
http://localhost:8008.
Anda sekarang dapat melihat status dan visualisasi pekerjaan pelatihan Anda dalam antarmuka Tensorboard. Melihat status dan visualisasi membantu Anda memantau dan menganalisis proses pelatihan. Memantau dan menganalisis proses pelatihan membantu Anda mendapatkan wawasan tentang perilaku dan kinerja model Anda. Untuk informasi selengkapnya tentang cara Anda memantau dan menganalisis pelatihan dengan Tensorboard, lihat Panduan Pengguna NVIDIA NeMo Framework
VizTracer
Untuk mengaktifkan VizTracer, Anda dapat memodifikasi resep Anda dengan menyetel variabel lingkungan ENABLE_VIZTRACER ke1. Setelah pelatihan selesai, VizTracer profil Anda ada di folder percobaanlog_dir/viztracer_xxx.json. Untuk menganalisis profil Anda, Anda dapat mengunduhnya dan membukanya menggunakan vizviewer alat:
vizviewer --port <port> viztracer_xxx.json
Perintah ini meluncurkan vizviewer pada port 9001. Anda dapat melihat Anda VizTracer dengan pergi ke http://localhost: <port>di browser Anda. Setelah Anda membuka VizTracer, Anda mulai menganalisis pelatihan. Untuk informasi selengkapnya tentang penggunaan VizTracer, lihat VizTracer dokumentasi