Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris. # Memulai ## Kirim Job Evaluasi Melalui SageMaker Studio ### Langkah 1: Arahkan ke Evaluasi Dari Kartu Model Anda Setelah Anda menyesuaikan model Anda, navigasikan ke halaman evaluasi dari kartu model Anda. Untuk informasi tentang pelatihan model kustom berat terbuka: [https://docs.aws.amazon.com/sagemaker/latest/dg/model- .html customize-open-weight-job](https://docs.aws.amazon.com/sagemaker/latest/dg/model-customize-open-weight-job.html) SageMaker memvisualisasikan model kustom Anda pada tab My Models: ![\[Halaman kartu model terdaftar\]](http://docs.aws.amazon.com/id_id/sagemaker/latest/dg/images/getting-started-registered-model-card.png) Pilih Lihat versi terbaru, lalu pilih Evaluasi: ![\[Halaman kustomisasi model\]](http://docs.aws.amazon.com/id_id/sagemaker/latest/dg/images/getting-started-evaluate-from-model-card.png) ### Langkah 2: Kirim Job Evaluasi Anda Pilih tombol Kirim dan kirimkan pekerjaan evaluasi Anda. Ini mengirimkan pekerjaan benchmark MMLU minimal. Untuk informasi tentang jenis pekerjaan evaluasi yang didukung, lihat[Jenis evaluasi dan Job Submission](model-customize-evaluation-types.md). ![\[Halaman pengajuan pekerjaan evaluasi\]](http://docs.aws.amazon.com/id_id/sagemaker/latest/dg/images/getting-started-benchmark-submission.png) ### Langkah 3: Lacak Kemajuan Pekerjaan Evaluasi Anda Progres pekerjaan evaluasi Anda dilacak di tab Langkah evaluasi: ![\[Kemajuan pekerjaan evaluasi Anda\]](http://docs.aws.amazon.com/id_id/sagemaker/latest/dg/images/getting-started-benchmark-tracking.png) ### Langkah 4: Lihat Hasil Job Evaluasi Anda Hasil pekerjaan evaluasi Anda divisualisasikan di tab Hasil evaluasi: ![\[Metrik pekerjaan evaluasi Anda\]](http://docs.aws.amazon.com/id_id/sagemaker/latest/dg/images/getting-started-benchmark-results.png) ### Langkah 5: Lihat Evaluasi Selesai Anda Pekerjaan evaluasi Anda yang telah selesai ditampilkan di Evaluasi kartu model Anda: ![\[Pekerjaan evaluasi Anda yang telah selesai\]](http://docs.aws.amazon.com/id_id/sagemaker/latest/dg/images/getting-started-benchmark-completed-model-card.png) ## Kirim Job Evaluasi Anda Melalui SageMaker Python SDK ### Langkah 1: Buat Anda BenchMarkEvaluator Lulus model terlatih terdaftar Anda, lokasi keluaran AWS S3, dan MLFlow sumber daya ARN `BenchMarkEvaluator` ke lalu inisialisasi. ``` from sagemaker.train.evaluate import BenchMarkEvaluator, Benchmark evaluator = BenchMarkEvaluator( benchmark=Benchmark.MMLU, model="arn:aws:sagemaker:::model-package//", s3_output_path="s3:////eval/", mlflow_resource_arn="arn:aws:sagemaker:::mlflow-tracking-server/", evaluate_base_model=False ) ``` ### Langkah 2: Kirim Job Evaluasi Anda Panggil `evaluate()` metode untuk mengirimkan pekerjaan evaluasi. ``` execution = evaluator.evaluate() ``` ### Langkah 3: Lacak Kemajuan Pekerjaan Evaluasi Anda Hubungi `wait()` metode eksekusi untuk mendapatkan pembaruan langsung dari kemajuan pekerjaan evaluasi. ``` execution.wait(target_status="Succeeded", poll=5, timeout=3600) ``` ### Langkah 4: Lihat Hasil Job Evaluasi Anda Hubungi `show_results()` metode untuk menampilkan hasil pekerjaan evaluasi Anda. ``` execution.show_results() ```