

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Memulai
<a name="model-customize-evaluation-getting-started"></a>

## Kirim Job Evaluasi Melalui SageMaker Studio
<a name="model-customize-evaluation-studio"></a>

### Langkah 1: Arahkan ke Evaluasi Dari Kartu Model Anda
<a name="model-customize-evaluation-studio-step1"></a>

Setelah Anda menyesuaikan model Anda, navigasikan ke halaman evaluasi dari kartu model Anda.

Untuk informasi tentang pelatihan model kustom berat terbuka: [https://docs.aws.amazon.com/sagemaker/latest/dg/model- .html customize-open-weight-job](https://docs.aws.amazon.com/sagemaker/latest/dg/model-customize-open-weight-job.html)

SageMaker memvisualisasikan model kustom Anda pada tab My Models:

![\[Halaman kartu model terdaftar\]](http://docs.aws.amazon.com/id_id/sagemaker/latest/dg/images/getting-started-registered-model-card.png)


Pilih Lihat versi terbaru, lalu pilih Evaluasi:

![\[Halaman kustomisasi model\]](http://docs.aws.amazon.com/id_id/sagemaker/latest/dg/images/getting-started-evaluate-from-model-card.png)


### Langkah 2: Kirim Job Evaluasi Anda
<a name="model-customize-evaluation-studio-step2"></a>

Pilih tombol Kirim dan kirimkan pekerjaan evaluasi Anda. Ini mengirimkan pekerjaan benchmark MMLU minimal.

Untuk informasi tentang jenis pekerjaan evaluasi yang didukung, lihat[Jenis evaluasi dan Job Submission](model-customize-evaluation-types.md).

![\[Halaman pengajuan pekerjaan evaluasi\]](http://docs.aws.amazon.com/id_id/sagemaker/latest/dg/images/getting-started-benchmark-submission.png)


### Langkah 3: Lacak Kemajuan Pekerjaan Evaluasi Anda
<a name="model-customize-evaluation-studio-step3"></a>

Progres pekerjaan evaluasi Anda dilacak di tab Langkah evaluasi:

![\[Kemajuan pekerjaan evaluasi Anda\]](http://docs.aws.amazon.com/id_id/sagemaker/latest/dg/images/getting-started-benchmark-tracking.png)


### Langkah 4: Lihat Hasil Job Evaluasi Anda
<a name="model-customize-evaluation-studio-step4"></a>

Hasil pekerjaan evaluasi Anda divisualisasikan di tab Hasil evaluasi:

![\[Metrik pekerjaan evaluasi Anda\]](http://docs.aws.amazon.com/id_id/sagemaker/latest/dg/images/getting-started-benchmark-results.png)


### Langkah 5: Lihat Evaluasi Selesai Anda
<a name="model-customize-evaluation-studio-step5"></a>

Pekerjaan evaluasi Anda yang telah selesai ditampilkan di Evaluasi kartu model Anda:

![\[Pekerjaan evaluasi Anda yang telah selesai\]](http://docs.aws.amazon.com/id_id/sagemaker/latest/dg/images/getting-started-benchmark-completed-model-card.png)


## Kirim Job Evaluasi Anda Melalui SageMaker Python SDK
<a name="model-customize-evaluation-sdk"></a>

### Langkah 1: Buat Anda BenchMarkEvaluator
<a name="model-customize-evaluation-sdk-step1"></a>

Lulus model terlatih terdaftar Anda, lokasi keluaran AWS S3, dan MLFlow sumber daya ARN `BenchMarkEvaluator` ke lalu inisialisasi.

```
from sagemaker.train.evaluate import BenchMarkEvaluator, Benchmark  
  
evaluator = BenchMarkEvaluator(  
    benchmark=Benchmark.MMLU,  
    model="arn:aws:sagemaker:<region>:<account-id>:model-package/<model-package-name>/<version>",  
    s3_output_path="s3://<bucket-name>/<prefix>/eval/",  
    mlflow_resource_arn="arn:aws:sagemaker:<region>:<account-id>:mlflow-tracking-server/<tracking-server-name>",  
    evaluate_base_model=False  
)
```

### Langkah 2: Kirim Job Evaluasi Anda
<a name="model-customize-evaluation-sdk-step2"></a>

Panggil `evaluate()` metode untuk mengirimkan pekerjaan evaluasi.

```
execution = evaluator.evaluate()
```

### Langkah 3: Lacak Kemajuan Pekerjaan Evaluasi Anda
<a name="model-customize-evaluation-sdk-step3"></a>

Hubungi `wait()` metode eksekusi untuk mendapatkan pembaruan langsung dari kemajuan pekerjaan evaluasi.

```
execution.wait(target_status="Succeeded", poll=5, timeout=3600)
```

### Langkah 4: Lihat Hasil Job Evaluasi Anda
<a name="model-customize-evaluation-sdk-step4"></a>

Hubungi `show_results()` metode untuk menampilkan hasil pekerjaan evaluasi Anda.

```
execution.show_results()
```