Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# CatBoost hiperparameter
<a name="catboost-hyperparameters"></a>

Tabel berikut berisi subset hiperparameter yang diperlukan atau paling umum digunakan untuk algoritma Amazon SageMaker AI CatBoost . Pengguna mengatur parameter ini untuk memfasilitasi estimasi parameter model dari data. CatBoost Algoritma SageMaker AI adalah implementasi dari [CatBoost](https://github.com/catboost/catboost)paket open-source.

**catatan**  
Hyperparameter default didasarkan pada contoh kumpulan data di file. [CatBoost contoh notebook](catboost.md#catboost-sample-notebooks)

Secara default, CatBoost algoritme SageMaker AI secara otomatis memilih metrik evaluasi dan fungsi kerugian berdasarkan jenis masalah klasifikasi. CatBoost Algoritma mendeteksi jenis masalah klasifikasi berdasarkan jumlah label dalam data Anda. Untuk masalah regresi, metrik evaluasi dan fungsi kerugian keduanya merupakan kesalahan kuadrat rata-rata akar. Untuk masalah klasifikasi biner, metrik evaluasi adalah Area Under the Curve (AUC) dan fungsi kerugiannya adalah kehilangan log. Untuk masalah klasifikasi multikelas, metrik evaluasi dan fungsi kerugian adalah entropi silang multiklas. Anda dapat menggunakan `eval_metric` hyperparameter untuk mengubah metrik evaluasi default. Lihat tabel berikut untuk informasi selengkapnya tentang hyperparameters LightGBM, termasuk deskripsi, nilai valid, dan nilai default.


| Nama Parameter | Deskripsi | 
| --- | --- | 
| iterations |  Jumlah maksimum pohon yang dapat dibangun. Nilai yang valid: bilangan bulat, rentang: Bilangan bulat positif. Nilai default:`500`.  | 
| early\$1stopping\$1rounds |  Pelatihan akan berhenti jika satu metrik dari satu titik data validasi tidak membaik di `early_stopping_rounds` babak terakhir. Jika `early_stopping_rounds` kurang dari atau sama dengan nol, hyperparameter ini diabaikan. Nilai yang valid: bilangan bulat. Nilai default:`5`.  | 
| eval\$1metric |  Metrik evaluasi untuk data validasi. Jika `eval_metric` diatur ke `"auto"` nilai default, maka algoritme secara otomatis memilih metrik evaluasi berdasarkan jenis masalah klasifikasi: [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/id_id/sagemaker/latest/dg/catboost-hyperparameters.html) Nilai yang valid: string, lihat [CatBoost dokumentasi](https://catboost.ai/en/docs/references/eval-metric__supported-metrics) untuk nilai yang valid. Nilai default:`"auto"`.  | 
| learning\$1rate |  Tingkat di mana bobot model diperbarui setelah mengerjakan setiap batch contoh pelatihan. Nilai yang valid: float, range: (`0.0`,`1.0`). Nilai default:`0.009`.  | 
| depth |  Kedalaman pohon. Nilai yang valid: integer, range: (`1`,`16`). Nilai default:`6`.  | 
| l2\$1leaf\$1reg |  Koefisien untuk jangka waktu regularisasi L2 dari fungsi biaya. Nilai yang valid: bilangan bulat, rentang: Bilangan bulat positif. Nilai default:`3`.  | 
| random\$1strength |  Jumlah keacakan yang digunakan untuk penilaian terbelah ketika struktur pohon dipilih. Gunakan parameter ini untuk menghindari model yang terlalu pas. Nilai yang valid: float, range: Nomor floating point positif. Nilai default:`1.0`.  | 
| max\$1leaves |  Jumlah maksimum daun di pohon yang dihasilkan. Hanya dapat digunakan dengan kebijakan yang `"Lossguide"` berkembang. Nilai yang valid: integer, range: [`2`,`64`]. Nilai default:`31`.  | 
| rsm |  Metode subruang acak. Persentase fitur yang akan digunakan pada setiap pemilihan split, ketika fitur dipilih lagi secara acak. Nilai yang valid: float, range: (`0.0`,`1.0`]. Nilai default:`1.0`.  | 
| sampling\$1frequency |  Frekuensi untuk mengambil sampel bobot dan benda saat membangun pohon. Nilai yang valid: string, baik: (`"PerTreeLevel"`atau`"PerTree"`). Nilai default:`"PerTreeLevel"`.  | 
| min\$1data\$1in\$1leaf |  Jumlah minimum sampel pelatihan dalam satu daun. CatBoost tidak mencari split baru di daun dengan jumlah sampel kurang dari nilai yang ditentukan. Hanya dapat digunakan dengan kebijakan yang `"Depthwise"` berkembang `"Lossguide"` dan berkembang. Nilai yang valid: bilangan bulat, rentang: (`1`atau`∞`). Nilai default:`1`.  | 
| bagging\$1temperature |  Mendefinisikan pengaturan bootstrap Bayesian. Gunakan bootstrap Bayesian untuk menetapkan bobot acak ke objek. Jika `bagging_temperature` diatur ke`1.0`, maka bobot diambil sampelnya dari distribusi eksponensial. Jika `bagging_temperature` diatur ke`0.0`, maka semua bobot adalah 1.0. Nilai yang valid: float, range: Float non-negatif. Nilai default:`1.0`.  | 
| boosting\$1type |  Skema peningkatan. “Otomatis” berarti `boosting_type` dipilih berdasarkan jenis unit pemrosesan, jumlah objek dalam kumpulan data pelatihan, dan mode pembelajaran yang dipilih. Nilai yang valid: string, salah satu dari berikut ini: (`"Auto"`,`"Ordered"`,`"Plain"`). Nilai default:`"Auto"`.  | 
| scale\$1pos\$1weight |  Bobot untuk kelas positif dalam klasifikasi biner. Nilai ini digunakan sebagai pengganda untuk bobot objek dari kelas positif. Nilai yang valid: float, range: Positive float. Nilai default:`1.0`.  | 
| max\$1bin |  Jumlah split untuk fitur numerik. `"Auto"`berarti yang `max_bin` dipilih berdasarkan jenis unit pengolahan dan parameter lainnya. Untuk detailnya, lihat CatBoost dokumentasi. Nilai yang valid: string, baik: (`"Auto"`atau string integer dari `"1"` ke `"65535"` inklusif). Nilai default:`"Auto"`.  | 
| grow\$1policy |  Kebijakan penanaman pohon. Mendefinisikan bagaimana melakukan konstruksi pohon serakah. Nilai yang valid: string, salah satu dari berikut ini: (`"SymmetricTree"`,`"Depthwise"`, atau`"Lossguide"`). Nilai default:`"SymmetricTree"`.  | 
| random\$1seed |  Benih acak yang digunakan untuk pelatihan. Nilai yang valid: bilangan bulat, rentang: Bilangan bulat non-negatif. Nilai default:`1.0`. | 
| thread\$1count |  Jumlah utas yang akan digunakan selama pelatihan. Jika `thread_count` ya`-1`, maka jumlah utas sama dengan jumlah inti prosesor. `thread_count`tidak bisa`0`. Nilai valid: integer, baik: (`-1`atau bilangan bulat positif). Nilai default:`-1`.  | 
| verbose |  Verbositas pesan cetak, dengan tingkat yang lebih tinggi sesuai dengan pernyataan cetak yang lebih rinci. Nilai yang valid: bilangan bulat, rentang: Bilangan bulat positif. Nilai default:`1`.  |