

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Penskalaan otomatis dengan titik akhir
<a name="comprehend-autoscaling"></a>

Alih-alih menyesuaikan secara manual jumlah unit inferensi yang disediakan untuk titik akhir klasifikasi dokumen dan titik akhir pengenal entitas, Anda dapat menggunakan penskalaan otomatis untuk secara otomatis mengatur penyediaan titik akhir agar sesuai dengan kebutuhan kapasitas Anda. 

Ada dua cara untuk menggunakan penskalaan otomatis untuk menyesuaikan jumlah unit inferensi yang disediakan untuk titik akhir Anda:
+ [Pelacakan Target](targettracking.md): Atur penskalaan otomatis untuk menyesuaikan penyediaan titik akhir agar sesuai dengan kebutuhan kapasitas berdasarkan penggunaan. 
+ [Penskalaan terjadwal](ScheduledScaling.md): Atur penskalaan otomatis untuk menyesuaikan penyediaan titik akhir agar sesuai dengan kebutuhan kapasitas pada jadwal yang ditentukan.

Anda dapat mengatur penskalaan otomatis hanya dengan AWS Command Line Interface (AWS CLI). Untuk informasi selengkapnya tentang auto scaling, lihat [Apa itu Application Auto Scaling](https://docs.aws.amazon.com/autoscaling/application/userguide/what-is-application-auto-scaling.html)?

# Pelacakan Target
<a name="targettracking"></a>

Dengan pelacakan target, Anda dapat menyesuaikan penyediaan titik akhir agar sesuai dengan kebutuhan kapasitas berdasarkan penggunaan. Jumlah unit inferensi secara otomatis menyesuaikan sehingga kapasitas yang digunakan berada dalam persentase target dari kapasitas yang disediakan. Anda dapat menggunakan pelacakan target untuk mengakomodasi lonjakan penggunaan sementara untuk titik akhir klasifikasi dokumen dan titik akhir pengenal entitas. Untuk informasi lebih lanjut, lihat [Kebijakan penskalaan pelacakan target untuk Application Auto Scaling](https://docs.aws.amazon.com/autoscaling/application/userguide/application-auto-scaling-target-tracking.html).

**catatan**  
Contoh berikut diformat untuk Unix, Linux, dan macOS. Untuk Windows, ganti karakter kelanjutan backslash (\$1) Unix di akhir setiap baris dengan tanda sisipan (^).

## Menyiapkan pelacakan target
<a name="setup-target-tracking"></a>

Untuk menyiapkan pelacakan target untuk titik akhir, Anda menggunakan perintah AWS CLI untuk mendaftarkan target yang dapat diskalakan dan kemudian membuat kebijakan penskalaan. Target yang dapat diskalakan mendefinisikan unit inferensi sebagai sumber daya yang digunakan untuk menyesuaikan penyediaan titik akhir, dan kebijakan penskalaan mendefinisikan metrik yang mengontrol penskalaan otomatis kapasitas yang disediakan. 

**Untuk mengatur pelacakan target**

1. Daftarkan target yang dapat diskalakan. Contoh berikut mendaftarkan target yang dapat diskalakan untuk menyesuaikan penyediaan titik akhir dengan kapasitas minimum 1 unit inferensi dan kapasitas maksimum 2 unit inferensi.

   Untuk titik akhir klasifikasi dokumen, gunakan perintah AWS CLI berikut:

   ```
   aws application-autoscaling register-scalable-target \
       --service-namespace comprehend \
       --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \
       --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \
       --min-capacity 1 \
       --max-capacity 2
   ```

   Untuk titik akhir pengenal entitas, gunakan perintah CLI berikut AWS :

   ```
   aws application-autoscaling register-scalable-target \
       --service-namespace comprehend \
       --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \
       --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \
       --min-capacity 1 \
       --max-capacity 2
   ```

1. Untuk memverifikasi pendaftaran target yang dapat diskalakan, gunakan perintah AWS CLI berikut:

   ```
   aws application-autoscaling describe-scalable-targets \
       --service-namespace comprehend \
       --resource-id endpoint ARN
   ```

1. Buat konfigurasi pelacakan target untuk kebijakan penskalaan dan simpan konfigurasi dalam file bernama`config.json`. Berikut ini adalah contoh konfigurasi pelacakan target untuk titik akhir klasifikasi dokumen yang menargetkan menjaga InferenceUtilization metrik pada 70%.

   ```
   {
     "TargetValue": 70,
     "CustomizedMetricSpecification": {
       "MetricName": "InferenceUtilization",
       "Namespace": "MyNamespace",
       "Dimensions": [
         {
           "Name": "EndpointArn",
           "Value": "arn:aws:comprehend:region:account-id:document-classifier-endpoint/name"
         }
       ],
       "Statistic": "Sum",
       "Unit": "Percent"
     }
   }
   ```

   Berikut ini adalah contoh untuk titik akhir pengenal entitas:

   ```
   {
     "TargetValue": 70,
     "CustomizedMetricSpecification": {
       "MetricName": "InferenceUtilization",
       "Namespace": "MyNamespace",
       "Dimensions": [
         {
           "Name": "EndpointArn",
           "Value": "arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name"
         }
       ],
       "Statistic": "Sum",
       "Unit": "Percent"
     }
   }
   ```

1. Buat kebijakan penskalaan. Contoh berikut membuat kebijakan penskalaan berdasarkan konfigurasi pelacakan target yang ditentukan dalam `config.json` file. 

   Untuk titik akhir klasifikasi dokumen, gunakan perintah AWS CLI berikut:

   ```
   aws application-autoscaling put-scaling-policy \
       --service-namespace comprehend \
       --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \
       --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \
       --policy-name TestPolicy \
       --policy-type TargetTrackingScaling \
       --target-tracking-scaling-policy-configuration file://config.json
   ```

   Untuk titik akhir pengenal entitas, gunakan perintah CLI berikut AWS :

   ```
   aws application-autoscaling put-scaling-policy \
       --service-namespace comprehend \
       --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \
       --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \
       --policy-name TestPolicy \
       --policy-type TargetTrackingScaling \
       --target-tracking-scaling-policy-configuration file://config.json
   ```

## Pertimbangan-pertimbangan
<a name="considerations"></a>

Pertimbangan berikut berlaku saat menggunakan pelacakan target dengan titik akhir Comprehend:
+ Metrik titik akhir dipancarkan hanya untuk permintaan yang berhasil. Metrik tidak akan muncul untuk permintaan yang dibatasi atau gagal dengan kesalahan server internal atau kesalahan pelanggan.
+ Ketika titik data hilang, status CloudWatch alarm dukungan akan berubah menjadi`INSUFFICIENT_DATA `. Ketika ini terjadi, Application Auto Scaling tidak dapat menskalakan titik akhir Anda.
+ Matematika metrik dapat membantu untuk mengatasi batasan ini. Misalnya, untuk menggunakan nilai 0 ketika tidak ada metrik yang dilaporkan, gunakan `FILL(m1,0)` fungsi di `m1` mana metrik. Penting untuk menguji konfigurasi Anda untuk memastikannya berperilaku seperti yang diharapkan. Lihat [Membuat kebijakan pelacakan target menggunakan matematika metrik](https://docs.aws.amazon.com/autoscaling/application/userguide/application-auto-scaling-target-tracking-metric-math.html) untuk opsi lebih lanjut.

## Menghapus pelacakan target
<a name="remove-target-tracking"></a>

Untuk menghapus pelacakan target untuk titik akhir, Anda menggunakan perintah AWS CLI untuk menghapus kebijakan penskalaan dan kemudian membatalkan pendaftaran target yang dapat diskalakan.

**Untuk menghapus pelacakan target**

1. Hapus kebijakan penskalaan. Contoh berikut menghapus kebijakan penskalaan tertentu.

   Untuk titik akhir klasifikasi dokumen, gunakan perintah AWS CLI berikut:

   ```
   aws application-autoscaling delete-scaling-policy \
       --service-namespace comprehend \
       --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \
       --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \
       --policy-name TestPolicy \
   ```

   Untuk titik akhir pengenal entitas, gunakan perintah CLI berikut AWS :

   ```
   aws application-autoscaling delete-scaling-policy \
       --service-namespace comprehend \
       --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \
       --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \
       --policy-name TestPolicy
   ```

1. Batalkan pendaftaran target yang dapat diskalakan. Contoh berikut membatalkan pendaftaran target terukur yang ditentukan.

   Untuk titik akhir klasifikasi dokumen, gunakan perintah AWS CLI berikut:

   ```
   aws application-autoscaling deregister-scalable-target \
       --service-namespace comprehend \
       --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \
       --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits
   ```

   Untuk titik akhir pengenal entitas, gunakan perintah CLI berikut AWS :

   ```
   aws application-autoscaling deregister-scalable-target \
       --service-namespace comprehend \
       --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \
       --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits
   ```

# Penskalaan terjadwal
<a name="ScheduledScaling"></a>

Dengan penskalaan terjadwal, Anda dapat menyesuaikan penyediaan titik akhir agar sesuai dengan kebutuhan kapasitas Anda pada jadwal yang ditentukan. Penskalaan terjadwal secara otomatis menyesuaikan jumlah unit inferensi untuk mengakomodasi lonjakan penggunaan pada waktu tertentu. Anda dapat menggunakan penskalaan terjadwal untuk titik akhir klasifikasi dokumen dan titik akhir pengenal entitas. Untuk informasi tambahan tentang penskalaan terjadwal, lihat [Penskalaan terjadwal untuk Application Auto Scaling](https://docs.aws.amazon.com/autoscaling/application/userguide/application-auto-scaling-scheduled-scaling.html).

**catatan**  
Contoh berikut diformat untuk Unix, Linux, dan macOS. Untuk Windows, ganti karakter kelanjutan backslash (\$1) Unix di akhir setiap baris dengan tanda sisipan (^).

## Menyiapkan penskalaan terjadwal
<a name="setup-scheduled-scaling"></a>

Untuk menyiapkan penskalaan terjadwal untuk titik akhir, Anda menggunakan perintah AWS CLI untuk mendaftarkan target yang dapat diskalakan dan kemudian membuat tindakan terjadwal. Target yang dapat diskalakan mendefinisikan unit inferensi sebagai sumber daya yang digunakan untuk menyesuaikan penyediaan titik akhir, dan tindakan terjadwal mengontrol penskalaan otomatis kapasitas yang disediakan pada waktu tertentu.

**Untuk mengatur penskalaan terjadwal**

1. Daftarkan target yang dapat diskalakan. Contoh berikut mendaftarkan target yang dapat diskalakan untuk menyesuaikan penyediaan titik akhir dengan kapasitas minimum 1 unit inferensi dan kapasitas maksimum 2 unit inferensi.

   Untuk titik akhir klasifikasi dokumen, gunakan perintah AWS CLI berikut:

   ```
   aws application-autoscaling register-scalable-target \
       --service-namespace comprehend \
       --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \
       --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \
       --min-capacity 1 \
       --max-capacity 2
   ```

   Untuk titik akhir pengenal entitas, gunakan perintah CLI berikut AWS :

   ```
   aws application-autoscaling register-scalable-target \
       --service-namespace comprehend \
       --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \
       --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \
       --min-capacity 1 \
       --max-capacity 2
   ```

1. Buat tindakan terjadwal. Contoh berikut membuat tindakan terjadwal untuk secara otomatis menyesuaikan kapasitas yang disediakan setiap hari pada pukul 12:00 UTC dengan minimal 2 unit inferensi dan maksimum 5 unit inferensi. Untuk informasi selengkapnya tentang ekspresi kronologis dan penskalaan terjadwal, lihat [Menjadwalkan](https://docs.aws.amazon.com/AmazonCloudWatch/latest/events/ScheduledEvents.html) ekspresi. 

   Untuk titik akhir klasifikasi dokumen, gunakan perintah AWS CLI berikut:

   ```
   aws application-autoscaling put-scheduled-action \
       --service-namespace comprehend \
       --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \
       --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \
       --scheduled-action-name TestScheduledAction \
       --schedule "cron(0 12 * * ? *)" \
       --scalable-target-action MinCapacity=2,MaxCapacity=5
   ```

   Untuk titik akhir pengenal entitas, gunakan perintah CLI berikut AWS :

   ```
   aws application-autoscaling put-scheduled-action \
       --service-namespace comprehend \
       --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \
       --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \
       --scheduled-action-name TestScheduledAction \
       --schedule "cron(0 12 * * ? *)" \
       --scalable-target-action MinCapacity=2,MaxCapacity=5
   ```

## Menghapus penskalaan terjadwal
<a name="remove-scheduled-scaling"></a>

Untuk menghapus penskalaan terjadwal untuk titik akhir, Anda menggunakan perintah AWS CLI untuk menghapus tindakan terjadwal dan kemudian membatalkan pendaftaran target yang dapat diskalakan.

**Untuk menghapus penskalaan terjadwal**

1. Hapus tindakan yang dijadwalkan. Contoh berikut menghapus tindakan terjadwal yang ditentukan.

   Untuk titik akhir klasifikasi dokumen, gunakan perintah AWS CLI berikut:

   ```
   aws application-autoscaling delete-scheduled-action \
       --service-namespace comprehend \
       --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \
       --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \
       --scheduled-action-name TestScheduledAction
   ```

   Untuk titik akhir pengenal entitas, gunakan perintah CLI berikut AWS :

   ```
   aws application-autoscaling delete-scheduled-action \
       --service-namespace comprehend \
       --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \
       --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \
       --scheduled-action-name TestScheduledAction
   ```

1. Batalkan pendaftaran target yang dapat diskalakan. Contoh berikut membatalkan pendaftaran target terukur yang ditentukan.

   Untuk titik akhir klasifikasi dokumen, gunakan perintah AWS CLI berikut:

   ```
   aws application-autoscaling deregister-scalable-target \
       --service-namespace comprehend \
       --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \
       --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits
   ```

   Untuk titik akhir pengenal entitas, gunakan perintah CLI berikut AWS :

   ```
   aws application-autoscaling deregister-scalable-target \
       --service-namespace comprehend \
       --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \
       --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits
   ```