

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Wawasan IP
<a name="ip-insights"></a>

Amazon SageMaker AI IP Insights adalah algoritme pembelajaran tanpa pengawasan yang mempelajari pola penggunaan untuk alamat. IPv4 Ini dirancang untuk menangkap asosiasi antara IPv4 alamat dan berbagai entitas, seperti nomor pengguna IDs atau akun. Anda dapat menggunakannya untuk mengidentifikasi pengguna yang mencoba masuk ke layanan web dari alamat IP anomali, misalnya. Atau Anda dapat menggunakannya untuk mengidentifikasi akun yang mencoba membuat sumber daya komputasi dari alamat IP yang tidak biasa. Model IP Insight yang terlatih dapat di-host di titik akhir untuk membuat prediksi waktu nyata atau digunakan untuk memproses transformasi batch.

SageMaker Wawasan IP AI menyerap data historis sebagai pasangan (entitas, IPv4 Alamat) dan mempelajari pola penggunaan IP dari setiap entitas. Saat ditanyakan dengan peristiwa (entity, IPv4 Address), model SageMaker AI IP Insights mengembalikan skor yang menyimpulkan seberapa anomali pola peristiwa tersebut. Misalnya, ketika pengguna mencoba masuk dari alamat IP, jika skor IP Insights cukup tinggi, server login web mungkin memutuskan untuk memicu sistem otentikasi multi-faktor. Dalam solusi yang lebih canggih, Anda dapat memasukkan skor IP Insights ke dalam model pembelajaran mesin lainnya. Misalnya, Anda dapat menggabungkan skor IP Insight dengan fitur lain untuk menentukan peringkat temuan sistem keamanan lain, seperti yang berasal dari [Amazon GuardDuty](https://docs.aws.amazon.com/guardduty/latest/ug/what-is-guardduty.html).

*Algoritma SageMaker AI IP Insights juga dapat mempelajari representasi vektor alamat IP, yang dikenal sebagai embeddings.* Anda dapat menggunakan embeddings yang disandikan vektor sebagai fitur dalam tugas pembelajaran mesin hilir yang menggunakan informasi yang diamati di alamat IP. Misalnya, Anda dapat menggunakannya dalam tugas-tugas seperti mengukur kesamaan antara alamat IP dalam tugas pengelompokan dan visualisasi.

**Topics**
+ [Antarmuka Input/Output untuk Algoritma Wawasan IP](#ip-insights-inputoutput)
+ [Rekomendasi Instans EC2 untuk Algoritma Wawasan IP](#ip-insights-instances)
+ [Notebook Contoh Wawasan IP](#ip-insights-sample-notebooks)
+ [Bagaimana IP Insights Bekerja](ip-insights-howitworks.md)
+ [Hiperparameter Wawasan IP](ip-insights-hyperparameters.md)
+ [Menyetel Model Wawasan IP](ip-insights-tuning.md)
+ [Format Data Wawasan IP](ip-insights-data-formats.md)

## Antarmuka Input/Output untuk Algoritma Wawasan IP
<a name="ip-insights-inputoutput"></a>

**Pelatihan dan Validasi**

Algoritma SageMaker AI IP Insights mendukung saluran data pelatihan dan validasi. Ini menggunakan saluran validasi opsional untuk menghitung skor area-under-curve (AUC) pada strategi pengambilan sampel negatif yang telah ditentukan. Metrik AUC memvalidasi seberapa baik model membedakan antara sampel positif dan negatif. Jenis konten data pelatihan dan validasi harus dalam `text/csv` format. Kolom pertama dari data CSV adalah string buram yang menyediakan pengidentifikasi unik untuk entitas. Kolom kedua adalah IPv4 alamat dalam notasi desimal titik. IP Insights saat ini hanya mendukung mode File. Untuk informasi lebih lanjut dan beberapa contoh, lihat[Format Data Pelatihan Wawasan IP](ip-insights-training-data-formats.md).

**Inferensi**

Untuk inferensi, IP Insights mendukung`text/csv`,`application/json`, dan tipe konten `application/jsonlines` data. Untuk informasi selengkapnya tentang format data umum untuk inferensi yang disediakan oleh SageMaker AI, lihat[Format data umum untuk inferensi](cdf-inference.md). Inferensi IP Insights mengembalikan output yang diformat sebagai salah satu atau. `application/json` `application/jsonlines` Setiap catatan dalam data keluaran berisi yang sesuai `dot_product` (atau skor kompatibilitas) untuk setiap titik data input. Untuk informasi lebih lanjut dan beberapa contoh, lihat[Format Data Inferensi Wawasan IP](ip-insights-inference-data-formats.md).

## Rekomendasi Instans EC2 untuk Algoritma Wawasan IP
<a name="ip-insights-instances"></a>

Algoritma SageMaker AI IP Insights dapat berjalan pada instans GPU dan CPU. Untuk pekerjaan pelatihan, sebaiknya gunakan instans GPU. Namun, untuk beban kerja tertentu dengan kumpulan data pelatihan yang besar, instans CPU terdistribusi dapat mengurangi biaya pelatihan. Untuk inferensi, sebaiknya gunakan instance CPU. IP Insights mendukung keluarga GPU P2, P3, G4dn, dan G5.

### Instans GPU untuk Algoritma Wawasan IP
<a name="ip-insights-instances-gpu"></a>

IP Insights mendukung semua yang tersedia GPUs. Jika Anda perlu mempercepat pelatihan, sebaiknya mulai dengan satu instance GPU, seperti ml.p3.2xlarge, dan kemudian pindah ke lingkungan multi-GPU, seperti ml.p3.8xlarge dan ml.p3.16xlarge. Multi- GPUs secara otomatis membagi kumpulan mini data pelatihan di antara mereka sendiri. Jika Anda beralih dari satu GPU ke beberapa GPUs, `mini_batch_size` dibagi rata ke dalam jumlah yang GPUs digunakan. Anda mungkin ingin meningkatkan nilai `mini_batch_size` untuk mengkompensasi ini.

### Instans CPU untuk Algoritma Wawasan IP
<a name="ip-insights-instances-cpu"></a>

Jenis instance CPU yang kami rekomendasikan sangat bergantung pada memori instans yang tersedia dan ukuran model. Ukuran model ditentukan oleh dua hiperparameter: `vector_dim` dan`num_entity_vectors`. Ukuran model maksimum yang didukung adalah 8 GB. Tabel berikut mencantumkan tipe instans EC2 tipikal yang akan Anda terapkan berdasarkan parameter input ini untuk berbagai ukuran model. Pada Tabel 1, nilai untuk `vector_dim` kolom pertama berkisar dari 32 hingga 2048 dan nilai untuk `num_entity_vectors` di baris pertama berkisar antara 10.000 hingga 50.000.000.


| `vector_dim` \\ `num_entity_vectors`. | 10.000 | 50.000 | 100.000 | 500.000 | 1.000.000 | 5.000.000 | 10.000.000 | 50.000.000 | 
| --- | --- | --- | --- | --- | --- | --- | --- | --- | 
| 32 | db.m5.large | ml.m5.large | ml.m5.large | ml.m5.large | ml.m5.large | ml.m5.xlarge | ml.m5.2xlarge | ml.m5.4xlarge | 
| `64` | db.m5.large | ml.m5.large | ml.m5.large | ml.m5.large | ml.m5.large | ml.m5.2xlarge | ml.m5.2xlarge |  | 
| `128` | db.m5.large | ml.m5.large | ml.m5.large | ml.m5.large | ml.m5.large | ml.m5.2xlarge | ml.m5.4xlarge |  | 
| `256` | db.m5.large | ml.m5.large | ml.m5.large | ml.m5.large | ml.m5.xlarge | ml.m5.4xlarge |  |  | 
| `512` | db.m5.large | ml.m5.large | ml.m5.large | ml.m5.large | ml.m5.2xlarge |  |  |  | 
| `1024` | db.m5.large | ml.m5.large | ml.m5.large | ml.m5.xlarge | ml.m5.4xlarge |  |  |  | 
| `2048` | db.m5.large | ml.m5.large | ml.m5.xlarge | ml.m5.xlarge |  |  |  |  | 

Nilai untuk`mini_batch_size`,, `num_ip_encoder_layers``random_negative_sampling_rate`, dan `shuffled_negative_sampling_rate` hyperparameters juga mempengaruhi jumlah memori yang dibutuhkan. Jika nilai ini besar, Anda mungkin perlu menggunakan jenis instance yang lebih besar dari biasanya.

## Notebook Contoh Wawasan IP
<a name="ip-insights-sample-notebooks"></a>

Untuk contoh notebook yang menunjukkan cara melatih algoritme SageMaker AI IP Insights dan melakukan inferensi dengannya, lihat [Pengantar Algoritma Wawasan SageMaker AIIP](https://sagemaker-examples.readthedocs.io/en/latest/introduction_to_amazon_algorithms/ipinsights_login/ipinsights-tutorial.html). Untuk petunjuk cara membuat dan mengakses instance notebook Jupyter yang dapat Anda gunakan untuk menjalankan contoh di SageMaker AI, lihat. [Instans SageMaker notebook Amazon](nbi.md) Setelah membuat instance notebook, pilih tab **Contoh SageMaker AI** untuk melihat daftar semua contoh SageMaker AI. Untuk membuka buku catatan, pilih tab **Use** dan pilih **Create copy**.