

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Membuat saluran input ML di AWS Clean Rooms
<a name="create-ml-input-channel"></a>

**Prasyarat:**
+ An Akun AWS dengan akses ke AWS Clean Rooms
+ Kolaborasi yang disiapkan di AWS Clean Rooms tempat Anda ingin membuat saluran input ML
+ Izin untuk menanyakan data dan membuat saluran input ML dalam kolaborasi. 
+ (Opsional) Algoritma model yang ada untuk diasosiasikan dengan saluran input ML, atau izin untuk membuat yang baru
+ (Opsional) Tabel dengan aturan analisis yang dapat dijalankan untuk model yang Anda tentukan. 
+ (Opsional) Kueri SQL atau templat analisis yang ada untuk digunakan untuk menghasilkan kumpulan data
+ (Opsional) Peran layanan yang ada dengan izin yang sesuai, atau izin untuk membuat peran layanan baru
+ (Opsional) AWS KMS Kunci khusus jika Anda ingin menggunakan kunci enkripsi Anda sendiri
+ Izin yang sesuai untuk membuat dan mengelola model ML dalam kolaborasi

*Saluran input ML* adalah kumpulan data yang dibuat dari kueri data tertentu. Anggota dengan kemampuan untuk query data dapat mempersiapkan data mereka untuk pelatihan dan inferensi dengan membuat saluran input ML. Membuat saluran input ML memungkinkan data tersebut digunakan dalam model pelatihan yang berbeda dalam kolaborasi yang sama. Anda harus membuat saluran input ML terpisah untuk pelatihan dan inferensi.

Untuk membuat saluran input ML, Anda harus menentukan query SQL yang digunakan untuk query data input dan membuat saluran input ML. Hasil kueri ini tidak pernah dibagikan dengan anggota mana pun dan tetap berada dalam batas-batas Clean Rooms. Referensi Amazon Resource Name (ARN) digunakan pada langkah selanjutnya untuk melatih model atau menjalankan inferensi.

------
#### [ Console ]

**Untuk membuat saluran input ML (konsol)**

1. Masuk ke Konsol Manajemen AWS dan buka AWS Clean Rooms konsol di [https://console.aws.amazon.com/cleanrooms](https://console.aws.amazon.com/cleanrooms/home).

1. Di panel navigasi kiri, pilih **Kolaborasi**.

1. Pada halaman **Kolaborasi**, pilih kolaborasi tempat Anda ingin membuat saluran input ML.

1. Setelah kolaborasi terbuka, pilih tab **model ML**.

1. Di bawah **model Custom** **ML, di bagian saluran input** ML, pilih **Buat saluran input ML**.

1. Pada halaman **Create channel input ML**, untuk **detail saluran masukan** ML, lakukan hal berikut: 

   1. Untuk **Nama**, masukkan nama unik untuk saluran Anda.

   1. (Opsional) Untuk **Deskripsi**, masukkan deskripsi saluran Anda.

   1. Untuk **algoritma model terkait**, pilih algoritma yang akan digunakan.

      Pilih **algoritma model Associate** untuk menambahkan yang baru.

1. Untuk **Dataset**, pilih metode untuk menghasilkan kumpulan data pelatihan:
   + Pilih **kueri SQL** untuk menggunakan hasil kueri SQL sebagai kumpulan data pelatihan. 

     Jika Anda memilih **kueri SQL**, masukkan kueri Anda di bidang **kueri SQL**.

     (Opsional) Untuk mengimpor kueri yang baru saja Anda gunakan, pilih **Impor dari kueri terbaru**. 
   + Pilih **template Analisis** untuk menggunakan hasil template analisis sebagai kumpulan data pelatihan.
**Awas**  
Pembuatan data sintetis melindungi dari menyimpulkan atribut individu apakah individu tertentu hadir dalam kumpulan data asli atau atribut pembelajaran individu tersebut hadir. Namun, itu tidak mencegah nilai literal dari kumpulan data asli, termasuk informasi yang dapat diidentifikasi secara pribadi (PII) muncul di kumpulan data sintetis.  
Sebaiknya hindari nilai dalam kumpulan data input yang hanya terkait dengan satu subjek data karena ini dapat mengidentifikasi kembali subjek data. Misalnya, jika hanya satu pengguna yang tinggal dalam kode pos, keberadaan kode pos itu dalam kumpulan data sintetis akan mengonfirmasi bahwa pengguna berada dalam kumpulan data asli. Teknik seperti memotong nilai presisi tinggi atau mengganti katalog yang tidak biasa dengan yang *lain* dapat digunakan untuk mengurangi risiko ini. Transformasi ini dapat menjadi bagian dari query yang digunakan untuk membuat saluran input ML.

   1. Jika tidak ada tabel yang terkait, pilih **Tabel asosiasi** untuk menambahkan tabel dengan aturan analisis yang dapat dijalankan untuk model yang ditentukan. 

   1. Pilih **Jenis pekerja** yang akan digunakan saat membuat saluran data ini. Jenis pekerja default adalah **CR.1X**. Tentukan **Jumlah pekerja yang** akan digunakan. Nomor pekerja default adalah **16**. Untuk menentukan **properti Spark**:

      1. Perluas **properti Spark**.

      1. Pilih **Tambahkan properti Spark**.

      1. **Pada kotak dialog **properti Spark**, pilih **nama Properti** dari daftar dropdown dan masukkan Nilai.**

      Tabel berikut memberikan definisi untuk setiap properti.

      Untuk informasi selengkapnya tentang properti Spark, lihat [Spark Properties](https://spark.apache.org/docs/latest/configuration.html#spark-properties) di dokumentasi Apache Spark. 
**catatan**  
Anda dapat mengonfigurasi maksimum 50 properti Spark. Setiap nilai properti bisa sampai 500 karakter.    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/id_id/clean-rooms/latest/userguide/create-ml-input-channel.html)    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/id_id/clean-rooms/latest/userguide/create-ml-input-channel.html)

   1. Untuk **penyimpanan data dalam beberapa hari**, masukkan jumlah hari untuk menyimpan data.

   1. Untuk **format Hasil,** pilih **CSV** atau **Parket** sebagai format data yang harus digunakan saluran input ML.

1. Untuk **akses Layanan**, pilih **nama peran layanan yang ada** yang akan digunakan untuk mengakses tabel ini atau pilih **Buat dan gunakan peran layanan baru**. 

1. Untuk **Enkripsi**, pilih **Enkripsi rahasia dengan kunci KMS khusus untuk menentukan kunci** KMS Anda sendiri dan informasi terkait. Jika tidak, Clean Rooms ML akan mengelola enkripsi.

1. Pilih **Buat saluran input ML**. 

   Ini akan memakan waktu beberapa menit untuk membuat saluran input ML. Anda dapat melihat daftar saluran input ML pada tab **model ML**.

**catatan**  
Setelah saluran input ML dibuat, Anda tidak dapat mengeditnya.

------
#### [ API ]

Untuk membuat saluran input ML (API)

Jalankan kode berikut dengan parameter spesifik Anda: 

```
import boto3 
acr_client = boto3.client('cleanroomsml')

acr_client.create_ml_input_channel(
    name="ml_input_channel_name",
    membershipIdentifier='membership_id',
    configuredModelAlgorithmAssociations=[configured_model_algorithm_association_arn],
    retentionInDays=1,
    inputChannel={
        "dataSource": {
            "protectedQueryInputParameters": {
                "sqlParameters": {
                    "queryString": "select * from table",
                    "computeConfiguration": {
                        "worker": {
                            "type": "CR.1X",
                            "number": 16,
                            "properties": {
                                "spark": {
                                    "spark configuration key": "spark configuration value",
                                }
                            }   
                        }
                    },
                    "resultFormat": "PARQUET"
                }
            }
        },
        "roleArn": "arn:aws:iam::111122223333:role/role_name"
    }
)
channel_arn = resp['ML Input Channel ARN']
```

------