

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Membuat template PySpark analisis
<a name="create-pyspark-analysis-template"></a>

**catatan**  
Parameter adalah string yang disediakan pengguna yang dapat berisi konten arbitrer.  
Tinjau kode untuk memastikan parameter ditangani dengan aman untuk mencegah perilaku tak terduga dalam analisis Anda.
Desain penanganan parameter untuk bekerja dengan aman terlepas dari nilai parameter apa yang disediakan pada waktu pengiriman.

**Prasyarat**

 Sebelum Anda membuat template PySpark analisis, Anda harus memiliki:
+ Keanggotaan dalam AWS Clean Rooms kolaborasi aktif
+ Akses ke setidaknya satu tabel yang dikonfigurasi dalam kolaborasi aktif
+ Izin untuk membuat templat analisis
+ Skrip pengguna Python dan lingkungan virtual yang dibuat dan disimpan di S3
  + Bucket S3 mengaktifkan versi. Untuk informasi selengkapnya, lihat [Menggunakan pembuatan versi di bucket S3](https://docs.aws.amazon.com/AmazonS3/latest/userguide/Versioning.html)
  + Bucket S3 dapat menghitung checksum SHA-256 untuk artefak yang diunggah. Untuk informasi selengkapnya, lihat [Menggunakan checksum](https://docs.aws.amazon.com/AmazonS3/latest/userguide/checking-object-integrity.html)
+ Izin untuk membaca kode dari bucket S3

  Untuk informasi tentang membuat peran layanan yang diperlukan, lihat[Buat peran layanan untuk membaca kode dari bucket S3 (peran template PySpark analisis)](setting-up-roles.md#create-role-pyspark-analysis-template).

Prosedur berikut menjelaskan proses pembuatan templat PySpark analisis menggunakan [AWS Clean Rooms konsol](https://console.aws.amazon.com/cleanrooms/home). Ini mengasumsikan bahwa Anda telah membuat skrip pengguna dan file lingkungan virtual dan menyimpan skrip pengguna dan file lingkungan virtual Anda dalam ember Amazon S3.

**catatan**  
Anggota yang membuat template PySpark analisis juga harus menjadi anggota yang menerima hasil.

Untuk informasi tentang cara membuat template PySpark analisis menggunakan AWS SDKs, lihat [Referensi AWS Clean Rooms API](https://docs.aws.amazon.com/clean-rooms/latest/apireference/Welcome.html).

**Untuk membuat template PySpark analisis**

1. Masuk ke Konsol Manajemen AWS dan buka [AWS Clean Rooms konsol](https://console.aws.amazon.com/cleanrooms/home) dengan Akun AWS yang akan berfungsi sebagai pembuat kolaborasi.

1. Di panel navigasi kiri, pilih **Kolaborasi**.

1. Pilih kolaborasi.

1. Pada tab **Template**, buka bagian **Analisis template yang dibuat oleh Anda**.

1. Pilih **Buat templat analisis**.

1. Pada halaman **template Buat analisis**, untuk **Detail**, 

   1. Masukkan **Nama** untuk templat analisis.

   1. (Opsional) Masukkan **Deskripsi**.

   1. Untuk **Format**, pilih **PySpark**opsi.

1. Untuk **Definisi**,

   1. Tinjau **Prasyarat dan pastikan setiap prasyarat** terpenuhi sebelum melanjutkan.

   1. Untuk **file Entry point**, masukkan bucket S3 atau pilih **Browse S3**.

   1. (Opsional) Untuk **file Libraries**, masukkan bucket S3 atau pilih **Browse** S3.

1. Untuk **Parameter - opsional**, jika Anda ingin menambahkan parameter untuk membuat template analisis Anda dapat digunakan kembali:

   1. Pilih **Add parameter** (Tambahkan parameter).

   1. Masukkan **nama Parameter**.

      Nama parameter harus dimulai dengan huruf atau garis bawah, diikuti oleh karakter alfanumerik atau garis bawah.

   1. Untuk **Type**, **STRING** secara otomatis dipilih sebagai satu-satunya tipe yang didukung untuk template PySpark analisis.

   1. (Opsional) Masukkan **nilai Default** untuk parameter.

      Jika Anda memberikan nilai default, job runner dapat menggunakan nilai ini saat menjalankan pekerjaan tanpa secara eksplisit memberikan nilai parameter.

   1. Untuk menambahkan lebih banyak parameter, pilih **Tambahkan parameter lain** dan ulangi langkah sebelumnya.
**catatan**  
Anda dapat menentukan hingga 50 parameter per templat PySpark analisis. Setiap nilai parameter bisa sampai 1.000 karakter.

1. Untuk **Tabel yang direferensikan dalam definisi,** 
   + Jika semua tabel yang direferensikan dalam definisi telah dikaitkan dengan kolaborasi:
     + Biarkan kotak centang **Semua tabel yang direferensikan dalam definisi telah dikaitkan dengan kolaborasi yang** dipilih.
     + Di bawah **Tabel yang terkait dengan kolaborasi**, pilih semua tabel terkait yang direferensikan dalam definisi. 
   + Jika semua tabel yang direferensikan dalam definisi belum dikaitkan dengan kolaborasi:
     + Kosongkan kotak centang **Semua tabel yang direferensikan dalam definisi telah dikaitkan dengan kolaborasi**.
     + Di bawah **Tabel yang terkait dengan kolaborasi**, pilih semua tabel terkait yang direferensikan dalam definisi.
     + Di bawah **Tabel yang akan dikaitkan nanti**, masukkan nama tabel. 
     + Pilih **Daftar tabel lain** untuk daftar tabel lain.

1. Untuk **konfigurasi pesan galat**, pilih salah satu dari berikut ini:
   + **Pesan kesalahan dasar - mengembalikan pesan** kesalahan dasar tanpa mengekspos data yang mendasarinya. Direkomendasikan untuk beban kerja produksi.
   + **Pesan kesalahan terperinci - mengembalikan pesan** kesalahan terperinci untuk pemecahan masalah yang lebih cepat. Direkomendasikan dalam lingkungan pengembangan dan pengujian. Dapat mengekspos data sensitif, termasuk informasi identitas pribadi (PII).
**catatan**  
Saat menggunakan **Pesan kesalahan terperinci**, semua anggota penyedia data harus menyetujui pengaturan ini untuk templat.

1. Tentukan izin **akses Layanan** dengan memilih **nama peran Layanan yang ada dari daftar** tarik-turun.

   1. Daftar peran ditampilkan jika Anda memiliki izin untuk membuat daftar peran.

      Jika Anda tidak memiliki izin untuk membuat daftar peran, Anda dapat memasukkan Nama Sumber Daya Amazon (ARN) peran yang ingin Anda gunakan.

   1. Lihat peran layanan dengan memilih tautan eksternal **View in IAM**.

      Jika tidak ada peran layanan yang ada, opsi untuk **Menggunakan peran layanan yang ada** tidak tersedia.

      Secara default, AWS Clean Rooms tidak mencoba memperbarui kebijakan peran yang ada untuk menambahkan izin yang diperlukan. 
**catatan**  
AWS Clean Rooms memerlukan izin untuk melakukan kueri sesuai dengan aturan analisis. Untuk informasi selengkapnya tentang izin AWS Clean Rooms, lihat[AWS kebijakan terkelola untuk AWS Clean Rooms](security-iam-awsmanpol.md).
Jika peran tidak memiliki izin yang memadai AWS Clean Rooms, Anda akan menerima pesan galat yang menyatakan bahwa peran tersebut tidak memiliki izin yang memadai untuk peran tersebut. AWS Clean Rooms Kebijakan peran harus ditambahkan sebelum melanjutkan.
Jika Anda tidak dapat mengubah kebijakan peran, Anda akan menerima pesan galat yang menyatakan bahwa AWS Clean Rooms tidak dapat menemukan kebijakan untuk peran layanan.

1. Jika Anda ingin mengaktifkan **Tag** untuk sumber daya tabel yang dikonfigurasi, pilih **Tambahkan tag baru** lalu masukkan pasangan **Kunci** dan **Nilai**.

1. Pilih **Buat**.

1. Anda sekarang siap memberi tahu anggota kolaborasi Anda bahwa mereka dapat [Meninjau template analisis](review-analysis-template.md). (Opsional jika Anda ingin menanyakan data Anda sendiri.)

**penting**  
Jangan memodifikasi atau menghapus artefak (skrip pengguna atau lingkungan virtual) setelah membuat templat analisis.  
Melakukannya akan:  
Menyebabkan semua pekerjaan analisis future menggunakan template ini gagal.
Memerlukan pembuatan template analisis baru dengan artefak baru.
Tidak mempengaruhi pekerjaan analisis yang telah diselesaikan sebelumnya.