Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Mengintegrasikan model Amazon SageMaker AI dengan Amazon Quick Sight
catatan
Anda tidak memerlukan pengalaman teknis apa pun dalam pembelajaran mesin (ML) untuk membuat analisis dan dasbor yang menggunakan fitur bertenaga ML di Amazon Quick Sight.
Anda dapat menambah data edisi Amazon Quick Suite Enterprise dengan model pembelajaran mesin Amazon SageMaker AI. Anda dapat menjalankan inferensi pada data yang disimpan dalam SPICE impor dari sumber data apa pun yang didukung oleh Quick Suite. Untuk daftar lengkap sumber data yang didukung, lihatSumber data yang didukung.
Menggunakan Quick Suite dengan model SageMaker AI dapat menghemat waktu yang mungkin Anda habiskan untuk mengelola pergerakan data dan menulis kode. Hasilnya berguna baik untuk mengevaluasi model dan—ketika Anda puas dengan hasilnya—untuk dibagikan dengan pengambil keputusan. Anda dapat mulai segera setelah model dibangun. Melakukan hal ini memunculkan model bawaan ilmuwan data Anda, dan memungkinkan Anda menerapkan ilmu data ke kumpulan data Anda. Kemudian Anda dapat membagikan wawasan ini di dasbor prediktif Anda. Dengan pendekatan tanpa server Quick Suite, prosesnya dapat diskalakan dengan mulus, sehingga Anda tidak perlu khawatir tentang inferensi atau kapasitas kueri.
Amazon Quick Suite mendukung model SageMaker AI yang menggunakan algoritma regresi dan klasifikasi. Anda dapat menerapkan fitur ini untuk mendapatkan prediksi untuk hampir semua kasus penggunaan bisnis. Beberapa contoh termasuk memprediksi kemungkinan churn pelanggan, gesekan karyawan, penilaian prospek penjualan, dan menilai risiko kredit. Untuk menggunakan Quick Suite untuk memberikan prediksi, data model SageMaker AI untuk input dan output harus dalam format tabel. Dalam kasus penggunaan klasifikasi multikelas atau multilabel, setiap kolom keluaran harus berisi satu nilai. Quick Suite tidak mendukung beberapa nilai dalam satu kolom.
Topik
Bagaimana integrasi SageMaker AI bekerja
Secara umum, prosesnya bekerja seperti ini:
-
Administrator Amazon Quick Suite menambahkan izin untuk Quick Suite untuk mengakses SageMaker AI. Untuk melakukan ini, buka pengaturan Keamanan & Izin dari halaman Kelola Suite Cepat. Buka akses Quick Suite ke AWS layanan, dan tambahkan SageMaker AI.
Saat Anda menambahkan izin ini, Quick Suite ditambahkan ke peran AWS Identity and Access Management (IAM) yang menyediakan akses untuk mencantumkan semua model SageMaker AI di akun Anda AWS . Ini juga memberikan izin untuk menjalankan pekerjaan SageMaker AI yang memiliki nama yang diawali.
quicksight-auto-generated- -
Kami menyarankan Anda terhubung ke model SageMaker AI yang memiliki pipeline inferensi, karena secara otomatis melakukan prapemrosesan data. Untuk informasi selengkapnya, lihat Menerapkan Saluran Inferensi di Panduan Pengembang SageMaker AI.
-
Setelah Anda mengidentifikasi data dan model yang telah dilatih sebelumnya yang ingin Anda gunakan bersama, pemilik model membuat dan menyediakan file skema. File JSON ini adalah kontrak dengan SageMaker AI. Ini menyediakan metadata tentang bidang, tipe data, urutan kolom, output, dan pengaturan yang diharapkan model. Komponen pengaturan opsional menyediakan ukuran instans dan jumlah instance komputasi yang akan digunakan untuk pekerjaan tersebut.
Jika Anda adalah ilmuwan data yang membuat model, buat file skema ini menggunakan format yang didokumentasikan berikut. Jika Anda adalah konsumen model, dapatkan file skema dari pemilik model.
-
Di Quick Suite, Anda mulai dengan membuat kumpulan data baru dengan data yang ingin Anda prediksi. Jika Anda mengunggah file, Anda dapat menambahkan model SageMaker AI di layar pengaturan unggah. Jika tidak, tambahkan model pada halaman persiapan data.
Sebelum Anda melanjutkan, verifikasi pemetaan antara kumpulan data dan model.
-
Setelah data diimpor ke kumpulan data, bidang keluaran berisi data yang dikembalikan dari SageMaker AI. Anda menggunakan bidang ini sama seperti Anda menggunakan bidang lain, dalam pedoman yang dijelaskan dalamPedoman penggunaan.
Saat Anda menjalankan integrasi SageMaker AI, Quick Suite meneruskan permintaan ke SageMaker AI untuk menjalankan pekerjaan transformasi batch dengan pipeline inferensi. Quick Suite memulai ketentuan dan penerapan instans yang diperlukan di akun Anda AWS . Saat pemrosesan selesai, instance ini dimatikan dan dihentikan. Kapasitas komputasi menimbulkan biaya hanya ketika memproses model.
Untuk memudahkan Anda mengidentifikasi mereka, Quick Suite SageMaker menamai semua pekerjaan AI-nya dengan awalan
quicksight-auto-generated-. -
Output dari inferensi disimpan SPICE dan ditambahkan ke dataset. Segera setelah inferensi selesai, Anda dapat menggunakan kumpulan data untuk membuat visualisasi dan dasbor menggunakan data prediksi.
-
Penyegaran data dimulai setiap kali Anda menyimpan kumpulan data. Anda dapat memulai proses penyegaran data secara manual dengan menyegarkan SPICE kumpulan data, atau Anda dapat menjadwalkannya untuk dijalankan secara berkala. Selama setiap penyegaran data, sistem secara otomatis memanggil transformasi batch SageMaker AI untuk memperbarui bidang output dengan data baru.
Anda dapat menggunakan operasi API SPICE konsumsi Amazon Quick Sight untuk mengontrol proses penyegaran data. Untuk informasi selengkapnya tentang penggunaan operasi API ini, lihat Referensi API Amazon Quick Sight.
Biaya yang dikeluarkan (tidak ada biaya tambahan dengan integrasi itu sendiri)
Menggunakan fitur ini sendiri tidak memerlukan biaya tambahan. Biaya Anda termasuk yang berikut:
-
Biaya penerapan model melalui SageMaker AI, yang dikeluarkan hanya ketika model sedang berjalan. Menyimpan dataset — setelah membuat atau mengeditnya — atau menyegarkan datanya memulai proses penyerapan data. Proses ini termasuk memanggil SageMaker AI jika kumpulan data memiliki bidang yang disimpulkan. Biaya dikeluarkan di AWS akun yang sama di mana langganan Quick Suite Anda berada.
-
Biaya berlangganan Quick Suite Anda adalah sebagai berikut:
-
Biaya penyimpanan data Anda di mesin perhitungan dalam memori di Quick Suite (SPICE). Jika Anda menambahkan data baruSPICE, Anda mungkin perlu membeli SPICE kapasitas yang cukup untuk mengakomodasi itu.
-
Langganan Quick Suite untuk penulis atau admin yang membuat kumpulan data.
-
Pay-per-session biaya untuk pemirsa (pembaca) untuk mengakses dasbor interaktif.
-
Pedoman penggunaan
Di Amazon Quick Suite, pedoman penggunaan berikut berlaku untuk fitur edisi Enterprise ini:
-
Pemrosesan model terjadi diSPICE. Oleh karena itu, ini hanya dapat berlaku untuk kumpulan data yang disimpan di. SPICE Proses saat ini mendukung hingga 500 juta baris per kumpulan data.
-
Hanya admin atau penulis Quick Suite yang dapat menambah kumpulan data dengan model ML. Pembaca hanya dapat melihat hasilnya ketika mereka adalah bagian dari dasbor.
-
Setiap dataset dapat bekerja dengan satu dan hanya satu model ML.
-
Bidang keluaran tidak dapat digunakan untuk menghitung bidang baru.
-
Kumpulan data tidak dapat difilter berdasarkan bidang yang terintegrasi dengan model. Dengan kata lain, jika bidang dataset Anda saat ini dipetakan ke model ML, Anda tidak dapat memfilter pada bidang itu.
Di SageMaker AI, pedoman penggunaan berikut berlaku untuk model terlatih yang Anda gunakan dengan Amazon Quick Sight:
-
Saat Anda membuat model, kaitkan dengan Amazon Resource Name (ARN) untuk peran IAM yang sesuai. Peran IAM untuk model SageMaker AI perlu memiliki akses ke bucket Amazon S3 yang digunakan Amazon Quick Sight.
-
Pastikan model Anda mendukung file.csv untuk input dan output. Pastikan data Anda dalam format tabel.
-
Berikan file skema yang berisi metadata tentang model, termasuk daftar bidang input dan output. Saat ini, Anda harus membuat file skema ini secara manual.
-
Pertimbangkan jumlah waktu yang diperlukan untuk menyelesaikan inferensi Anda, yang tergantung pada sejumlah faktor. Ini termasuk kompleksitas model, jumlah data, dan kapasitas komputasi yang ditentukan. Menyelesaikan inferensi dapat memakan waktu beberapa menit hingga beberapa jam. Amazon Quick Sight membatasi semua konsumsi data dan pekerjaan inferensi hingga maksimal 10 jam. Untuk mengurangi waktu yang diperlukan untuk melakukan inferensi, pertimbangkan untuk meningkatkan ukuran instans atau jumlah instance.
-
Saat ini, Anda hanya dapat menggunakan transformasi batch untuk integrasi dengan SageMaker AI, bukan data real-time. Anda tidak dapat menggunakan titik akhir SageMaker AI.
Mendefinisikan file skema
Sebelum Anda menggunakan model SageMaker AI dengan data Quick Sight, buat file skema JSON yang berisi metadata yang dibutuhkan Amazon Quick Sight untuk memproses model tersebut. Penulis atau admin Amazon Quick Suite mengunggah file skema saat mengonfigurasi kumpulan data.
Bidang skema didefinisikan sebagai berikut. Semua bidang diperlukan kecuali ditentukan dalam deskripsi berikut. Atribut peka huruf besar/kecil.
- inputContentType
-
Jenis konten yang diharapkan model SageMaker AI ini untuk data input. Satu-satunya nilai yang didukung untuk ini adalah
"text/csv". Quick Sight tidak menyertakan nama header apa pun yang Anda tambahkan ke file input. - outputContentType
-
Jenis konten output yang dihasilkan oleh model SageMaker AI yang ingin Anda gunakan. Satu-satunya nilai yang didukung untuk ini adalah
"text/csv". - masukan
-
Daftar fitur yang diharapkan model dalam data input. Quick Sight menghasilkan data input dalam urutan yang persis sama. Daftar ini berisi atribut berikut:
-
Nama - Nama kolom. Jika memungkinkan, buat ini sama dengan nama kolom yang sesuai dalam QuickSight kumpulan data. Atribut ini dibatasi hingga 100 karakter.
-
type — Tipe data dari kolom ini. Atribut ini mengambil nilai-nilai
"INTEGER","STRING", dan"DECIMAL". -
nullable - (Opsional) Nullability lapangan. Nilai default-nya adalah
true. Jika Andanullablemenyetelnyafalse, Quick Sight akan menjatuhkan baris yang tidak berisi nilai ini sebelum memanggil SageMaker AI. Melakukan hal ini membantu menghindari menyebabkan SageMaker AI gagal pada data yang diperlukan yang hilang.
-
- keluaran
-
Daftar kolom keluaran yang dihasilkan model SageMaker AI. Quick Sight mengharapkan bidang-bidang ini dalam urutan yang persis sama. Daftar ini berisi atribut berikut:
-
name — Nama ini menjadi nama default untuk kolom baru yang sesuai yang dibuat di Quick Sight. Anda dapat mengganti nama yang ditentukan di sini di Quick Sight. Atribut ini dibatasi hingga 100 karakter.
-
type — Tipe data dari kolom ini. Atribut ini mengambil nilai-nilai
"INTEGER","STRING", dan"DECIMAL".
-
- InstanceTypes
-
Daftar jenis instans ML yang dapat disediakan SageMaker AI untuk menjalankan tugas transformasi. Daftar ini disediakan untuk pengguna Amazon Quick Suite untuk dipilih. Daftar ini terbatas pada jenis yang didukung oleh SageMaker AI. Untuk informasi selengkapnya tentang jenis yang didukung, lihat TransformResourcesdi Panduan Pengembang SageMaker AI.
- defaultInstanceType
-
(Opsional) Jenis instans yang disajikan sebagai opsi default di wizard SageMaker AI di Quick Sight. Sertakan jenis contoh ini di
instanceTypes. - InstanceCount
-
(Opsional) Jumlah instans menentukan berapa banyak instance yang dipilih untuk disediakan SageMaker AI untuk menjalankan pekerjaan transformasi. Nilai ini harus berupa bilangan bulat positif.
- deskripsi
-
Bidang ini menyediakan tempat bagi orang yang memiliki model SageMaker AI untuk berkomunikasi dengan orang yang menggunakan model ini di Quick Sight. Gunakan bidang ini untuk memberikan petunjuk tentang berhasil menggunakan model ini. Misalnya, bidang ini dapat berisi informasi tentang memilih jenis instans yang efektif untuk dipilih dari daftar
instanceTypes, berdasarkan ukuran kumpulan data. Bidang ini dibatasi hingga 1.000 karakter. - versi
-
Versi skema, misalnya "
1.0".
Contoh berikut menunjukkan struktur JSON dalam file skema.
{ "inputContentType": "CSV", "outputContentType": "CSV", "input": [ { "name": "buying", "type": "STRING" }, { "name": "maint", "type": "STRING" }, { "name": "doors", "type": "INTEGER" }, { "name": "persons", "type": "INTEGER" }, { "name": "lug_boot", "type": "STRING" }, { "name": "safety", "type": "STRING" } ], "output": [ { "name": "Acceptability", "type": "STRING" } ], "description": "Use ml.m4.xlarge instance for small datasets, and ml.m4.4xlarge for datasets over 10 GB", "version": "1.0", "instanceCount": 1, "instanceTypes": [ "ml.m4.xlarge", "ml.m4.4xlarge" ], "defaultInstanceType": "ml.m4.xlarge" }
Struktur file skema terkait dengan jenis model yang digunakan dalam contoh yang disediakan oleh SageMaker AI.
Menambahkan model SageMaker AI ke kumpulan data Quick Sight Anda
Dengan menggunakan prosedur berikut, Anda dapat menambahkan model SageMaker AI yang telah dilatih sebelumnya ke kumpulan data Anda, sehingga Anda dapat menggunakan data prediktif dalam analisis dan dasbor.
Sebelum Anda mulai, sediakan item berikut:
-
Data yang ingin Anda gunakan untuk membangun dataset.
-
Nama model SageMaker AI yang ingin Anda gunakan untuk menambah dataset.
-
Skema model. Skema ini mencakup pemetaan nama bidang dan tipe data. Akan sangat membantu jika juga berisi pengaturan yang disarankan untuk jenis instance dan jumlah instance yang akan digunakan.
Untuk menambah dataset Amazon Quick Sight Anda dengan AI SageMaker
-
Buat kumpulan data baru dari halaman awal dengan memilih Datasets, lalu pilih Dataset baru.
Anda juga dapat mengedit kumpulan data yang ada.
-
Pilih Augment dengan SageMaker pada layar persiapan data.
-
Untuk Pilih model Anda, pilih pengaturan berikut:
-
Model — Pilih model SageMaker AI yang akan digunakan untuk menyimpulkan bidang.
-
Nama — Berikan nama deskriptif untuk model.
-
Skema - Unggah file skema JSON yang disediakan untuk model.
-
Pengaturan lanjutan — QuickSight merekomendasikan default yang dipilih berdasarkan kumpulan data Anda. Anda dapat menggunakan pengaturan runtime tertentu untuk menyeimbangkan kecepatan dan biaya pekerjaan Anda. Untuk melakukan ini, masukkan jenis instans SageMaker AI ML untuk tipe Instance dan jumlah instance untuk Count.
Pilih Next untuk melanjutkan.
-
-
Untuk input Tinjauan, tinjau bidang yang dipetakan ke kumpulan data Anda. Quick Sight mencoba untuk secara otomatis memetakan bidang dalam skema Anda ke bidang dalam kumpulan data Anda. Anda dapat membuat perubahan di sini jika pemetaan perlu penyesuaian.
Pilih Next untuk melanjutkan.
-
Untuk keluaran Tinjauan, lihat bidang yang ditambahkan ke kumpulan data Anda.
Pilih Simpan dan siapkan data untuk mengonfirmasi pilihan Anda.
-
Untuk menyegarkan data, pilih kumpulan data untuk melihat detail. Kemudian pilih Refresh Now untuk menyegarkan data secara manual, atau pilih Jadwalkan penyegaran untuk mengatur interval penyegaran reguler. Selama setiap penyegaran data, sistem secara otomatis menjalankan pekerjaan transformasi batch SageMaker AI untuk memperbarui bidang output dengan data baru.