Ringkasan Prasyarat dan batasan Arsitektur Alat Praktik terbaik Epik Sumber daya terkait

Buat model peramalan awal dingin dengan menggunakan DeepAR untuk deret waktu di SageMaker Amazon AI Studio Lab

Ivan Cui dan Eyal Shacham, Amazon Web Services

Ringkasan

Apakah Anda mengalokasikan sumber daya secara lebih efisien untuk lalu lintas web, memperkirakan permintaan pasien untuk kebutuhan staf, atau mengantisipasi penjualan produk perusahaan, peramalan adalah alat yang penting. Peramalan awal dingin membangun perkiraan untuk deret waktu yang memiliki sedikit data historis, seperti produk baru yang baru saja memasuki pasar ritel. Pola ini menggunakan algoritme peramalan Amazon SageMaker AI DeepAR untuk melatih model peramalan awal dingin dan menunjukkan cara melakukan peramalan pada item start dingin.

DeepAR adalah algoritma pembelajaran yang diawasi untuk meramalkan deret waktu skalar (satu dimensi) menggunakan jaringan saraf berulang (RNN). DeepAR mengambil pendekatan pelatihan satu model bersama-sama di semua rangkaian waktu deret waktu produk terkait.

Metode peramalan deret waktu tradisional seperti autoregressive integrated moving average (ARIMA) atau exponential smoothing (ETS) sangat bergantung pada deret waktu historis dari setiap produk individu. Oleh karena itu, metode tersebut tidak efektif untuk peramalan awal dingin. Ketika kumpulan data Anda berisi ratusan deret waktu terkait, DeepAR mengungguli metode ARIMA dan ETS standar. Anda juga dapat menggunakan model terlatih untuk menghasilkan perkiraan untuk deret waktu baru yang mirip dengan deret waktu yang telah dilatihnya.

Prasyarat dan batasan

Prasyarat

Aktif Akun AWS.
Domain SageMaker AI Amazon.
Aplikasi lab Amazon SageMaker AI Studio atau Jupiter.
Bucket Amazon Simple Storage Service (Amazon S3) dengan izin baca dan tulis.
Pengetahuan tentang pemrograman dengan Python.
Pengetahuan tentang menggunakan notebook Jupyter.

Batasan

Memanggil model perkiraan tanpa titik data historis akan mengembalikan kesalahan. Memohon model dengan titik data historis minimal akan mengembalikan prediksi yang tidak akurat dengan keyakinan tinggi. Pola ini menyarankan pendekatan untuk menyelesaikan keterbatasan peramalan awal dingin yang diketahui ini.
Beberapa Layanan AWS tidak tersedia di semua Wilayah AWS. Untuk ketersediaan Wilayah, lihat layanan AWS menurut Wilayah. Untuk titik akhir tertentu, lihat Titik akhir dan kuota layanan, dan pilih tautan untuk layanan.

Versi produk

Python versi 3.10 atau yang lebih baru.
Notebook pola diuji di Amazon SageMaker AI Studio pada instance ml.t3.medium dengan kernel Python 3 (Data Science).

Arsitektur

Diagram berikut menunjukkan alur kerja dan komponen arsitektur untuk pola ini.

Alur kerja untuk membangun model peramalan awal dingin menggunakan SageMaker dan Amazon S3.

Alur kerja melakukan tugas-tugas berikut:

File input data pelatihan dan pengujian disintesis dan kemudian diunggah ke bucket Amazon S3. Data ini mencakup beberapa deret waktu dengan fitur kategoris dan dinamis, bersama dengan nilai target (untuk diprediksi). Notebook Jupyter memvisualisasikan data untuk lebih memahami persyaratan data pelatihan dan nilai prediksi yang diharapkan.
Pekerjaan tuner hyperparameters dibuat untuk melatih model dan menemukan model terbaik berdasarkan metrik yang telah ditentukan.
File input diunduh dari bucket Amazon S3 ke setiap instance pekerjaan penyetelan hyperparameters.
Setelah pekerjaan tuner memilih model terbaik berdasarkan ambang batas yang telah ditentukan tuner, model tersebut digunakan sebagai titik akhir AI. SageMaker
Model yang diterapkan kemudian siap untuk dipanggil di mana prediksinya divalidasi terhadap data pengujian.

Notebook menunjukkan seberapa baik model memprediksi nilai target ketika jumlah titik data historis yang memadai tersedia. Namun, ketika kami menggunakan model dengan titik data historis yang lebih sedikit (yang mewakili produk dingin), prediksi model tidak cocok dengan data pengujian asli bahkan dalam tingkat kepercayaan model. Dalam polanya, model baru dibangun untuk produk dingin di mana panjang konteks awalnya (titik prediksi) didefinisikan sebagai jumlah titik sejarah yang tersedia, dan model baru dilatih secara iteratif saat titik data baru diperoleh. Notebook menunjukkan bahwa model akan memiliki prediksi yang akurat selama jumlah titik data historis mendekati panjang konteksnya.

Alat

Layanan AWS

AWS Identity and Access Management (IAM) membantu Anda mengelola akses ke AWS sumber daya dengan aman dengan mengontrol siapa yang diautentikasi dan diberi wewenang untuk menggunakannya.
Amazon SageMaker AI adalah layanan pembelajaran mesin terkelola (ML) yang membantu Anda membangun dan melatih model ML, lalu menerapkannya ke lingkungan host yang siap produksi.
Amazon SageMaker AI Studio adalah lingkungan pengembangan terintegrasi (IDE) berbasis web untuk ML yang memungkinkan Anda membuat, melatih, men-debug, menerapkan, dan memantau model ML Anda.
Amazon Simple Storage Service (Amazon S3) adalah layanan penyimpanan objek berbasis cloud yang membantu Anda menyimpan, melindungi, dan mengambil sejumlah data.

Alat lainnya

Python adalah bahasa pemrograman komputer tujuan umum.

Repositori kode

Kode untuk pola ini tersedia di repositori GitHub DeepAR- ColdProduct -Pattern.

Praktik terbaik

Latih model Anda di lingkungan virtual, dan selalu gunakan kontrol versi untuk upaya reproduktifitas tertinggi.
Sertakan sebanyak mungkin fitur kategoris berkualitas tinggi untuk mendapatkan model prediktif tertinggi.
Pastikan bahwa metadata berisi item kategoris yang serupa agar model dapat menyimpulkan prediksi produk start dingin secara memadai.
Jalankan pekerjaan tuning hyperparameter untuk mendapatkan model prediktif tertinggi.
Dalam pola ini, model yang Anda buat memiliki panjang konteks 24 jam, yang berarti akan memprediksi 24 jam ke depan. Jika Anda mencoba memprediksi 24 jam ke depan ketika Anda memiliki data kurang dari 24 jam secara historis, akurasi prediksi model menurun secara linier berdasarkan jumlah titik data historis. Untuk mengurangi masalah ini, buat model baru untuk setiap set titik data historis hingga angka ini mencapai panjang prediksi (konteks) yang diinginkan. Misalnya, mulailah dengan model panjang konteks 2 jam, kemudian tingkatkan model secara progresif menjadi 4 jam, 8 jam, 16 jam, dan 24 jam.

Epik

Tugas	Deskripsi	Keterampilan yang dibutuhkan
Mulai lingkungan notebook Anda.	Masuk ke Konsol Manajemen AWS, dan buka beranda SageMaker AI Studio. Kemudian pilih Open Studio. Di panel navigasi kiri, pilih ikon Studio Classic di Aplikasi. Kemudian, pilih tombol Buka pada daftar Aplikasi. Untuk informasi selengkapnya, lihat Meluncurkan Amazon SageMaker AI Studio di dokumentasi SageMaker AI.	Ilmuwan data

Tugas Deskripsi Keterampilan yang dibutuhkan

Tugas	Deskripsi	Keterampilan yang dibutuhkan
Siapkan lingkungan virtual Anda untuk pelatihan model.	Untuk mengatur lingkungan virtual Anda untuk pelatihan model, lakukan hal berikut: Unduh `deepar_synthetic.ipynb` buku catatan dari GitHub repositori pola ini ke mesin lokal Anda. Di Amazon SageMaker AI Studio Classic, pilih ikon Unggah File dari bilah menu Studio Classic dan pilih buku catatan yang diunduh. Pilih buku catatan di File Browser di panel navigasi kiri. Ikuti petunjuk untuk menyiapkan lingkungan notebook. Pilih Data Science 3.0 Image dan Python 3 Kernel. Untuk informasi selengkapnya, lihat Mengunggah File ke SageMaker AI Studio Classic dalam dokumentasi SageMaker AI.	Ilmuwan data
Buat dan validasi model peramalan.	Ikuti instruksi di buku catatan untuk membuat data pelatihan dan pengujian, melatih model, dan kemudian memanggil model. Amati seberapa akurat prediksi model ketika dilengkapi dengan titik data historis yang memadai.	Ilmuwan data

Siapkan lingkungan virtual Anda untuk pelatihan model.

Untuk mengatur lingkungan virtual Anda untuk pelatihan model, lakukan hal berikut:

Unduh deepar_synthetic.ipynb buku catatan dari GitHub repositori pola ini ke mesin lokal Anda.
Di Amazon SageMaker AI Studio Classic, pilih ikon Unggah File dari bilah menu Studio Classic dan pilih buku catatan yang diunduh.
Pilih buku catatan di File Browser di panel navigasi kiri. Ikuti petunjuk untuk menyiapkan lingkungan notebook. Pilih Data Science 3.0 Image dan Python 3 Kernel.

Untuk informasi selengkapnya, lihat Mengunggah File ke SageMaker AI Studio Classic dalam dokumentasi SageMaker AI.

Ilmuwan data

Buat dan validasi model peramalan.

Ikuti instruksi di buku catatan untuk membuat data pelatihan dan pengujian, melatih model, dan kemudian memanggil model.
Amati seberapa akurat prediksi model ketika dilengkapi dengan titik data historis yang memadai.

Ilmuwan data

Sumber daya terkait

Awas Javascript dinonaktifkan atau tidak tersedia di browser Anda.

Untuk menggunakan Dokumentasi AWS, Javascript harus diaktifkan. Lihat halaman Bantuan browser Anda untuk petunjuk.

Konvensi Dokumen

Secara otomatis mengekstrak konten dari file PDF

Membangun MLOps alur kerja menggunakan SageMaker AI dan Azure DevOps