View a markdown version of this page

Strategi data - AWS Bimbingan Preskriptif

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Strategi data

Strategi data yang terdefinisi dengan baik sangat penting untuk keberhasilan adopsi AI generatif. Bagian ini membahas bagaimana strategi data memainkan peran penting pada setiap tahap perjalanan adopsi AI generatif. Ini juga menguraikan pertimbangan utama di berbagai dimensi implementasi. Untuk informasi lebih lanjut tentang tahapan perjalanan AI generatif, lihat Model kematangan untuk mengadopsi AI generatif AWS tentang AWS Panduan Preskriptif.

Perjalanan adopsi AI generatif adalah perkembangan terstruktur melalui empat tahap kunci:

  • Envision — Organizations mengeksplorasi konsep AI generatif, membangun kesadaran, dan mengidentifikasi kasus penggunaan potensial.

  • Eksperimen - Organizations memvalidasi potensi AI generatif melalui proyek percontohan terstruktur dan bukti konsep, sambil membangun kemampuan teknis inti dan kerangka kerja dasar untuk implementasi.

  • Launch - Organizations secara sistematis menerapkan solusi AI generatif siap produksi dengan mekanisme tata kelola, pemantauan, dan dukungan yang kuat untuk memberikan nilai yang konsisten dan keunggulan operasional sambil mempertahankan standar keamanan dan kepatuhan.

  • Scale — Organizations membangun kemampuan AI generatif di seluruh perusahaan melalui komponen yang dapat digunakan kembali, pola standar, dan platform swalayan untuk mempercepat adopsi sambil mempertahankan tata kelola otomatis dan mendorong inovasi.

Di semua tahap, AWS menekankan pendekatan holistik, menyelaraskan strategi dengan investasi infrastruktur, kebijakan tata kelola, kerangka kerja keamanan, dan praktik terbaik operasional untuk mempromosikan penyebaran AI yang bertanggung jawab dan terukur. Setiap tahap membutuhkan penyelarasan di enam pilar adopsi dasar: Bisnis, Orang, Tata Kelola, Platform, Keamanan, dan Operasi. Pilar-pilar ini selaras dengan dan memperluas AWS Cloud Adoption Framework (AWS CAF) untuk memenuhi kebutuhan AI generatif.

Bagian ini membahas tahapan model kematangan berikut secara lebih rinci:

Level 1: Bayangkan

Pada tahap Envision, organisasi fokus pada perencanaan dengan mengidentifikasi kasus penggunaan yang sesuai, memetakan sumber data yang diperlukan untuk implementasi, dan menetapkan persyaratan keamanan dan akses data dasar untuk fase eksperimen mendatang.

Pada tahap ini, berikut ini adalah kriteria penyelarasan untuk pilar adopsi:

  • Bisnis — Identifikasi kasus penggunaan strategis untuk AI generatif yang selaras dengan tujuan perusahaan. Menilai di mana data bernilai tinggi berada dan aksesibilitasnya.

  • Orang - Menumbuhkan budaya berbasis data dengan mendidik kepemimpinan dan pemangku kepentingan tentang pentingnya data dalam adopsi AI generatif.

  • Tata Kelola — Melakukan audit data awal untuk mengevaluasi kepatuhan, masalah privasi, dan potensi risiko etika. Mengembangkan kebijakan awal tentang transparansi dan akuntabilitas AI.

  • Platform — Menilai infrastruktur data yang ada, membuat katalog sumber data internal dan eksternal, dan mengevaluasi kualitas data untuk kelayakan AI generatif.

  • Keamanan — Mulai menerapkan kontrol akses dan prinsip hak istimewa paling tidak untuk akses data. Pastikan bahwa model AI generatif hanya dapat mengambil informasi yang diizinkan oleh pengguna untuk diakses.

  • Operasi — Tentukan pendekatan terstruktur untuk mengumpulkan, membersihkan, dan memberi label data untuk eksperimen AI generatif. Buat loop umpan balik awal untuk pemantauan data.

Level 2: Eksperimen

Selama fase Eksperimen, organisasi memvalidasi ketersediaan dan kesesuaian data yang diperlukan untuk mendukung implementasi kasus penggunaan yang diidentifikasi. Secara paralel, buat kerangka kerja tata kelola data minimum yang layak untuk mendukung penggunaan data nyata dalam pembuktian konsep. Anda dapat menyempurnakan model foundation yang dipilih atau menggunakan model yang dikombinasikan dengan off-the-shelf pendekatan Retrieval Augmented Generation (RAG).

Pada tahap ini, berikut ini adalah kriteria penyelarasan untuk pilar adopsi:

  • Bisnis — Tentukan kriteria keberhasilan yang jelas untuk proyek percontohan, dan pastikan ketersediaan data memenuhi kebutuhan setiap kasus penggunaan.

  • Orang — Membentuk tim lintas fungsi yang mencakup insinyur data, spesialis AI, dan pakar domain. Tim ini bertanggung jawab untuk memvalidasi kualitas data dan penyelarasan model dengan persyaratan bisnis.

  • Tata Kelola — Menyusun kerangka kerja untuk tata kelola data AI generatif. Minimal, kerangka kerja harus membahas kepatuhan terhadap peraturan dan pedoman AI yang bertanggung jawab.

  • Platform — Menerapkan upaya integrasi data tahap awal, termasuk jaringan data terstruktur dan tidak terstruktur. Siapkan database vektor untuk eksperimen RAG.

  • Keamanan — Menegakkan izin data yang ketat dan pemeriksaan kepatuhan. Pastikan PII atau informasi sensitif lainnya disamarkan atau dianonimkan sebelum pelatihan model.

  • Operasi — Untuk mempersiapkan rilis produksi, buat metrik kualitas untuk mengidentifikasi kesenjangan.

Level 3: Peluncuran

Pada tahap Peluncuran, solusi AI generatif beralih dari eksperimen ke penerapan skala penuh. Pada titik ini, integrasi sepenuhnya diterapkan, dan kerangka kerja pemantauan yang kuat dibentuk untuk melacak kinerja, perilaku model, dan kualitas data. Langkah-langkah keamanan dan kepatuhan yang komprehensif diberlakukan untuk mendukung privasi data, keselamatan, dan kepatuhan terhadap peraturan.

Pada tahap ini, berikut ini adalah kriteria penyelarasan untuk pilar adopsi:

  • Bisnis — Mengukur efisiensi operasional dan nilai bisnis. Optimalkan biaya operasional dan penggunaan sumber daya.

  • People — Melatih tim operasional tentang manajemen dan pemantauan model AI generatif. Gunakan proses kurasi data yang tepat.

  • Tata Kelola — Perbaiki kerangka kerja untuk tata kelola data AI generatif. Mengatasi kepatuhan terhadap peraturan, bias model, dan pedoman AI yang bertanggung jawab. Menetapkan audit berkelanjutan dari jaringan data AI generatif untuk memvalidasi kepatuhan terhadap peraturan yang berkembang.

  • Platform — Optimalkan infrastruktur yang dapat diskalakan untuk mendukung konsumsi data real-time, pencarian vektor, dan fine-tuning jika diperlukan.

  • Keamanan — Menyebarkan enkripsi, kontrol akses berbasis peran (RBAC), dan model akses hak istimewa terkecil. Anda dapat menggunakan Amazon Q Business untuk mengontrol akses data dan memastikan bahwa solusi AI generatif hanya mengambil data yang diizinkan untuk diakses pengguna.

  • Operasi - Menetapkan praktik pengamatan data. Lacak garis keturunan data, asal, dan metrik kualitas untuk mengidentifikasi celah sebelum penskalaan.

Level 4: Skala

Pada tahap Skala, fokus beralih ke otomatisasi, standardisasi, dan adopsi di seluruh perusahaan. Organizations membuat pipeline data yang dapat digunakan kembali, menerapkan kerangka kerja tata kelola yang dapat diskalakan, dan menegakkan kebijakan yang kuat untuk mendukung aksesibilitas, keamanan, dan kepatuhan data. Fase ini mendemokratisasikan produk data. Ini membantu tim di seluruh organisasi untuk mengembangkan dan menerapkan solusi AI generatif baru dengan mulus sambil mempertahankan konsistensi, kualitas, dan kontrol.

Pada tahap ini, berikut ini adalah kriteria penyelarasan untuk pilar adopsi:

  • Bisnis — Sejajarkan proyek AI generatif dengan tujuan bisnis jangka panjang. Fokus pada pertumbuhan pendapatan, pengurangan biaya, dan kepuasan pelanggan.

  • People - Mengembangkan program literasi AI di seluruh perusahaan dan menanamkan adopsi AI dalam fungsi bisnis melalui AI Centers of Excellence (). CoEs

  • Tata Kelola — Standarisasi kebijakan tata kelola AI lintas departemen untuk mempromosikan konsistensi dalam pengambilan keputusan AI.

  • Platform — Investasikan platform data AI yang dapat diskalakan yang menggunakan solusi cloud-native untuk akses dan pemrosesan data gabungan.

  • Keamanan — Menerapkan pemantauan kepatuhan otomatis, pencegahan kehilangan data yang kuat (DLP), dan penilaian ancaman berkelanjutan.

  • Operasi - Menetapkan kerangka kerja observabilitas AI. Integrasikan loop umpan balik, deteksi anomali, dan analisis kinerja model dalam skala besar.