

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Kerangka strategi data
<a name="framework"></a>

Kerangka strategi data yang disajikan dalam panduan ini didasarkan pada prinsip-prinsip arsitektur data dan analitik modern berikut:

1. Gunakan **lapisan penyimpanan yang terintegrasi, hemat biaya, dan terukur**, sehingga setiap produsen data dan konsumen memiliki kemampuan teknis untuk berinteraksi dengan data.

1. **Keamanan adalah wajib**. Menerapkan aturan privasi data, memberikan perlindungan data dengan enkripsi, mengaktifkan audit, dan memberikan kepatuhan otomatis.

1. **Mengatur data untuk membagikannya ke** seluruh perusahaan. Berikan katalog data unik dan glosarium bisnis sehingga pengguna dapat menemukan dan menggunakan data yang mereka butuhkan.

1. Pilih **layanan yang tepat untuk pekerjaan yang tepat.** Pertimbangkan fungsionalitas, skalabilitas, latensi data, upaya yang diperlukan untuk menjalankan layanan, ketahanan, integrasi, dan otomatisasi saat Anda memilih komponen.

1. Gunakan **kecerdasan buatan (AI) dan pembelajaran mesin (ML)**.

1. Menyediakan **literasi data** dan alat dengan **abstraksi untuk pebisnis**.

1. **Uji hipotesis** inisiatif data Anda dan **ukur hasilnya**.

Kerangka data menggunakan pendekatan [bekerja kembali dari pelanggan](https://docs.aws.amazon.com/whitepapers/latest/building-cloud-operating-model/step-1.-work-backwards-from-the-customer.html). Metode ini, yang digunakan di Amazon dan AWS, mengikuti lima langkah:

1. Wawancarai pengguna di area bisnis perusahaan Anda. Pilih masalah dan peluang bisnis yang dapat diatasi dengan inisiatif data.

1. Tentukan hasil bisnis yang diharapkan dalam area bisnis.

1. Prioritaskan inisiatif yang memiliki dampak bisnis tertinggi.

1. Identifikasi berbagi data dan kemampuan teknis untuk mencapai hasil bisnis, dan kelompokkan mereka dalam proyek pemberdayaan.

1. Identifikasi peran dan tanggung jawab untuk memungkinkan inisiatif berbasis data, dan diskusikan pembangunan tim multidisiplin.

Bagian berikut membahas tahapan utama dari proses ini:
+ [Penemuan bisnis](business-discovery.md)
+ [Menilai ketersediaan data](data-availability.md)
+ [Penilaian teknis](technical-assessment.md)
+ [Menyelaraskan cerita dengan tujuan bisnis](align-stories-goals.md)

# Penemuan bisnis
<a name="business-discovery"></a>

Untuk melakukan wawancara bisnis secara efektif, penting untuk memahami tujuan**** perusahaan Anda yang bergantung pada data pada tingkat tinggi. Misalnya, tujuan ini mungkin termasuk:
+ Meningkatkan kelincahan bisnis
+ Mengaktifkan inovasi canggih
+ Menjadi Customer-Centric
+ Meningkatkan pangsa pasar
+ Mencapai pasar global
+ Meluncurkan platform pelanggan baru  

Setelah Anda menyelaraskan tujuan perusahaan Anda, Anda harus berbicara dengan anggota tim di bidang bisnis. Minimal, fokuslah pada area yang memengaruhi tujuan utama perusahaan Anda, tetapi jika Anda memiliki kesempatan, bicaralah dengan anggota tim di setiap area bisnis.

Dalam percakapan penemuan ini, Anda ingin mempelajari tujuan dari setiap area bisnis atau unit bisnis (BU), metrik yang mereka gunakan untuk mengukur area mereka, dan bagaimana penggunaan data dapat memengaruhi tujuan mereka. Berikut adalah beberapa contoh pertanyaan yang mungkin Anda tanyakan:
+ Apa tujuan utama BU Anda?
+ Bagaimana BU Anda berkontribusi untuk mencapai tujuan perusahaan?
+ Apa proyek utama dalam BU Anda?
+ Bagaimana setiap proyek bergantung pada data?

Penting untuk mendapatkan visibilitas ke dalam proyek-proyek utama, garis waktu mereka, bagaimana mereka bergantung pada data, dan bagaimana mereka menyelaraskan dengan, atau mendukung, tujuan perusahaan. Contoh proyek meliputi:
+ Peningkatan pengalaman pelanggan melalui interaksi omnichannel yang konsisten, dan membangun kesadaran akan tindakan dan masalah pelanggan terbaru
+ Membuat mesin rekomendasi berdasarkan perilaku pelanggan untuk meningkatkan tingkat konversi dan keterlibatan
+ Untuk produk keuangan online, perhitungan risiko lebih cepat untuk menyetujui kredit pelanggan, untuk menghindari terlalu lama dan kehilangan nasabah ke lembaga keuangan lain
+ Akurasi perkiraan penjualan yang lebih baik untuk mengurangi kehilangan pasokan
+ Mengurangi kerugian penipuan dengan mengoptimalkan deteksi penipuan secara real time

# Menilai ketersediaan data untuk bisnis
<a name="data-availability"></a>

Gunakan pertanyaan tindak lanjut seperti berikut ini untuk memahami kesenjangan antara keadaan ketersediaan data saat ini dan apa yang ingin dicapai BU:
+ Bagaimana data mendukung proyek Anda dan tujuan bisnis Anda saat ini?
+ Apakah sulit untuk mendapatkan data yang tepat untuk digunakan dan membuat keputusan?
+ Seberapa otomatis proses untuk mendapatkan data? Apa langkah-langkah manual yang terlibat, jika ada?
+ Ketika data tersedia, dapatkah tim Anda memahami dan bekerja dengannya, atau apakah Anda harus menerjemahkan data ke domain bisnis Anda?
+ Apakah Anda menerima data tepat waktu untuk mendukung keputusan bisnis Anda?
  + Bagaimana mendapatkan data lebih cepat meningkatkan bisnis Anda? Untuk mendorong peningkatan, seberapa cepat data harus tersedia?
+ Apakah pengambil keputusan Anda kehilangan data?
  + Jika ya, data mana yang hilang?
  + Apa keuntungan memiliki data ini?
  + Bagaimana proyek utama Anda dipengaruhi oleh data yang hilang?
+ Apakah Anda memiliki tantangan yang terkait dengan peraturan kepatuhan seperti Peraturan Perlindungan Data Umum (GDPR) atau standar lainnya?
+ Apakah BU Anda memiliki produk data yang tersedia untuk memungkinkan aplikasi mengambil tindakan?
+ Apakah area Anda dapat memberikan model pembelajaran mesin untuk meningkatkan bisnis Anda? Jika tidak, apakah orang lain BUs mendukung bisnis Anda di bidang ini?
+ Apakah Anda mengetahui adanya data di dalam perusahaan yang saat ini tidak tersedia untuk BU Anda tetapi akan mendukung proyek Anda atau mendorong peningkatan di wilayah Anda?
  + Apa mereka?
+ Apakah Anda mengandalkan kualitas data yang tersedia untuk wilayah Anda?
  + Apakah tim Anda melakukan proses pembersihan data Anda sendiri sebelum Anda menggunakan data?
  + Apakah tim Anda melakukan proses kualitas Anda sendiri sebelum Anda menggunakan data?
  + Ketika tim Anda bekerja pada ketersediaan data dan menghasilkan produk data baru untuk analisis, pengayaan, dan visi agregat, dapatkah mereka berbagi produk ini dengan yang lain BUs di perusahaan Anda?

# Penilaian teknis
<a name="technical-assessment"></a>

Penilaian teknis penting karena memberi Anda peta kemampuan teknis saat ini yang dimiliki perusahaan Anda. Penilaian tersebut mencakup tata kelola data, konsumsi data, transformasi data, berbagi data, platform pembelajaran mesin (ML), proses, dan otomatisasi. 

Berikut adalah contoh pertanyaan yang dapat Anda ajukan selama penilaian teknis, oleh tim. Anda dapat menambahkan pertanyaan berdasarkan konteks Anda.

## Tim rekayasa data
<a name="data-engineering"></a>
+ Apa tantangan saat ini yang terkait dengan menelan data untuk tim Anda? 
+ Apakah ada sumber data eksternal atau internal yang dibutuhkan tim Anda yang tidak tersedia untuk dikonsumsi? Mengapa mereka tidak tersedia?
+ Jenis sumber data apa yang Anda konsumsi data dari (misalnya, database MySQL, Salesforce API, file yang diterima, data navigasi situs web)?
+ Berapa lama waktu yang dibutuhkan untuk menelan data dari sumber data baru?
+ Apakah proses menelan data dari sumber baru otomatis?
+ Seberapa mudah bagi tim pengembangan untuk mempublikasikan data transaksional untuk analitik dari aplikasi mereka?
+ Apakah Anda memiliki alat untuk beban penuh atau beban tambahan (dalam batch atau batch mikro) dari sumber data Anda?
+ Apakah Anda memiliki alat change data capture (CDC) untuk beban berkelanjutan dari database Anda?
+ Apakah Anda memiliki opsi streaming data untuk konsumsi data?
+ Bagaimana Anda melakukan transformasi data untuk data batch dan real-time?
+ Bagaimana Anda mengelola orkestrasi alur kerja transformasi data?
+ Aktivitas apa yang paling sering Anda lakukan: penemuan dan katalogisasi data, konsumsi data, transformasi data, membantu analis bisnis, membantu ilmuwan data, tata kelola data, tim pelatihan, dan pengguna?
+ Ketika dataset dibuat, bagaimana itu diklasifikasikan untuk privasi data? Bagaimana Anda membersihkannya agar berarti bagi konsumen internal Anda?
+ Apakah tata kelola data dan pengelolaan data terpusat atau terdesentralisasi?
+ Bagaimana Anda menegakkan tata kelola data? Apakah Anda memiliki proses otomatis?
+ Siapa pemilik dan pelayan data di setiap fase pipeline: konsumsi data, pemrosesan data, berbagi data, dan penggunaan data? Apakah ada konsep domain data untuk menentukan pemilik dan pelayan?
+ Apa tantangan utama dalam berbagi kumpulan data dalam organisasi dengan kontrol akses?
+ Apakah Anda menggunakan infrastruktur sebagai kode (IAc) untuk menyebarkan dan mengelola pipeline data?
+ Apakah Anda memiliki strategi data lake? 
  + Apakah data lake Anda didistribusikan atau terpusat di seluruh organisasi? 
+ Bagaimana katalog data Anda diatur? Apakah di seluruh perusahaan atau per area?
+ Apakah Anda memiliki pendekatan data lakehouse?
+ Apakah Anda menggunakan atau berencana untuk menggunakan konsep data mesh?

Anda dapat melengkapi pertanyaan-pertanyaan ini dengan [AWS Well-Architected Framework](https://docs.aws.amazon.com/wellarchitected/latest/analytics-lens/analytics-lens.html) Data Analytics Lens.

## Tim analisis bisnis
<a name="business-analysis"></a>
+ Bagaimana Anda menggambarkan karakteristik berikut dari data yang tersedia untuk pekerjaan Anda:
  + Kebersihan
  + Kualitas
  + Klasifikasi
  + Metadata
  + Arti bisnis
+ Apakah tim Anda berpartisipasi dalam definisi glosarium bisnis dari kumpulan data di domain Anda?
+ Apa dampak dari tidak memiliki data yang Anda butuhkan untuk melakukan pekerjaan Anda pada saat Anda membutuhkannya?
+ Apakah Anda memiliki contoh skenario di mana Anda tidak memiliki akses ke data atau terlalu lama untuk mendapatkan data? Berapa lama waktu yang dibutuhkan untuk mendapatkan data yang Anda butuhkan?
+ Seberapa sering Anda menggunakan dataset yang lebih kecil dari yang Anda butuhkan karena masalah teknis atau waktu pemrosesan?
+ Apakah Anda memiliki lingkungan kotak pasir dengan timbangan dan alat yang Anda butuhkan?
+ Bisakah Anda melakukan A/B pengujian untuk memvalidasi hipotesis?
+ Apakah Anda kehilangan alat yang Anda butuhkan untuk melakukan pekerjaan Anda?
  + Jenis alat apa?
  + Mengapa mereka tidak tersedia?
+ Apakah ada kegiatan penting yang Anda tidak punya waktu untuk melakukan?
+ Aktivitas apa yang paling banyak menghabiskan waktu Anda?
+ Bagaimana pandangan bisnis Anda disegarkan?
  + Apakah mereka dijadwalkan dan dikelola secara otomatis?
+ Dalam skenario apa Anda memerlukan data yang lebih segar daripada data yang Anda dapatkan?
+ Bagaimana Anda berbagi analisis? Alat dan proses apa yang Anda gunakan untuk berbagi?
+ Apakah Anda sering membuat produk data baru dan membuatnya tersedia untuk tim lain?
  + Bagaimana proses Anda untuk berbagi produk data dengan area bisnis lain atau di seluruh perusahaan?

## Tim ilmu data (untuk menentukan penerapan model)
<a name="data-science"></a>
+ Bagaimana Anda menggambarkan karakteristik berikut dari data yang tersedia untuk pekerjaan Anda:
  + Kebersihan
  + Kualitas
  + Klasifikasi
  + Metadata
  + Arti
+ Apakah Anda memiliki alat otomatis untuk melatih, menguji, dan menerapkan model pembelajaran mesin (ML)?
+ Apakah Anda memiliki opsi ukuran mesin untuk melakukan setiap langkah dalam pembuatan dan penerapan model ML?
+ Bagaimana model ML dimasukkan ke dalam produksi?
+ Apa langkah-langkah untuk menerapkan model baru? Seberapa otomatis mereka?
+ Apakah Anda memiliki komponen untuk melatih, menguji, dan menerapkan model ML untuk data batch dan real-time? 
+ Bisakah Anda menggunakan dan memproses kumpulan data yang cukup besar untuk mewakili data yang Anda butuhkan untuk membuat model?
+ Bagaimana Anda memantau model Anda dan mengambil tindakan untuk melatihnya kembali?
+ Bagaimana Anda mengukur dampak model terhadap bisnis Anda?
+ Bisakah Anda melakukan A/B pengujian untuk memvalidasi hipotesis untuk tim bisnis?

Untuk pertanyaan tambahan, lihat Lensa [Machine Learning Kerangka AWS Well-Architected](https://docs.aws.amazon.com/wellarchitected/latest/machine-learning-lens/machine-learning-lens.html) Framework.

# Menyelaraskan cerita dengan tujuan bisnis
<a name="align-stories-goals"></a>

Setelah Anda melakukan penilaian bisnis dan teknis, kami sarankan Anda membuat diagram yang mencakup serangkaian cerita untuk setiap tingkat kematangan penggunaan data. Visualisasi ini memudahkan untuk menyelaraskan penggunaan data Anda dengan tujuan bisnis perusahaan Anda. Misalnya, hasil bisnis deteksi penipuan hampir real-time membutuhkan cerita kemampuan tindakan yang mendekati waktu nyata.  

Ceritanya adalah kemampuan teknis, mekanisme berbagi data, orang, dan proses yang diperlukan untuk mencapai tujuan bisnis. Anda menulis hasil bisnis di sisi kanan diagram berdasarkan wawancara penemuan bisnis Anda, dan mengisi status setiap cerita berdasarkan penilaian teknis. Anda kemudian dapat memilih cerita yang harus dikerjakan perusahaan Anda, dan membuat peta jalan.  

Diagram berikut menunjukkan apakah setiap cerita diperlukan, berdasarkan hasil bisnis. Ini juga menunjukkan status terkini dari setiap cerita berdasarkan informasi yang Anda kumpulkan dalam penilaian teknis. Diagram biasanya diikuti oleh laporan yang menjelaskan setiap status secara rinci.

![\[Memvisualisasikan kisah pemberdayaan untuk setiap fase kematangan data\]](http://docs.aws.amazon.com/id_id/prescriptive-guidance/latest/strategy-aws-data/images/enablement-stories.png)


Anda bekerja kembali dari sisi kanan (*hasil bisnis*) ke sisi kiri untuk mengaktifkan cerita. Misalnya, untuk mengaktifkan cerita di tahap ketiga (*Wawasan dan laporan*), Anda harus mengaktifkan dependensinya di tahap kedua (*Data lake*) dan tahap pertama (*Data* foundation).

Berdasarkan penilaian dan persyaratan untuk hasil bisnis, setiap cerita diklasifikasikan sebagai hijau, kuning, abu-abu, atau merah.
+ Hijau berarti bahwa cerita sudah ada dan dapat skala untuk memberikan hasil bisnis. Misalnya, dalam diagram, cerita konsumsi CDC pada tahap pertama (*Data foundation*) berwarna hijau, yang berarti bahwa perusahaan memiliki alat dan proses untuk menyelesaikan cerita untuk sumber data yang mereka miliki. Hasil bisnis *pengalaman pelanggan yang lebih baik* memerlukan pengambilan data pelanggan yang relevan dan memperkayanya dengan data lain di dalam perusahaan, untuk lebih memahami pelanggan dan memberikan personalisasi.
+ Kuning berarti bahwa kemampuan atau proses ada, tetapi tidak berfungsi penuh atau tidak akan mendukung skala yang dibutuhkan hasil bisnis. Misalnya, dalam diagram, cerita *katalog data terpusat* pada tahap kedua (*Data lake*) berwarna kuning. Ini menunjukkan bahwa perusahaan memiliki katalog data pusat, tetapi katalog tidak sepenuhnya diisi dengan metadata yang diperlukan oleh tahapan lain, atau hanya digunakan oleh beberapa area bisnis. Klasifikasi ini berdampak pada kemampuan berbagi data pada tahap (*Wawasan dan laporan*) berikutnya.
+ Gray berarti ceritanya tidak diperlukan.
+ Merah berarti bahwa cerita diperlukan oleh hasil bisnis tetapi belum diterapkan. Misalnya, dalam diagram, cerita *berbagi data* di tahap *Wawasan dan laporan* berwarna merah. Membuat model pembelajaran mesin yang komprehensif untuk rekomendasi pelanggan memerlukan pengelompokan kumpulan data, yang membutuhkan kemampuan berbagi data. Namun, cerita ini belum diimplementasikan. Dalam contoh ini, berbagi data juga memerlukan kemampuan di tahap *Data lake* agar berfungsi penuh, setidaknya untuk kumpulan data yang merupakan bagian dari model, tetapi Anda dapat melihat bahwa *pengelolaan data* belum diterapkan.

Cerita *Privasi, perlindungan, dan kepatuhan data* (dalam tahap *Data lake*) selalu diperlukan, dan menjadi lebih relevan karena peraturan privasi data didorong oleh persyaratan perlindungan data baru. [https://www.leyes.congreso.gob.pe/Documentos/Leyes/29733.pdf](https://www.leyes.congreso.gob.pe/Documentos/Leyes/29733.pdf)