

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

# Quadro di strategia dei dati
<a name="framework"></a>

Il framework di strategia dei dati presentato in questa guida si basa sui seguenti principi della moderna architettura di dati e analisi:

1. Utilizza un **livello di storage integrato, conveniente e scalabile,** in modo che ogni produttore e consumatore di dati abbia le capacità tecniche per interagire con i dati.

1. **La sicurezza** è obbligatoria. Applica le regole sulla privacy dei dati, fornisci protezione dei dati con crittografia, abilita il controllo e fornisci la conformità automatizzata.

1. **Gestisci i dati per condividerli con** tutta l'azienda. Fornisci un catalogo di dati unico e un glossario aziendale in modo che gli utenti possano trovare e utilizzare i dati di cui hanno bisogno.

1. Seleziona il **servizio giusto per il lavoro giusto**. Quando scegli un componente, considera la funzionalità, la scalabilità, la latenza dei dati, lo sforzo richiesto per eseguire il servizio, la resilienza, l'integrazione e l'automazione.

1. Usa l'**intelligenza artificiale (AI) e l'apprendimento automatico (ML**).

1. Fornisci agli uomini d'**affari **l'alfabetizzazione dei dati** e gli strumenti con astrazioni**.

1. **Metti alla prova le ipotesi** **delle tue iniziative relative ai dati e misurane i risultati.**

Il framework dei dati utilizza l'approccio basato [sulla collaborazione con il cliente](https://docs.aws.amazon.com/whitepapers/latest/building-cloud-operating-model/step-1.-work-backwards-from-the-customer.html). Questo metodo, utilizzato in Amazon AWS, segue cinque passaggi:

1. Intervistate gli utenti delle aree di business della vostra azienda. Seleziona i problemi e le opportunità aziendali che potrebbero essere risolti con iniziative relative ai dati.

1. Definisci i risultati aziendali attesi all'interno delle aree aziendali.

1. Dai priorità alle iniziative che hanno il massimo impatto aziendale.

1. Identifica la condivisione dei dati e le capacità tecniche per raggiungere risultati di business e raggruppali in progetti di abilitazione.

1. Identifica ruoli e responsabilità per abilitare iniziative basate sui dati e discuti del team building multidisciplinare.

Le seguenti sezioni illustrano le fasi principali di questo processo:
+ [Scoperta aziendale](business-discovery.md)
+ [Valutazione della disponibilità dei dati](data-availability.md)
+ [Valutazione tecnica](technical-assessment.md)
+ [Allineamento delle storie agli obiettivi aziendali](align-stories-goals.md)

# Scoperta aziendale
<a name="business-discovery"></a>

Per eseguire interviste aziendali in modo efficace, è importante comprendere gli obiettivi della propria**** azienda che dipendono da dati di alto livello. Ad esempio, questi obiettivi potrebbero includere:
+ Migliorare l'agilità aziendale
+ Favorire l'innovazione avanzata
+ Diventare incentrati sul cliente
+ Aumento della quota di mercato
+ Raggiungere i mercati globali
+ Lancio di una nuova piattaforma per i clienti  

Dopo aver definito gli obiettivi della tua azienda, dovresti parlare con i membri del team delle aree aziendali. Concentrati almeno sulle aree che influiscono sugli obiettivi principali della tua azienda, ma se ne hai la possibilità, parla con i membri del team di ogni area aziendale.

In questa conversazione di esplorazione, vorrete conoscere gli obiettivi di ogni area aziendale o unità aziendale (BU), le metriche utilizzate per misurare la rispettiva area e come l'utilizzo dei dati può influire sui loro obiettivi. Ecco alcuni esempi di domande che potresti porre:
+ Quali sono gli obiettivi principali della tua BU?
+ In che modo la tua BU contribuirà al raggiungimento degli obiettivi dell'azienda?
+ Quali sono i progetti chiave della tua BU?
+ In che modo ogni progetto dipende dai dati?

È importante ottenere visibilità sui progetti chiave, sulla loro tempistica, sul modo in cui dipendono dai dati e su come si allineano o supportano gli obiettivi dell'azienda. Alcuni esempi di progetti includono:
+ Miglioramenti all'esperienza del cliente attraverso un'interazione omnicanale coerente e la creazione di consapevolezza delle azioni e dei problemi più recenti dei clienti
+ Creazione di un motore di raccomandazione basato sul comportamento dei clienti per aumentare il tasso di conversione e il coinvolgimento
+ Per quanto riguarda i prodotti finanziari online, un calcolo più rapido del rischio per l'approvazione del credito ai clienti, per evitare di impiegare troppo tempo e di perdere il cliente a favore di un altro istituto finanziario
+ Migliore precisione delle previsioni di vendita per ridurre le perdite di fornitura
+ Ridurre le perdite dovute alle frodi ottimizzando il rilevamento delle frodi in tempo reale

# Valutazione della disponibilità dei dati per le aziende
<a name="data-availability"></a>

Utilizza domande di follow-up come le seguenti per comprendere le lacune tra lo stato attuale della disponibilità dei dati e gli obiettivi della BU:
+ In che modo i dati supportano i tuoi progetti e i tuoi attuali obiettivi aziendali?
+ È difficile ottenere i dati giusti da utilizzare e prendere decisioni?
+ Quanto è automatizzato il processo per ottenere i dati? Quali sono le fasi manuali necessarie, se ce ne sono?
+ Quando i dati diventano disponibili, il tuo team è in grado di comprenderli e utilizzarli oppure devi tradurli nel tuo dominio aziendale?
+ Ricevete dati tempestivamente per supportare le vostre decisioni aziendali?
  + In che modo ottenere dati più velocemente migliorerebbe la tua attività? Per favorire i miglioramenti, quanto velocemente dovrebbero essere disponibili i dati?
+ Ai tuoi decisori mancano dati?
  + In caso affermativo, quali dati mancano?
  + Quale sarebbe il vantaggio di disporre di questi dati?
  + In che modo i dati mancanti influiscono sui vostri progetti principali?
+ Avete problemi associati a normative di conformità come il Regolamento generale sulla protezione dei dati (GDPR) o altri standard?
+ La tua BU dispone di prodotti di dati per consentire alle applicazioni di intraprendere azioni?
+ La tua area è in grado di fornire modelli di machine learning per migliorare la tua attività? In caso contrario, altri BUs supportano la tua attività in quest'area?
+ Siete a conoscenza di dati interni all'azienda che attualmente non sono disponibili per la vostra BU, ma che potrebbero supportare i vostri progetti o favorire miglioramenti nella vostra area?
  + Cosa sono?
+ Fai affidamento sulla qualità dei dati disponibili per la tua zona?
  + Il tuo team esegue il processo di pulizia dei dati prima di utilizzarli?
  + Il tuo team esegue il proprio processo di qualità prima di utilizzare i dati?
  + Quando il tuo team lavora sulla disponibilità dei dati e produce nuovi prodotti di dati per l'analisi, l'arricchimento e una visione aggregata, può condividere questi prodotti con altri BUs membri della tua azienda?

# Valutazione tecnica
<a name="technical-assessment"></a>

Una valutazione tecnica è importante perché fornisce una mappa delle attuali capacità tecniche di cui dispone l'azienda. La valutazione riguarda la governance dei dati, l'ingestione dei dati, la trasformazione dei dati, la condivisione dei dati, la piattaforma di apprendimento automatico (ML), il processo e l'automazione. 

Ecco alcuni esempi di domande che puoi porre durante la valutazione tecnica, suddivise per team. Puoi aggiungere domande in base al tuo contesto.

## Team di ingegneria dei dati
<a name="data-engineering"></a>
+ Quali sono le sfide attuali associate all'acquisizione di dati per il tuo team? 
+ Esistono fonti di dati esterne o interne di cui il tuo team ha bisogno che non sono disponibili per l'ingestione? Perché non sono disponibili?
+ Da quali tipi di fonti di dati acquisisci dati (ad esempio, database MySQL, API Salesforce, file ricevuti, dati di navigazione del sito Web)?
+ Quanto tempo occorre per importare dati da una nuova fonte di dati?
+ I processi di acquisizione dei dati da una nuova fonte sono automatizzati?
+ Quanto è facile per un team di sviluppo pubblicare dati transazionali per l'analisi dalla propria applicazione?
+ Disponi di strumenti per carichi completi o incrementali (in batch o microbatch) dalla tua fonte di dati?
+ Disponi di strumenti CDC (Change Data Capture) per carichi continui dai tuoi database?
+ Disponete di opzioni di streaming dei dati per l'ingestione dei dati?
+ Come si esegue la trasformazione dei dati per dati in batch e in tempo reale?
+ Come gestisci l'orchestrazione dei flussi di lavoro di trasformazione dei dati?
+ Quali attività svolgi più frequentemente: individuazione e catalogazione dei dati, inserimento dei dati, trasformazione dei dati, assistenza agli analisti aziendali, assistenza ai data scientist, governance dei dati, formazione di team e utenti?
+ Quando viene creato un set di dati, come viene classificato per la privacy dei dati? Come lo pulisci per renderlo significativo per i tuoi consumatori interni?
+ La governance e la gestione dei dati sono centralizzate o decentralizzate?
+ Come si applica la governance dei dati? Hai un processo automatizzato?
+ Chi è il proprietario e l'amministratore dei dati in ogni fase della pipeline: ingestione dei dati, elaborazione dei dati, condivisione dei dati e utilizzo dei dati? Esiste un concetto di dominio dei dati per determinare i proprietari e gli amministratori?
+ Quali sono le principali sfide legate alla condivisione dei set di dati all'interno dell'organizzazione con controllo degli accessi?
+ Utilizzate l'infrastruttura come codice (IaC) per implementare e gestire le pipeline di dati?
+ Hai una strategia per i data lake? 
  + Il tuo data lake è distribuito o centralizzato in tutta l'organizzazione? 
+ Come è organizzato il tuo catalogo di dati? È a livello aziendale o per area?
+ Hai adottato un approccio basato sul concetto di data lakehouse?
+ Utilizzate o intendete utilizzare concetti di data mesh?

Puoi completare queste domande con la lente di analisi dei dati [AWS Well-Architected Framework](https://docs.aws.amazon.com/wellarchitected/latest/analytics-lens/analytics-lens.html).

## Team di analisi aziendale
<a name="business-analysis"></a>
+ Come descriveresti le seguenti caratteristiche dei dati disponibili per il tuo lavoro:
  + Pulizia
  + Qualità
  + Classificazione
  + Metadati
  + Significato aziendale
+ Il tuo team partecipa alle definizioni dei glossari aziendali dei set di dati del tuo dominio?
+ Qual è l'impatto di non disporre dei dati necessari per svolgere il lavoro nel momento in cui ne hai bisogno?
+ Avete esempi di scenari in cui non avete accesso ai dati o ci vuole troppo tempo per ottenerli? Quanto tempo occorre per ottenere i dati necessari?
+ Con che frequenza utilizzi un set di dati più piccolo di quello necessario a causa di problemi tecnici o tempi di elaborazione?
+ Disponi di un ambiente sandbox con la scalabilità e gli strumenti di cui hai bisogno?
+ Potete eseguire A/B test per convalidare le ipotesi?
+ Ti mancano gli strumenti necessari per svolgere il tuo lavoro?
  + Quali tipi di utensili?
  + Perché non sono disponibili?
+ Ci sono attività importanti che non hai tempo per svolgere?
+ Quali sono le attività che consumano di più il tuo tempo?
+ Come vengono rinnovate le vostre opinioni aziendali?
  + Sono programmate e gestite automaticamente?
+ In quali scenari avresti bisogno di dati più aggiornati di quelli che ottieni?
+ Come condividete le analisi? Quali strumenti e processi utilizzate per la condivisione?
+ Crei spesso nuovi prodotti di dati e li rendi disponibili ad altri team?
  + Qual è il vostro processo per condividere i prodotti di dati con altre aree aziendali o all'interno dell'azienda?

## Team di data science (per determinare l'implementazione del modello)
<a name="data-science"></a>
+ Come descriveresti le seguenti caratteristiche dei dati disponibili per il tuo lavoro:
  + Pulizia
  + Qualità
  + Classificazione
  + Metadati
  + Significato
+ Disponete di strumenti automatizzati per l'addestramento, il test e l'implementazione di modelli di machine learning (ML)?
+ Disponete di opzioni relative alle dimensioni di una macchina per eseguire ogni fase della creazione e dell'implementazione di un modello di machine learning?
+ Come vengono messi in produzione i modelli ML?
+ Quali sono i passaggi per implementare un nuovo modello? Quanto sono automatizzati?
+ Disponi dei componenti per addestrare, testare e implementare modelli di machine learning per dati in batch e in tempo reale? 
+ Puoi utilizzare ed elaborare un set di dati sufficientemente grande da rappresentare i dati necessari per creare il modello?
+ Come monitorate i vostri modelli e intraprendete azioni per riqualificarli?
+ Come misurate l'impatto dei modelli sulla vostra attività?
+ Potete eseguire A/B test per convalidare ipotesi per i team aziendali?

Per ulteriori domande, consulta la Lente [Machine Learning AWS Well-Architected](https://docs.aws.amazon.com/wellarchitected/latest/machine-learning-lens/machine-learning-lens.html) Framework.

# Allineamento delle storie agli obiettivi aziendali
<a name="align-stories-goals"></a>

Dopo aver eseguito le valutazioni aziendali e tecniche, ti consigliamo di creare un diagramma che includa una serie di storie per ogni livello di maturità dell'utilizzo dei dati. Questa visualizzazione semplifica l'allineamento dell'utilizzo dei dati con gli obiettivi aziendali dell'azienda. Ad esempio, un risultato aziendale di rilevamento delle frodi quasi in tempo reale richiede una storia di capacità di intervento quasi in tempo reale.  

Le storie riguardano le capacità tecniche, i meccanismi di condivisione dei dati, le persone e i processi necessari per raggiungere gli obiettivi aziendali. Scrivete i risultati aziendali sul lato destro del diagramma in base ai colloqui di esplorazione aziendale e compilate lo stato di ogni storia sulla base di valutazioni tecniche. Puoi quindi selezionare le storie su cui la tua azienda dovrebbe lavorare e creare una tabella di marcia.  

Il diagramma seguente mostra se ogni storia è necessaria, in base ai risultati aziendali. Mostra anche lo stato attuale di ogni storia in base alle informazioni raccolte durante le valutazioni tecniche. Il diagramma è in genere seguito da un rapporto che spiega ogni stato in dettaglio.

![\[Visualizzazione delle storie di abilitazione per ogni fase di maturità dei dati\]](http://docs.aws.amazon.com/it_it/prescriptive-guidance/latest/strategy-aws-data/images/enablement-stories.png)


Si lavora a ritroso dal lato destro (*Risultati aziendali*) al lato sinistro per abilitare le storie. Ad esempio, per abilitare una storia nella terza fase (*Insights e report*), è necessario abilitarne le dipendenze nella seconda fase (*Data lake*) e nella prima fase (*Data foundation*).

In base alla valutazione e ai requisiti per i risultati aziendali, ogni storia è classificata in verde, giallo, grigio o rosso.
+ Il verde indica che la storia è pronta e può essere adattata per fornire i risultati aziendali. Ad esempio, nel diagramma, la storia relativa all'ingestione di CDC nella prima fase (*Data foundation*) è verde, il che significa che l'azienda dispone degli strumenti e dei processi necessari per realizzare la storia in base alla fonte di dati di cui dispone. Per ottenere risultati aziendali in grado di *migliorare l'esperienza del cliente* è necessario acquisire i dati pertinenti dei clienti e arricchirli con altri dati interni all'azienda, per comprendere meglio il cliente e fornire servizi di personalizzazione.
+ Il giallo indica che la capacità o il processo esistono, ma non sono completamente funzionali o non supportano la scalabilità richiesta dal risultato aziendale. Ad esempio, nel diagramma, la storia del *catalogo di dati centralizzato* nella seconda fase (*Data lake*) è gialla. Ciò indica che l'azienda dispone di un catalogo dati centrale, ma il catalogo non è completamente popolato con i metadati richiesti dalle altre fasi oppure è utilizzato solo da alcune aree aziendali. Questa classificazione influisce sulle funzionalità di condivisione dei dati nella fase successiva (*approfondimenti e report*).
+ Il grigio significa che la storia non è richiesta.
+ Il rosso indica che la storia è richiesta dai risultati aziendali ma non è stata implementata. Ad esempio, nel diagramma, la storia sulla *condivisione dei dati* nella fase *Approfondimenti e report* è rossa. La creazione di un modello di machine learning completo per le raccomandazioni dei clienti richiede il raggruppamento di set di dati, il che richiede funzionalità di condivisione dei dati. Tuttavia, questa storia non è stata implementata. In questo esempio, la condivisione dei dati richiede anche che le funzionalità nella fase di *Data lake* siano pienamente funzionanti, almeno per i set di dati che fanno parte dei modelli, ma si può vedere che la *gestione dei dati non è stata implementata*.

La storia La *privacy, la protezione e la conformità* dei *dati (nella fase del Data lake*) sono sempre necessarie e diventano sempre più importanti man mano che le normative sulla privacy dei dati sono imposte da nuovi requisiti di protezione dei dati. [Ad esempio, il [Regolamento generale sulla protezione dei dati (GDPR)](https://gdpr.eu/what-is-gdpr/) è iniziato negli Stati Uniti con il [Virginia Consumer Data Protection Act (CDPA)](https://law.lis.virginia.gov/vacodefull/title59.1/chapter53/) e il [California Consumer Privacy Act (CCPA)](https://oag.ca.gov/privacy/ccpa) ed è già in vigore per alcuni paesi dell'America Latina come [Lei Geral de Proteção a Dados Pessoais (LGPD)](https://www.serpro.gov.br/privacidade-protecao-dados) in Brasile, la protezione dei dati [messicana in Messico, la protezione dei dati in](https://www.dataguidance.com/notes/mexico-data-protection-overview) Colombia, la legge [29733](https://www.leyes.congreso.gob.pe/Documentos/Leyes/29733.pdf) in Perù e Leggi sulla protezione dei dati personali in Argentina.](http://servicios.infoleg.gob.ar/infolegInternet/anexos/320000-324999/323901/norma.htm)