

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# Cadre de stratégie en matière de données
<a name="framework"></a>

Le cadre de stratégie de données présenté dans ce guide repose sur les principes suivants de l'architecture moderne des données et de l'analyse :

1. Utilisez une **couche de stockage intégrée, rentable et évolutive**, afin que chaque producteur et consommateur de données dispose des capacités techniques nécessaires pour interagir avec les données.

1. **La sécurité est obligatoire**. Appliquez des règles de confidentialité des données, protégez les données grâce au chiffrement, activez l'audit et assurez la conformité automatisée.

1. **Gérez les données pour les partager** au sein de l'entreprise. Fournissez un catalogue de données unique et un glossaire commercial afin que les utilisateurs puissent trouver et utiliser les données dont ils ont besoin.

1. Choisissez le **bon service pour le bon travail.** Lorsque vous choisissez un composant, tenez compte des fonctionnalités, de l'évolutivité, de la latence des données, de l'effort requis pour exécuter le service, de la résilience, de l'intégration et de l'automatisation.

1. Utilisez l'**intelligence artificielle (IA) et l'apprentissage automatique (ML)**.

1. Fournir une **culture des données** et des outils contenant des **abstractions aux hommes d'affaires**.

1. **Testez les hypothèses** de vos initiatives en matière de données et **mesurez leurs résultats**.

Le cadre de données utilise l'approche consistant [à travailler en retour avec le client](https://docs.aws.amazon.com/whitepapers/latest/building-cloud-operating-model/step-1.-work-backwards-from-the-customer.html). Cette méthode, qui est utilisée chez Amazon AWS, suit cinq étapes :

1. Interrogez les utilisateurs des domaines d'activité de votre entreprise. Sélectionnez les problèmes commerciaux et les opportunités qui pourraient être traités par des initiatives en matière de données.

1. Définissez les résultats commerciaux attendus dans les domaines d'activité.

1. Priorisez les initiatives qui ont le plus grand impact commercial.

1. Identifiez le partage des données et les capacités techniques permettant d'obtenir des résultats commerciaux, et regroupez-les dans des projets d'habilitation.

1. Identifiez les rôles et les responsabilités pour permettre les initiatives axées sur les données, et discutez de la constitution d'équipes multidisciplinaires.

Les sections suivantes décrivent les principales étapes de ce processus :
+ [Découverte commerciale](business-discovery.md)
+ [Évaluation de la disponibilité des données](data-availability.md)
+ [Évaluation technique](technical-assessment.md)
+ [Aligner les histoires sur les objectifs commerciaux](align-stories-goals.md)

# Découverte commerciale
<a name="business-discovery"></a>

Pour réaliser des entretiens d'affaires de manière efficace, il est important de comprendre les objectifs de votre**** entreprise qui dépendent de données de haut niveau. Par exemple, ces objectifs peuvent inclure :
+ Améliorer l'agilité de l'entreprise
+ Favoriser l'innovation avancée
+ Devenir centré sur le client
+ Augmentation de la part de marché
+ Atteindre les marchés mondiaux
+ Lancement d'une nouvelle plateforme client  

Une fois que vous vous êtes aligné sur les objectifs de votre entreprise, vous devriez parler aux membres de l'équipe dans les domaines d'activité. Au minimum, concentrez-vous sur les domaines qui ont une incidence sur les principaux objectifs de votre entreprise, mais si vous en avez l'occasion, parlez-en aux membres de l'équipe dans chaque domaine d'activité.

Dans cette conversation de découverte, vous souhaitez connaître les objectifs de chaque secteur d'activité ou unité commerciale (BU), les indicateurs utilisés pour mesurer leur domaine et la manière dont l'utilisation des données peut affecter leurs objectifs. Voici quelques exemples de questions que vous pourriez vous poser :
+ Quels sont les principaux objectifs de votre BU ?
+ Comment votre BU contribuera-t-elle à atteindre les objectifs de l'entreprise ?
+ Quels sont les principaux projets de votre BU ?
+ Comment chaque projet dépend-il des données ?

Il est important d'avoir une meilleure visibilité sur les projets clés, leur calendrier, la façon dont ils dépendent des données et la manière dont ils s'alignent sur les objectifs de l'entreprise ou les soutiennent. Voici des exemples de projets :
+ Améliorations de l'expérience client grâce à une interaction omnicanale cohérente et à la sensibilisation aux dernières actions et problèmes des clients
+ Création d'un moteur de recommandation basé sur le comportement des clients pour augmenter le taux de conversion et l'engagement
+ Pour les produits financiers en ligne, calcul des risques plus rapide pour approuver le crédit du client, afin d'éviter de prendre trop de temps et de perdre le client au profit d'une autre institution financière
+ Meilleure précision des prévisions de ventes pour réduire les pertes d'approvisionnement
+ Réduire les pertes dues à la fraude en optimisant la détection des fraudes en temps réel

# Évaluation de la disponibilité des données pour les entreprises
<a name="data-availability"></a>

Utilisez des questions de suivi telles que les suivantes pour comprendre les écarts entre l'état actuel de disponibilité des données et les objectifs de la BU :
+ Comment les données soutiennent-elles vos projets et vos objectifs commerciaux actuels ?
+ Est-il difficile d'obtenir les bonnes données pour les utiliser et prendre des décisions ?
+ Dans quelle mesure le processus d'obtention des données est-il automatisé ? Quelles sont les étapes manuelles nécessaires, le cas échéant ?
+ Lorsque les données sont disponibles, votre équipe peut-elle les comprendre et les utiliser, ou devez-vous les traduire dans votre domaine d'activité ?
+ Est-ce que vous recevez des données en temps opportun pour étayer vos décisions commerciales ?
  + Comment l'accélération de l'obtention de données pourrait-elle améliorer votre activité ? Pour apporter des améliorations, à quelle vitesse les données doivent-elles être disponibles ?
+ Des données manquent-elles à vos décideurs ?
  + Dans l'affirmative, quelles données sont manquantes ?
  + Quel serait l'avantage de disposer de ces données ?
  + Comment vos principaux projets sont-ils affectés par les données manquantes ?
+ Avez-vous des difficultés liées aux réglementations de conformité telles que le règlement général sur la protection des données (RGPD) ou d'autres normes ?
+ Votre BU dispose-t-elle de produits de données permettant aux applications de prendre des mesures ?
+ Votre région est-elle en mesure de fournir des modèles d'apprentissage automatique pour améliorer votre activité ? Si ce n'est pas le cas, est-ce que d'autres BUs soutiennent votre entreprise dans ce domaine ?
+ Connaissez-vous des données internes à l'entreprise qui ne sont actuellement pas disponibles pour votre BU, mais qui pourraient soutenir vos projets ou apporter des améliorations dans votre région ?
  + Quels sont-ils ?
+ Vous fiez-vous à la qualité des données disponibles pour votre région ?
  + Votre équipe effectue-t-elle son propre processus de nettoyage des données avant que vous ne les utilisiez ?
  + Votre équipe exécute-t-elle son propre processus de qualité avant que vous n'utilisiez les données ?
  + Lorsque votre équipe travaille sur la disponibilité des données et produit de nouveaux produits de données à des fins d'analyse, d'enrichissement et de vision agrégée, peut-elle partager ces produits avec d'autres BUs membres de votre entreprise ?

# Évaluation technique
<a name="technical-assessment"></a>

Une évaluation technique est importante car elle vous donne une carte des capacités techniques actuelles de votre entreprise. L'évaluation couvre la gouvernance des données, l'ingestion des données, la transformation des données, le partage des données, la plateforme d'apprentissage automatique (ML), les processus et l'automatisation. 

Voici des exemples de questions que vous pouvez poser lors de l'évaluation technique, par équipe. Vous pouvez ajouter des questions en fonction de votre contexte.

## Équipe d'ingénierie des données
<a name="data-engineering"></a>
+ Quels sont les défis actuels liés à l'ingestion de données pour votre équipe ? 
+ Y a-t-il des sources de données externes ou internes dont votre équipe a besoin qui ne sont pas disponibles pour l'ingestion ? Pourquoi ne sont-ils pas disponibles ?
+ De quels types de sources de données ingérez-vous des données (par exemple, les bases de données MySQL, l'API Salesforce, les fichiers reçus, les données de navigation sur le site Web) ?
+ Combien de temps faut-il pour ingérer les données d'une nouvelle source de données ?
+ Les processus d'ingestion de données provenant d'une nouvelle source sont-ils automatisés ?
+ Est-il facile pour une équipe de développement de publier des données transactionnelles à des fins d'analyse à partir de son application ?
+ Disposez-vous d'outils pour les chargements complets ou incrémentiels (par lots ou microlots) à partir de votre source de données ?
+ Disposez-vous d'outils de capture des données de modification (CDC) pour les chargements continus à partir de vos bases de données ?
+ Disposez-vous d'options de diffusion de données pour l'ingestion de données ?
+ Comment procédez-vous à la transformation des données par lots et en temps réel ?
+ Comment gérez-vous l'orchestration des flux de travail de transformation des données ?
+ Quelles sont les activités que vous effectuez le plus fréquemment : découverte et catalogage des données, ingestion de données, transformation des données, assistance aux analystes commerciaux, assistance aux scientifiques des données, gouvernance des données, formation des équipes et des utilisateurs ?
+ Lorsqu'un ensemble de données est créé, comment est-il classé pour garantir la confidentialité des données ? Comment le nettoyer pour le rendre significatif pour vos consommateurs internes ?
+ La gouvernance et la gestion des données sont-elles centralisées ou décentralisées ?
+ Comment appliquez-vous la gouvernance des données ? Disposez-vous d'un processus automatisé ?
+ Qui est le propriétaire et le responsable des données à chaque phase du pipeline : ingestion des données, traitement des données, partage des données et utilisation des données ? Existe-t-il un concept de domaine de données pour déterminer les propriétaires et les administrateurs ?
+ Quels sont les principaux défis liés au partage d'ensembles de données au sein de l'organisation avec le contrôle d'accès ?
+ Utilisez-vous l'infrastructure en tant que code (IaC) pour déployer et gérer des pipelines de données ?
+ Disposez-vous d'une stratégie en matière de data lake ? 
  + Votre lac de données est-il distribué ou centralisé au sein de l'entreprise ? 
+ Comment est organisé votre catalogue de données ? Est-ce à l'échelle de l'entreprise ou par région ?
+ Avez-vous mis en place une approche fondée sur le data lakehouse ?
+ Utilisez-vous ou prévoyez-vous d'utiliser des concepts de maillage de données ?

Vous pouvez compléter ces questions avec l'objectif d'analyse de [AWS données Well-Architected Framework](https://docs.aws.amazon.com/wellarchitected/latest/analytics-lens/analytics-lens.html).

## Équipe d'analyse commerciale
<a name="business-analysis"></a>
+ Comment décririez-vous les caractéristiques suivantes des données disponibles pour votre travail :
  + Propreté
  + Qualité
  + Classification
  + Métadonnées
  + Signification commerciale
+ Votre équipe participe-t-elle aux définitions des glossaires commerciaux des ensembles de données de votre domaine ?
+ Quel est l'impact de ne pas disposer des données dont vous avez besoin pour effectuer votre travail au moment où vous en avez besoin ?
+ Avez-vous des exemples de scénarios dans lesquels vous n'avez pas accès aux données ou où leur obtention prend trop de temps ? Combien de temps faut-il pour obtenir les données dont vous avez besoin ?
+ À quelle fréquence utilisez-vous un jeu de données plus petit que celui dont vous avez besoin en raison de problèmes techniques ou de temps de traitement ?
+ Disposez-vous d'un environnement sandbox doté de l'échelle et des outils dont vous avez besoin ?
+ Pouvez-vous effectuer des A/B tests pour valider des hypothèses ?
+ Il vous manque les outils dont vous avez besoin pour effectuer votre travail ?
  + Quels types d'outils ?
  + Pourquoi ne sont-ils pas disponibles ?
+ Y a-t-il des activités importantes que vous n'avez pas le temps de réaliser ?
+ Quelles sont les activités qui vous prennent le plus de temps ?
+ Comment actualisez-vous les points de vue de votre entreprise ?
  + Sont-ils planifiés et gérés automatiquement ?
+ Dans quels scénarios auriez-vous besoin de données plus récentes que celles que vous obtenez ?
+ Comment partagez-vous les analyses ? Quels outils et processus utilisez-vous pour le partage ?
+ Créez-vous souvent de nouveaux produits de données et les mettez-vous à la disposition d'autres équipes ?
  + Quel est votre processus de partage de produits de données avec d'autres secteurs d'activité ou au sein de l'entreprise ?

## Équipes de data science (pour déterminer le déploiement du modèle)
<a name="data-science"></a>
+ Comment décririez-vous les caractéristiques suivantes des données disponibles pour votre travail :
  + Propreté
  + Qualité
  + Classification
  + Métadonnées
  + Signification
+ Disposez-vous d'outils automatisés pour la formation, le test et le déploiement de modèles d'apprentissage automatique (ML) ?
+ Disposez-vous d'options de taille de machine pour effectuer chaque étape de la création et du déploiement d'un modèle de machine learning ?
+ Comment sont mis en production les modèles ML ?
+ Quelles sont les étapes à suivre pour déployer un nouveau modèle ? Dans quelle mesure sont-ils automatisés ?
+ Disposez-vous des composants nécessaires pour former, tester et déployer des modèles de machine learning pour les données par lots et en temps réel ? 
+ Pouvez-vous utiliser et traiter un jeu de données suffisamment grand pour représenter les données dont vous avez besoin pour créer le modèle ?
+ Comment surveillez-vous vos modèles et prenez-vous des mesures pour les recycler ?
+ Comment mesurez-vous l'impact des modèles sur votre entreprise ?
+ Pouvez-vous effectuer des A/B tests pour valider des hypothèses pour les équipes commerciales ?

Pour des questions supplémentaires, consultez le [AWS Well-Architected Framework Machine Learning Lens](https://docs.aws.amazon.com/wellarchitected/latest/machine-learning-lens/machine-learning-lens.html).

# Aligner les histoires sur les objectifs commerciaux
<a name="align-stories-goals"></a>

Après avoir effectué des évaluations commerciales et techniques, nous vous recommandons de créer un diagramme qui inclut un ensemble d'histoires pour chaque niveau de maturité de l'utilisation des données. Cette visualisation permet d'aligner facilement votre utilisation des données sur les objectifs commerciaux de votre entreprise. Par exemple, un résultat commercial de détection des fraudes en temps quasi réel nécessite un historique des capacités d'action en temps quasi réel.  

Les histoires portent sur les capacités techniques, les mécanismes de partage de données, les personnes et les processus nécessaires pour atteindre les objectifs commerciaux. Vous inscrivez les résultats commerciaux sur le côté droit du diagramme en fonction de vos entretiens de découverte d'entreprise, et vous indiquez le statut de chaque histoire sur la base d'évaluations techniques. Vous pouvez ensuite sélectionner les sujets sur lesquels votre entreprise devrait travailler et créer une feuille de route.  

Le schéma suivant indique si chaque histoire est requise, en fonction des résultats commerciaux. Il indique également l'état actuel de chaque histoire en fonction des informations que vous avez collectées lors des évaluations techniques. Le diagramme est généralement suivi d'un rapport qui explique chaque statut en détail.

![\[Visualisation des récits d'activation pour chaque phase de maturité des données\]](http://docs.aws.amazon.com/fr_fr/prescriptive-guidance/latest/strategy-aws-data/images/enablement-stories.png)


Vous revenez du côté droit (*résultats commerciaux*) vers le côté gauche pour activer les stories. Par exemple, pour activer une histoire dans la troisième étape (*Insights and reports*), vous devez activer ses dépendances dans la deuxième étape (*Data lake*) et la première étape (*Data foundation*).

Sur la base de l'évaluation et des exigences relatives aux résultats commerciaux, chaque histoire est classée en vert, jaune, gris ou rouge.
+ Le vert signifie que l'histoire est en place et qu'elle peut évoluer pour obtenir les résultats commerciaux souhaités. Par exemple, dans le diagramme, l'histoire de l'ingestion par les CDC de la première étape (*base des données*) est verte, ce qui signifie que l'entreprise dispose des outils et du processus nécessaires pour réaliser l'histoire pour la source de données dont elle dispose. Pour *améliorer l'expérience client*, il faut intégrer des données clients pertinentes et les enrichir avec d'autres données internes à l'entreprise, afin de mieux comprendre le client et de le personnaliser.
+ Le jaune signifie que la capacité ou le processus existe, mais qu'il n'est pas entièrement fonctionnel ou qu'il ne répondra pas à l'échelle requise par les résultats commerciaux. Par exemple, dans le diagramme, l'histoire du *catalogue de données centralisé* de la deuxième étape (*lac de données*) est jaune. Cela indique que l'entreprise dispose d'un catalogue de données central, mais que le catalogue n'est pas entièrement rempli avec les métadonnées requises par les autres étapes, ou qu'il n'est utilisé que par quelques secteurs d'activité. Cette classification a un impact sur les capacités de partage de données lors de l'étape suivante (*Insights and reports*).
+ Gray signifie que l'histoire n'est pas obligatoire.
+ Le rouge signifie que l'histoire est requise par les résultats commerciaux mais n'a pas été mise en œuvre. Par exemple, dans le diagramme, l'histoire du *partage de données* dans la phase *Insights and reports* est rouge. La création d'un modèle d'apprentissage automatique complet pour les recommandations des clients nécessite le regroupement des ensembles de données, ce qui nécessite des capacités de partage de données. Cependant, cette histoire n'a pas été mise en œuvre. Dans cet exemple, le partage de données nécessite également que les fonctionnalités de l'étape *du lac de données* soient pleinement fonctionnelles, du moins pour les ensembles de données qui font partie des modèles, mais vous pouvez constater que la *gestion des données* n'a pas été mise en œuvre.

L'histoire La *confidentialité, la protection et la conformité des données* (au stade du *lac de données*) sont toujours nécessaires, et elles deviennent de plus en plus pertinentes à mesure que les réglementations relatives à la confidentialité des données sont imposées par de nouvelles exigences en matière de protection des données. [https://www.leyes.congreso.gob.pe/Documentos/Leyes/29733.pdf](https://www.leyes.congreso.gob.pe/Documentos/Leyes/29733.pdf)