

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

# Rahmen für die Datenstrategie
<a name="framework"></a>

Das in diesem Leitfaden vorgestellte Datenstrategie-Framework basiert auf den folgenden Grundsätzen einer modernen Daten- und Analysearchitektur:

1. Verwenden Sie eine **integrierte, kostengünstige und skalierbare Speicherebene**, sodass jeder Datenproduzent und -verbraucher über die technischen Möglichkeiten verfügt, mit Daten zu interagieren.

1. **Sicherheit ist Pflicht**. Wenden Sie Datenschutzregeln an, sorgen Sie für Datenschutz durch Verschlüsselung, aktivieren Sie Auditing und sorgen Sie für automatisierte Compliance.

1. **Steuern Sie die Daten, um sie unternehmensweit gemeinsam zu nutzen**. Stellen Sie einen einzigartigen Datenkatalog und ein Unternehmensglossar bereit, damit Benutzer die benötigten Daten finden und verwenden können.

1. Wählen Sie den **richtigen Service für den richtigen Job**. Berücksichtigen Sie bei der Auswahl einer Komponente Funktionalität, Skalierbarkeit, Datenlatenz, den Aufwand für die Ausführung des Dienstes, Belastbarkeit, Integration und Automatisierung.

1. Verwenden Sie **künstliche Intelligenz (KI) und maschinelles Lernen (ML)**.

1. Bieten Sie **Geschäftsleuten **Datenkompetenz** und Tools mit Abstraktionen**.

1. **Testen Sie die Hypothesen** Ihrer Dateninitiativen und **messen** Sie deren Ergebnisse.

Das Datenframework verwendet den Ansatz, vom [Kunden aus zu arbeiten](https://docs.aws.amazon.com/whitepapers/latest/building-cloud-operating-model/step-1.-work-backwards-from-the-customer.html). Diese Methode, die bei Amazon verwendet wird und AWS folgt fünf Schritten:

1. Befragen Sie Benutzer in den Geschäftsbereichen Ihres Unternehmens. Wählen Sie Geschäftsprobleme und Chancen aus, die durch Dateninitiativen angegangen werden könnten.

1. Definieren Sie die erwarteten Geschäftsergebnisse innerhalb der Geschäftsbereiche.

1. Priorisieren Sie Initiativen, die die größten Auswirkungen auf das Geschäft haben.

1. Identifizieren Sie die Möglichkeiten zur gemeinsamen Nutzung von Daten und die technischen Fähigkeiten, mit denen Sie Geschäftsergebnisse erzielen können, und fassen Sie diese in Projekten zusammen.

1. Identifizieren Sie Rollen und Verantwortlichkeiten, um datengestützte Initiativen zu ermöglichen, und erörtern Sie die multidisziplinäre Teambildung.

In den folgenden Abschnitten werden die wichtigsten Phasen dieses Prozesses erörtert:
+ [Geschäftserkundung](business-discovery.md)
+ [Bewertung der Datenverfügbarkeit](data-availability.md)
+ [Technische Bewertung](technical-assessment.md)
+ [Geschichten an Geschäftszielen ausrichten](align-stories-goals.md)

# Geschäftserkundung
<a name="business-discovery"></a>

Um Geschäftsinterviews effektiv durchführen zu können, ist es wichtig, die Ziele Ihres**** Unternehmens zu verstehen, die von Daten auf hoher Ebene abhängen. Zu diesen Zielen könnten beispielsweise gehören:
+ Verbesserung der geschäftlichen Agilität
+ Förderung fortschrittlicher Innovationen
+ Wir werden kundenorientiert
+ Erhöhung des Marktanteils
+ Erreichen globaler Märkte
+ Einführung einer neuen Kundenplattform  

Nachdem Sie sich auf die Ziele Ihres Unternehmens geeinigt haben, sollten Sie mit Teammitgliedern in den Geschäftsbereichen sprechen. Konzentrieren Sie sich zumindest auf Bereiche, die sich auf die Hauptziele Ihres Unternehmens auswirken. Wenn Sie jedoch die Möglichkeit haben, sprechen Sie mit Teammitgliedern in allen Geschäftsbereichen.

In diesem Discovery-Gespräch möchten Sie die Ziele der einzelnen Geschäftsbereiche oder Geschäftseinheiten (BU), die Kennzahlen, die sie zur Messung ihres Bereichs verwenden, und herausfinden, wie sich die Datennutzung auf ihre Ziele auswirken kann. Hier sind einige Beispiele für Fragen, die Sie stellen könnten:
+ Was sind die Hauptziele Ihrer BU?
+ Wie wird Ihre BU dazu beitragen, die Unternehmensziele zu erreichen?
+ Was sind die wichtigsten Projekte in Ihrer BU?
+ Wie hängt jedes Projekt von Daten ab?

Es ist wichtig, sich einen Überblick über wichtige Projekte, ihren Zeitplan, ihre Abhängigkeit von Daten und darüber zu verschaffen, wie sie mit den Unternehmenszielen übereinstimmen oder diese unterstützen. Zu den Beispielen für Projekte gehören:
+ Verbesserung des Kundenerlebnisses durch konsistente Omnichannel-Interaktion und Sensibilisierung für die neuesten Kundenaktionen und -probleme
+ Schaffung einer Empfehlungsmaschine, die auf dem Kundenverhalten basiert, um die Konversionsrate und die Kundenbindung zu erhöhen
+ Bei Online-Finanzprodukten eine schnellere Risikoberechnung zur Genehmigung von Kundenkrediten, um zu vermeiden, dass zu lange dauert und der Kunde nicht an ein anderes Finanzinstitut verloren geht
+ Bessere Genauigkeit der Verkaufsprognosen zur Reduzierung von Lieferverlusten
+ Reduzierung von Betrugsverlusten durch Optimierung der Betrugserkennung in Echtzeit

# Bewertung der Datenverfügbarkeit für Unternehmen
<a name="data-availability"></a>

Verwenden Sie Folgefragen wie die folgenden, um die Unterschiede zwischen dem aktuellen Stand der Datenverfügbarkeit und dem, was die BU erreichen möchte, zu verstehen:
+ Wie unterstützen Daten Ihre Projekte und Ihre aktuellen Geschäftsziele?
+ Ist es schwierig, die richtigen Daten zu erhalten, um sie zu nutzen und Entscheidungen zu treffen?
+ Wie automatisiert ist der Prozess zur Datenbeschaffung? Welche manuellen Schritte sind erforderlich, falls vorhanden?
+ Wenn Daten verfügbar werden, kann Ihr Team sie verstehen und damit arbeiten, oder müssen Sie die Daten in Ihre Geschäftsdomäne übersetzen?
+ Erhalten Sie rechtzeitig Daten, um Ihre Geschäftsentscheidungen zu unterstützen?
  + Wie würde eine schnellere Datenbeschaffung Ihr Geschäft verbessern? Wie schnell sollten Daten verfügbar sein, um Verbesserungen voranzutreiben?
+ Fehlen Ihren Entscheidungsträgern irgendwelche Daten?
  + Falls ja, welche Daten fehlen?
  + Was wäre der Vorteil, diese Daten zu haben?
  + Wie wirken sich die fehlenden Daten auf Ihre Hauptprojekte aus?
+ Stehen Sie vor Herausforderungen im Zusammenhang mit Compliance-Vorschriften wie der Allgemeinen Datenschutzverordnung (DSGVO) oder anderen Standards?
+ Verfügt Ihre BU über Datenprodukte, mit denen Anwendungen Maßnahmen ergreifen können?
+ Ist Ihre Region in der Lage, Modelle für maschinelles Lernen bereitzustellen, um Ihr Geschäft zu verbessern? Wenn nicht, BUs unterstützen andere Ihr Unternehmen in diesem Bereich?
+ Kennen Sie unternehmensinterne Daten, die derzeit nicht für Ihre BU verfügbar sind, die aber Ihre Projekte unterstützen oder Verbesserungen in Ihrer Region vorantreiben könnten?
  + Was sind sie?
+ Verlassen Sie sich auf die Qualität der für Ihre Region verfügbaren Daten?
  + Führt Ihr Team Ihren eigenen Datenbereinigungsprozess durch, bevor Sie die Daten verwenden?
  + Führt Ihr Team Ihren eigenen Qualitätsprozess durch, bevor Sie die Daten verwenden?
  + Wenn Ihr Team an der Datenverfügbarkeit arbeitet und neue Datenprodukte für die Analyse, Anreicherung und eine aggregierte Vision entwickelt, kann es diese Produkte dann mit anderen BUs in Ihrem Unternehmen teilen?

# Technische Bewertung
<a name="technical-assessment"></a>

Eine technische Bewertung ist wichtig, da sie Ihnen einen Überblick über die aktuellen technischen Kapazitäten Ihres Unternehmens gibt. Die Bewertung umfasst Datenverwaltung, Datenaufnahme, Datentransformation, Datenaustausch, Plattform für maschinelles Lernen (ML), Prozesse und Automatisierung. 

Hier finden Sie Beispiele für Fragen, die Sie während der technischen Bewertung pro Team stellen können. Sie können je nach Kontext Fragen hinzufügen.

## Team für Datentechnik
<a name="data-engineering"></a>
+ Was sind die aktuellen Herausforderungen im Zusammenhang mit der Datenerfassung für Ihr Team? 
+ Gibt es externe oder interne Datenquellen, die Ihr Team benötigt und die nicht zur Erfassung zur Verfügung stehen? Warum sind sie nicht verfügbar?
+ Aus welchen Arten von Datenquellen nehmen Sie Daten auf (z. B. MySQL-Datenbanken, Salesforce-API, empfangene Dateien, Website-Navigationsdaten)?
+ Wie lange dauert es, Daten aus einer neuen Datenquelle aufzunehmen?
+ Sind die Prozesse der Datenaufnahme aus einer neuen Quelle automatisiert?
+ Wie einfach ist es für ein Entwicklungsteam, Transaktionsdaten für Analysen aus seiner Anwendung zu veröffentlichen?
+ Verfügen Sie über Tools für Komplettladungen oder inkrementelle Ladevorgänge (in Batches oder Mikrobatches) aus Ihrer Datenquelle?
+ Verfügen Sie über CDC-Tools (Change Data Capture) für kontinuierliche Ladevorgänge aus Ihren Datenbanken?
+ Haben Sie Datenstreaming-Optionen für die Datenaufnahme?
+ Wie führen Sie die Datentransformation für Batch- und Echtzeitdaten durch?
+ Wie managen Sie die Orchestrierung von Workflows zur Datentransformation?
+ Welche Aktivitäten führen Sie am häufigsten durch: Datenermittlung und Katalogisierung, Datenaufnahme, Datentransformation, Unterstützung von Geschäftsanalysten, Unterstützung von Datenwissenschaftlern, Datenverwaltung, Schulung von Teams und Benutzern?
+ Wenn ein Datensatz erstellt wird, wie wird er aus Datenschutzgründen klassifiziert? Wie reinigen Sie es, damit es für Ihre internen Verbraucher aussagekräftig ist?
+ Sind Datenverwaltung und Datenverwaltung zentralisiert oder dezentralisiert?
+ Wie setzen Sie Datenverwaltung durch? Haben Sie einen automatisierten Prozess?
+ Wer ist der Dateneigentümer und -verwalter in jeder Phase der Pipeline: Datenaufnahme, Datenverarbeitung, Datenaustausch und Datennutzung? Gibt es ein Datendomain-Konzept zur Bestimmung von Eigentümern und Datenverwaltern?
+ Was sind die größten Herausforderungen bei der gemeinsamen Nutzung von Datensätzen innerhalb der Organisation mit Zugriffskontrolle?
+ Verwenden Sie Infrastructure as Code (IaC) für die Bereitstellung und Verwaltung von Daten-Pipelines?
+ Haben Sie eine Data-Lake-Strategie? 
  + Ist Ihr Data Lake im gesamten Unternehmen verteilt oder zentralisiert? 
+ Wie ist Ihr Datenkatalog organisiert? Ist es unternehmensweit oder pro Bereich?
+ Haben Sie einen Data-Lakehouse-Ansatz eingeführt?
+ Verwenden Sie Data-Mesh-Konzepte oder planen Sie, dies zu tun?

Sie können diese Fragen mit dem [AWS Well-Architected Framework Data Analytics](https://docs.aws.amazon.com/wellarchitected/latest/analytics-lens/analytics-lens.html) Lens ergänzen.

## Team für Geschäftsanalyse
<a name="business-analysis"></a>
+ Wie würden Sie die folgenden Merkmale der Daten beschreiben, die für Ihre Arbeit verfügbar sind:
  + Sauberkeit
  + Qualität
  + Klassifizierung
  + Metadaten
  + Geschäftliche Bedeutung
+ Nimmt Ihr Team an den Definitionen von Datensätzen in Ihrem Fachgebiet im Geschäftsglossar teil?
+ Welche Auswirkungen hat es, wenn die Daten, die Sie für Ihre Arbeit benötigen, nicht zum richtigen Zeitpunkt zur Verfügung stehen?
+ Haben Sie Beispiele für Szenarien, in denen Sie keinen Zugriff auf Daten haben oder es zu lange dauert, die Daten zu erhalten? Wie lange dauert es, die benötigten Daten zu erhalten?
+ Wie oft verwenden Sie aufgrund technischer Probleme oder der Verarbeitungszeit einen kleineren Datensatz als Sie benötigen?
+ Haben Sie eine Sandbox-Umgebung mit dem Umfang und den Tools, die Sie benötigen?
+ Können Sie A/B Tests durchführen, um Hypothesen zu validieren?
+ Fehlen Ihnen Werkzeuge, die Sie für Ihre Arbeit benötigen?
  + Welche Arten von Tools?
  + Warum sind sie nicht verfügbar?
+ Gibt es wichtige Aktivitäten, für die Sie keine Zeit haben?
+ Welche Aktivitäten beanspruchen deine Zeit am meisten?
+ Wie werden Ihre Geschäftsansichten aktualisiert?
  + Werden sie automatisch geplant und verwaltet?
+ In welchen Szenarien würden Sie Daten benötigen, die aktueller sind als die Daten, die Sie erhalten?
+ Wie teilen Sie Analysen? Welche Tools und Prozesse verwenden Sie zum Teilen?
+ Entwickeln Sie häufig neue Datenprodukte und stellen Sie sie anderen Teams zur Verfügung?
  + Wie sieht Ihr Verfahren für die gemeinsame Nutzung von Datenprodukten mit anderen Geschäftsbereichen oder innerhalb des Unternehmens aus?

## Data-Science-Teams (um den Einsatz des Modells zu bestimmen)
<a name="data-science"></a>
+ Wie würden Sie die folgenden Merkmale der Daten beschreiben, die für Ihre Arbeit verfügbar sind:
  + Sauberkeit
  + Qualität
  + Klassifizierung
  + Metadaten
  + Bedeutung
+ Verfügen Sie über automatisierte Tools zum Trainieren, Testen und Bereitstellen von Modellen für maschinelles Lernen (ML)?
+ Haben Sie Optionen zur Maschinengröße für die Durchführung der einzelnen Schritte bei der Erstellung und Bereitstellung eines ML-Modells?
+ Wie werden die ML-Modelle in Produktion genommen?
+ Was sind die Schritte zur Implementierung eines neuen Modells? Wie automatisiert sind sie?
+ Haben Sie die Komponenten, um ML-Modelle für Batch- und Echtzeitdaten zu trainieren, zu testen und bereitzustellen? 
+ Können Sie einen Datensatz verwenden und verarbeiten, der groß genug ist, um die Daten darzustellen, die Sie zur Erstellung des Modells benötigen?
+ Wie überwachen Sie Ihre Modelle und ergreifen Maßnahmen, um sie neu zu schulen?
+ Wie messen Sie die Auswirkungen der Modelle auf Ihr Unternehmen?
+ Können Sie A/B Tests durchführen, um Hypothesen für Geschäftsteams zu validieren?

Weitere Fragen finden Sie im [AWS Well-Architected Framework Machine Learning Lens](https://docs.aws.amazon.com/wellarchitected/latest/machine-learning-lens/machine-learning-lens.html).

# Geschichten an Geschäftszielen ausrichten
<a name="align-stories-goals"></a>

Nach der Durchführung der geschäftlichen und technischen Bewertungen empfehlen wir Ihnen, ein Diagramm zu erstellen, das eine Reihe von Geschichten für jeden Reifegrad der Datennutzung enthält. Diese Visualisierung macht es einfach, Ihre Datennutzung an den Geschäftszielen Ihres Unternehmens auszurichten. Ein Geschäftsergebnis bei der Betrugserkennung nahezu in Echtzeit erfordert beispielsweise eine Beschreibung der Handlungsfähigkeit nahezu in Echtzeit.  

Bei den Geschichten handelt es sich um technische Fähigkeiten, Mechanismen für den Datenaustausch, Personen und Prozesse, die zur Erreichung der Geschäftsziele erforderlich sind. Sie schreiben die Geschäftsergebnisse auf der rechten Seite des Diagramms auf der Grundlage Ihrer Interviews zur Geschäftsentwicklung und geben den Status jeder Geschichte auf der Grundlage technischer Bewertungen an. Anschließend können Sie die Geschichten auswählen, an denen Ihr Unternehmen arbeiten soll, und eine Roadmap erstellen.  

Das folgende Diagramm zeigt auf der Grundlage der Geschäftsergebnisse, ob jede Story erforderlich ist. Es zeigt auch den aktuellen Status jeder Story auf der Grundlage von Informationen, die Sie im Rahmen von technischen Bewertungen gesammelt haben. Auf das Diagramm folgt in der Regel ein Bericht, in dem die einzelnen Status detailliert erläutert werden.

![\[Visualisierung von Erfolgsgeschichten für jede Phase der Datenreife\]](http://docs.aws.amazon.com/de_de/prescriptive-guidance/latest/strategy-aws-data/images/enablement-stories.png)


Sie arbeiten von der rechten Seite (*Geschäftsergebnisse*) zur linken Seite zurück, um die Storys zu aktivieren. Um beispielsweise eine Story in der dritten Phase (*Einblicke und Berichte*) zu aktivieren, müssen Sie die zugehörigen Abhängigkeiten in der zweiten Phase (*Data Lake*) und der ersten Phase (*Data Foundation*) aktivieren.

Auf der Grundlage der Bewertung und der Anforderungen an die Geschäftsergebnisse wird jede Story als grün, gelb, grau oder rot klassifiziert.
+ Grün bedeutet, dass die Story vorhanden ist und skaliert werden kann, um die Geschäftsergebnisse zu erzielen. In dem Diagramm ist beispielsweise die CDC-Datenerfassung in der ersten Phase (*Datengrundlage*) grün dargestellt, was bedeutet, dass das Unternehmen über die Tools und Prozesse verfügt, um die Story mit der vorhandenen Datenquelle umzusetzen. Das *Geschäftsergebnis „Besseres Kundenerlebnis*“ erfordert die Erfassung relevanter Kundendaten und deren Anreicherung mit anderen Daten innerhalb des Unternehmens, um den Kunden besser zu verstehen und eine Personalisierung zu ermöglichen.
+ Gelb bedeutet, dass die Fähigkeit oder der Prozess zwar vorhanden sind, aber nicht voll funktionsfähig sind oder nicht den Umfang unterstützen, den das Geschäftsergebnis erfordert. In dem Diagramm ist beispielsweise die Geschichte des *zentralisierten Datenkatalogs* in der zweiten Phase (*Data Lake*) gelb. Dies weist darauf hin, dass das Unternehmen über einen zentralen Datenkatalog verfügt, der jedoch nicht vollständig mit den Metadaten gefüllt ist, die für die anderen Phasen erforderlich sind, oder er wird nur von wenigen Geschäftsbereichen verwendet. Diese Klassifizierung wirkt sich auf die Möglichkeiten zur gemeinsamen Nutzung von Daten in der nächsten Phase (*Einblicke und Berichte*) aus.
+ Grau bedeutet, dass die Geschichte nicht erforderlich ist.
+ Rot bedeutet, dass die Story aufgrund der Geschäftsergebnisse erforderlich ist, aber nicht umgesetzt wurde. Im Diagramm ist beispielsweise die Geschichte zum *Datenaustausch* in der Phase *Einblicke und Berichte* rot. Die Erstellung eines umfassenden Modells für maschinelles Lernen für Kundenempfehlungen erfordert die Gruppierung von Datensätzen, was Funktionen zur gemeinsamen Nutzung von Daten erfordert. Diese Geschichte wurde jedoch nicht umgesetzt. In diesem Beispiel setzt die gemeinsame Nutzung von Daten auch voraus, dass die Funktionen in der *Data-Lake-Phase* voll funktionsfähig sind, zumindest für die Datensätze, die Teil der Modelle sind. Sie können jedoch feststellen, dass *Data Stewardship nicht implementiert* wurde.

Die Geschichte *Datenschutz, Datenschutz und Compliance* (in der *Data-Lake-Phase*) sind immer erforderlich, und sie werden immer relevanter, da die Datenschutzbestimmungen durch neue Datenschutzanforderungen vorangetrieben werden. [Zum Beispiel begann die [Allgemeine Datenschutzverordnung (DSGVO)](https://gdpr.eu/what-is-gdpr/) in den USA mit dem [Virginia Consumer Data Protection Act (CDPA)](https://law.lis.virginia.gov/vacodefull/title59.1/chapter53/) und dem [California Consumer Privacy Act (CCPA)](https://oag.ca.gov/privacy/ccpa) und ist bereits in einigen lateinamerikanischen Ländern in Kraft, darunter [Lei Geral de Proteção a Dados Pessoais (LGPD)](https://www.serpro.gov.br/privacidade-protecao-dados) in Brasilien, [mexikanischer Datenschutz in Mexiko, Datenschutz](https://www.dataguidance.com/notes/mexico-data-protection-overview) in Kolumbien, [Gesetz 29733](https://www.leyes.congreso.gob.pe/Documentos/Leyes/29733.pdf) in Peru und Argentinien Datenschutzgesetze.](http://servicios.infoleg.gob.ar/infolegInternet/anexos/320000-324999/323901/norma.htm)