Verwenden Sie AMS SSP, um Amazon EMR in Ihrem AMS-Konto bereitzustellen - AMS-Benutzerhandbuch für Fortgeschrittene

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Verwenden Sie AMS SSP, um Amazon EMR in Ihrem AMS-Konto bereitzustellen

Verwenden Sie den AMS Self-Service Provisioning (SSP) -Modus, um direkt in Ihrem AMS-verwalteten Konto auf Amazon EMR-Funktionen zuzugreifen. Amazon EMR ist die branchenführende Cloud-Big-Data-Plattform für die Verarbeitung riesiger Datenmengen mithilfe von Open-Source-Tools wie Apache Spark, Apache Hive, Apache, Apache Flink HBase, Apache Hudi und Presto. Mit Amazon EMR können Sie Analysen im Petabyte-Bereich zu weniger als der Hälfte der Kosten herkömmlicher On-Premises-Lösungen und mehr als dreimal schneller als Apache Spark-Standardlösungen durchführen. Für Aufträge mit kurzer Laufzeit können Sie Cluster hoch- und herunterfahren und pro Sekunde für die verwendeten Instances zahlen. Für Workloads mit langer Laufzeit können Sie hochverfügbare Cluster erstellen, die automatisch skaliert werden, um der Nachfrage gerecht zu werden.

Sie können eine oder mehrere Instances der Amazon EMR-Cluster entweder in AMS-Landingzone-Konten mit mehreren Konten oder Landingzone-Konten mit einem Konto erstellen, um sowohl transiente als auch persistente Amazon EMR-Cluster zu unterstützen. Sie können auch die Kerberos-Authentifizierung aktivieren, um Benutzer aus einer lokalen Active Directory-Domäne zu authentifizieren.

Sie können mehrere Datenspeicher mit den Amazon EMR-Clustern nutzen, um anwendungsspezifische Hadoop-Tools und -Bibliotheken zu unterstützen. Die Amazon EMR-Cluster können mithilfe von OnDemand Spot-Instances erstellt und Autoscaling konfiguriert werden, um die Kapazität zu verwalten und die Kosten zu senken.

Die Cluster-Protokolldateien können zum Protokollieren und Debuggen in einem Amazon S3 S3-Bucket archiviert werden. Sie können auch auf die im Amazon EMR-Cluster gehosteten Weboberflächen zugreifen, um Hadoop-Administrationsanforderungen oder Notizbucherfahrungen für Kunden zu unterstützen.

Weitere Informationen finden Sie unter Amazon EMR.

Häufig gestellte Fragen zu Amazon EMR in AWS Managed Services

F: Wie beantrage ich Zugriff auf Amazon EMR in meinem AMS-Konto?

Beantragen Sie den Zugriff, indem Sie den Änderungstyp Verwaltung | AWS Service | Self-Provisioned Service | Hinzufügen (Überprüfung erforderlich) (ct-3qe6io8t6jtny) einreichen. Dieser RFC stellt Ihrem Konto die folgenden IAM-Rollen zur Verfügung:

  • customer_emr_cluster_instance_profile

  • customer_emr_cluster_autoscaling_role

  • customer_emr_console_role

  • customer_emr_cluster_service_role

Nachdem es in Ihrem Konto bereitgestellt wurde, müssen Sie die customer_emr_console_role in Ihre Verbundlösung integrieren.

F: Welche Einschränkungen gelten für die Nutzung von Amazon EMR in meinem AMS-Konto?

Wir empfehlen Ihnen, bei der Erstellung von Amazon EMR auf einem EC2 Cluster von der AWS-Konsole aus die Option Create Cluster — Advanced zu verwenden. Amazon EMR-Cluster müssen erstellt werden, indem das Tag mit dem Schlüssel "for-use-with-amazon-emr-managed-policies" mit dem Wert „true“ hinzugefügt wird. Wählen Sie in den Sicherheitsoptionen die folgenden Konfigurationen aus:

  • Wählen Sie benutzerdefinierte Rollen für Ihren Cluster aus:

    • EMR-Rolle: customer_emr_cluster_service_role

    • EC2 Instanzprofil: customer_emr_cluster_instance_profile

    • Auto Scaling Scaling-Rolle: customer_emr_cluster_autoscaling_role

  • EC2 Sicherheitsgruppen:

    • Master: ams-emr-master-security -Gruppe

    • Kern und Aufgabe: -Gruppe ams-emr-worker-security

    • Servicezugriff: -group ams-emr-serviceaccess-security

F: Was sind die Voraussetzungen oder Abhängigkeiten für die Verwendung von Amazon EMR in meinem AMS-Konto?

AMS erstellt Standardsicherheitsgruppen für die Master-, Worker- und Services-Knoten von Amazon EMR.

Die Startvorlagen und Sicherheitsgruppen, die mit Amazon EMR-Clustern verwendet werden sollen, müssen den Tag-Schlüssel "for-use-with-amazon-emr-managed-policies" mit dem Wert „true“ haben.

Das standardmäßige Amazon EMR-Cluster-Instance-Profil ermöglicht den Zugriff auf Ressourcen wie S3-Buckets und Dynamodb-Tabellen, deren Namen „emr“ enthalten. Sie können zusätzliche IAM-Richtlinien anfordern, um zusätzliche Ressourcen für Amazon EMR zu nutzen. Die folgenden Ressourcen-ARNs können mit Amazon EMR-Jobs unter Verwendung des customer_emr_cluster_instance_profile verwendet werden:

  • arn:aws:dynamodb: *:*:table/*emr*

  • arn:aws:kinesis: *:*:stream/*emr*

  • arn:aws:sns: *:*: *emr*arn:aws:sqs: *:*: *emr*

  • arn:aws:sqs: *:*: *emr*

  • arn:aws:sqs: *:*:AWS-* ElasticMapReduce

  • arn:aws:sdb: *::domäne: *emr*

  • arn:aws:s3: ::*emr*

Wenn Kerberos-Authentifizierung für den Amazon EMR-Cluster erforderlich ist:

  • Geben Sie den Bereichsnamen an, der für jeden kerberisierten Amazon EMR-Cluster verwendet werden soll, und die lokalen Active Directory-IP-Adressen.

  • Anforderungen an die Infrastruktur:

    Multi-Account Landing Zone (MALZ): Reichen Sie einen RFC ein, um ein neues verwaltetes Anwendungskonto oder eine neue VPC in einem vorhandenen Anwendungskonto zu erstellen.

    Single-Account Landing Zone (SALZ): Reichen Sie einen RFC ein, um ein neues Subnetz in Ihrer VPC zu erstellen.

  • Konfigurieren Sie die eingehende Vertrauensstellung für den Bereich des Clusters im lokalen Active Directory.

  • Reichen Sie einen RFC ein, um DNS-Zonen für den Bereich im Managed AD zu konfigurieren.

  • Konfiguration des Bereichs:

    MALZ: Senden Sie einen Management | Other | Other | Update (ct-0xdawir96cy7k) -RFC, um den VPC-DHCP-Optionssatz so zu aktualisieren, dass er den Realmnamen als Domainnamensuffix verwendet.

    SALZ: Reichen Sie einen RFC für Management | Other | Other | Update (ct-0xdawir96cy7k) ein, um ein neues Amazon EMR-AMI zu generieren, das den spezifischen Bereich für das Domainnamensuffix verwendet.

Für die Bereitstellung von Amazon EMR Studio ist für die Rolle customer_emr_cluster_service_role eine Voraussetzung für einen Amazon Simple Storage Service-Bucket erforderlich. Um den Bucket zu erstellen, verwenden Sie das automatisierte CT ct-1a68ck03fn98r (Deployment | Advanced Stack Components | S3 storage | Create). Wenn Sie dieses automatisierte CT verwenden, um einen Amazon S3 S3-Bucket für Amazon EMR zu erstellen, muss der Bucket-Name mit dem Präfix customer-emr-* beginnen. Außerdem müssen Sie den Bucket in derselben AWS Region wie der Amazon EMR-Cluster erstellen.