Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

# Verbindung zu Daten in Ray-Aufträgen
<a name="edit-script-ray-connections-formats"></a>

**Wichtig**  
AWS Glue for Ray wird ab dem 30. April 2026 nicht mehr für Neukunden geöffnet sein. Wenn Sie AWS Glue For Ray nutzen möchten, melden Sie sich vor diesem Datum an. Bestandskunden können den Service weiterhin wie gewohnt nutzen. Funktionen, die denen von AWS Glue für Ray ähneln, finden Sie in Amazon EKS. Weitere Informationen finden Sie unter [Ende des Supports AWS Glue für Ray](https://docs.aws.amazon.com/glue/latest/dg/awsglue-ray-jobs-availability-change.html).

AWS Glue Ray-Jobs können eine breite Palette von Python-Paketen verwenden, mit denen Sie Daten schnell integrieren können. Wir stellen einen minimalen Satz an Abhängigkeiten bereit, um Ihre Umgebung nicht zu überladen. Weitere Informationen darüber, was standardmäßig enthalten ist, finden Sie unter [Mit Ray-Aufträgen bereitgestellte Module](edit-script-ray-env-dependencies.md#edit-script-ray-modules-provided).

**Anmerkung**  
AWS Glue Extrahieren, Transformieren und Laden (ETL) bietet die DynamicFrame Abstraktion zur Optimierung von ETL-Workflows, bei denen Sie Schemaunterschiede zwischen Zeilen in Ihrem Datensatz beheben. AWS Glue ETL bietet zusätzliche Funktionen — Job-Lesezeichen und Gruppierung von Eingabedateien. Wir bieten derzeit keine entsprechenden Features in Ray-Aufträgen an.  
AWS Glue for Spark bietet direkte Unterstützung für die Verbindung zu bestimmten Datenformaten, Quellen und Datenquellen. In Ray decken das AWS -SDK für Pandas und aktuelle Bibliotheken von Drittanbietern diesen Bedarf weitgehend ab. Sie müssen diese Bibliotheken zu Rate ziehen, um zu verstehen, welche Funktionen verfügbar sind.

AWS Glue für Ray ist die Integration mit Amazon VPC derzeit nicht verfügbar. Auf Ressourcen in Amazon VPC kann ohne eine öffentliche Route nicht zugegriffen werden. Weitere Informationen zur Verwendung AWS Glue mit Amazon VPC finden Sie unter[Konfigurieren von Schnittstellen-VPC-Endpunkten (AWS PrivateLink) für AWS Glue (AWS PrivateLink)](vpc-interface-endpoints.md). 

## Allgemeine Bibliotheken für die Arbeit mit Daten in Ray
<a name="edit-script-ray-etl-libraries"></a>

**Ray Data** – Ray Data bietet Methoden zum Umgang mit gängigen Datenformaten, Quellen und Senken. Weitere Informationen zu unterstützten Formaten und Quellen in Ray Data finden Sie unter [Eingabe/Ausgabe](https://docs.ray.io/en/latest/data/api/input_output.html) in der Ray Data-Dokumentation. Bei Ray Data handelt es sich eher um eine eigensinnige Bibliothek als um eine Allzweckbibliothek für die Verarbeitung von Datensätzen. 

Ray bietet bestimmte Hinweise zu Anwendungsfällen, in denen Ray Data möglicherweise die beste Lösung für Ihre Aufgabe sein könnte. Weitere Informationen finden Sie in Ray-Dokumentation unter den [Ray-Anwendungsfällen](https://docs.ray.io/en/latest/ray-overview/use-cases.html). 

**AWS SDK für Pandas (awswrangler)** — AWS SDK für Pandas ist ein AWS Produkt, das saubere, getestete Lösungen für das Lesen und Schreiben von AWS Diensten bietet, wenn Ihre Transformationen Daten mit Pandas verwalten. DataFrames Weitere Informationen zu den unterstützten Formaten und Quellen im SDK für Pandas finden Sie in der [API-Referenz](https://aws-sdk-pandas.readthedocs.io/en/stable/api.html) in der Dokumentation zum AWS SDK für Pandas. AWS 

Beispiele zum Lesen und Schreiben von Daten mit dem AWS SDK für Pandas finden Sie unter [Schnellstart](https://aws-sdk-pandas.readthedocs.io/en/stable/) in der Dokumentation zum AWS SDK für Pandas. Das AWS SDK für Pandas bietet keine Transformationen für Ihre Daten. Es bietet lediglich Unterstützung für das Lesen und Schreiben aus Quellen. 

**Modin** – Modin ist eine Python-Bibliothek, die gängige Pandas-Operationen auf verteilbare Weise implementiert. Weitere Informationen zu Modin finden Sie in der [Modin-Dokumentation](https://modin.readthedocs.io/en/stable/). Modin selbst bietet keine Unterstützung für das Lesen und Schreiben aus Quellen. Es bietet verteilte Implementierungen gängiger Transformationen. Modin wird vom AWS SDK für Pandas unterstützt. 

Wenn Sie Modin und das AWS SDK für Pandas zusammen in einer Ray-Umgebung ausführen, können Sie allgemeine ETL-Aufgaben mit leistungsstarken Ergebnissen ausführen. Weitere Informationen zur Verwendung von Modin mit dem AWS SDK für Pandas finden Sie unter [Maßstabsgetreu in der AWS Dokumentation zum](https://aws-sdk-pandas.readthedocs.io/en/stable/scale.html) SDK für Pandas. 

**Andere Frameworks** – Weitere Informationen zu den von Ray unterstützten Frameworks finden Sie in der Ray-Dokumentation unter [The Ray Ecosystem](https://docs.ray.io/en/latest/ray-overview/ray-libraries.html). Wir bieten keine Unterstützung für andere Frameworks in AWS Glue for Ray.

## Herstellen einer Verbindung zu Daten über den Data Catalog
<a name="edit-script-ray-gludc"></a>

Die Verwaltung Ihrer Daten über den Datenkatalog in Verbindung mit Ray-Jobs wird mit dem AWS SDK für Pandas unterstützt. Weitere Informationen finden Sie im [Glue-Katalog](https://aws-sdk-pandas.readthedocs.io/en/3.0.0rc2/tutorials/005%20-%20Glue%20Catalog.html) auf der AWS SDK for Pandas-Website.